БИОЛОГИЧЕСКИ АКТИВНОЕ СОЕДИНЕНИЕ, СОДЕРЖАЩЕЕ КОДИРУЮЩИЙ ОЛИГОНУКЛЕОТИД (ВАРИАНТЫ), СПОСОБ ЕГО СИНТЕЗА, БИБЛИОТЕКА СОЕДИНЕНИЙ (ВАРИАНТЫ), СПОСОБ ЕЕ СИНТЕЗА И СПОСОБ ПОИСКА СОЕДИНЕНИЯ, СВЯЗЫВАЮЩЕГОСЯ С БИОЛОГИЧЕСКОЙ МИШЕНЬЮ (ВАРИАНТЫ) Российский патент 2012 года по МПК C12Q1/68 C12P19/34 C07H21/00 C40B20/04 C40B30/00 C40B40/00 C40B50/08 

Описание патента на изобретение RU2470077C2

Область техники, к которой относится изобретение

Данное изобретение относится к области биологической химии, а именно к новому способу синтеза библиотек молекул, содержащих олигонуклеотидную метку. Данные библиотеки могут быть использованы для определения соединений, связывающихся с определенной биологической мишенью.

Уровень техники

Поиск более эффективных способов идентификации соединений, характеризующихся ценными биологическими свойствами, привел к развитию методов скриннинга огромного числа различных соединений, собранных в коллекциях, которые называются комбинаторными библиотеками. Такие библиотеки включают 105 или более различных соединений. Существует множество способов создания комбинаторных библиотек, а также описан комбинаторный синтез пептидов, пептидомиметиков и низкомолекулярных органических молекул.

Две основные проблемы при использовании комбинаторного подхода в создании лекарственных средств заключаются в синтезе библиотек достаточной сложности и в идентификации молекул, обладающих активностью, определенной различными методами анализа. Общеизвестно, что чем выше степень сложности библиотеки, т.е. число различных структур, включенных в библиотеку, тем выше вероятность наличия в библиотеке молекул, обладающих требуемой активностью. Следовательно, методы химического синтеза для создания библиотеки должны обеспечивать получение огромного числа соединений в пределах разумного промежутка времени. Однако с учетом данной "формальной" или общей концентрации, при увеличении числа различных членов в библиотеке снижается концентрация конкретного члена в библиотеке, что осложняет идентификацию активных молекул в библиотеках высокой сложности.

Один из подходов к преодолению таких недостатков заключается в создании кодированных библиотек, и, прежде всего, библиотек, в которых каждое соединение включает амплифицируемую метку. Такие библиотеки включают ДНК-кодированные библиотеки, в которых меченый фрагмент ДНК, идентифицирующий член библиотеки, можно амплифицировать с использованием методов молекулярной биологии, таких как полимеразная цепная реакция. Однако использование таких способов для получения библиотек, включающих огромное множество соединений, еще находится на стадии разработки и очевидно, что для реализации такого подхода при создании лекарственных средств существует необходимость в развитии усовершенствованных методов создания таких библиотек.

Раскрытие изобретения

В настоящем изобретении предлагается способ синтеза библиотек молекул, которые содержат кодирующую олигонуклеотидную метку. В данном способе используется стратегия "разделения и объединения", которая заключается в том, что раствор, содержащий инициатор, первый структурный фрагмент, связанный с кодирующим олигонуклеотидом, разделяют на множество фракций ("разделение"). В каждой фракции инициатор взаимодействует со вторым, уникальным, структурным фрагментом и вторым уникальным олигонуклеотидом, который идентифицирует второй структурный фрагмент. Эти реакции проводят одновременно или последовательно, и в случае последовательных реакций каждая реакция предшествует другой реакции. Димерные молекулы, образующиеся в каждой фракции, объединяют ("объединение") и затем снова разделяют на множество фракций. Каждая из таких фракций взаимодействует с третьим уникальным (специфичным для данной фракции) структурным фрагментом и третьим уникальным олигонуклеотидом, который кодирует фрагмент. Число специфичных молекул, присутствующих в полученной библиотеке, зависит (1) от числа различных фрагментов, использованных на каждой стадии синтеза, и (2) от числа стадий разделения и объединения фракций.

В одном варианте воплощения настоящего изобретения предлагается способ синтеза молекулы, содержащей или представляющей собой функциональный компонент, эффективно связанный с кодирующим олигонуклеотидом. Такой способ включает следующие стадии: (1) выбор соединения-инициатора, состоящего из функционального компонента, содержащего n структурных фрагментов (где n равно целому числу 1 или более), причем функциональный компонент содержит по меньшей мере одну реакционноспособную группу, и эффективно связана с исходным олигонуклеотидом; (2) взаимодействие соединения-инициатора со структурным фрагментом, содержащим по меньшей мере одну комплементарную реакционноспособную группу, которая является комплементарной в отношении реакционноспособной группы, описанной на стадии (1), в условиях, пригодных для взаимодействия реакционноспособной группы и комплементарной реакционноспособной группы с образованием ковалентной связи; (3) взаимодействие исходного олигонуклеотида с новым олигонуклеотидом, который идентифицирует структурный фрагмент, описанном на стадии (b) в присутствии фермента, который катализирует лигирование исходного олигонуклеотида и нового олигонуклеотида в условиях, пригодных для лигирования исходного олигонуклеотида и нового олигонуклеотида, с образованием молекулы, содержащей или представляющей собой функциональный компонент, включающий n+1 структурных фрагментов, которые эффективно связаны с кодирующим олигонуклеотидом. Если функциональная группа, описанная на стадии (3), содержит реакционноспособную группу, то стадии 1-3 при необходимости повторяют один или более раз, при этом проводят циклы 1-i (где i равно целому числу 2 или более) с использованием продукта, полученного на стадии (3) цикла s (где s равно целому числу 1 или менее), выполняющего функции соединения-инициатора в цикле s+1.

В одном варианте воплощения настоящего изобретения предлагается способ синтеза библиотеки соединений, в которой соединения содержат функциональный компонент, содержащий 2 или более структурных фрагментов, эффективно связанных с олигонуклеотидом, который идентифицирует структуру функционального компонента. Способ включает следующие стадии: (1) обеспечение раствора, включающего m соединений-инициаторов (где m равно целому числу 1 или более), причем соединения-инициаторы состоят из функционального компонента, содержащего n структурных фрагментов (где n равно целому числу 1 или более), которые эффективно связаны с исходным олигонуклеотидом, идентифицирующим n структурных фрагментов; (2) разделение раствора, полученного на стадии (2), на r фракций (где r равно целому числу 2 или более); (3) взаимодействие соединений-инициаторов в составе каждой фракции с одним из r структурных фрагментов с образованием r фракций, содержащих соединения, состоящие из функционального компонента, содержащего n+1 структурных фрагментов, который эффективно связан с исходным олигонуклеотидом; (4) взаимодействие исходного олигонуклеотида в составе каждой фракции с одним из набора r различных новых олигонуклеотидов в присутствии фермента, который катализирует лигирование нового и исходного олигонуклеотидов в условиях, пригодных для ферментативного лигирования нового и исходного олигонуклеотидов, с получением r аликвотных фракций, состоящих из функционального компонента, содержащего n+1 структурных фрагментов, эффективно связанной с удлиненным олигонуклеотидом, который кодирует n+1 структурных фрагментов. Способ необязательно включает стадию (5) рекомбинирования r фракций, полученных на стадии (4), с получением раствора, содержащего соединения, состоящие из функциональной группы, содержащей n+1 структурных фрагментов, и эффективно связанной с удлиненным олигонуклеотидом. Стадии (1)-(5) при необходимости повторяют один или более раз, при этом проводят циклы 1-i (где i равно целому числу 2 или более). В цикле s+1 (где s равно целому числу i-1 или менее), раствор, включающий m соединений-инициаторов, описанных на стадии (1), является раствором, описанным на стадии (5) цикла s. Аналогичным образом, соединения-инициаторы, описанные на стадии (1) цикла s+1, являются соединениями-инициаторами, описанными на стадии (5) цикла s.

В предпочтительном варианте, для конденсации структурных фрагментов на каждой стадии используют стандартные химические реакции. Фрагменты конденсируют с образованием линейных или разветвленных полимеров или олигомеров, таких как пептиды, пептидомиметики или пептоиды, или неолигомерные молекулы, такие как молекулы, включающие структуру-каркас, к которой присоединяют один или более дополнительных химических компонентов. Например, если структурные фрагменты представляют собой аминокислотные остатки, то их конденсируют с использованием стандартных методов пептидного синтеза, таких как синтез в растворе или твердофазный синтез, с использованием известных пригодных способов введения/удаления защитных групп. Предпочтительным способом для конденсирования структурных фрагментов является синтез в растворе. В качестве кодирующих олигонуклеотидов используют одноцепочечные или двухцепочечные олигонуклеотиды, предпочтительно двухцепочечные олигонуклеотиды. Кодирующие олигонуклеотиды предпочтительно включают от 4 до 12 оснований или пар оснований на один структурный фрагмент; кодирующие олигонуклеотиды конденсируют с использованием стандартных методов синтеза олигонуклеотидов в растворе или твердофазного синтеза, но предпочтительно конденсируют с использованием ферментативного синтеза в растворе. Например, олигонуклеотиды конденсируют с использованием топоизомеразы, лигазы или ДНК-полимеразы, если последовательность кодирующих олигонуклеотидов включает инициирующую последовательность для лигирования с одним из таких ферментов. Ферментативная конденсация кодирующих олигонуклеотидов характеризуется следующими преимуществами: (1) высокая точность присоединения по сравнению со стандартной (неферментативной) конденсацией и (2) использование более простого способа введения/удаления защитных групп.

В другом варианте в настоящем изобретении предлагаются соединения формулы I:

где Х означает функциональный компонент, содержащий один или более структурных фрагментов; Z означает олигонуклеотид, присоединенный через 3'-концевой участок к В; Y означает олигонуклеотид, который присоединен через 5'-концевой участок к С; А означает функциональную группу, ковалентно связанную с X; В означает функциональную группу, связанную с 3'-концевым участком фрагмента Z; С означает функциональную группу, связанную с 5'-концевым участком фрагмента Y; D, F и Е каждый независимо означает бифункциональную связующую группу, a S означает атом или молекулярный каркас. Такие соединения могут быть в синтезированы в том числе с использованием способов по настоящему изобретению.

Настоящее изобретение относится также к библиотеке соединений, содержащей соединения, содержащие функциональный компонент, содержащий два или более структурных фрагментов, и эффективно связанную с олигонуклеотидом, кодирующим структуру функционального компонента. Такие библиотеки включают от приблизительно 102 до приблизительно 1012 или более различных членов, например 102, 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012 или более различных членов, т.е. различных молекулярных структур. В одном варианте воплощения настоящего изобретения библиотека соединений содержит соединения, каждое из которых независимо означает соединение формулы I:

где Х означает функциональный компонент, содержащий один или более структурных фрагментов; Z означает олигонуклеотид, присоединенный через 3'-концевой участок к В; Y означает олигонуклеотид, присоединенный через 5'-концевой участок С; А означает функциональную группу, ковалентно связанную с X; В означает функциональную группу, связанную с 3'-концевым участком фрагмента Z; С означает функциональную группу, связанную с 5'-концевым участком фрагмента Y; D, F и Е каждый независимо означает бифункциональную связующую группу, a S означает атом или молекулярный каркас.Такие библиотеки могут быть синтезированы в том числе с использованием способов по настоящему изобретению.

В другом аспекте настоящего изобретения предлагается способ поиска (идентификации) соединения, которое связывается с биологической мишенью, при этом указанный способ включает следующие стадии: (1) контактирование биологической мишени с библиотекой соединений по настоящему изобретению, включающей соединения, которые содержат функциональный компонент, содержащий два или более фрагмента, и эффективно связанную с олигонуклеотидом, кодирующим структуру функционального компонента. Данную стадию проводят в условиях, пригодных для связывания по крайней мере одного члена библиотеки соединений с мишенью; (2) удаление членов библиотеки, которые не связаны с мишенью; (3) амплификация кодирующих олигонуклеотидов по меньшей мере одного члена библиотеки соединений, который связывается с мишенью; (4) секвенирование кодирующих олигонуклеотидов, описанных на стадии (3), и использование последовательностей, определенных на стадии (4), для определения структуры функциональных компонентов членов библиотеки соединений, которые связываются с биологической мишенью.

Настоящее изобретение демонстрирует несколько преимуществ идентификации молекул, обладающих требуемыми свойствами. Например, способы по настоящему изобретению обеспечивают использование ряда химических реакций для конструирования молекул в присутствии олигонуклеотидной метки. Способы по настоящему изобретению позволяют вводить с высокой точностью олигонуклеотидные метки в образующиеся таким образом химические структуры. Более того, указанные способы позволяют проводить синтез библиотек, содержащих множество копий каждого члена, что в свою очередь позволяет проводить множество циклов селекции в отношении биологической мишени и при этом остается достаточное число молекул, которые подвергаются конечному циклу амплификации и секвенирования олигонуклеотидной метки.

Краткое описание чертежей

На фиг.1 показана схема лигирования двухцепочечных нуклеотидов, причем исходный нуклеотид содержит выступающий участок, комплементарный выступающему участку нового олигонуклеотида. Исходная цепочка изображена в виде свободной, конъюгированной с аминогексильным линкером или конъюгированной с остатком фенилаланина через аминогексильный линкер.

На фиг.2 показана схема лигирования олигонкулеотидов с использованием фиксирующей цепочки. В данном варианте фиксирующей цепочкой является 12-членный олигонуклеотид с последовательностями, комплементарными одноцепочечному исходному олигонуклеотиду и одноцепочечному новому олигонуклеотиду.

На фиг.3 показана схема лигирования исходного и нового олигонуклеотидов, причем исходный олигонуклеотид содержит две ковалентно связанные цепочки, а новый олигонуклеотид является двухцепочечным.

На фиг.4 показана схема наращивания олигонуклеотидной цепочки с использованием полимеразы. Исходная цепочка изображена в виде свободной, конъюгированной с аминогексильным линкером или конъюгированной с остатком фенилаланина через аминогексильный линкер.

На фиг.5 показана схема синтетического цикла по одному из вариантов воплощения настоящего изобретения.

На фиг.6 показана схема многостадийного процесса идентификации с использованием библиотек по настоящему изобретению.

На фиг.7 показан результат гелевого электрофореза продуктов, полученных в каждом из циклов 1-5, описанных в примере 1, и последующего лигирования замыкающего праймера. Олигонуклеотиды со стандартной молекулярной массой указаны на дорожке 1, и указанные параметры гиперлэддера для определения количества ДНК показаны на дорожках 9-12.

На фиг.8 показана схема конденсации структурных фрагментов с использованием азид-алкин-циклоприсоединения.

На фиг.9 и 10 показана конденсация структурных фрагментов с использованием нуклеофильного ароматического замещения хлорированного триазина.

На фиг.11 показаны хлорированные гетероароматические структуры, пригодные для синтеза функциональных компонентов.

На фиг.12 показана циклизация линейного пептида с использованием реакции азид-алкин-циклоприсоединения.

На фиг.13а показана хроматограмма библиотеки, полученной, как описано в примере 2, в результате цикла 4.

На фиг.13б показан масс-спектр библиотеки, полученной, как описано в примере 2, в результате цикла 4.

Осуществление изобретения

Настоящее изобретение относится к способам получения соединений комбинаторных библиотек соединений, к соединениям и библиотекам, которые получают с использованием способов по настоящему изобретению, и к способам использования библиотек для идентификации соединений, обладающих требуемыми свойствами, такими как требуемая биологическая активность. Настоящее изобретение относится также к соединениям, которые идентифицируют с использованием таких способов.

Для получения и анализа комбинаторных химических библиотек используют множество подходов. Примеры включают способы, в которых отдельные члены библиотеки физически отделены друг от друга, например, если синтез отдельного соединения проводят в одном из множества отдельных сосудов. Однако обычно в таких библиотеках анализируют единовременно только одно соединение или в лучшем случае несколько соединений, и, следовательно, такой способ не является наиболее эффективным методом скриннинга. Согласно другим способам, соединения синтезируют на твердой фазе. Такие твердые носители включают чипы, в которых специфичные соединения занимают особые участки чипа или мембраны ("адресуемое положение"). Согласно другим способам, соединения синтезируют на гранулах, при этом каждая гранула несет отдельную химическую структуру.

При анализе больших библиотек возникают две проблемы: (1) множество отдельных соединений, которые подвергаются анализу, и (2) идентификация соединений, проявляющих активность при данном при данном методе анализа. Согласно одному способу, соединения, проявляющие активность при данном методе анализа, идентифицируют разделением исходной библиотеки на меньшие фракции и подфракции, в каждом случае отбирая фракцию или подфракцию, содержащую активные соединения, и затем снова разделяют на фракции до получения активной подфракции, которая содержит набор соединений, который достаточно мал, чтобы все его компоненты можно было синтезировать каждый в отдельности и получить соединения с требуемой активностью. Такой способ является слишком трудоемким и длительным процессом.

Другой способ обратного анализа комбинаторной библиотеки заключается в использовании библиотек, в которых члены библиотеки содержат индивидуальные метки, т.е. каждая метка, присутствующая в библиотеке, связана с конкретной структурой соединения, присутствующего в библиотеке, таким образом, что идентификация метки определяет структуру меченой молекулы. Один из подходов получения меченых библиотек заключается в использовании олигонуклеотидных меток, как описано, например, в патентах США №№5573905, 5708153, 5723598, 6060596, в опубликованных заявках на выдачу патентов РСТ WO 93/06121, WO 93/20242, WO 94/13623, WO 00/23458, WO 02/074929 и WO 02/103008, а также в работах Brenner and Lenner (Proc. Natl. Acad. Sci. USA, 89, 5381-5383 (1992); Nielsen and Janda (Methods: A Companion to Methods in Enzymology, 6, 361-371 (1994) и Nielesen, Brenner and Janda (J. Amer. Chem. Soc., 115, 9812-9813 (1993)), каждая из которых полностью включена в настоящее описание в качестве ссылки. Такие метки амплифицируют с использованием, например, полимеразной цепной реакции для получения большого числа копий меченого фрагмента и идентификации его при секвенировании. Секвенирование меченого фрагмента позволяет идентифицировать структуру связывающей молекулы, которая может быть синтезирована в чистой форме и протестирована. К настоящему времени данные по использованию методологии, описанной в статье Lerner et al., для получения больших библиотек отсутствуют. В настоящем изобретении предлагается усовершенствование способов получения ДНК-кодированных библиотек, а также первые примеры больших (105 членов и более) библиотек ДНК-кодированных молекул, в которых функциональный фрагмент получают с использованием синтеза в растворе. В настоящем изобретении предлагаются способы простого синтеза комбинаторных библиотек, кодированных олигонуклеотидами, причем указанные способы позволяют с высокой точностью вводить олигонуклеотидную метку в каждый член многочисленного набора молекул.

Способы по настоящему изобретению включают способы синтеза бифункциональных молекул, которые включают первый компонент ("функциональный компонент"), которая состоит из структурных фрагментов, и второй компонент, эффективно связанный с первым компонентом, содержащим олигонуклеотидную метку, которая определяет структуру первого компонента, т.е. олигонуклеотидная метка указывает, какие структурные фрагменты были использованы при конструировании первого компонента и в каком порядке они связаны. В основном, информации, содержащейся в олигонуклеодидной метке, оказывается достаточно для определения структурных фрагментов, использованных для конструирования активного компонента. В определенных вариантах последовательность олигонуклеотидной метки является достаточной для определения расположения структурных фрагментов в функциональном компоненте, например для пептидных групп достаточно аминокислотной последовательности.

Термин "функциональный компонент", использованный в данном контексте, означает химический компонент, содержащий один или более структурных фрагментов. Предпочтительно, структурные фрагменты в функциональных компонентах не означают нуклеиновые кислоты. Функциональным компонентом является линейный, разветвленный или циклический полимер, или олигомер, или низкомолекулярная органическая молекула.

Термин "структурный фрагмент", использованный в данном контексте, означает химическое структурное звено, которое соединено с другими химическими структурными звеньями или присоединено к другим таким звеньям. Если функциональный компонент является полимерным или олигомерным, то фрагменты являются мономерными звеньями полимера или олигомера. Структурные фрагменты включают также структуру-каркас ("каркасный структурный фрагмент"), к которому присоединена или может быть присоединена одна или более дополнительных структур ("периферические структурные фрагменты").

Следует понимать, что термин "структурный фрагмент", использованный в данном контексте, означает химическое структурное звено, которое входит в состав функционального компонента, а также находится в реакционноспособной форме, используемой для синтеза функционального компонента. Структурный фрагмент полностью включен в состав функционального компонента, и ни одна из частей структурного фрагмента не высвобождается при синтезе функционального компонента. Например, если в реакциях, идущих с образованием связи, высвобождается небольшая молекула (см. ниже), то в состав функционального компонента входит "остаток структурного фрагмента", т.е. остаток, который образуется в процессе синтеза при высвобождении из структурного фрагмента атомов, которые присоединяются к высвобожденной молекуле.

В качестве структурных фрагментов используют любые химические соединения, которые являются комплементарными, т.е. эти структурные фрагменты способны взаимодействовать друг с другом с образованием структуры, содержащей два или более таких фрагментов. Обычно все используемые фрагменты содержат по крайней мере 2 реакционноспособные группы, хотя некоторые фрагменты (например, последний структурный фрагмент олигомерного функционального компонента) могут содержать только по одной реакционноспособной группе. Реакционноспособные группы двух различных фрагментов должны быть комплементарными, т.е. способны взаимодействовать друг с другом с образованием ковалентной связи, необязательно с сопутствующим высвобождением небольшой молекулы, такой как вода, HCl, HF и т.п.

Согласно настоящему изобретению, две реакционноспособные группы являются комплементарными, если они способны взаимодействовать с образованием ковалентной связи. В предпочтительном варианте реакции с образованием связи протекают быстро в условиях окружающей среды в основном без образования побочных продуктов. Предпочтительно, одна реакционноспособная группа взаимодействует с другой комплементарной реакционноспособной группой только один раз. В одном варианте комплементарные реакционносособные группы двух структурных фрагментов взаимодействуют, например, по механизму нуклеофильного замещения с образованием ковалентной связи. В другом варианте один член пары комплементарных реакционноспособных групп является электрофильной группой, а другой член пары - нуклеофильной группой.

Комплементарные электрофильные и нуклеофильные группы включают любые две группы, которые взаимодействуют по механизму нуклеофильного замещения в пригодных условиях с образованием ковалентной связи. В данной области техники известно множество образующих связь реакций. См., например, March, Advanced Organic Chemistry, 4th ed., New York: John Wiley and Sons (1992), гл. 10-16; Carey and Sundberg, Advanced Organic Chemistry, Part B, Plenum (1990), гл. 1-11; Collman et al., Principles and Applications of Organotransition Metal Chemistry, University Science Books, Mill Valley, Calif. (1987), гл. 13-20, каждая из которых полностью включена в настоящее описание в виде ссылки. Примеры пригодных электрофильных групп включают реакционноспособные карбонильные группы, такие как хлорангидридные группы, сложноэфирные группы, включая карбонилпентафторфенильные эфирные группы и сукцинимидные эфирные группы, кето- и альдегидные группы, реакционноспособные сульфонильные группы, такие как сульфонилхлоридные группы и реакционноспособные фосфонильные группы. Другие электрофильные группы включают концевые эпоксидные группы, изоцианатные группы и галогеналкил группы. Пригодные нуклеофильные группы включают первичные и вторичные аминогруппы, гидроксильные группы и карбоксильные группы.

Пригодные комплементарные реакционноспособные группы перечислены ниже. Специалистам в данной области техники известны другие пары реакционноспособных групп, которые можно использовать в настоящем изобретении, а приведенные ниже примеры не ограничивают объем настоящего изобретения.

В первом варианте комплементарные реакционноспособные группы включают активированные карбоксильные группы, реакционоспособные сульфонильные группы или реакционноспособные фосфонильные группы, или комбинацию указанных выше групп, и первичные или вторичные аминогруппы. В данном варианте комплементарные реакционоспособные группы взаимодействуют в пригодных условиях с образованием амидной, сульфонамидной или фосфонамидатной связи.

Во втором варианте воплощения настоящего изобретения комплементарные реакционноспособные группы включают эпоксидные группы и первичные или вторичные аминогруппы. Эпоксидсодержащий структурный фрагмент взаимодействует с аминосодержащим фрагментом в пригодных условиях с образованием связи углерод-азот, т.е. с образованием β-аминоспирта.

В другом варианте комплементарные реакционноспособные группы включают азиридиновые группы и первичные или вторичные аминогруппы. В пригодных условиях азиридинсодержащий структурный фрагмент взаимодействует с аминосодержащим фрагментом с образованием связи углерод-азот, т.е. с образованием 1,2-диамина. В третьем варианте комплементарные реакционноспособные группы включают изоцианатные группы и первичные или вторичные аминогруппы. Изоцианатсодержащий структурный фрагмент взаимодействует с аминосодержащим фрагментом в пригодных условиях с образованием связи углерод-азот, т.е. с образованием остатка мочевины.

В четвертом варианте комплементарные реакционноспособные группы включают изоцианатные группы и гидроксильные группы. Изоцианатсодержащий структурный фрагмент взаимодействует с гидроксилсодержащим фрагментом в пригодных условиях с образованием связи углерод-кислород, т.е. с образованием карбаматной группы.

В пятом варианте комплементарные реакционноспособные группы включают аминогруппы и карбонилсодержащие группы, такие, как альдегиды или кето-группы. Амины взаимодействуют с такими группами по реакции восстановительного аминирования с образованием новой связи углерод-азот.

В шестом варианте комплементарные реакционноспособные группы включают фосфорилидные группы и альдегиды или кетогруппы. Фосфорилидсодержащий структурный фрагмент взаимодействует с альдегид- или кетосодержащим фрагментом в пригодных условиях с образованием углерод-углеродной двойной связи, т.е. с образованием алкена.

В седьмом варианте комплементарные реакционноспособные группы взаимодействуют по механизму циклоприсоединения с образованием циклической структуры. Один пример таких комплементарных реакционноспособных групп включает алкины и органические азиды, которые в пригодных условиях взаимодействуют с образованием триазольной кольцевой структуры. Пример использования такой реакции для связывания двух фрагментов показан на фиг.8. Пригодные условия для проведения таких реакций известны в данной области техники и включают условия, описанные в заявке WO 03/101972, содержание которой полностью включено в настоящее описание в качестве ссылки.

В восьмом варианте комплементарные реакционноспособные группы включают алкилгалогениды и нуклеофилы, такие как аминогруппа, гидроксигруппа или карбоксильная группа. Такие группы взаимодействуют в пригодных условиях с образованием связи углерод-азот (акилгалогенид + амин) или связи углерод-кислородной (алкилгалогенид + гидроксильная или карбоксильная группа).

В девятом варианте комплементарные реакционноспособные группы включают галогенированную гетероароматическую группу и нуклеофил, и фрагменты связываются в пригодных условиях по реакции ароматического нуклеофильного замещения. Пригодные галогенированные гетероароматические группы включают хлорированные пиримидины, триазины и пурины, которые взаимодействуют с нуклеофилами, такими как амины, в мягких условиях в водном растворе. Примеры реакции олигонуклеотидов, содержащих трихлортриазиновые группы с аминами, показаны на фиг.9 и 10. Примеры пригодных хлорированных гетероароматических групп показаны на фиг.11.

Следует понимать, что синтез функционального фрагмента можно проводить с использованием одного конкретного типа реакций конденсации, таких как, без ограничения перечисленным, одна из описанных выше реакций, или с использованием комбинации двух или более реакций конденсации, например двух или более описанных выше реакций. Например, в одном варианте структурные фрагменты соединяют путем сочетания образования амидной связи (комплементарные амино- и карбоксильные группы) и восстановительного аминирования (комплементарные амино- и альдегидные или кетогруппы). Можно использовать любые реакции конденсации при условии, что они совместимы с присутствием олигонуклеотида. Двухцепочечные (дуплексные) олигонуклеотидные метки, использованные в определенных вариантах воплощения настоящего изобретения, являются химически более стабильными по сравнению с одноцепочечными метками, и, следовательно, устойчивы в более широком интервале условий реакции и участвуют в реакциях с образованием связи, что невозможно с использованием одноцепочечных меток.

Структурный фрагмент кроме реакционноспособной группы или групп, образующих функциональный компонент, может включать одну или более функциональных групп. Одну или более из таких дополнительных функциональных групп защищают для предотвращения их вступления в нежелательные реакции. Пригодные защитные группы известны в данной области техники для множества функциональных групп (см. книгу Greene and Wuts, Protective Groups in Organic Synthesys, second edition, New York: John Wiley and Sons (1991), включенную в данный контекст в качестве ссылки). Прежде всего используемые защитные группы включают трет-бутиловые простые и сложные эфиры, ацетали, тритильные эфиры и амины, ацетиловые эфиры, триметилсилиловые эфиры, трихлорэтиловые простые и сложные эфиры и карбаматы.

В одном варианте каждый структурный фрагмент включает две реакционноспособные группы, которые могут быть одинаковыми или отличаться друг от друга. Например, каждый структурный фрагмент, добавляемый в цикле s, может включать две одинаковые реакционноспособные группы, но при этом обе группы являются комплементарными с реакционноспособными группами структурных фрагментов, добавляемых на стадиях s-1 и s+1. В другом варианте каждый структурный фрагмент включает две реакционноспособные группы, которые комплементарны друг с другом. Например, библиотеку, содержащую полиамидные молекулы, получают по реакциям между структурными фрагментами, содержащими две первичные аминогруппы, и фрагментами, содержащими две активированные карбоксильные группы. В полученных соединениях отсутствуют N- или С-концевые фрагменты, т.к. альтернативные амидные группы имеют противоположное направление. В другом варианте полиамидную библиотеку получают с использованием структурных фрагментов, каждый из которых включает аминогруппу и активированную карбоксильную группу. В таком варианте структурные фрагменты, добавляемые на стадии n-го цикла, содержат свободную реакционноспособную группу, которая комплементарна с доступной реакционноспособной группой в составе фрагмента n-1, в то время как, предпочтительно, другая реакционноспособная группа в составе структурного фрагмента n защищена. Например, если члены библиотеки синтезируют в направлении от С-концевого участка к N-концевому участку, то добавляемые структурные фрагменты содержат активированную карбоксильную группу и защищенную аминогруппу.

Функциональные компоненты являются полимерными или олигомерными компонентами, такими как пептиды, пептидомиметики, пептидонуклеиновые кислоты или пептоиды, или они являются низкомолекулярными соединениями, например молекулами со структурой, включающей центральный каркас, и структурами, расположенными по периферии каркаса. Линейные полимерные или олигомерные библиотеки получают с использованием структурных фрагментов с двумя реакционноспособными группами, в то время как разветвленные полимерные или олигомерные библиотеки получают с использованием структурных фрагментов с тремя или более реакционноспособными группами, необязательно в комбинации с фрагментами, содержащими только две реакционноспособные группы. Такие молекулы можно представить общей формулой Х1Х2…Хn, где каждый Х означает мономерное звено полимера, включающего n мономерных звеньев, где n равно целому числу более 1. В случае олигомерных или полимерных соединений нет необходимости в наличии двух функциональных групп на концевых фрагментах. Например, в случае полиамидной библиотеки С-концевой фрагмент содержит аминогруппу, а присутствие карбоксильной группы необязательно. Аналогичным образом, N-концевой фрагмент содержит карбоксильную группу, но не содержит аминогруппу.

Разветвленные олигомерные или полимерные соединения синтезируют также при условии, что по крайней мере один структурный фрагмент включает три функциональные группы, которые взаимодействуют с другими структурными фрагментами. Библиотека по настоящему изобретению включает линейные молекулы, разветвленные молекулы или их комбинацию.

Библиотеки получают также с использованием, например, каркасных фрагментов с одной или двумя реакционноспособными группами, в комбинации с другими структурными фрагментами, содержащими только одну доступную реакционноспособную группу, например, в которых любые другие реакционноспособные группы защищены или нереакционноспособны в отношении других реакционноспособных групп в составе каркасного фрагмента. В одном варианте, например, полученные молекулы могут быть представлены общей формулой X(Y)n, где Х означает каркасный структурный фрагмент, каждый Y означает структурный фрагмент, связанный с X, а n равно целому числу, равному по крайней мере 2, и предпочтительно от 2 до приблизительно 6. В одном предпочтительном варианте исходный фрагмент в цикле 1 означает каркасный фрагмент. В молекулах формулы X(Y)n каждый Y является одинаковым или различным, но в большинстве членов типичной библиотеки каждый Y является различным.

В одном варианте библиотеки по настоящему изобретению содержат полиамидные соединения. Полиамидные соединения состоят из структурных фрагментов, содержащих любые аминокислоты, включая 20 природных α-аминокислот, таких как аланин (Аlа, А), глицин (Gly, G), аспарагин (Asn, N), аспартамовая кислота (Asp, D), глутаминовая кислота (Glu, E), гистидин (His, Н), лейцин (Leu, L), лизин (Lys, К), фенилаланин (Phe, F), тирозин (Tyr, Y), треонин (Thr, Т), серин (Ser, S), аргинин (Arg, R), валин (Val, V), глутамин (Gin, Q), изолейцин (IIе, I), цистеин (Cys, С), метионин (Met, M), пролин (Pro, P) и триптофан (Trp, W), в скобках приведены трехбуквенный и однобуквенный коды обозначения аминокислот. В природной форме все из описанных аминокислот существуют в L-конфигурации, если не указано иное. Однако в настоящем изобретении можно использовать D-конфигурацию указанных аминокислот. Такие D-аминокислоты обозначены в настоящем описании в трех- и однобуквенном коде прописными буквами: ala (a), gly (g), leu (l), gln (q), thr (t), ser (s) и т.п. Фрагменты могут содержать другие α-аминокислоты, включая, без ограничения перечисленным, 3-арилаланины, такие как нафтилаланин, фенилзамещенные фенилаланины, включая 4-фтор-, 4-хлор-, 4-бром- и 4-метилфенилаланин, 3-гетероарилаланины, такие как 3-пиридилаланин, 3-тиенилаланин, 3-хинолилаланин и 3-имидазолилаланин; орнитин, итрулин, гомоцитрулин, саркозин, гомопролин, гомоцистеин; замещенные пролины, такие как гидроксипролин и фторпролин; дегидропролин, норлейцин, O-метилтирозин, O-метилсерин, O-метилтреонин и 3-циклогексилаланин. Каждую из перечисленных выше аминокислот используют в D- или L-конфигурации.

Фрагменты могут включать также аминокислоты, не являющиеся α- аминокислотами, такие как α-азаминокислоты, β, γ, δ, ε-аминокислоты, и N-замещенные аминокислоты, такие как N-замещенный глицин, в котором заместитель у атома азота означает, например, замещенный или незамещенный алкил, арил, гетероарил, арилалкил или гетероарилалкил. В одном варианте заместитель у атома азота означает боковую цепь природных или неприродных α-аминокислот.

Структурный фрагмент может также представлять собой структуру пептидомиметика, такого как дипептидный, трипептидный, тетрапептидный или пентапептидный миметик. Такие пептидомиметиковые структурные фрагменты предпочтительно включают производные аминоацильных соединений, например, полученных при добавлении таких структурных фрагментов к наращиваемой поли(аминоацильной) группе по одной и той же или аналогичной реакции, использованной для получения других структурных фрагментов. В качестве структурных фрагментов можно использовать также молекулы, которые образуют связи, изостеричные пептидной связи, с образованием функциональных компонентов пептидомиметиков, включающих модифицированную пептидную цепь, такую как ψ[CH2S], ψ[CH2NH], ψ[CSNH2], ψ[NHCO], ψ[COCH2] и ψ[(Е) или (Z) СН=СН]. В использованной выше номенклатуре ψ означает отсутствие амидной связи. Структура, заменяющая амидную группу, расположена в скобках.

В одном варианте настоящего изобретения предлагается способ синтеза соединения, содержащего или представляющего собой функциональный компонент, который эффективно присоединен к кодирующему олигонуклеотиду. Способ включает следующие стадии: (1) получение соединения-инициатора, состоящего из исходного функционального компонента, содержащего n структурных фрагментов (где n равно целому числу 1 или более), по крайней мере одну реакционноспособную группу, и эффективно связанного с исходным олигонуклеотидом, который кодирует n структурных фрагментов; (2) взаимодействие соединения-инициатора со структурным фрагментом, содержащим по крайней мере одну комплементарную реакционноспособную группу, являющуюся комплементарной с реакционноспособной группой, полученной на стадии (1), в условиях, пригодных для взаимодействия реакционноспособной группы и комплементарной реакционноспособной группы с образованием ковалентной связи; (3) взаимодействие исходного олигонуклеотида с новым олигонуклеотидом в присутствии фермента, который катализирует лигирование исходного олигонуклеотида и нового олигонуклеотида в пригодных для этого условиях, с получением молекулы, содержащей или представляющей собой функциональный компонент, содержащий n+1 структурных фрагментов, и эффективно связанный с кодирующим олигонуклеотидом. Если функциональный компонент, полученный на стадии (3), включает реакционноспособную группу, то стадии 1-3 при необходимости повторяют один или более раз, при этом проводят циклы 1-i (i равно целому числу 2 или более), с участием продукта, полученного на стадии (3) в цикле s-1 (где s равно целому числу i или менее), с образованием соединения-инициатора, описанного на стадии (1) в цикле s. В каждом цикле к наращиваемому функциональному компоненту добавляют один структурный фрагмент, а к наращиваемому кодирующему олигонуклеотиду добавляют одну олигонуклеотидную последовательность, которая кодирует новый структурный фрагмент.

В предпочтительном варианте каждый конкретный структурный фрагмент связан с отдельным олигонуклеотидом таким образом, что последовательность нуклеотидов в составе олигонуклеотида, добавленного в данном цикле, идентифицирует функциональный компонент, добавленный в том же цикле.

Конденсация структурных фрагментов и лигирование олигонукдеотидов обычно происходят при одинаковых концентрациях исходных веществ и реагентов. Например, для эффективного связывания структурных фрагментов предпочтительными являются концентрации порядка от микромолярной или миллимолярной, например от приблизительно 10 мкм до приблизительно 10 Мм.

В некоторых вариантах способ также включает стадию, которая включает удаление всех непрореагировавших исходных функциональных компонентов после проведения стадии (2). Удаление всех непрореагировавших исходных функциональных компонентов в конкретном цикле позволяет исключить взаимодействие исходного функционального компонента в цикле со структурными фрагментами, добавленными в следующем цикле. Такие реакции могут привести к образованию функциональных компонентов, не содержащих один или более структурных фрагментов, и к возможности образования нескольких структур функционального компонента, соответствующих конкретной последовательности олигонуклеотида. Такое удаление проводят при взаимодействии любого остаточного функционального компонента с соединением, которое взаимодействует с реакционноспособной группой, описанной на стадии (2). Предпочтительно, соединение, используемое для удаления, быстро взаимодействует с реакционноспособной группой, описанной на стадии (2), и не содержит дополнительных реакционноспособных групп, которые могут взаимодействовать со структурными фрагментами, добавляемыми в следующих циклах. Например, при синтезе соединения, в котором реакционноспособной группой на стадии (2) является аминогруппа, пригодным соединением для удаления является сложный эфир N-гидроксисукцинимида, такой как N-гидроксисукцинимидный эфир уксусной кислоты.

В другом варианте воплощения настоящего изобретения предлагается способ получения библиотек соединений, в которых каждое соединение содержит функциональный компонент, содержащий два или более структурных фрагментов, и который эффективно присоединен к олигонуклеотиду. В предпочтительном варианте олигонуклеотид присутствует в каждой молекуле и позволяет определить структурные фрагменты в составе молекулы и, необязательно, порядок добавления этих фрагментов. В данном варианте способ по настоящему изобретению включает способ синтеза библиотеки соединений, в которой соединения содержат функциональный компонент, содержащий два или более структурных фрагмента, и который эффективно связан с олигонуклеотидом, который определяет структуру функционального компонента. Способ включает следующие стадии: (1) получение раствора, содержащего m соединений-инициаторов (где m равно целому числу 1 или более), состоящих из функционального компонента, содержащего n фрагментов (где n равно целому числу 1 или более), который эффективно связан с исходным олигонуклеотидом, определяющим n структурных компонентов; (2) разделение раствора, полученного на стадии (1), по крайней мере на r фракций (где r равно целому числу 2 или более); (3) взаимодействие каждой фракции с одним из r структурных фрагментов с образованием r фракций, содержащих соединения, состоящие из функционального компонента, содержащего n+1 структурных фрагментов, и эффективно связанного с исходным олигонуклеотидом; (4) взаимодействие каждой из r фракций, полученных на стадии (3), с одним из набора r новых различных олигонуклеотидов в условиях, пригодных для ферментативного лигирования нового и исходного олигонуклеотидов, при этом получают r фракций, содержащих молекулы, состоящие из функционального компонента, содержащего n+1 структурных фрагментов, и эффективно связанного с удлиненным олигонуклеотидом, который кодирует n+1 структурных фрагментов. Способ необязательно включает стадию (5) объединения r фракций, полученных на стадии (4), при этом получают раствор, содержащий молекулы, состоящие из функционального компонента, содержащего n+1 структурных фрагментов, и эффективно связанного с удлиненным олигонуклеотидом, который кодирует n+1 структурных фрагментов. Стадии (1)-(5) повторяют один или более раз, при этом проводят циклы 1-i (где i равно целому числу 2 или более). В цикле s+1, где s равно целому числу i-1 или менее, раствор, содержащий m соединений-инициаторов, полученных на стадии (1), является раствором, полученным на стадии (5) в цикле s. Аналогичным образом, соединения-инициаторы, полученные на стадии (1) в цикле s+1, являются продуктами, полученными на стадии (4) в цикле s.

Раствор, полученный на стадии (2), предпочтительно разделяют на r фракций в каждом цикле синтеза библиотеки. В данном варианте каждая фракция взаимодействует с отдельным структурным фрагментом.

Согласно способу, по настоящему изобретению порядок добавления структурных фрагментов и новых олигонуклеотидов не имеет значения, при этом стадии (2) и (3) синтеза молекулы и стадии (3) и (4) синтеза библиотеки можно проводить в обратном порядке, т.е. новый олигонуклеотид можно лигировать с исходным олигонуклеотидом перед добавлением нового структурного фрагмента. В некоторых вариантах эти две стадии можно проводить одновременно.

В некоторых вариантах способ также включает стадию удаления всех непрореагировавших исходных функциональных компонентов после проведения стадии (2). Удаление всех непрореагировавших исходных функциональных компонентов в каждом цикле позволяет исключить взаимодействие исходного функционального компонента в цикле со структурными фрагментами, добавленными в следующем цикле. Такие реакции могут привести к образованию функциональных компонентов, не содержащих один или более структурных фрагментов, и к возможности образования нескольких структур функционального компонента, которые соответствуют конкретной последовательности олигонуклеотида. Такое удаление проводят при взаимодействии любого остаточного функционального компонента с соединением, которое взаимодействует с реакционноспособной группой, описанной на стадии (2). Предпочтительно, соединение, используемое для удаления, быстро взаимодействуете реакционноспособной группой, описанной на стадии (2), и не содержит дополнительных реакционноспособных групп, которые могут взаимодействовать со структурными фрагментами, добавляемыми в следующих циклах. Например, при синтезе соединения, в котором реакционноспособной группой на стадии (2) является аминогруппа, пригодным соединением для удаления является сложный эфир N-гидроксисукцинимида, такой как N-гидроксисукцинимидный эфир уксусной кислоты.

В одном варианте фрагменты, используемые при синтезе библиотеки, выбирают из набора возможных, оценивая способность возможных фрагментов взаимодействовать с соответствующими комплементарными функциональными группами в условиях, используемых для синтеза библиотеки. Фрагменты, которые оказались реакционноспособными в таких условиях, отбирают для включения в библиотеку. Продукты каждого отдельного цикла необязательно очищают. Если цикл является промежуточным циклом, т.е. любым циклом, предшествующим конечному циклу, то продукты, полученные в таких циклах, являются промежуточными соединениями и их очищают перед началом следующего цикла. Если цикл является конечным, то полученные продукты являются конечными продуктами и их очищают перед использованием соединений. На такой стадии очистки, например, удаляют непрореагировавшие реагенты или их избыток, а также фермент, использованный для лигирования олигонуклеотида. Используют любые способы, которые пригодны для отделения продуктов от других соединений, присутствующих в растворе, включая жидкостную хроматографию, такую как высокоэффективную жидкостную хроматографию (ВЭЖХ), и осаждение пригодным со-растворителем, таким как этанол. Выбор пригодных способов очистки зависит от природы продуктов и системы растворителей, используемой для синтеза.

Реакции предпочтительно проводят в водном растворе, таком как буферный водный раствор, но также могут быть проведены в смешанной водно-органической среде, совместимой с растворимостью структурных фрагментов, олигонуклеотидов, промежуточных и конечных продуктов, а также фермента, использованного для катализа лигирования олигонуклеотида.

Следует понимать, что теоретическое число соединений, полученных в данном цикле согласно способу по настоящему изобретению, равно произведению числа различных соединений-инициаторов, m, использованных в данном цикле, на число отдельных фрагментов r, добавленных в цикле. Реальное число отдельных соединений, полученных в цикле, может быть больше произведения r на m (r×m), но может быть и меньше с учетом различий в реакционной способности некоторых структурных фрагментов с некоторыми другими фрагментами. Например, кинетика присоединения определенного структурного фрагмента к определенному соединению-инициатору определяет выход продукта в ходе данного цикла синтеза и в зависимости от указанной кинетики выход продукта составляет незначительную величину или продукт совсем не образуется.

В одном варианте стандартный структурный фрагмент добавляют перед началом цикла 1, после завершения последнего цикла или между двумя любыми циклами. Например, если функциональным фрагментом является полиамид, то стандартный структурный фрагмент с защищенной N-концевой группой добавляют после завершения последнего цикла. Стандартный фрагмент вводят между любыми двумя циклами, например, для включения функциональной группы, такой как алкиновая или азидная группа, которую можно использовать для модификации функциональных компонентов, например, путем циклизации после завершения синтеза библиотеки.

Термин "эффективно связанный", использованный в данном контексте, означает, что две химические структуры связаны вместе таким образом, что связь между ними устойчива в различных условиях, в которых предполагается обрабатывать данную структуру. Обычно функциональный компонент и кодирующий олигонуклеотид связаны ковалентно через соответствующую связующую (мостиковую) группу. Связующая группа означает двухвалентный остаток, содержащий связь для присоединения олигонуклеотида и связь для присоединения функционального компонента. Например, если функциональным компонентом является полиамидное соединение, то полиамид присоединен к связующему звену по N-концевому атому, С-концевому атому или через функциональную группу в одной из боковых цепей. Длина связующей группы, достаточной чтобы разделить полиамидное соединение и олигонуклеотид, составляет по крайней мере один атом, и предпочтительно, более одного атома, например, по крайней мере два, по крайней мере три, по крайней мере четыре, по крайней мере пять или по крайней мере шесть атомов. Предпочтительно, связующая группа является достаточно гибкой для обеспечения связывания полиамидного соединения с молекулами-мишенями независимо от олигонуклеотида.

В одном варианте связующая группа присоединена к N-концевому атому полиамидного соединения и к 5'-фосфатной группе олигонуклеотида. Например, связующую группу можно получить из соответствующего предшественника, содержащего активированную карбоксильную группу на одном концевом участке и активированную сложноэфирную группу на другом концевом участке. Реакция предшественника связующей группы с N-концевым атомом азота приводит к образованию амидной связи, соединяющей связующую группу с полиамидным соединением или N-концевым фрагментом, в то время как реакция предшественника связующей группы с 5'-гидроксильной группой олигонуклеотида приводит к присоединению олигонуклеотида к связующей группе через сложноэфирную связь. Связующая группа включает, например, полиметиленовую цепь, такую как -(СН2)n-, или поли(этиленгликолевую) цепь, такую как -(CH2CH2O)m, где в обоих случаях n равно целому числу от 1 до приблизительно 20. Предпочтительно, n равно от 2 до приблизительно 12, более предпочтительно от приблизительно 4 до приблизительно 10. В одном варианте связующая группа включает гексаметиленовую группу (-(СH2)6-).

Если фрагменты означают аминокислотные остатки, то конечный функциональный фрагмент означает полиамид. Аминокислоты конденсируют с использованием любых пригодных методик с образованием амидных связей. Предпочтительно, конденсацию аминокислотных фрагментов проводят в условиях, совместимых с ферментативным лигированием олигонуклеотидов, например, при нейтральных или близких к нейтральным рН и в водном растворе. В одном варианте полиамидное соединение синтезируют в направлении от С-концевого атома к N-концевому. В данном варианте первый или С-концевой фрагмент конденсируют по карбоксильной группе с олигонуклеотидом через пригодную связующую группу. Первый функциональный компонент взаимодействует со вторым функциональным компонентом, который предпочтительно содержит активированную карбоксильную группу и защищенную аминогруппу. Используют любые методики активирования/введения защитных групп, пригодные для образования амидной связи в растворе. Например, пригодные активированные карбоксильные соединения включают ацилфториды (патент США №5360928, полностью включенный в данное описание в качестве ссылки), симметричные ангидриды и N-гидроксисукцинимидные сложные эфиры. Ацильные группы также активируют in situ, как известно в данной области техники, по реакции с пригодным активирующим соединением. Пригодные активирующие соединения включают дициклогексилкарбодиимид (DCC), диизопропилкарбодиимид (DIC), 1-этоксикарбонил-2-этокси-1,2-дигидрохинолин (EEDQ), гидрохлорид 1-этил-3-(3-диметиламинопропил)-карбодиимида (EDC), ангидрид н-пропанфосфоновой кислоты (РРА), N,N-бис(2-оксо-3-оксазолидинил)имидофосфорилхлорид (BOP-Cl), гексафторфосфат бром-трис-пирролидинофосфония (PyBrop), дифенилфосфорилазид (DPPA), реагент Кастро (ВОР, РуВОР), соли O-бензотриазолил-N,N,N',N'-тетраметилурония (HBTU), диэтилфосфорилцианид (DEPCN), диоксид 2,5-дифенил-2,3-дигидро-3-оксо-4-гидрокситиофена (HOTDO, реагент Стеглиха), 1,1'-карбонилдиимидазол (CDI) и хлорид 4-(4,6-диметокси-1,3,5-триазин-2-ил)-4-метилморфолиния (DMT-MM). Кондесирующие агенты используют в отдельности или в комбинации с добавками, такими как N,N-диметил-4-аминопиридин (DMAP), N-гидроксибензотриазол (HOBt), N-гидроксибензотриазин (HOOBt), N-гидроксисукцинимид (HOSu), N-гидроксиазабензотриазол (HOAt), соли азабензотриазолилтетраметилурония (HATU, HAPyU) или 2-гидроксипиридин. В некоторых вариантах для синтеза библиотек необходимо использование двух или более методик активации, что необходимо для использования отличающихся в структурном отношении наборов фрагментов. Для каждого фрагмента специалист в данной области техники может определить соответствующую методику активации.

В качестве N-концевой защитной группы используют любые защитные группы, совместимые с условиями проведения процесса, а также защитные группы, пригодные в условиях синтеза в растворе. Предпочтительной защитной группой является флуоренилметоксикарбонильная (“Fmoc”) группа. Необходимо также вводить защитные группы во все потенциально реакционноспособные функциональные группы в боковой цепи аминоацильного структурного фрагмента. Предпочтительно защитная группа боковой цепи расположена ортогонально к N-концевой защитной группе, и таким образом защитную группу боковой цепи удаляют в условиях, отличающихся от условий, необходимых для удаления N-концевой защитной группы. Пригодные защитные группы боковой цепи включают нитровератрильную группу, которую можно использовать как для защиты карбоксильных групп в составе боковой цепи, так и аминогрупп в составе боковой цепи. Другие пригодные защитные группы аминогрупп в боковой цепи включают N-пент-4-еноильную группу.

Структурные компоненты можно модифицировать после введения их в функциональный компонент, например, путем пригодной реакции, вводящей функциональную группу в один или более структурных фрагментов. Модификация структурных фрагментов может быть проведена после присоединения конечного структурного фрагмента или на любой промежуточной стадии синтеза функционального компонента, например, после любого цикла синтеза. После синтеза библиотеки бифункциональных молекул по настоящему изобретению модификацию структурных фрагментов проводят в составе всей библиотеки или в части библиотеки, при этом возрастает степень сложности библиотеки. Пригодные реакции модификации структурных фрагментов включают такие реакции, которые можно проводить в условиях, совместимых с функциональным компонентом и кодирующим олигонуклеотидом. Примеры таких реакций включают ацилирование и сульфирование аминогрупп или гидроксильных групп, алкилирование аминогрупп, этерификацию или тиоэтерификацию карбоксильных групп, амидирование карбоксильных групп, эпоксидирование алкенов и другие реакции, известные в данной области техники. Если функциональный фрагмент включает фрагмент, содержащий алкиновую или азидную функциональную группу, то реакцию циклоприсоединения азида/алкина используют для модификации структурного фрагмента. Например, структурный фрагмент, включающий алкин, взаимодействует с органическим азидом, или функциональный блок, включающий азид, взаимодействует с алкином, при этом в любом случае образуется триазол. Реакции модификации структурных фрагментов проводят после присоединения конечного фрагмента или на любой промежуточной стадии синтеза и используют для включения в функциональный компонент большого числа химических структур, включая углеводы, металлсвязывающие компоненты и структуры, специфичные к определенным биомишеням или тканям.

В одном варианте функциональный компонент содержит линейную серию структурных фрагментов, которую подвергают циклизации с использованием пригодной реакции. Например, если по крайней мере 2 структурных фрагмента в линейном наборе включают сульфгидрильные группы, то сульфгидрильные группы окисляют с образованием дисульфидной связи, при этом происходит циклизация линейной серии структурных фрагментов. Например, функциональными компонентами являются олигопептиды, которые включают два или более остатков L- или D-цистеина и/или L- или D-гомоцистеина. Структурные фрагменты могут также включать и другие функциональные группы, способные взаимодействовать друг с другом, такие как карбоксильные группы и амино- или гидроксильные группы; при этом происходит циклизация линейной серии.

В предпочтительном варианте один из структурных фрагментов в линейном наборе включает алкиновую группу, а другой структурный фрагмент в линейном наборе включает азидную группу. Азидная и алкиновая группа могут взаимодействовать по механизму циклоприсоединения с образованием макроциклической структуры. Как показано на фиг.9, функциональным компонентом является полипептид, содержащий пропаргилглициновый фрагмент в С-концевом участке и азидоацетильную группу в N-концевом участке. Реакция алкиновой и азидной групп в пригодных условиях приводит к образованию циклического соединения, которое включает триазольную структуру в составе макроцикла. В одном варианте каждый член библиотеки включает алкин- и азидсодержащие структурные фрагменты, и, следовательно, их можно циклизовать. Во втором варианте все члены библиотеки включают алкин- и азидсодержащие фрагменты, но только часть библиотеки циклизуется. В третьем варианте только некоторые функциональные компоненты включают алкин- и азидсодержащие фрагменты, и только такие молекулы циклизуются. В описанных выше втором и третьем вариантах, после реакции циклоприсоединения библиотека будет включать как циклические, так и линейные функциональные компоненты.

Олигонуклеотиды лигируют с использованием ферментативных методов. В одном варианте исходный фрагмент эффективно связан с исходным олигонуклеотидом. Перед или после присоединения второго структурного фрагмента к исходному структурному фрагменту вторую олигонуклеотидную последовательность, которая определяет второй структурный фрагмент, лигируют с исходным олигонуклеотидом. Способы лигирования исходной олигонуклеотидной последовательности и новой олигонуклеотидной последовательности показаны на фиг.1 и 2. Как показано на фиг.1, исходный олигонуклеотид является двухцепочечным, причем одна цепочка содержит дополнительную последовательность, комплементарную одному концевому участку второго олигонуклеотида, и способствует контактированию второго и исходного олигонуклеотидов. Предпочтительно, дополнительная последовательность в исходном олигонуклеотиде и комплементарная последовательность во втором олигонуклеотиде обе составляют по крайней мере 4 основания, более предпочтительно обе последовательности имеют одинаковую длину. Исходный и второй олигонуклеотиды лигируют с использованием пригодного фермента. Если исходный олигонуклеотид присоединен к первому структурному фрагменту в 5'-концевом участке одной из цепей ("верхняя цепь"), то цепь, комплементарная верхней цепи ("нижняя цепь"), будет включать дополнительную последовательность в 5'-концевом участке, а второй олигонуклеотид будет включать комплементарную последовательность в 5'-концевом участке. После лигирования второго олигонуклеотида добавляют цепь, комплементарную последовательности второго олигонуклеотида, который присоединен к 3' участку дополнительной комплементарной последовательности и который включает еще одну дополнительную последовательность.

В одном варианте олигонуклеотид наращивают, как показано на фиг.2. Олигонуклеотид, связанный с наращиваемым функциональным фрагментом, и новый олигонуклеотид предназначены для лигирования с использованием фиксирующей последовательности, которая включает участок, комплементарный 3'-концевому участку в исходном олигонуклеотиде, и участок, комплементарный 5'-концевому участку в новом олигонуклеотиде. Фиксирующая цепь способствует сближению 5'-концевого участка олигонуклеотида с 3'-концевым участком в новом олигонуклеотиде, и лигирование проводят с использованием ферментов. На примере, показанном на фиг.2, исходный олигонуклеотид состоит из 16 оснований, а фиксирующая цепь является комплементарной 6 основаниям, расположенным в 3'-концевом участке. Новый олигонуклеотид включает 12 оснований, а фиксирующая цепь является комплементарной 6 основаниям в 5'-концевом участке. Длина фиксирующей цепи и длина комплементарных участков не являются определяющими. Однако комплементарные участки должны быть достаточно длинными для образования устойчивого димера в условиях лигирования и одновременно достаточно короткими, чтобы исключить образование конечных молекул, содержащих слишком длинный кодирующий нуклеотид. Предпочтительно, длина комплементарных участков составляет от приблизительно 4 оснований до приблизительно 12 оснований, более предпочтительно от приблизительно 5 оснований до приблизительно 10 оснований, и наиболее предпочтительно от приблизительно 5 оснований до приблизительно 8 оснований.

В одном варианте исходный олигонуклеотид является двухцепочечным и две цепи соединены ковалентной связью. Один из способов ковалентного связывания двух цепей показан на фиг.3, причем для связывания двух цепей и функционального компонента используют связующую группу. В качестве связующей группы используют любую химическую структуру, которая включает первую функциональную группу, способную взаимодействовать со структурным фрагментом, вторую функциональную группу, способную взаимодействовать с 3'-концевым участком олигонуклеотида, и третью функциональную группу, способную взаимодействовать с 5'-концевым участком олигонуклеотида. Предпочтительно, вторая и третья функциональные группы расположены таким образом, чтобы две олигонуклеотидные цепи находились в относительной ориентации, обеспечивающей гибридизацию двух цепей. Например, связующая группа характеризуется общей структурой (I):

где А означает функциональную группу, которая образует ковалентную связь со структурным фрагментом, В означает функциональную группу, которая образует связь с 5'-концевым участком олигонуклеотида, а С означает функциональную группу, которая образует связь с 3'-концевым участком олигонуклеотида. D, F и Е означают химические группы, которые связывают функциональные группы А, С и В с атомом S, который является центральным атомом или атомами каркаса. Предпочтительно, D, Е и F каждый независимо означает цепь, такую как алкиленовая цепь или олиго(этиленгликольная) цепь, и D, Е и F могут быть одинаковыми или различными, и предпочтительно их наличие обеспечивает гибридизацию двух олигонуклеотидов и синтез функционального фрагмента. В одном варианте трехвалентная связующая группа характеризуется структурой.

В этом варианте группа NH доступна для присоединения к структурному фрагменту, в то время как концевые фосфатные группы доступны для присоединения к олигонуклеотиду.

В вариантах, в которых исходных нуклеотид является двухцепочечным, новый олигонуклеотид также является двухцепочечным. Как показано на фиг.3, одна цепь исходного нуклеотида может быть длиннее другой и таким образом включает дополнительную последовательность. В таком варианте новый олигонуклеотид включает дополнительную последовательность, которая является комплементарной с дополнительной последовательностью исходного олигонуклеотида. Гибридизация двух комплементарных дополнительных последовательностей обеспечивает расположение нового олигонуклеотида, пригодное для лигирования с исходным олигонуклеотидом. Такое лигирование проводят ферментативным методом в присутствии ДНК- или РНК-лигаз. Дополнительная последовательность нового олигонуклеотида и исходного нуклеотида предпочтительно характеризуются одинаковой длиной и состоят из 2 или более нуклеотидов, предпочтительно от 2 до приблизительно 10 нуклеотидов, более предпочтительно от 2 до приблизительно 6 нуклеотидов. В одном предпочтительном варианте новый олигонуклеотид является двухцепочечным, содержащим дополнительную последовательность в каждом концевом участке. Дополнительная последовательность в одном концевом участке является комплементарной дополнительной последовательности исходного олигонуклеотида, в то время как после лигирования нового и исходного олигонуклеотидов дополнительная последовательность в другом концевом участке превращается в дополнительную последовательность исходного олигонуклеотида в следующем цикле. В одном варианте три дополнительные последовательности все содержат от 2 до 6 нуклеотидов, а кодирующая последовательность нового олигонуклеотида содержит от 3 до 10 нуклеотидов, предпочтительно от 3 до 6 нуклеотидов. В предпочтительном варианте все дополнительные последовательности содержат по 2 нуклеотида, а кодирующие последовательности содержат 5 нуклеотидов.

В варианте, показанном на фиг.4, новая цепь содержит участок в 3'-концевом фрагменте, который является комплементарным с 3'-концевым участком исходного олигонуклеотида, при этом в обеих цепях содержатся дополнительные последовательности в 5'-концевых участках. 5'-концевые последовательности могут быть заполнены путем использования, например, ДНК-полимеразы, такой как vent-полимераза, при этом образуется двухцепочечный олигонуклеотид. Нижнюю цепь такого олигонуклеотида удаляют, а еще одну дополнительную последовательность присоединяют к 3'-концевому участку верхней цепи с использованием аналогичного метода.

Кодирующую олигонуклеотидную метку получают в результате последующего присоединения олигонуклеотидов, которые определяют каждый последующий компонент. В одном варианте способа по настоящему изобретению последующие олигонуклеотидные метки конденсируют методом ферментативного лигирования с образованием кодирующего олигонуклеотида.

Катализируемое ферментом лигирование олигонуклеотидов проводят с использованием любого фермента, который обеспечивает лигирование структурных фрагментов нуклеиновых кислот. Примеры ферментов включают лигазы, полимеразы и топоизомеразы. В предпочтительном варианте воплощения настоящего изобретения для лигирования олигонуклеотидов используют ДНК лигазу (ЕС 6.5.1.1), ДНК полимеразу (ЕС 2.7.7.7), РНК полимеразу (ЕС 2.7.7.6) или топоизомеразу (ЕС 5.99.1.2). Описание ферментов каждого класса ЕС приведено в статье Bairoch, Nucleic Acids Research, 28, 304-4 (2000).

В предпочтительном варианте используемые олигонуклеотиды по настоящему изобретению являются олигодезоксинуклеотидами, а в качестве ферментов для катализа лигирования олигонуклеотидов используют ДНК-лигазу. Чтобы лигирование происходило в присутствии лигазы, т.е. чтобы образовалась фосфодиэфирная связь между двумя олигонуклеотидами, один олигонуклеотид должен содержать свободную 5'-фосфатную группу, и другой олигонуклеотид должен содержать свободную 3'-гидроксильную группу. Примеры ДНК-лигаз по настоящему изобретению включают Т4 ДНК-лигазу, Taq ДНК-лигазу, Т4 РНК-лигазу, ДНК-лигазу (E.coli) (все лигазы выпускаются, например, фирмой New England Biolabs, MA).

Специалистам в данной области техники известно, что каждый фермент для лигирования характеризуется оптимальной активностью в особых условиях, например при определенных температуре, концентрации буферного раствора, рН и за определенный период времени. С целью обеспечения оптимального лигирования олигонуклеотидных меток все перечисленные выше условия можно изменять, например, согласно инструкциям фирмы-производителя.

Длина нового олигонуклеотида может быть любой, однако предпочтительно она составляет по крайней мере 3 нуклеотида. Более предпочтительно, новый олигонуклеотид включает 4 или более нуклеотидов. В одном варианте новый олигонуклеотид включает от 3 до приблизительно 12 нуклеотидов. Олигонуклеотиды в составе молекул в библиотеке по настоящему изобретению предпочтительно включают общую концевую последовательность, которая можно использовать в качестве праймера для ПЦР, как известно в данной области техники. Такую общую концевую последовательность можно включать в виде концевой последовательности в новом олигонуклеотиде, который присоединяют в конечном цикле синтеза библиотеки, или ее включают после завершения синтеза библиотеки, например, с использованием методов ферментативного лигирования, описанных в данном контексте.

Предпочтительный вариант способа по настоящему изобретению показан на фиг.5. Процесс начинают с использования синтетической последовательности ДНК, которая присоединена через 5'-концевой участок к связующей группе, которая содержит концевую аминогруппу. На стадии 1 такую исходную последовательность ДНК лигируют с новой последовательностью ДНК в присутствии фиксирующей цепи ДНК, ДНК-лигазы и дитиотреита в трис-буферном растворе. При этом получают меченую последовательность ДНК, которую затем непосредственно используют на следующей стадии без дополнительной очистки или очищают перед следующей стадией, например, с использованием ВЭЖХ или осаждения этанолом. На стадии 2 меченая ДНК взаимодействует с защищенной активированной аминокислотой, в данном примере с фторидом Fmoc-защищенной аминокислоты, при этом получают конъюгат защищенной аминокислоты и ДНК. На стадии 3, в полученном конъюгате аминокислоты и ДНК удаляют защитную группу, например, в присутствии пиперидина, и полученный конъюгат с удаленной защитной группой необязательно очищают, например, ВЭЖХ или осаждением этанолом. Конъюгат с удаленной защитной группой является продуктом первого цикла синтеза, который превращается в исходный материал во втором цикле, в котором присоединяют второй аминокислотный остаток к свободной аминогруппе конъюгата с удаленной защитной группой.

В вариантах, в которых ПЦР используют для амплификации кодирующих олигонуклеотидов отдельных молекул, кодирующие олигонуклеотиды предпочтительно включают последовательности праймеров для ПЦР. Например, последовательность праймера для ПЦР может быть включена в исходный олигонуклеотид перед первым циклом синтеза или вместе с введением первого нового олигонуклеотида. Кодирующий олигонуклеотид может также включать завершающую последовательность праймера для ПЦР, которая следует за кодирующими последовательностями. Завершающая последовательность может быть лигирована с кодирующим олигонуклеотидом после конечного цикла синтеза библиотеки или включена в новый олигонуклеотид, вводимый в конечном цикле. Если последовательности праймеров для ПЦР включают в новый олигонуклеотид, такие новые олигонуклеотиды предпочтительно являются более длинными по сравнению с новыми олигонуклеотидами, которые присоединяют в других циклах, поскольку они включают кодирующую последовательность и последовательность праймера для ПЦР.

Если завершающую последовательность добавляют после присоединения конечного структурного фрагмента и конечного нового олигонуклеотида, то синтез библиотеки, описанный в данном контексте, включает стадию лигирования завершающей последовательности с кодирующим олигонуклеотидом, при этом олигонуклеотидная часть практически всех членов библиотеки имеет в качестве концевого фрагмента последовательность, включающую последовательность праймера для ПЦР. Последовательности праймеров для ПЦР, пригодные для использования в библиотеках по настоящему изобретению, известны в данной области техники, пригодные праймеры и способы описаны, например, в книге Innis et al., eds., PCR Protocols: A Guide to Methods and Applications, San Diego: Academic Press (1990), содержание которой полностью включено в настоящее описание в качестве ссылки. Предпочтительно, заключительную последовательность присоединяют путем лигирования с объединенными фракциями, которые являются продуктами конечного цикла синтеза. Заключительную последовательность присоединяют с использованием ферментов, которые используют при получении библиотеки.

Как указано выше, нуклеотидную последовательность меченого олигонуклеотида как часть способа по настоящему изобретению можно определять с использованием полимеразной цепной реакции (ПЦР).

Меченый олигонуклеотид включает полинуклеотиды, которые определяют фрагменты, входящие в состав функционального фрагмента, как описано выше. Последовательность нуклеиновой кислоты меченого олигонуклеотида определяют с помощью реакции ПЦР олигонуклеотидной метки следующим образом. Соответствующий образец смешивают с парой праймеров ПЦР, причем каждый член пары характеризуется предварительно выбранной последовательностью нуклеотидов. Пара праймеров ПЦР инициирует реакцию наращивания цепи праймера при гибридизации с участком связывания праймера в кодирующем меченом олигонуклеотиде. Участок связывания праймера ПЦР предпочтительно включен в кодирующий меченый олигонуклеотид. Например, участок связывания праймера ПЦР включен в исходный меченый олигонуклеотид, а участок связывания второго праймера ПЦР включен в конечный меченый олигонуклеотид. В другом варианте участок связывания второго праймера ПЦР включен в заключительную последовательность, как описано в данном контексте. В предпочтительных вариантах участок связывания праймера ПЦР составляет по крайней мере приблизительно 5, 7, 10, 13, 15, 17, 20, 22 или 25 нуклеотидов.

Реакцию ПЦР проводят при смешении пары праймеров ПЦР, предпочтительно в предварительно определенном количестве, с нуклеиновыми кислотами кодирующего олигонуклеотида, предпочтительно в предварительно определенном количестве, в буферном растворе ПЦР с образованием реакционной смеси ПЦР. Смесь помещают в термический циклизатор и проводят ряд циклов, число которых обычно предварительно определяют, при этом образуется продукт реакции ПЦР. Количество продукта должно быть достаточным, чтобы выделить его в достаточном количестве для определения последовательности ДНК.

ПЦР обычно проводят в термическом циклизаторе, т.е. при повторном увеличении и снижении температуры реакционной смеси ПЦР в пределах температурного интервала, нижняя граница которого составляет от приблизительно 30°С до приблизительно 55°С, а верхняя граница составляет от приблизительно 90°С до приблизительно 100°С. Повышение и снижение температуры можно проводить в непрерывном режиме, но предпочтительно циклы проводят через определенные периоды времени при определенной температуре, при которой обеспечиваются оптимальные условия синтеза полинуклеотидов, денатурации и гибридизации.

Реакцию ПЦР проводят с использованием любого пригодного способа. В основном ее проводят в буферном водном растворе, т.е. в буферном растворе ПЦР, предпочтительно при рН от 7 до 9, предпочтительно в присутствии молярного избытка праймера. Значительный молярный избыток праймера необходим для повышения эффективности процесса.

Буферный раствор ПЦР содержит также термостабильные трифосфаты дезоксирибонуклеотидов (субстраты синтеза полинуклеотидов) dАТФ, dЦТФ, dГТФ и dТТФ и полимеразу, все компоненты в соответствующих количествах, пригодных для реакции наращивания цепи праймера (синтез полинуклеотидов). Полученный раствор (смесь для ПЦР) нагревают при приблизительно 90-100°С в течение от приблизительно 1 до 10 мин, предпочтительно в течение от 1 до 4 мин. После нагревания раствор охлаждают до 54°С, которая является предпочтительной для гибридизации праймера. Реакцию синтеза проводят при температуре от комнатной температуры до температуры, выше которой снижается эффективность действия полимеразы (индуцирующего агента). Таким образом, например, если используют ДНК-полимеразу, то температура обычно не превышает приблизительно 40°С. Циклы в термическом циклизаторе повторяют до образования требуемого количества продукта ПЦР. Пример буферного раствора ПЦР включает следующие реагенты: 50 Мм КСl, 10 Мм трис-HCl, рН 8,3, 1,5 Мм MgCl2, 0,001 мас/об.% желатины, 20 мкм dАТФ, 200 мкм dТТФ, 200 мкм dЦТФ, 200 мкм dГТФ и 2,5 ед. полимеразы ДНК I (Thermus aquaticus (Taq)) на 100 мкл буферного раствора.

Пригодные ферменты для наращивания последовательностей праймеров включают, например, ДНК полимеразу I Е.соli, ДНК полимеразу Taq, фрагмент Кленова ДНК полимеразы I E.coli, T4 ДНК-полимеразу, другие доступные ДНК-полимеразы, обратную транскриптазу и другие ферменты, включая термоустойчивые ферменты, которые способствуют расположению нуклеотидов соответствующим образом с образованием продуктов наращивания цепи праймеров, комплементарных каждой цепи нуклеиновой кислоты. В основном синтез инициируют в 3'-концевом участке каждого праймера и наращивание цепи происходит в 5'-направлении вдоль цепи матрицы до завершения синтеза с образованием молекул различной длины.

Синтезированная цепь ДНК и комплементарная ей цепь образуют двухцепочечную молекулу, которую используют на следующих стадиях анализа.

Способы амплификации ПЦР подробно описаны в патентах США

№№4683192, 4683202, 4800159 и 4965188, а также в книгах PCR Technology: Principles and Applications for DNA Amplifications, H. Erich, ed., Stockton Press, New York (1989) и Innis et al., eds., PCR Protocols: A Guide to Methods and Applications, Academic Press, San Diego, Calif. (1990). Содержание всех документов полностью включено в настоящее описание в качестве ссылок.

Термин "полинуклеотид", использованный в данном контексте по отношению к праймерам, зондам и фрагментам или сегментам нуклеиновых кислот, которые синтезируются путем наращивания праймера, означает молекулу, включающую два или более дезоксирибонуклеотидов, предпочтительно более трех.

Термин "праймер", использованный в данном контексте, означает полинуклеотид, полученный путем очистки рестрикционного гидролизата нуклеиновой кислоты или путем синтеза, который действует в качестве точки инициации синтеза нуклеиновой кислоты в условиях, в которых индуцируется синтез продукта наращивания праймера, комплементарного цепи нуклеиновой кислоты, т.е. в присутствии нуклеотидов и агента полимеризации, такого как ДНК-полимераза, обратная транскриптаза и т.п. при пригодной температуре и величине рН. Для достижения максимальной эффективности праймер предпочтительно является одноцепочечным, однако в другом варианте является двухцепочечным. В случае двухцепочечного праймера его перед использованием для получения продуктов наращивания сначала обрабатывают для отделения от комплементарной цепи. Предпочтительно праймер предпочтительно является полидезоксирибонуклеотидом. Праймер может быть достаточно длинным, чтобы обеспечивать запуск синтеза продуктов наращивания в присутствии агентов полимеризации. Точная длина праймеров зависит от многих факторов, включая температуру и источник праймера.

Праймеры, используемые в способе по настоящему изобретению, должны быть в "значительной" степени комплементарными другим цепям каждой специфической последовательности, предназначенной для амплификации. Это означает, что праймер должен быть в значительной степени комплементарным, чтобы обеспечивать точную гибридизацию только с соответствующей цепью матрицы. Следовательно, последовательность праймера может отражать или не отражать точную последовательность матрицы.

Полинуклеотидные праймеры получают с использованием любого пригодного способа, такого как, например, фосфотриэфирный или фосфодиэфирный способы, описанные в статье Narang et al., Meth. Enzymol., 68, 90 (1979), патентах США №№4356270, 4458066, 4416988 и 4293652, а также в статье Brown et al., Meth. Ezymol., 68, 109 (1979). Содержание всех указанных документов полностью включено в объем настоящего изобретения в качестве ссылок.

После амплификации кодирующего меченого олигонуклеотида его последовательность и однозначный состав выбранной молекулы определяют с использованием анализа последовательностей нуклеиновых кислот, известной методики секвенирования последовательностей нуклеотидов. Анализ последовательностей нуклеиновых кислот проводят при комбинации (а) физико-химических методов, основанных на гибридизации или денатурации цепи зонда плюс цепи комплементарной ему мишени, и (б) ферментативных реакций с участием полимеразы.

Настоящее изобретение относится также к соединениям, которые получают согласно способам по настоящему изобретению, и к наборам таких соединений, как в виде отдельных соединений, так и в виде объединения соединений, которые образуют библиотеку химических структур. Соединения по настоящему изобретению включают соединения формулы:

где Х означает функциональный компонент, содержащий один или более структурных фрагментов; Z означает олигонуклеотид, присоединенный по 3'-концевому участку к В, a Y означает олигонуклеотид, который присоединен по 5'-концевому участку к С. А означает функциональную группу, образующую ковалентную связь с X; В означает функциональную группу, образующую 3'-связь с Z, а С означает функциональную группу, образующую 5'-связь с Y. D, F и Е означают химические группы, которые связывают функциональные группы А, С и В с S, который означает атом или молекулярный каркас. Предпочтительно, D, Е и F каждый независимо означает цепь атомов, таких как алкиленовая цепь или олиго(этиленгликольная) цепь. D, Е и F могут быть одинаковыми или различными, и предпочтительно их наличие обеспечивает гибридизацию двух олигонуклеотидов и синтез функционального фрагмента.

Предпочтительно, Y и Z в значительной степени являются комплементарными друг к другу и расположены в соединении таким образом, чтобы способствовать образованию пар Уотсона-Крика и образованию дуплекса в пригодных условиях. Длина Y и Z является одинаковой или различной. Предпочтительно, длина Y и Z является одинаковой, или один из Y и Z длиннее другого на 1-10 оснований. В предпочтительном варианте длина каждого Y и Z составляет 10 или более оснований, и эти фрагменты содержат комплементарные участки, включающие от 10 и более оснований. Более предпочтительно, Y и Z в значительной степени комплементарны друг другу на протяжении всей длины, т.е. они содержат не более одного ошибочного несовпадения оснований на каждые 10 пар оснований. Более предпочтительно, Y и Z комплементарны на протяжении всей длины, т.е. за исключением дополнительного участка в Y или Z, цепи гибридизуются с образованием пар Уотсона-Крика и не содержат ошибочных несовпадений на протяжении всей длины.

S означает отдельный атом или молекулярный каркас. Например, S означает атом углерода, атом бора, атом азота или атом фосфора, или многоатомный каркас, такой как фосфатная группа или циклическая группа, такая как циклоалкил, циклоалкенил, гетероциклоалкил, гетероциклоалкенил, арил или гетероарил. В одном варианте связующая группа означает группу структуры

где каждый n, m и р независимо равен целому числу от 1 до приблизительно 20, предпочтительно от 2 до 8 и более предпочтительно от 3 до 6. В другом варианте связующая группа означает группу структуры:

В одном варианте библиотеки по настоящему изобретению включают молекулы, содержащие функциональный компонент, содержащий структурные фрагменты, причем каждый функциональный компонент эффективно связан с кодирующим олигонуклеотидом. Последовательность нуклеотидов в кодирующем олигонуклеотиде определяет структурные фрагменты, присутствующие в функциональном компоненте, а в некоторых вариантах определяет порядок их присоединения или расположение. Способ по настоящему изобретению характеризуется преимуществом, которое заключается в том, что метод конструирования функционального компонента и олигонуклеотида можно проводить в одной и той же реакционной среде, предпочтительно в водной среде, что таким образом упрощает способ получения библиотеки по сравнению со способами, известными из предшествующего уровня техники. В некоторых вариантах, в которых стадии лигирования олигонуклеотида и стадии присоединения структурных фрагментов проводят в водной среде, причем для каждой реакции существуют различное оптимальное значение рН. В таких вариантах реакцию присоединения структурных фрагментов проводят при пригодных рН и температуре в пригодном водном буфером растворе. Затем буферный раствор можно заменить на водный буферный раствор, характеризующийся пригодным рН для лигирования олгонуклеотида.

Одно из преимуществ способов по настоящему изобретению заключается в том, что их можно использовать для получения библиотеки, включающей огромное число соединений. Способность амплифицировать последовательности кодирующих олигинуклеотидов с использованием известных способов, таких как полимеразная цепная реакция (ПЦР), означает, что выбранные молекулы можно идентифицировать с использованием лишь относительно малого числа копий. Это позволяет использовать чрезвычайно многочисленные библиотеки, которые вследствие их высокой степени сложности включают либо относительно малое количество копий каждого члена библиотеки либо требуют использования чрезвычайно больших объемов. Например, библиотека, включающая 108 отдельных структур, в которых каждая структура содержится в виде 1×1012 копий (приблизительно 1 пмоль), требует приблизительно 100 л раствора с эффективной концентрацией 1 мкм. Для той же библиотеки, если каждый член представлен 1000000 копиями, то требуется объем 100 мкл с эффективной концентрацией 1 мкм.

В предпочтительном варианте библиотека включает от приблизительно 103 до приблизительно 1015 копий каждого члена библиотеки. Вследствие различий в эффективности синтеза различных членов библиотеки в любой данной библиотеке члены могут быть представлены различных числом копий. Следовательно, хотя число копий каждого члена, теоретически присутствующего в библиотеке, может быть одинаковым, реальное число копий любого члена данной библиотеки не зависит от числа копий любого другого члена. Более предпочтительно, библиотеки соединений по настоящему изобретению включают по крайней мере приблизительно 105, 106 или 107 копий каждого члена библиотеки или практически всех членов библиотеки. Термин "практически все" члены библиотеки означает по крайней мере приблизительно 85% членов библиотеки, предпочтительно по крайней мере приблизительно 90% или более предпочтительно по крайней мере приблизительно 95% членов библиотеки.

Библиотека предпочтительно включает достаточное число копий каждого члена, чтобы обеспечить выполнение множества экспериментов (т.е. 2 или более) по отбору соединений в отношении биологической мишени, при этом после завершения конечного числа экспериментов по отбору остается достаточное количество связанных молекул после последнего круга выбора для проведения амплификации олигонуклеотидной метки в остальных молекулах и, следовательно, для идентификации функциональных компонентов связывающих молекул. Схема такого процесса отбора показана на фиг.6, где 1 и 2 означают членов библиотеки, В означает молекулу-мишень, а Х означает остаток, эффективно связанный с В, что позволяет удалить В из среды для отбора. В данном примере соединение 1 связано с В, в то время как соединение 2 не связано с В. Процесс отбора, как показано в эксперименте 1, включает (I) контактирование библиотеки, включающей соединения 1 и 2, с В-Х в условиях, пригодных для связывания соединения 1 с В, (II) удаление несвязанного соединения 2, (III) диссоциацию соединения 1 от В и удаление ВХ из реакционной среды. Результатом эксперимента 1 является отбор молекул, обогащенных соединением 1 по сравнению с соединением 2. Следующие эксперименты, включающие стадии I-III, приводят к дальнейшему обогащению соединением 1 по сравнению с соединением 2. Хотя на фиг.6 показаны 3 эксперимента, на практике можно выполнить любое число экспериментов, например от 1 до 10 экспериментов, при этом достигается требуемая степень обогащения связывающимися молекулами по сравнению с несвязывающимися.

В варианте, показанном на фиг.6, амплификацию (синтез большего числа копий) соединений, оставшихся после любого из экспериментов отбора, не проводят. Такая амплификация приводит к образованию смеси соединений, не совместимой с относительными количествами соединений, оставшихся после отбора. Такая несовместимость возникает вследствие того, что синтез некоторых соединений проходит с более высоким выходом по сравнению с другими соединениями, и, следовательно, амплификация будет проходить не пропорционально их присутствию после отбора. Например, если соединение 2 синтезируется с большим выходом, чем соединение 2, то амплификация молекул, оставшихся после эксперимента 2, приведет к непропорциональной амплификации соединения 2 по сравнению с соединением 1, и к образованию смеси соединений с значительно меньшим (или с отсутствием) обогащением соединения 1 по сравнению с соединением 2.

В одном варианте мишень иммобилизуют на твердом носителе с использованием любой известной методики иммобилизации. В качестве твердого носителя используют, например, водонерастворимую матрицу, расположенную внутри хроматографической колонки или мембраны. Кодирующую библиотеку наносят на водонерастворимую матрицу, расположенную внутри хроматографической колонки. Затем колонку промывают для удаления неспецифически связанных веществ. Соединения, связанные с мишенью, диссоциируют изменением рН, концентрации соли, концентрации органического растворителя или с использованием других методов, таких как конкурентное связывание известного лиганда с мишенью.

В другом варианте мишень находится в растворе в свободном виде, ее инкубируют в присутствии кодирующей библиотеки. Соединения, связанные с мишенью (называемые в данном контексте "лигандами"), выделяют методом разделения по размерам, таким как гельфильтрация или ультрафильтрация. В одном варианте смесь кодированных соединений и биомолекулу-мишень пропускают через молекулярно-ситовую хроматографическую колонку (гель-фильтрация), на которой происходит разделение любых комплексов лиганд-мишень от несвязанных соединений. Комплексы лиганд-мишень переносят на обращенно-фазовую хроматографическую колонку, на которой происходит диссоциация лигандов от мишени. Затем диссоциированные лиганды анализируют ПЦР амплификацией и секвенированием кодирующего олигонуклеотида. Такой подход является прежде всего преимущественным в случаях, когда иммобилизация мишени приводит к потере ее активности.

Хотя отдельные лиганды идентифицируют по описанным выше методикам, можно использовать различные уровни анализа для исследования взаимосвязи структуры с активностью и для дальнейшей оптимизации аффинности, специфичности и биоактивности лиганда. Для лигандов, полученных из одного каркаса, используют трехмерное молекулярное моделирование для определения важных структурных характеристик, общих для лигандов, получая таким образом семейства низкомолекулярных лигандов, которые предположительно связываются с одним участком биомолекулы-мишени.

Используют ряд подходов к анализу, позволяющих получить лиганды с высоким сродством к одной мишени, но значительно более слабым сродством к другой близкой по строению мишени. Один подход к анализу заключается в идентификации лигандов для обеих биомолекул в параллельных экспериментах и в последовательном удалении общих лигандов при перекрестном сравнении. По данной методике, лиганды для каждой биомолекулы идентифицируют отдельно, как описано выше. Такой метод можно использовать как в присутствии иммобилизованных биомолекул-мишеней, так и в присутствии биомолекул-мишеней в растворе.

Для иммобилизованных биомолекул-мишеней другая стратегия заключается во включении дополнительной стадии перед отбором, на которой удаляются из библиотеки все лиганды, которые не связываются с биомолекулой-немишенью из библиотеки. Например, первая биомолекула контактирует с кодирующей библиотекой, как описано выше. Затем соединения, которые не связываются с первой биомолекулой, отделяют от всех образующихся комплексов "первая биомолекула-лиганд". Затем вторая биомолекула контактирует с соединениями, которые не связываются с первой биомолекулой. Соединения, которые связываются со второй биомолекулой, могут быть идентифицированы, как описано выше, и характеризуются более сильным сродством ко второй биомолекуле по сравнению с первой.

Лиганд для биомолекулы с неизвестной функцией, который идентифицируют по методике, описанной выше, можно использовать для определения биологической функции биомолекулы, что является преимуществом, поскольку хотя все еще существует необходимость в выявлении последовательности новых генов, функции белков, закодированных в этой последовательности, и ценность таких белков в качестве мишеней для поиска и разработки новых лекарственных средств с трудом поддаются определению и, возможно, представляют основной недостаток при применении генетической информации для лечения заболеваний. Мишень-специфичные лиганды, полученные способом по настоящему изобретению, можно эффективно использовать для биологических анализов на основе цельных клеток или на соответствующих моделях животных, т.е. для исследования функции белка-мишени и ценности белка-мишени для применения в медицине. Данный подход подтверждает также тот факт, что мишень прежде всего пригодна для поиска низкомолекулярных лекарственных средств.

В одном варианте одно или более соединений в составе библиотеки по настоящему изобретению являются лигандами для определенной биомолекулы. Способность таких соединений связываться с биомолекулами оценивают методом анализа in vitro. Предпочтительно, функциональные фрагменты связывающихся соединений синтезируют без олигонуклеотидной метки или связующей группы, и оценивают способность таких функциональных компонентов связываться с биомолекулой.

Влияние связывания функциональных компонентов с биомолекулой на функцию биомолекулы оценивают также с методом анализа in vitro в отсутствии или в присутствии клеток. В случае биомолекулы с известной функцией анализ включает сравнение активности биомолекулы в присутствии и отсутствии лиганда, например, прямым измерением активности, такой как ферментативная активность, или косвенным анализом, таким как оценка влияния биомолекулы на клеточную функцию. В случае биомолекулы с неизвестной функцией клетку, которая экспрессирует биомолекулу, вводят в контакт с лигандом и оценивают влияние лиганда на жизнеспособность, функцию, фенотип и/или экспрессию гена клеткой. Анализ in vitro включает, например, оценку апоптоза клеток, клеточной пролиферации или репликации вируса. Например, если биомолекулой является белок, экспрессируемый вирусом, то клетку, инфицированную вирусом, вводят в контакт с лигандом для белка. Затем оценивают влияние связывания лиганда с белком на жизнеспособность вируса.

Лиганд, идентифицированный способом по настоящему изобретению, оценивают также на модели in vivo или при испытании на пациентах. Например, действие лиганда оценивают при испытании на животных или в организме, в котором образуется эта биомолекула. При этом определяют любые изменения состояния здоровья (например, развитие болезни) у животного или в организме пациента.

В случае биомолекулы, такой как белок или нуклеиновая кислота, с неизвестной функцией, влияние лиганда, который связывается с биомолекулой, на клетки или организм, в которых образуется биомолекула, позволяет получить информацию о биологической функции биомолекулы. Например, ингибирование конкретного клеточного процесса в присутствии лиганда свидетельствует о том, что процесс зависит, по крайней мере частично, от функции биомолекулы.

Лиганды, идентифицированные с использованием способов по настоящему изобретению, используют также в качестве аффинных реагентов для биомолекулы, с которой они связываются. В одном варианте такие лиганды используют для аффинной очистки биомолекулы, например, при аффинной хроматографии раствора, включающего биомолекулу, с использованием твердой фазы, на которой иммобилизованы один или более таких лигандов.

Настоящее изобретение иллюстрируется следующими примерами, которые не ограничивают его объем. Содержание всех ссылок, патентов и опубликованных заявок на выдачу патента, которые цитируются в описании настоящего изобретения, а также фигуры и перечень последовательностей включены в объем настоящего изобретения в качестве ссылок.

Примеры

Пример 1. Синтез и характеристика библиотеки, содержащей 105 членов

Синтез библиотеки, включающей порядка 105 отдельных членов, проводят с использованием следующих реагентов:

Соединение 1:

Однобуквенный код структуры дезоксирибонуклеотидов:

А означает аденозин

С означает цитидин

G означает гуанозин

Т означает тимидин.

Предшественники фрагментов:

Буферный раствор 1Х для лигазы: 50 мМ Трис, рН 7,5, 10 мМ дитиотрейтол, 10 мМ МgСl2, 2,5 мМ АТР, 50 мМ NaCl.

Буферный раствор 10Х для лигазы: 500 мМ Трис, рН 7,5, 100 мМ дитиотрейтол, 100 мМ MgCl2, 25 мМ АТР, 500 мМ NaCl.

Цикл 1

В каждую из 12 пробирок для ПЦР добавляют по 50 мкл 1 мМ раствора соединения 1 в воде, 75 мкл 0,80 мМ раствора одного из нуклеотидов 1.1-1.12, 15 мкл буферного раствора 10X для лигазы и 10 мкл деионизированной воды. Пробирки нагревают при 95°С в течение 1 мин и затем охлаждают до 16°С в течение 10 мин. В каждую пробирку добавляют по 5000 единиц Т4 ДНК-лигазы (2,5 мкл раствора 2000000 ед/мл, фирмы New England Biolabs, номер по каталогу М0202) в 50 мкл буферного раствора 1Х для лигазы и полученный раствор инкубируют в течение 16 ч при 16°С.

После лигирования образцы переносят в пробирки Эппендорфа объемом 1,5 мл и обрабатывают 20 мкл 5М водного раствора NaCl и 500 мкл охлажденного (-20°С) этанола, выдерживают при -20°С в течение 1 ч. После центрифугирования супернатант удаляют и осадок промывают 70% водным раствором этанола при -20°С. Каждую порцию осадка растворяют в 150 мкл 150 мМ буферного раствора, содержащего борат натрия, рН 9,4.

Концентрированные растворы, содержащие по одному из предшественников фрагментов ВВ1-ВВ12, N,N-диизопропилэтаноламин и гексафторфосфат O-(7-азабензотриазол-1-ил)-1,1,3,3-тетраметилурония, причем концентрация каждого компонента составляет 0,25 М, готовят в ДМФА и перемешивают при комнатной температуре в течение 20 мин. Растворы предшественников структурных фрагментов добавляют в каждый надосадочный раствор, описанный выше, и при этом получают 10-кратный избыток структурного фрагмента по отношению к связующей группе. Полученные растворы перемешивают. Через 20 мин в реакционную смесь добавляют еще 10 экв. предшественника структурного фрагмента и через 40 мин еще 10 экв. Конечная концентрация ДМФА в реакционной смеси составляет 22%. Реакционные смеси перемешивают в течение ночи при 4°С. Ход реакции контролируют методом ОФ-ВЭЖХ (элюент: 50 мМ водный раствор ацетата тетраэтиламмония (рН 7,5) и ацетонитрил, градиент от 2 до 46% ацетонитрила в течение 14 мин). Реакцию останавливают при ацилировании приблизительно 95% исходного материала (связующей группы). После ацилирования реакционные смеси объединяют и лиофилизируют досуха. Лиофилизованный материал очищают ВЭЖХ и фракции, соответствующие библиотеке (ацилированный продукт), объединяют и лиофилизуют.

Библиотеку растворяют в 2,5 мл 0,01 М буферного раствора, содержащего фосфат натрия (рН 8,2), и добавляют 0,1 мл пиперидина (4 об.%). Добавление пиперидина приводит к образованию осадка (опалесцирующий раствор), который не растворяется при перемешивании. Реакционные смеси перемешивают при комнатной температуре в течение 50 мин, и затем опалесцирующий раствор центрифугируют (14000 об/мин), супернатант удаляют с использованием дозатора на 200 мл и осадок ресуспендируют в 0,1 мл воды. Водный слой объединяют с супернатантом и осадок отбрасывают. Библиотеку с удаленными защитными группами осаждают из раствора при добавлении избытка этанола, охлажденного на льду, при этом конечная концентрация этанола в реакционной смеси составляет 70 об.%. После центрифугирования водно-этанольной смеси получают белый осадок, содержащий библиотеку. Осадок промывают один раз охлажденным 70% водным этанолом. После удаления растворителя осадок сушат на воздухе (приблизительно 5 мин) для удаления следов этанола и затем используют в цикле 2. Олигонуклеотиды и соответствующие предшественники структурных фрагментов, использованные в эксперименте 1, приведены в таблице 1 ниже.

Таблица 1 Предшественник фрагмента Меченый олигонуклеотид ВВ1 1.11 ВВ2 1.6 ВВ3 1.2 ВВ4 1.8 ВВ5 1.1 ВВ6 1.10 ВВ7 1.12 ВВ8 1.5 ВВ9 1.4 ВВ10 1.3 ВВ11 1.7 ВВ12 1.9

Циклы 2-5

Для каждого из этих циклов объединенный раствор, полученный в предыдущем цикле, разделяют на 12 равных аликвотных частей по 50 мкл каждая и помещают в пробирки для ПЦР. В каждую пробирку добавляют раствор, содержащий олигонуклеотидную метку, и проводят лигирование, очистку и ацилирование, как описано в цикле 1, за исключением того, что в циклах 3-5 не проводят стадию очистки ВЭЖХ, описанную для цикла 1. Соответствие между олигонуклеотидной меткой и предшественниками структурных фрагментов, использованных в циклах 2-5, представлено в таблице 2.

Продукты, полученные в цикле 5, лигируют с замыкающим праймером, показанным ниже, с использованием метода, описанного выше для лигирования олигонуклеотидных меток.

5'-PO3-GGCACATTGATTTGGGAGTCA

GTGTAACTAAACCCTCAGT- РО3-5'

Таблица 2 Предшественник структ. фрагмента Цикл 2 Метка Цикл 3 Метка Цикл 4 Метка Цикл 5 Метка ВВ1 2.7 3.7 4.7 5.7 ВВ2 2.8 3.8 4.8 5.8 ВВ3 2.2 3.2 4.2 5.2 ВВ4 2.20 3.10 4.10 5.10 ВВ5 2.1 3.1 4.1 5.1 ВВ6 2.12 3.12 4.12 5.12 ВВ7 2.5 3.5 4.5 5.5 ВВ8 2.6 3.6 4.6 5.6 ВВ9 2.4 3.4 4.4 5.4 ВВ10 2.3 3.3 4.3 5.3 ВВ11 2.9 3.9 4.9 5.9 ВВ12 2.11 3.11 4.11 5.11

Результаты

Методика синтеза, описанная выше, предназначена для получения библиотеки, включающей 125 (приблизительно 249000) различных структур. Результаты синтеза контролируют с использованием гель-электрофореза продукта, полученного в каждом цикле. Результаты каждого из 5 циклов и лигирование конечной библиотеки с заключительным праймером показано на фиг.7. Соединение, обозначенное "головной фрагмент", означает соединение 1. На фигуре показано, что каждый цикл приводит к ожидаемому повышению молекулярной массы и что продукты в каждом цикле характеризуются высокой гомогенностью по молекулярной массе.

Пример 2. Синтез и характеристика библиотеки, содержащей 108 членов

Синтез библиотеки, включающей порядка 108 отдельных членов, проводят с использованием следующих реагентов:

Соединение 2:

Однобуквенный код структуры дезоксирибонуклеотидов:

А означает аденозин

С означает цитидин

G означает гуанозин

Т означает тимидин.

Предшественники фрагментов:

Таблица 7
Соответствие между структурными фрагментами и олигонуклеотидными метками для циклов 1-4
Стр. фрагмент Цикл 1 Цикл 2 Цикл 3 Цикл 4 ВВ1 1.1 2.1 3.1 4.1 ВВ2 1.2 2.2 3.2 4.2 ВВ3 1.3 2.3 3.3 4.3 ВВ4 1.4 2.4 3.4 4.4 ВВ5 1.5 2.5 3.5 4.5 ВВ6 1.6 2.6 3.6 4.6 ВВ7 1.7 2.7 3.7 4.7 BB8 1.8 2.8 3.8 4.8 BB9 1.9 2.9 3.9 4.9 BB10 1.10 2.10 3.10 4.10 ВВ11 1.11 2.11 3.11 4.11 ВВ12 1.12 2.12 3.12 4.12 ВВ13 1.13 2.13 3.13 4.13 ВВ14 1.14 2.14 3.14 4.14 ВВ15 1.15 2.15 3.15 4.15 ВВ16 1.16 2.16 3.16 4.16 ВВ17 1.17 2.17 3.17 4.17 ВВ18 1.18 2.18 3.18 4.18 ВВ19 1.19 2.19 3.19 4.19 ВВ20 1.20 2.20 3.20 4.20 ВВ21 1.21 2.21 3.21 4.21 ВВ22 1.22 2.22 3.22 4.22 ВВ23 1.23 2.23 3.23 4.23 ВВ24 1.24 2.24 3.24 4.24 ВВ25 1.25 2.25 3.25 4.25 ВВ26 1.26 2.26 3.26 4.26 ВВ27 1.27 2.27 3.27 4.27 ВВ28 1.28 2.28 3.28 4.28 ВВ29 1.29 2.29 3.29 4.29 ВВ30 1.30 2.30 3.30 4.30 ВВ31 1.31 2.31 3.31 4.31 ВВ32 1.32 2.32 3.32 4.32 ВВ33 1.33 2.33 3.33 4.33 ВВ34 1.34 2.34 3.34 4.34 ВВ35 1.35 2.35 3.35 4.35 ВВ36 1.36 2.36 3.36 4.36 ВВ37 1.37 2.37 3.37 4.37 ВВ38 1.38 2.38 3.38 4.38 ВВ39 1.39 2.39 3.39 4.39 ВВ40 1.40 2.40 3.40 4.40 ВВ41 1.41 2.41 3.41 4.41 ВВ42 1.42 2.42 3.42 4.42 ВВ43 1.43 2.43 3.43 4.43 ВВ44 1.44 2.44 3.44 4.44 ВВ45 1.45 2.45 3.45 4.45 ВВ46 1.46 2.46 3.46 4.46 ВВ47 1.47 2.47 3.47 4.47 ВВ48 1.48 2.48 3.48 4.48 ВВ49 1.49 2.49 3.49 4.49 ВВ50 1.50 2.50 3.50 4.50 ВВ51 1.51 2.51 3.51 4.51 ВВ52 1.52 2.52 3.52 4.52 BB53 1.53 2.53 3.53 4.53 BB54 1.54 2.54 3.54 4.54 BB55 1.55 2.55 3.55 4.55 BB56 1.56 2.56 3.56 4.56 BB57 1.57 2.57 3.57 4.57 BB58 1.58 2.58 3.58 4.58 BB59 1.59 2.59 3.59 4.59 BB60 1.60 2.60 3.60 4.60 ВВ61 1.61 2.61 3.61 4.61 ВВ62 1.62 2.62 3.62 4.62 ВВ63 1.63 2.63 3.63 4.63 ВВ64 1.64 2.64 3.64 4.64 ВВ65 1.65 2.65 3.65 4.65 ВВ66 1.66 2.66 3.66 4.66 ВВ67 1.67 2.67 3.67 4.67 ВВ68 1.68 2.68 3.68 4.68 ВВ69 1.69 2.69 3.69 4.69

1Х буферный раствор для лигазы: 50 мМ Трис, рН 7,5, 10 мМ дитиотриит, 10 мМ MgCl2, 50 мМ NaCl.

10Х буферный раствор для лигазы: 500 мМ Трис, рН 7,5, 100 мМ дитиотриит, 100 мМ MgCl2, 20 мМ АТР, 500 мМ NaCl.

Присоединение водорастворимого спейсера к соединению 2

В раствор соединения 2 (60 мл, 1 мМ) в буферном растворе, содержащем борат натрия (150 мМ, рН 9,4), охлажденном до 4°С, добавляют 40 экв. N-Fmос-15-амино-4,7,10,13-тетраоксаоктадекановой кислоты (S-Ado) в М,М-диметилформамиде (ДМФА, 16 мл, 0,15 М) и 40 экв. гидрата хлорида 4-(4,6-диметокси[1.3.5]триазин-2-ил)-4-метилморфолиния (DMTMM) в воде (9,6 мл, 0,25 М). Смесь осторожно встряхивают в течение 2 ч при 4°С, затем добавляют еще 40 экв. S-Ado и DMTMM, смесь встряхивают в течение 16 ч при 4°С.

После ацилирования добавляют 0,1 Х объемов 5 М водного раствора NaCl и 2,5Х объемов охлажденного (-20°С) этанола и смесь выдерживают при -20°С в течение по крайней мере в течение 1 ч. Затем смесь центрифугируют в течение 15 мин при 14000 об/мин при 4°С, при этом получают осадок белого цвета, который промывают охлажденным EtOH и затем подвергают лиофильной сушке при комнатной температуре в течение 30 мин. Твердое вещество растворяют в 40 мл воды и очищают обращенно-фазовой ВЭЖХ на колонке Waters Xterra RP18 (элюент: градиент двухфазной подвижной фазы - 50 мМ водный буферный раствор, содержащий ацетат триэтиламмония, при рН 7,5 и раствор 99% ацетонитрил/1% вода. Очищенный материал концентрируют лиофильно и полученный остаток растворяют в 5 мл воды. К раствору добавляют 0,1Х объем пиперидина и смесь осторожно встряхивают в течение 45 мин при комнатной температуре. Продукт очищают осаждением из этанола, как описано выше, и выделяют центрифугированием. Полученный осадок дважды промывают охлажденным EtOH и подвергают лиофильной сушке и в результате получают очищенное соединение 3.

Цикл 1

В каждую лунку 96-луночного планшета добавляют по 12,5 мкл 4 мМ раствора соединения 3 в воде, 100 мкл 1 мМ раствора одного из олигонуклеотидов 1.1-1.96, как показано в таблице 3, приведенной в графической части (молярное соотношение соединения 3 к олигонуклеотиду составляет 1:2). Планшеты нагревают при 95°С в течение 1 мин и затем охлаждают до 16°С в течение 10 мин. В каждую лунку добавляют 10 мкл буферного раствора 10Х для лигазы, 30 единиц ДНК Т4 лигазы (1 мкл раствора 30 ед/мкл раствор, фирмы Fermentas Life Science, номер по каталогу EL0013), 76,5 мкл воды, и полученный раствор инкубируют в течение 16 ч при 16°С.

После реакции лигирования в каждую лунку добавляют 20 мкл 5М водного раствора NaCl, 500 мкл охлажденного (-20°С) этанола, и выдерживают при -20°С в течение 1 ч. Планшеты центрифугируют в течение 1 ч при 3200 g на центрифуге устройства Beckman Coulter Allegra 6R с использованием Beckman Microplus Carriers. Супернатант осторожно удаляют при переворачивании планшета и осадок промывают 70% водным раствором этанола при -20°С. Каждую порцию осадка растворяют в буферном растворе, содержащем борат натрия (50 мкл, 150 мМ, рН 9,4), при этом получают раствор с концентрацией 1 мМ, который охлаждают до 4°С.

В каждый раствор добавляют по 40 экв. одного из 96 предшественников структурных фрагментов в ДМФА (13 мкл, 0,15 мМ), 40 экв. DMTMM в воде (8 мкл, 0,25 М) и раствор осторожно встряхивают при 4°С. Через 2 ч добавляют еще 40 экв. одного из предшественников структурных фрагментов и DMTMM, полученные растворы осторожно встряхивают в течение 16 ч при 4°С. После ацилирования в каждый раствор добавляют 10 экв. N-гидроксисукцинимидного эфира уксусной кислоты в ДМФА (2 мкл, 0,25 М) и смесь осторожно встряхивают в течение 10 мин.

После ацилирования 96 реакционных смесей объединяют и добавляют 0,1 объема 5 М водного раствора NaCl и 2,5 объемов охлажденного абсолютизированного этанола, смесь выдерживают при -20°С в течение по крайней мере 1 ч. Затем смесь центрифугируют. После центрифугирования удаляют максимально возможное количество супернатанта с использованием микродозатора, при этом получают осадок, который промывают охлажденным этанолом и снова центрифугируют. Супернатант удаляют с использованием дозатора объемом 200 мкл. В пробирку добавляют 70% охлажденный этанол и полученную смесь центрифугируют в течение 5 мин при 4°С.

Супернатант удаляют и оставшийся этанол удаляют лиофильно при комнатной температуре в течение 10 мин. Затем осадок растворяют в 2 мл воды и очищают обращенно-фазовой ВЭЖХ на колонке Waters Xterra RP18 (элюент: градиент двухфазной подвижной фазы - 50 мМ водный буферный раствор, содержащий ацетат триэтиламмония, при рН 7,5 и раствор 99% ацетонитрил/1% вода. Фракции, содержащие библиотеку, собирают, объединяют и лиофилизируют. Полученный остаток растворяют в 2,5 мл воды и добавляют 250 мкл пиперидина. Раствор осторожно встряхивают в течение 45 мин и затем осаждают этанолом, как описано выше. Полученный осадок подвергают лиофильной сушке и затем растворяют в буферном растворе, содержащем борат натрия (4,8 мл, 150 мМ, рН 9,4), при этом получают раствор при концентрации 1 мМ.

Раствор охлаждают до 4°С и добавляют по 40 экв. N-Fmoc-пропаргилглицина в ДМФА (1,2 мл, 0,15 М) и DMT-MM в воде (7,7 мл, 0,25 М). Смесь осторожно встряхивают в течение 2 ч при 4°С и затем добавляют еще по 40 экв. N-Fmoc-пропаргилглицина и DMT-MM, раствор встряхивают в течение еще 16 ч. Затем смесь очищают осаждением из ЕtОН и обращено-фазовой ВЭЖХ, как описано выше, и группу N-Fmoc удаляют обработкой пиперидином, как описано выше. После окончательной очистки осаждением из ЕtОН полученный осадок подвергают лиофильной сушке и используют на следующей стадии.

Циклы 2-4

Для каждого из таких циклов сухой осадок, полученный в предыдущем цикле, растворяют в воде и концентрацию библиотеки определяют спектрофотометрически с использованием коэффициента экстинкции компонента ДНК, входящего в состав библиотеки, при этом исходный коэффициент экстинкции соединения 2 составляет 131500 л/(моль•см). Концентрацию библиотеки доводят водой таким образом, чтобы конечная концентрация в реакционной среде для лигирования составляла 0,25 мМ. Затем библиотеку делят на 96 равных аликвотных частей в 96-луночном планшете. В каждую лунку добавляют раствор, включающий различные олигонуклеотиды (молярное соотношение компонента библиотеки к олигонуклеотиду составляет 1:2), и проводят лигирование, как описано в цикле 1. Олигонуклеотиды, использованные в циклах 2, 3 и 4, описаны в таблицах 4, 5 и 6 соответственно, приведенных в графической части. Соответствие между олигонуклеотидными метками и предшественниками структурных фрагментов для циклов 1-4 показано в таблице 7. Библиотеку осаждают при добавлении этанола, как описано выше в цикле 1, и растворяют в буферном растворе, содержащем борат натрия (150 мМ, рН 9,4), при этом получают раствор с концентрацией 1 мМ. Последующие ацилирование и очистку проводят, как описано в цикле 1, за исключением очистки ВЭЖХ, исключенной из цикла 3.

Продукты, полученные в цикле 4, лигируют завершающим праймером, показанным ниже, с использованием метода, описанного выше для лигирования олигонуклеотидов.

5'-PO3-CAG AAG АСА GAC AAG СТТ САС CTG C(SEQ ID NO:889)

5'-PO3-GCA GGT GAA GCT TGT CTG TCT TCT GAA(SEQ ID NO:890)

Результаты

В результате синтеза, описанного выше, получают библиотеку, включающую 964 (приблизительно 108) различных структур. Ход синтеза библиотеки контролируют методами гель-электрофореза и ЖХ/МС продукта, полученного в каждом цикле. После завершения синтеза библиотеку анализируют с использованием различных методов. На фиг.13а показана хроматограмма библиотеки, полученная после цикла 4, но перед лигированием заключительным праймером, на фиг.13b показан масс-спектр библиотеки на той же стадии синтеза. Среднюю молекулярную массу определяют методом ЖХ/МС (отрицательные ионы). Ионные сигналы обрабатывают с использованием программного обеспечения ProMass. Полученный результат соответствует предсказанной величине средней массы библиотеки.

Компонент ДНК в составе библиотеки анализируют методом электрофореза в агарозе, который свидетельствует о том, что основная часть материала библиотеки соответствует лигированому продукту соответствующего размера. Анализ последовательности молекулярных клонов ДНК, продуктов ПЦР, полученных с использованием образцов библиотеки, показывает, что лигирование ДНК проходит с высокой точностью и практически полностью завершено.

Циклизация библиотеки

После завершения цикла 4 в части библиотеки N-концевой остаток блокируют с использованием азидоуксусной кислоты в стандартных условиях ацилирования. После очистки осаждением из ЕtOН продукт растворяют в буферном растворе, содержащем фосфат натрия (150 мМ, рН 8), при этом получают концентрацию 1 мМ, и в полученный раствор добавляют 4 экв CuSO4 в воде (200 мМ), аскорбиновой кислоты в воде (200 мМ) и раствор соединения, показанного ниже, в ДМФА (200 мМ). Реакционную смесь осторожно встряхивают в течение 2 ч при комнатной температуре:

Для оценки степени циклизации 5 мкл аликвотной части реакционной смеси, полученной после циклизации библиотеки, удаляют и обрабатывают флуоресцентно-меченым азидом или алкином (1 мкл 100 мМ раствора в ДМФА), полученного, как описано в примере 4. Через 16 ч поданным ВЭЖХ при 500 нм показано, что ни азидная, ни алкиновая метки не включаются в состав библиотеки, что свидетельствует о том, что библиотека уже не содержит азидных или алкиновых групп, способных к циклоприсоединению, и, следовательно, члены библиотеки будут взаимодействовать друг с другом за счет реакций циклизации или межмолекулярных реакций. Циклизованную библиотеку очищают обращенно-фазовой ВЭЖХ, как описано выше. Контрольные эксперименты с использованием нециклизованной библиотеки показывают полное включение флуоресцентных меток, упомянутых выше.

Пример 4. Получение флуоресцентных меток для анализа методом циклизации

В отдельных пробирках пропаргилглицин или 2-амино-3-фенилпропилазид (по 8 мкмоль каждого) смешивают с FAM-OSu (Molecular Probes Inc., 1,2 экв.) в боратном буферном растворе при рН 9,4 (250 мкл).

Реакционную смесь выдерживают при комнатной температуре в течение 3 ч и затем лиофилизируют в течение ночи. После очистки на ВЭЖХ получают требуемый флуоресцентный алкин или азид с количественным выходом:

Пример 5. Циклизация индивидуальных соединений с использованием реакции циклоприсоединения азид/алкин

Получение азидоацетил-Gly-Рro-Рhe-Рra-NН2:

Указанную последовательность синтезируютс использованием 0,3 ммоль амидной смолы Rink в стандартных условиях твердофазного синтеза с использованием Fmoc-защищенных аминокислот и HATU в качестве активирующего агента (Рra означает С-пропаргилглицин). Азидоуксусную кислоту используют для введения защитной группы в тетрапептид. Пептид отщепляют от смолы при обработке 20% ТФУ/ДХМ в течение 4 ч. После очистки ОФ-ВЭЖХ получают продукт в виде твердого вещества белого цвета (75 мг, 515). 1H (ДМСО-d6, 400 МГц): 8,4-7,8 (m, 3Н), 7,4-7,1 (m, 7H), 4,6-4,4 (m, 1H), 4,4-4,2 (m, 2H), 4,0-3,9 (m, 2H), 3,74 (dd, 1H, J=6 Гц, 17 Гц), 3,5-3,3 (m, 2H), 3,07 (dt, 1H, J=5 Гц, 14 Гц), 2,92 (dd, 1H, J=5 Гц, 16 Гц), 2,86 (t, 1H, J=2 Гц), 2,85-2,75 (m, 1H), 2,6-2,4 (m, 2H), 2,2-1,6 (m, 4H). ИК (mull) 2900, 2100, 1450, 1300 см-1. MC (ESI): 497,4 ([M+H], 100%), 993,4 ([2M+H], 50%). MC (ESI): (источник ионной фрагментации): 519,3 ([M+Na], 100%), 491,3 (100%), 480,1 ([M-NH2], 90%), 452,2 ([M-NH2-CO], 20%), 424,2 (20%), 385,1 ([M-Pra], 50%), 357,1 ([M-Pra-CO], 40%), 238,0 ([M-Pra-Phe], 100%).

Циклизация азидоацетил-Gly-Рrо-Рhе-Рrа-NН2:

Азидоацилпептид (31 мг, 0,62 ммоль) растворяют в MeCN (30 мл). Затем добавляют диизопропилэтиламин (DIEA, 1 мл) и Cu(MeCN)4PF6 (1 мг). После перемешивания в течение 1,5 ч раствор упаривают и полученный остаток обрабатывают 20% MeCN/H2O. После центрифугирования для удаления нерастворимых солей раствор очищают обращенно-фазовой ВЭЖХ. Требуемый циклический пептид выделяют в виде твердого вещества белого цвета (10 мг, 32%). 1H (ДМСО-d6, 400 МГц): 8,28 (t, 1H, J=5 Гц), 7,77 (s, 1H), 7,2-6,9 (m, 9H), 4,98 (m, 2H), 4,48 (m, 1H), 4,28 (m, 1H), 4,1-3,9 (m, 2H), 3,63 (dd, 1H, J=5 Гц, 16 Гц), 3,33 (m, 2H), 3,0 (m, 3Н), 2,48 (dd, 1H, J=11 Гц, 14 Гц), 1,75 (m, 1H), 1,55 (m, 1H), 1,32 (m, 1H), 1,05 (m, 1H). ИK (mull) 2900, 1475, 1400 см-1. MC (ESI): 497,2 ([M+H], 100%), 993,2 ([2M+H], 30%), 1015,2 ([2M+Na], 15%). MC (ESI) (источник ионной фрагментации): 535,2 (70%), 519,3 ([M+Na], 100%), 497,2 ([M+H], 80%), 480,1 ([M-NH2], 30%), 452,2 ([M-NH2-CO], 40%), 208,1 (60%).

Получение азидоацетил-Gly-Pro-Phe-Pra-Gly-OH:

С использованием 0,3 ммоль смолы Glycine-Wang указанную последовательность синтезируют в стандартных условиях твердофазного синтеза с использованием Fmoc-защищенных аминокислот и HATU в качестве активирующего агента. Азидоуксусную кислоту используют на последней стадии конденсации в качестве защитной группы для пентапептида. Пептид отщепляют от смолы при обработке 50% ТФУ/ДХМ в течение 2 ч. После очистки ОФ-ВЭЖХ получают продукт в виде твердого вещества белого цвета (83 мг, 50%). 1H ЯМР (ДМСО-d6, 400 МГц): 8,4-7,9 (m, 4H), 7,2 (m, 5H), 4,7-4,2 (m, 3Н), 4,0-3,7 (m, 4H), 3,5-3,3 (m, 2H), 3,1 (m, 1H), 2,91 (dd, 1H, J=4 Гц, 16 Гц), 2,84 (t, 1H, J=2,5 Гц), 2,78 (m, 1H), 2,6-2,4 (m, 2H), 2,2-1,6 (m, 4H). ИК (mull) 2900, 2100, 1450, 1300 см-1. МС (ESI): 555,3 ([М+Н], 100%). MC (ESI) (источник ионной фрагментации): 577,1 ([M+Na], 90%), 555,3 (80%), 480,1 ([M-Gly], 100%), 385,1 ([M-Gly-Pra], 70%), 357,1 ([M-Gly-Pra-CO], 40%), 238,0 ([M-Gly-Pra-Phe], 80%).

Циклизация азидоацетил-Gly-Pro-Phe-Pra-Gly-OH:

Пептид (32 мг, 0,058 ммоль) растворяют в MeCN (60 мл). Затем добавляют диизопропилэтиламин (1 мл) и Cu(MeCN)4PF6 (1 мг) и раствор перемешивают в течение 2 ч. Растворитель упаривают и полученный неочищенный продукт очищают ОФ-ВЭЖХ для удаления димеров и тримеров. Циклический мономер выделяют в виде бесцветного стеклообразного вещества (6 мг, 20%). МС (ESI): 555,6 ([М+Н], 100%), 1109,3 ([2М+Н], 20%), 1131,2 ([2M+Na], 15%). МС (ESI) (источник ионной фрагментации) 555,3 ([М+Н], 100%), 480,4 ([M-Gly], 30%), 452,2 ([M-Gly-CO], 25%), 424,5 ([M-Gly- СО], 10%, наблюдается только в циклической структуре).

Конъюгация линейного пептида с ДНК:

Соединение 2 (20 нмоль) растворяют в 45 мкл боратного буферного раствора (рН 9,4, 150 мМ). При 4°С добавляют линейный пептид (18 мкл 100 мМ исходного раствора в ДМФА, 180 нмоль, 40 экв), DMT-MM (3,6 мкл 500 мМ исходного раствора в воде, 180 нмоль, 40 экв). После встряхивания в течение 2 ч по данным МСЖХ реакция завершена и продукт выделяют осаждением из этанола. МС (ESI): 1823,0 ([М-3Н]/3, 20%), 1367,2 ([М-4Н]/4, 20%), 1093,7 ([М-5Н]/5, 40%), 911,4 ([М-6Н)/6, 100%).

Конъюгация циклического пептида с ДНК:

Соединение 2 (20 нмоль) растворяют в 20 мкл боратного буферного раствора (рН 9,4, 150 мМ). При 4°С добавляют линейный пептид (8 мкл 100 мМ исходного раствора в ДМФА, 80 нмоль, 40 экв), DMT-MM (1,6 мкл 500 мМ исходного раствора в воде, 80 ммоль, 40 экв). После встряхивания в течение 2 ч по данным МСЖХ реакция завершена и продукт выделяют осаждением из этанола. МС (ESI) 1823,0 ([М-3Н]/3, 20%), 1367,2 ([M-4H]/4, 20%), 1093,7 ([М-5Н]/5, 40%), 911,4 ([М-6Н)/6, 100%).

Циклизация пептида, связанного с ДНК:

Конъюгат линейный пептид-ДНК (10 нмоль) растворяют в натрий-фосфатном буферном растворе, рН 8 (10 мкл, 150 ммоль). При комнатной температуре добавляют по 4 экв СuSО4, аскорбиновой кислоты и лиганда Sharpless (по 0,2 мкл 200 мМ исходных растворов). Реакционную смесь выдерживают в течение ночи. По данным ОФ-ВЭЖХ, линейный пептид-ДНК в смеси отсутствует, и продукт элюируется одновременно с контрольным циклическим пептидом-ДНК. Присутствие следовых количеств димеров или других олигомеров не наблюдается:

Условия проведения ЖХ: колонка Targa C18, 2,1140 мм, 10-40%

MeCN в 40 мМ водном растворе ТЕАА в течение 8 мин.

Пример 6. Применение реакции ароматического нуклеофильного замещения для синтеза функционального компонента

Общая методика арилирования соединения 3 цианурхлоридом:

Соединение 2 растворяют в боратном буферном растворе, рН 9,4, при этом получают раствор при концентрации 1 мМ. Раствор охлаждают до 4°С и затем добавляют 20 экв цианурхлорида в виде 500 мМ раствора в MeCN. Через 2 ч по данным МСЖХ реакция завершена и полученный конъюгат дихлортриазин-ДНК выделяют осаждением этанолом.

Методика аминозамещения конъюгата дихлортриазин-ДНК:

Конъюгат дихлортриазин-ДНК растворяют в боратном буфере, рН 9,5, при этом получают раствор при концентрации 1 мМ. Затем при комнатной температуре добавляют 40 экв алифатического амина в виде раствора в ДМФА. Ход реакции контролируют методом МСЖХ и через 2 ч реакция завершена. Полученный конъюгат алкиламиномонохлортриазин-ДНК выделяют осаждением этанолом.

Методика аминозамещения конъюгата монохлортриазин-ДНК:

Конъюгат алкиламиномонохлортриазин-ДНК растворяют в боратном буферном растворе, рН 9,5, при этом получают раствор при концентрации 1 мМ. Затем при 42°С добавляют 40 экв второго алифатического амина в виде раствора в ДМФА. Ход реакции контролируют методом МСЖХ и через 2 ч реакция завершена. Полученный конъюгат диаминотриазин-ДНК выделяют осаждением этанолом.

Пример 7. Применение реакции восстановительного аминирования для синтеза функционального компонента

Общая методика восстановительного аминирования ДНК-связующее звено, содержащее вторичный амин, с использованием альдегидного структурного фрагмента:

Соединение 2 конденсируют с N-концевым остатком пролина остатком. Полученное соединение растворяют в боратном буферном растворе (50 мкл, 150 мМ, рН 9,5), при этом получают раствор с концентрацией 1 мМ. К полученному раствору добавляют по 40 экв альдегидного структурного фрагмента в ДМФА (8 мкл, 0,25 М) и цианоборгидрида натрия в ДМФА (8 мкл, 0,25 М), раствор нагревают при 80°С в течение 2 ч. После алкилирования раствор очищают осаждением этанолом. Общая методика восстановительного аминирования комплекса ДНК-связующее звено, содержащего альдегид, с использованием аминофрагментов:

Соединение 2, конденсированное со структурным фрагментом, содержащим альдегидную группу, растворяют в боратном буферном растворе (50 мкл, 250 мМ, рН 5,5), при этом получают раствор при концентрации 1 мМ. К полученному раствору добавляют по 40 экв аминофрагмента в ДМФА (8 мкл, 0,25 М) и цианоборгидрида натрия в ДМФА (8 мкл, 0,25 М), раствор нагревают при 80°С в течение 2 ч. После алкилирования раствор очищают осаждением этанолом.

Пример 8. Применение синтеза пептоидных структурных фрагментов для получения функционального компонента

Общая методика синтеза пептоида с использованием комплекса ДНК-связующее звено:

Соединение 2 растворяют в боратном буферном растворе (50 мкл, 150 мМ, рН 9,4), при этом получают раствор при концентрации 1 мМ, который охлаждают до 4°С. К полученному раствору добавляют 40 экв N-гидроксисукцинимидилбромацетата в ДМФА (13 мкл, 0,15 М) и раствор осторожно встряхивают при 4°С в течение 2 ч. После ацилирования ДНК-связующее звено очищают осаждением этанолом и повторно растворяют в боратном буферном растворе (50 мкл, 150 мМ, рН 9,4), при этом получают раствор при концентрации 1 мМ, который охлаждают до 4°С. К полученному раствору добавляют 40 экв. аминофрагмента в ДМФА (13 мкл, 0,15 М) и раствор осторожно встряхивают при 4°С в течение 16 ч. После алкилирования остаток ДНК-связующее звено очищают осаждением этанолом и повторно растворяют в боратном буферном растворе (50 мкл, 150 мМ, рН 9,4), при этом получают раствор при концентрации 1 мМ, который охлаждают до 4°С. Синтез пептоида продолжают постадийно при добавлении N-гидроксисукцинимидил-бромацетата с последующим добавлением аминофрагмента.

Пример 9. Применение реакции циклоприсоединения азид-алкин для синтеза функционального компонента Общая методика

Алкинсодержащий конъюгат ДНК растворяют в боратном буферном растворе, рН 8,0, при этом получают раствор при концентрации приблизительно 1 мМ. К полученной смеси добавляют 10 экв. органического азида и по 5 экв. сульфата меди(II), аскорбиновой кислоты и лиганда (трис-((1-бензилтриазол-4-ил)метил)амин) при комнатной температуре. Ход реакции контролируют методом МСЖХ и через 1-2 ч реакция завершена. Полученный конъюгат триазол-ДНК выделяют осаждением этанолом.

Пример 10. Идентификация лиганда киназы Ав в составе кодирующей библиотеки

Возможность повышать содержание требуемых молекул в ДНК-кодированной библиотеке по сравнению с нежелательными членами библиотеки является первостепенной при идентификации отдельных соединений с определенными свойствами в отношении исследуемых терапевтических мишеней. Для демонстрации такой возможности обогащения синтезируют известную молекулу (как описано в статье Shah et al., Science 305, 399-401 (2004), включенной в настоящее описание в качестве ссылки), способную связываться с киназой rhAbI (GenBank U07563). Данное соединение присоединяют к двухцепочечному олигонуклеотиду через связующую группу, как описано в предыдущих примерах, с использованием стандартных методик, при этом получают молекулу (функциональный компонент, соединенный с олигонуклеотидом), аналогичную соединениям, которые получают по методике, описанной в примерах 1 и 2. Библиотека, которую в основном получают, как описано в примере 2, и соединенный с ДНК участок связывания с киназой Abl сконструированы из уникальных последовательностей ДНК, которые позволяют провести количественный ПЦР анализ для обоих образцов. Соединенный с ДНК участок связывания с киназой Abl смешивают с библиотекой в соотношении 1:1000. Полученную смесь уравновешивают в присутствии киназы rhAble, и фермент сорбируют на твердой фазе, промывают для удаления несвязанных членов библиотеки и элюируют связывающимися молекулами. Соотношение молекул библиотеки и связанного с ДНК ингибитора киназы Abl в элюате составляет 1:1, что означает обогащение по соединенному с ДНК связывающегося с киназой Abl участка в более 500 раз и в 1000-кратном избытке по отношению к молекулам библиотеки.

Пример 11. Получение соединения-инициатора со связующей группой

Материалы

Fmoc-защищенные и незащищенные аминокислоты и амины были получены из коммерческих источников. Для растворения аминокислот использовали диметилформамид, амины растворяли с смеси 1:1 ацетонитрил-вода или в диметилацетамиде в зависимости от растворимости. Головной фрагмент ДНК (соединение 2) и различные теги ДНК были получены IDT Inc., Coralville, IA и Biosearch Technology, Novato, CA. Т4 ДНК-лигазы были получены от Fermentas (30U/ul). В реакциях лигирования использовался 10Х буферный раствор следующего состава 500 мМ Трис, рН 7,5, 100 мМ дитиотриит, 100 мМ MgCl2, 25 мМ АТР, 500 мМ NaCl.

Присоединение химического спейсера к соединению 2

В раствор соединения 2 (43 мл, 43 мкмоль, 1 мМ) в буферном растворе, содержащем борат натрия (250 мМ, рН 9,4), добавляют 40 экв. N-Fmoc-15-амино-4,7,10,13-тетраоксапентадекановой кислоты (АОР) в N,N-диметилформамиде (ДМФА, 16 мл, 0,15 М) и 40 экв хлорида 4-(4,6-диметокси[1.3.5]триазин-2-ил)-4-метилморфолиния (DMTMM) в воде (8,6 мл, 0,2 М). Ацилирование проводили в течение 18 ч при комнатной температуре.

После ацилирования добавляют водный раствор 5 М NaCl (10% от объема) и 2,5 объема охлажденного этанола. Полученную смесь центрифугируют, при этом получают осадок белого цвета, который промывают охлажденным этанолом и затем подвергают лиофильной сушке при комнатной температуре. Защитную группу Fmoc снимают посредством обработки лиофилизированного осадка 20 мл 10%-ного раствора пиперидина в воде. Продукт с удаленной защитной группой осаждают из этанола, выделяют центрифугированием и очищают обращенно-фазовой ВЭЖХ.

Полученный продукт пускают в дальнейшие циклы синтеза библиотек.

Эквиваленты. Специалисты в данной области техники могут выявить с использованием стандартных методик множество эквивалентов специфических вариантов воплощения настоящего изобретения, описанных в данном контексте. Такие эквиваленты определены в следующих пунктах формулы настоящего изобретения.

Похожие патенты RU2470077C2

название год авторы номер документа
СОЕДИНЕНИЕ, СОДЕРЖАЩЕЕ КОДИРУЮЩИЙ ОЛИГОНУКЛЕОТИД, СПОСОБ ЕГО ПОЛУЧЕНИЯ, БИБЛИОТЕКА СОЕДИНЕНИЙ, СПОСОБ ЕЕ ПОЛУЧЕНИЯ, СПОСОБ ИДЕНТИФИКАЦИИ СОЕДИНЕНИЯ, СВЯЗЫВАЮЩЕГОСЯ С БИОЛОГИЧЕСКОЙ МИШЕНЬЮ (ВАРИАНТЫ) 2006
  • Арико-Муэндель Кристофер К.
  • Ачарья Ракша А.
  • Бенджамин Дэнис
  • Вагнер Ричард
  • Джефтер Малкольм Л.
  • Израэл Дэвид И.
  • Каварана Малкольм Дж.
  • Кларк Мэтью
  • Кризер Стефан Филип
  • Морган Барри
  • Франклин Джордж Дж.
  • Хансен Нильс Якоб Вест
  • Хэйл Стивен
  • Чентрелла Паоло А.
RU2459869C2
БИОЛОГИЧЕСКИ АКТИВНОЕ СОЕДИНЕНИЕ, СОДЕРЖАЩЕЕ КОДИРУЮЩИЙ ОЛИГОНУКЛЕОТИД, И БИБЛИОТЕКА СОЕДИНЕНИЙ 2011
  • Арико-Муэндель Кристофер К.
  • Ачарья Ракша А.
  • Бенджамин Дэнис
  • Вагнер Ричард
  • Джефтер Малькольм Л.
  • Израэл Дэвид И.
  • Каварна Малкольм Дж.
  • Кларк Мэтью
  • Кризер Стефан Филип
  • Чентрелла Паоло А.
  • Морган Бэрри
  • Фрэнклин Джордж Дж.
  • Хансен Нильс Якоб Вест
  • Хэйл Стивен
RU2592673C2
НАПРАВЛЯЕМЫЙ ОЛИГОНУКЛЕОТИДАМИ И ОТСЛЕЖИВАЕМЫЙ КОМБИНАТОРНЫЙ СИНТЕЗ КОДИРУЕМЫХ МОЛЕКУЛ-ЗОНДОВ 2017
  • Воттс, Ричард Эдвард
RU2769571C2
КОНЪЮГАТЫ АФФИННАЯ ЧАСТЬ-ОЛИГОНУКЛЕОТИД И ИХ ПРИМЕНЕНИЯ 2016
  • Вино, Франсуа
  • Бриггс, Адриан Рэнгем
  • Голдфлесс, Стивен Дж.
  • Бельмонт, Брайан Дж.
RU2778754C2
СПОСОБ ИДЕНТИФИКАЦИИ НАТИВНЫХ ПАР ФРАГМЕНТОВ ДНК ИЛИ РНК, ПРИСУТСТВУЮЩИХ В ОДНИХ И ТЕХ ЖЕ ЖИВЫХ КЛЕТКАХ 2013
  • Чудаков Дмитрий Михайлович
  • Турчанинова Мария Андреевна
RU2578009C2
СИСТЕМА АНАЛИЗА ДЛЯ ОРТОГОНАЛЬНОГО ДОСТУПА К БИОМОЛЕКУЛАМ И ИХ МЕЧЕНИЯ В КЛЕТОЧНЫХ КОМПАРТМЕНТАХ 2017
  • Раджи, Рамеш
  • Стимерс, Фрэнк, Дж.
  • Кристиансен, Лена
  • Похолок, Дмитрий, К,
  • Чжан, Фань
RU2771892C2
АНАЛИЗ МНОЖЕСТВА АНАЛИТОВ С ИСПОЛЬЗОВАНИЕМ ОДНОГО АНАЛИЗА 2019
  • Стимерс, Фрэнк Дж.
  • Чжан, Фань
  • Похолок, Дмитрий К.
  • Норберг, Стивен
RU2824049C2
СПОСОБЫ И ПРИБОРЫ ДЛЯ ОБНАРУЖЕНИЯ И ИДЕНТИФИКАЦИИ ЗАКОДИРОВАННЫХ ГРАНУЛ И БИОЛОГИЧЕСКИХ МОЛЕКУЛ 2007
  • Горфинкель Вера
  • Горбовицки Борис
  • Горбовицки Микаил
RU2487169C2
НАБОР ДЛЯ ПОЛУЧЕНИЯ РЕАКЦИОННОЙ СМЕСИ ДЛЯ СИНТЕЗА 3′-O-ПРОПАРГИЛ-МОДИФИЦИРОВАННОЙ НУКЛЕИНОВОЙ КИСЛОТЫ 2014
  • Ким Дэ Хюнь
RU2688435C2
СПОСОБ ИДЕНТИФИКАЦИИ НАТИВНЫХ ПАР ФРАГМЕНТОВ ДНК ИЛИ РНК, ПРИСУТСТВУЮЩИХ В ОДНИХ И ТЕХ ЖЕ ЖИВЫХ КЛЕТКАХ 2015
  • Чудаков Дмитрий Михайлович
  • Турчанинова Мария Андреевна
RU2600873C1

Иллюстрации к изобретению RU 2 470 077 C2

Реферат патента 2012 года БИОЛОГИЧЕСКИ АКТИВНОЕ СОЕДИНЕНИЕ, СОДЕРЖАЩЕЕ КОДИРУЮЩИЙ ОЛИГОНУКЛЕОТИД (ВАРИАНТЫ), СПОСОБ ЕГО СИНТЕЗА, БИБЛИОТЕКА СОЕДИНЕНИЙ (ВАРИАНТЫ), СПОСОБ ЕЕ СИНТЕЗА И СПОСОБ ПОИСКА СОЕДИНЕНИЯ, СВЯЗЫВАЮЩЕГОСЯ С БИОЛОГИЧЕСКОЙ МИШЕНЬЮ (ВАРИАНТЫ)

Изобретение относится к области биологической химии и может быть использовано для определения соединений, связывающихся с биологической мишенью. Синтезируют соединение, содержащее функциональный компонент и кодирующий олигонуклеотид. Способ синтеза предусматривает присоединение к исходному функциональному компоненту дополнительного структурного фрагмента и ферментативное лигирование исходного олигонуклеотида с дополнительным олигонуклеотидом. Олигонуклеотид является двухцепочечным, связан с функциональным компонентом каждой своей цепью и определяет его структуру. Данный способ синтеза используют в способе получения библиотеки соединений, в которых структура функционального компонента определяется кодирующим олигонуклеотидом. Библиотеку соединений используют в способе поиска соединений, связывающихся с биологической мишенью. Изобретение позволяет расширить спектр химических реакций, используемых для конструирования молекул в присутствии химически немодифицированной олигонуклеотидной метки, с высокой точностью вводить олигонуклеотидные метки в химические структуры и получать библиотеки, содержащие множество копий каждого члена. 8 н. и 110 з.п. ф-лы, 13 ил., 7 табл., 10 пр.

Формула изобретения RU 2 470 077 C2

1. Способ синтеза соединения, содержащего функциональный компонент, который связан с кодирующим олигонуклеотидом, который определяет структуру функционального компонента, отличающийся тем, что в качестве исходного соединения используют соединение-инициатор, состоящее из исходного функционального компонента, содержащего n структурных фрагментов, где n равно целому числу 1 или более, и по крайней мере одну реакционноспособную группу, и связанного с исходным олигонуклеотидом, при этом исходный функциональный компонент и исходный олигонуклеотид связаны посредством связующей группы, где исходный олигонуклеотид является двухцепочечным, а связующая группа ковалентно связана с исходным функциональным компонентом и с каждой цепью исходного олигонуклеотида; осуществляют взаимодействие в растворе указанного соединения-инициатора с вводимым структурным фрагментом, содержащим по крайней мере одну реакционноспособную группу, комплементарную реакционноспособной группе соединения-инициатора, в условиях, пригодных для образования ковалентной связи между реакционноспособными группами посредством реакции конденсации, совместимой с присутствием двухцепочечного олигонуклеотида; осуществляют взаимодействие в растворе исходного олигонуклеотида с вводимым олигонуклеотидом, который определяет структуру вводимого структурного фрагмента, ковалентно связанного с соединением-инициатором, причем взаимодействие исходного олигонуклеотида с вводимым олигонуклеотидом осуществляют в присутствии фермента, который катализирует лигирование исходного олигонуклеотида и вводимого олигонуклеотида в пригодных условиях с образованием кодирующего олигонуклеотида, который определяет структуру функционального компонента; и в результате получают соединение, содержащее функциональный компонент, содержащий n+1 структурных фрагментов и связанный с кодирующим олигонуклеотидом, который определяет структуру функционального компонента.

2. Способ по п.1, отличающийся тем, что функциональный компонент полученного соединения содержит по меньшей мере одну реакционноспособную группу, и указанное соединение используют в качестве соединения-инициатора для проведения повторного цикла всех стадий способа по п.1, которые повторяют по меньшей мере один раз, причем соединение, полученное в результате каждого цикла, служит соединением-инициатором для последующего цикла реакций.

3. Способ по п.1, отличающийся тем, что стадия взаимодействия соединения-инициатора с вводимым олигонуклеотидом предшествует стадии взаимодействия соединения-инициатора с вводимым структурным фрагментом или указанная стадия взаимодействия с вводимым структурным фрагментом предшествует указанной стадии взаимодействия с вводимым олигонуклеотидом.

4. Способ по п.1, отличающийся тем, что по крайней мере один из структурных фрагментов выбирают из группы, состоящей из аминокислоты или активированной аминокислоты.

5. Способ по п.1, отличающийся тем, что реакционноспособная группа представляет собой аминогруппу, а комплементарную реакционноспособную группу выбирают из группы, состоящей из карбоксильной группы, сульфонильной группы, фосфонильной группы, эпоксидной группы, азиридиновой группы и изоцианатной группы.

6. Способ по п.1, отличающийся тем, что реакционноспособную группу или комплементарную реакционноспособную группу независимо выбирают из группы, состоящей из гидроксильной группы, карбоксильной группы, сульфонильной группы, фосфонильной группы, эпоксидной группы, азиридиновой группы и изоцианатной группы.

7. Способ по п.1, отличающийся тем, что реакционноспособную группу или комплементарную реакционноспособную группу независимо выбирают из группы, состоящей из аминогруппы, альдегидной группы и кетогруппы.

8. Способ по п.7, отличающийся тем, что реакцию между реакционноспособной группой и комплементарной реакционноспособной группой проводят в восстанавливающих условиях.

9. Способ по п.1, отличающийся тем, что реакционноспособную группу или комплементарную реакционноспособную группу независимо выбирают из группы, включающей фосфор-илидную группу, альдегидную группу и кетогруппу.

10. Способ по п.1, отличающийся тем, что реакцию между реакционноспособной группой и комплементарной реакционноспособной группой проводят в условиях циклоприсоединения с образованием циклической структуры.

11. Способ по п.10, отличающийся тем, что реакционноспособную группу или комплементарную реакционноспособную группу независимо выбирают из группы, состоящей из алкина и азида.

12. Способ по п.10, отличающийся тем, что реакционноспособную группу или комплементарную реакционноспособную группу независимо выбирают из группы, состоящей из галогенированной гетероароматической группы и нуклеофила.

13. Способ по п.12, отличающимся тем, что галогенированную гетероароматическую группу выбирают из группы, состоящей из хлорированных пиримидинов, хлорированных триазинов и хлорированных пуринов.

14. Способ по п.12, отличающийся тем, что нуклеофилом является аминогруппа.

15. Способ по п.1, отличающийся тем, что фермент выбирают из группы, состоящей из ДНК-лигазы, РНК-лигазы и топоизомеразы.

16. Способ по п.1, отличающийся тем, что исходный олигонуклеотид содержит последовательность праймера ПЦР.

17. Способ по п.1, отличающийся тем, что вводимый олигонуклеотид характеризуется длиной от 3 до 10 нуклеотидов.

18. Способ по п.2, отличающийся тем, что вводимый олигонуклеотид в последнем цикле включает конечный праймер ПЦР.

19. Способ по п.2, отличающийся тем, что в последнем цикле осуществляют дополнительную заключительную стадию лигирования полученного кодирующего олигонуклеотида с олигонуклеотидом, содержащим последовательность конечного праймера ПЦР.

20. Способ по п.19, отличающийся тем, что реакцию лигирования проводят в присутствии фермента, катализирующего указанное лигирование.

21. Способ по п.2, отличающийся тем, что после завершения последнего цикла дополнительно осуществляют стадию циклизации функционального компонента.

22. Способ по п.21, отличающийся тем, что функциональный компонент содержит алкинильную группу и азидную группу, а циклизацию осуществляют в условиях, пригодных для циклоприсоединения алкинильной группы и азидной группы с образованием триазольной группы.

23. Способ по п.1, отличающийся тем, что соединение-инициатор содержит связующую группу, содержащую первую функциональную группу, связанную со структурным фрагментом, вторую функциональную группу, связанную с 5'-концевым участком олигонуклеотида, и третью функциональную группу, связанную с 3'-концевым участком олигонуклеотида.

24. Способ по п.1, отличающийся тем, что связующая группа означает группу формулы

где А означает функциональную группу, ковалентно связанную со структурным фрагментом,
В означает функциональную группу, связанную с 5'-концевым участком олигонуклеотида,
С означает функциональную группу, связанную с 3'-концевым участком олигонуклеотида,
S означает атом или каркас, образующий связи с группами D, Е и F,
D означает химическую структуру, соединяющую группу А с группой S,
Е означает химическую структуру, соединяющую группу В с группой S, и
F означает химическую структуру, соединяющую группу С с группой S.

25. Способ по п.24, отличающийся тем, что А означает аминогруппу, В означает фосфатную группу, а С означает фосфатную группу.

26. Способ по п.24, отличающийся тем, что группы D, Е и F каждую независимо выбирают из группы, состоящей из алкиленовой группы или олиго(этиленгликольной) группы.

27. Способ по п.24, отличающийся тем, что S выбирают из группы, состоящей из атома углерода, атома азота, атома фосфора, атома бора, фосфатной группы, циклической группы или полициклической группы.

28. Способ по п.27, отличающийся тем, что связующая группа означает группу формулы

где каждый n, m и p независимо равен целому числу от 1 до приблизительно 20.

29. Способ по п.28, отличающийся тем, что каждый n, m и р независимо равен целому числу от 2 до 8.

30. Способ по п.29, отличающийся тем, что каждый n, m и р независимо равен целому числу от 3 до 6.

31. Способ по п.28, отличающийся тем, что связующая группа означает группу формулы

32. Способ по п.1, в котором указанные реакции проводят в растворе.

33. Способ по п.1, в котором синтезированное соединение является полимерным.

34. Способ по п.1, в котором синтезированное соединение является неполимерным.

35. Способ синтеза библиотеки соединений, содержащих функциональный компонент, содержащий по меньшей мере два структурных фрагмента и связанный с олигонуклеотидом, который определяет структуру функционального компонента, отличающийся тем, что в качестве исходного раствора используют раствор, содержащий по меньшей мере одно соединение-инициатор, содержащее исходный функциональный компонент, включающий n структурных фрагментов, которые имеют по меньшей мере одну реакционноспособную группу, где n равно целому числу 1 или более, и связанный с исходным олигонуклеотидом, определяющим n структурных фрагментов, при этом исходный функциональный компонент и исходный олигонуклеотид связаны посредством связующей группы, где исходный олигонуклеотид является двухцепочечным, а связующая группа ковалентно связана с исходным функциональным компонентом и с каждой цепью исходного олигонуклеотида; помещают аликвотные части исходного раствора в по меньшей мере два реакционных сосуда; осуществляют взаимодействие в растворе соединений-инициаторов в каждом реакционном сосуде с вводимым структурным фрагментом, который содержит по меньшей мере одну реакционноспособную группу, комплементарную реакционноспособной группе соединения-инициатора посредством реакции конденсации, совместимой с присутствием двухцепочечного олигонуклеотида, с образованием соединений, содержащих функциональный компонент, включающий n+1 структурных фрагментов и связанный с исходным олигонуклеотидом; и осуществляют в пригодных условиях взаимодействие исходного олигонуклеотида в составе каждой аликвотной части с одним вводимым олигонуклеотидом, который определяет структуру вводимого структурного фрагмента, в присутствии фермента, который катализирует лигирование вводимого и исходного олигонуклеотидов; и в результате получают по меньшей мере две аликвотные части, содержащие соединения, имеющие в своем составе функциональный компонент, включающий n+1 структурных фрагментов и связанный с кодирующим олигонуклеотидом, который определяет функциональный компонент, включающий n+1 структурных фрагментов.

36. Способ по п.35, отличающийся тем, что дополнительно осуществляют объединение по меньшей мере двух полученных аликвотных частей с получением единого раствора.

37. Способ по п.36, отличающийся тем, что объединяют все полученные аликвотные части.

38. Способ по п.35, отличающийся тем, что полученные по меньшей мере две аликвотные части далее объединяют с получением содержащего по меньшей мере одно соединение-инициатор единого раствора, который используется в качестве исходного раствора для проведения повторного цикла всех стадий способа по п.35.

39. Способ по п.38, отличающийся тем, что по крайней мере в одном цикле стадия взаимодействия соединения-инициатора с вводимым олигонуклеотидом предшествует стадии взаимодействия соединения-инициатора с вводимым структурным фрагментом.

40. Способ по п.35, отличающийся тем, что по крайней один структурный фрагмент означает аминокислоту.

41. Способ по п.35, отличающийся тем, что фермент выбирают из группы, содержащей ДНК-лигазу, РНК-лигазу или топоизомеразу.

42. Способ по п.35, отличающийся тем, что соединение-инициатор содержит связующую группу, содержащую первую функциональную группу, связанную со структурным фрагментом, вторую функциональную группу, связанную с 5'-концевым участком олигонуклеотида, и третью функциональную группу, связанную с 3'-концевым участком олигонуклеотида.

43. Способ по п.35, отличающийся тем, что связующая группа означает группу формулы

где А означает функциональную группу, ковалентно связанную со структурным фрагментом,
В означает функциональную группу, связанную с 5'-концевым участком олигонуклеотида,
С означает функциональную группу, связанную с 3'-концевым участком олигонуклеотида,
S означает атом или каркас, образующий связи с группами D, Е и F,
D означает химическую структуру, соединяющую группу А с группой S,
Е означает химическую структуру, соединяющую группу В с группой S, и
F означает химическую структуру, соединяющую группу С с группой S.

44. Способ по п.43, отличающийся тем, что А означает аминогруппу, В означает фосфатную группу, а С означает фосфатную группу.

45. Способ по п.43, отличающийся тем, что группы D, Е и F каждую независимо выбирают из группы, состоящей из алкиленовой группы или олиго(этиленгликольной) группы.

46. Способ по п.43, отличающийся тем, что S выбирают из группы, состоящей из атома углерода, атома азота, атома фосфора, атома бора, фосфатной группы, циклической группы или полициклической группы.

47. Способ по п.46, отличающийся тем, что связующая группа означает группу формулы

где каждый n, m и p независимо равен целому числу от 1 до приблизительно 20.

48. Способ по п.47, отличающийся тем, что каждый n, m и р независимо равен целому числу от 2 до 8.

49. Способ по п.48, отличающийся тем, что каждый n, m и р независимо равен целому числу от 3 до 6.

50. Способ по п.47, отличающийся тем, что связующая группа означает группу формулы

51. Способ по п.35, отличающийся тем, что реакционноспособная группа представляет собой аминогруппу, а комплементарную реакционноспособную группу выбирают из группы, состоящей из карбоксильной группы, сульфонильной группы, фосфонильной группы, эпоксидной группы, азиридиновой группы и изоцианатной группы.

52. Способ по п.35, отличающийся тем, что реакционноспособная группа или комплементарная реакционноспособная группа независимо выбирают из группы, состоящей из гидроксильной группы, карбоксильной группы, сульфонильной группы, фосфонильной группы, эпоксидной группы, азиридиновой группы и изоцианатной группы.

53. Способ по п.35, отличающийся тем, что реакционноспособную группу или комплементарную реакционноспособную группу независимо выбирают из группы, состоящей из аминогруппы, альдегидной группы и кетогруппы.

54. Способ по п.35, отличающийся тем, что реакцию между реакционноспособной группой и комплементарной реакционноспособной группой проводят в восстанавливающих условиях.

55. Способ по п.35, отличающийся тем, что реакционноспособную группу или комплементарную реакционноспособную группу независимо выбирают из группы, состоящей из фосфор-илидной группы, альдегидной группы и кетогруппы.

56. Способ по п.35, отличающийся тем, что реакцию между реакционноспособной группой и комплементарной реакционноспособной группой проводят в условиях циклоприсоединения с образованием циклической структуры.

57. Способ по п.56, отличающийся тем, что реакционноспособную группу и комплементарную реакционноспособную группу выбирают из группы, состоящей из алкина и азида.

58. Способ по п.35, отличающийся тем, что реакционноспособную группу или комплементарную реакционноспособную группу независимо выбирают из группы, состоящей из галогенированной гетероароматической группы и нуклеофила.

59. Способ по п.58, отличающийся тем, что галогенированную гетероароматическую группу выбирают из группы, состоящей из хлорированных пиримидинов, хлорированных триазинов и хлорированных пуринов.

60. Способ по п.58, отличающийся тем, что нуклеофилом является аминогруппа.

61. Способ по п.36, отличающийся тем, что после завершения последнего цикла дополнительно осуществляют стадию циклизации по меньшей мере одного функционального компонента.

62. Способ по п.61, отличающийся тем, что функциональный компонент на стадии циклизации содержит азидную группу и алкинильную группу.

63. Способ по п.62, отличающийся тем, что циклизацию осуществляют в условиях, пригодных для циклоприсоединения азидной группы и алкинильной группы с образованием триазольной группы.

64. Способ по п.63, отличающийся тем, что реакцию циклоприсоединения проводят в присутствии медного катализатора.

65. Способ по п.64, отличающийся тем, что по крайней мере один из функциональных компонентов на стадии циклизации содержит по крайней мере две сульфгидрильные группы и упомянутый функциональный компонент обрабатывают в условиях, пригодных для взаимодействия двух сульфгидрильных групп с образованием дисульфидной связи.

66. Способ по п.35, отличающийся тем, что исходный олигонуклеотид содержит последовательность праймера ПЦР.

67. Способ по п.36, отличающийся тем, что вводимый олигонуклеотид в последнем цикле содержит конечный праймер ПЦР.

68. Способ по п.36, отличающийся тем, что по завершении последнего цикла осуществляют дополнительную стадию лигирования полученного кодирующего олигонуклеотида с олигонуклеотидом, содержащим последовательность конечного праймера ПЦР.

69. Способ по п.68, отличающийся тем, что заключительную реакцию лигирования проводят в присутствии фермента, катализирующего указанное лигирование.

70. Способ по п.35, в котором указанные реакции проводят в растворе.

71. Способ по п.35, в котором указанная библиотека включает полимерные соединения.

72. Способ по п.35, в котором указанная библиотека включает неполимерные соединения.

73. Соединение формулы

где X означает функциональный компонент, содержащий по меньшей мере один структурный фрагмент,
Z означает олигонуклеотид, соединенный по 3'-концевому участку с группой В,
Y означает олигонуклеотид, соединенный по 5'-концевому участку с группой С,
А означает функциональную группу, которая образует ковалентную связь с Х,
В означает функциональную группу, такую как терминальная фосфатная группа, которая образует связь с 3'-концевым участком олигонуклеотида Z,
С означает функциональную группу, такую как терминальная фосфатная группа, которая образует связь с 5'-концевым участком олигонуклеотида Y,
D, F и Е каждый независимо означает бифункциональную связующую группу, а
S означает атом или каркас, образующий связи с группами D, Е и F, причем Y, ковалентно связанный с группой С, и Z, ковалентно связанный с группой В, синтезированы посредством лигирования п+1 олигонуклеотида, где n равно целому числу 1 или более и определяется количеством структурных фрагментов, в присутствии фермента, катализирующего указанное лигирование, и Y и Z являются полностью или частично комплементарными и ориентированы в соединении таким образом, чтобы в пригодных условиях обеспечивать образование пары Уотсона-Крика и дуплекс.

74. Соединение по п.73, отличающееся тем, что D, F и Е каждый независимо выбирают из группы, состоящей из алкиленовой цепи или олиго(этиленгликольной) цепи.

75. Соединение по п.73, отличающееся тем, что Y и Z имеют одинаковую или различную длину.

76. Соединение по п.75, отличающееся тем, что Y и Z имеют одинаковую длину.

77. Соединение по п.73, отличающееся тем, что каждый Y и Z характеризуется длиной по меньшей мере 10 оснований и содержит комплементарные участки длиной по меньшей мере 10 пар оснований.

78. Соединение по п.73, отличающееся тем, что S выбирают из группы, состоящей из атома углерода, атома бора, атома азота, атома фосфора и многоатомного каркаса.

79. Соединение по п.78, отличающееся тем, что S выбирают из группы, состоящей из фосфатной группы или циклической группы.

80. Соединение по п.79, отличающееся тем, что S выбирают из группы, состоящей из циклоалкила, циклоалкенила, гетероциклоалкила, гетероциклоалкенила, арила и гетероарила.

81. Соединение по п.73, отличающееся тем, что связующая группа означает группу формулы

где каждый n, m и р независимо равен целому числу от 1 до приблизительно 20.

82. Соединение по п.81, отличающееся тем, что каждый n, m и р независимо равен целому числу от 2 до 8.

83. Соединение по п.82, отличающееся тем, что каждый n, m и р независимо равен целому числу от 3 до 6.

84. Соединение по п.73, отличающееся тем, что связующая группа означает группу формулы

85. Соединение по п.73, отличающееся тем, что Х и Y содержат последовательность праймера ПЦР.

86. Библиотека соединений, содержащая по крайней мере порядка 102 отдельных соединений, причем упомянутые соединения имеют в составе функциональный компонент, содержащий по меньшей мере два структурных фрагмента, и соединенный с олигонуклеотидом, который определяет структуру функционального компонента, где указанные соединения независимо представлены формулой I:

где
Х означает функциональный компонент, содержащий один или более структурных фрагментов,
Z означает олигонуклеотид, соединенный по 3'-концевому участку с группой В,
Y означает олигонуклеотид, соединенный по 5'-концевому участку с группой С,
А означает функциональную группу, которая образует ковалентную связь с Х,
В означает функциональную группу, такую как терминальная фосфатная группа, которая образует связь с 3'-концевым участком олигонуклеотида Z,
С означает функциональную группу, такую как терминальная фосфатная группа, которая образует связь с 5'-концевым участком олигонуклеотида Y,
D, F и Е каждый независимо означает бифункциональную связующую группу, а
S означает атом или каркас, образующий связи с группами D, Е и F, причем Y, ковалентно связанный с группой С, и Z, ковалентно связанный с группой В, синтезированы посредством лигирования n+1 олигонуклеотида, где n равно целому числу 1 или более и определяется количеством структурных фрагментов, в присутствии фермента, катализирующего указанное лигирование, и Y и Z являются полностью или частично комплементарными и ориентированы в соединении таким образом, чтобы в пригодных условиях обеспечивать образование пары Уотсона-Крика и дуплекс.

87. Библиотека соединений по п.86, отличающаяся тем, что она содержит по крайней мере порядка 105 копий каждого из отдельных соединений.

88. Библиотека соединений по п.86, отличающаяся тем, что она содержит по крайней мере порядка 106 копий каждого из отдельных соединений.

89. Библиотека соединений по п.86, отличающаяся тем, что она содержит по крайней мере порядка 104 отдельных соединений.

90. Библиотека соединений по п.86, отличающаяся тем, что она содержит по крайней мере порядка 106 отдельных соединений.

91. Библиотека соединений по п.86, отличающаяся тем, что она содержит по крайней мере порядка 108 отдельных соединений.

92. Библиотека соединений по п.86, отличающаяся тем, что она содержит по крайней мере порядка 1010 отдельных соединений.

93. Библиотека соединений по п.86, отличающаяся тем, что она содержит по крайней мере порядка 1012 отдельных соединений.

94. Библиотека соединений по п.86, отличающаяся тем, что каждый из А, В, С, D, Е, F и S имеет одинаковое значение во всех соединениях формулы I.

95. Библиотека соединений по п.86, отличающаяся тем, что она содержит в основном множество соединений формулы I.

96. Библиотека соединений по п.86, отличающаяся тем, что D, F и Е каждый независимо выбраны из группы, состоящий из алкиленовой цепи и олиго(этиленгликольной) цепи.

97. Библиотека соединений по п.86, отличающаяся тем, что Y и Z имеют одинаковую или различную длину.

98. Библиотека соединений по п.86, отличающаяся тем, что Y и Z имеют одинаковую длину.

99. Библиотека соединений по п.86, отличающаяся тем, что каждый Y и Z характеризуется длиной по меньшей мере 10 оснований и содержит комплементарные участки длиной по меньшей мере 10 пар оснований.

100. Библиотека соединений по п.86, отличающаяся тем, что S выбран из группы, состоящей из атома углерода, атома бора, атома азота, атома фосфора и многоатомного каркаса.

101. Библиотека соединений по п.86, отличающаяся тем, что S выбран из группы, состоящей из фосфатной группы или циклической группы.

102. Библиотека соединений по п.101, отличающаяся тем, что S выбран из группы, состоящей из циклоалкила, циклоалкенила, гетероциклоалкила, гетероциклоалкенила, арила и гетероарила.

103. Библиотека соединений по п.86, отличающаяся тем, что связующая группа означает группу формулы

где каждый n, m и р независимо равен целому числу от 1 до приблизительно 20.

104. Библиотека соединений по п.103, отличающаяся тем, что каждый n, m и р независимо равен целому числу от 2 до 8.

105. Библиотека соединений по п.104, отличающаяся тем, что каждый n, m и р независимо равен целому числу от 3 до 6.

106. Библиотека соединений по п.86, отличающаяся тем, что связующая группа означает группу формулы

107. Библиотека соединений по п.86, отличающаяся тем, что Х и Z содержат последовательность праймера ПЦР.

108. Соединение, полученное способом по п.1.

109. Библиотека соединений, полученная способом по п.35.

110. Способ поиска одного или более соединений, которые связываются с биологической мишенью, отличающийся тем, что осуществляют контактирование биологической мишени с соединениями библиотеки, полученной способом по п.35, в условиях, пригодных для связывания по крайней мере одного члена библиотеки с мишенью; отделяют те члены библиотеки, которые не связаны с мишенью; амплифицируют кодирующие олигонуклеотиды по крайней мере одного соединения, связанного с мишенью; секвенируют полученные кодирующие олигонуклеотиды и определяют структуры функциональных компонентов, входящих в состав соединений, связанных с биологической мишенью с использованием последовательностей, определенных при секвенирования кодирующих олигонуклеотидов.

111. Способ поиска соединения, которое связывается с биологической мишенью, отличающийся тем, что осуществляют контактирование биологической мишени с соединениями библиотеки по п.86 в условиях, пригодных для связывания по крайней мере одного члена библиотеки с мишенью; отделяют те члены библиотеки, которые связаны с мишенью; амплифицируют кодирующие олигонуклеотиды по крайней мере одного соединения, связанного с мишенью; секвенируют полученные кодирующие олигонуклеотиды и определяют структуры функциональных компонентов, входящих в состав соединений, связанных с биологической мишенью, с использованием последовательностей, определенных при секвенировании кодирующих олигонуклеотидов.

112. Способ по п.111, отличающийся тем, что библиотека соединений содержит по крайней мере порядка 105 копий каждого из отдельных соединений.

113. Способ по п.111, отличающийся тем, что библиотека содержит по крайней мере порядка 106 копий каждого из отдельных соединений.

114. Способ по п.111, отличающийся тем, что библиотека содержит по крайней мере порядка 104 отдельных соединений.

115. Способ по п.111, отличающийся тем, что библиотека включает по крайней мере порядка 106 отдельных соединений.

116. Способ по п.111, отличающийся тем, что библиотека содержит по крайней мере порядка 108 отдельных соединений.

117. Способ по п.111, отличающийся тем, что библиотека содержит по крайней мере порядка 1010 отдельных соединений.

118. Способ по п.111, отличающийся тем, что библиотека содержит по крайней мере порядка 1012 отдельных соединений.

Документы, цитированные в отчете о поиске Патент 2012 года RU2470077C2

Домовый номерной фонарь, служащий одновременно для указания названия улицы и номера дома и для освещения прилежащего участка улицы 1917
  • Шикульский П.Л.
SU93A1
WO 03089454 A2, 30.10.2003
NEEDLES M.C
et al
Generation and screening of an oligonucleotide-encoded synthetic library//Proc
Natl
Acad
Sci, 1993, v.90, pp.10700-10704
НЕУПОРЯДОЧЕННАЯ БИБЛИОТЕКА ПЕПТИДОВ, СПОСОБ ЕЕ ПОЛУЧЕНИЯ И СПОСОБ ИДЕНТИФИКАЦИИ ПЕПТИДА, СИНТЕЗИРОВАННОГО ТВЕРДОФАЗНЫМ СИНТЕЗОМ 1991
  • Кит Санг Лэм
RU2145233C1

RU 2 470 077 C2

Авторы

Арико-Муэндель Кристофер К.

Ачарья Ракша А.

Бенджамин Дэнис

Вагнер Ричард

Джефтер Малькольм Л.

Израэл Дэвид И.

Каварна Малькольм Дж.

Кларк Мэтью

Кризер Стефан Филип

Морган Бэрри

Фрэнклин Джордж Дж.

Хансен Нильс Якоб Вест

Хэйл Стивен

Чентрелла Паоло А.

Даты

2012-12-20Публикация

2004-12-17Подача