КОМПОЗИЦИИ НА ОСНОВЕ НЕПРИРОДНЫХ ПАР ОСНОВАНИЙ И СПОСОБЫ ИХ ПРИМЕНЕНИЯ Российский патент 2023 года по МПК C07H21/04 C07K14/34 C12N1/20 C12N1/21 

Описание патента на изобретение RU2799441C2

ПЕРЕКРЕСТНАЯ ССЫЛКА

Данная заявка испрашивает приоритет в соответствии с предварительной заявкой на патент США № 62/612062, поданной 29 декабря 2017, которая включена в данный документ посредством ссылки во всей полноте.

ЗАЯВЛЕНИЕ ОБ ИССЛЕДОВАНИИ, СПОНСИРУЕМОМ ФЕДЕРАЛЬНЫМ БЮДЖЕТОМ

Настоящее изобретение, раскрытое в данном документе, по меньшей мере частично было осуществлено при поддержке правительства США в рамках гранта № R35 GM118178/GM/NIGMS, выданного Национальными институтами здравоохранения (NIH). Соответственно, правительство США обладает определенными правами на настоящее изобретение.

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

Настоящая заявка содержит перечень последовательностей, который был подан в электронном виде в формате с кодировкой ASCII и включен в данный документ посредством ссылки во всей своей полноте. Копия указанного файла с кодировкой ASCII, созданная 20 декабря 2018 года, имеет название 46085-712_601_SL.txt, а ее размер составляет 116287 байтов.

ПРЕДПОСЫЛКИ СОЗДАНИЯ ИЗОБРЕТЕНИЯ

Использование способности синтезировать/амплифицировать олигонуклеотиды (ДНК или РНК), специфически по отношению к последовательности, с помощью полимераз лимитировано ограниченным химическим/физическим разнообразием, присутствующим в природном генетическом алфавите (четыре природных нуклеотида в ДНК: A, C, G и T, и четыре природных нуклеотида в РНК: A, C, G и U). Расширенный генетический алфавит, включающий неприродные нуклеиновые кислоты, увеличивает количество информации, которое может храниться в клетке, и облегчает создание полусинтетических организмов (SSO), которые используют эту увеличенное количество информации для создания новых форм продуктов экспрессии генов.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В данном документе в определенных вариантах осуществления описаны способы, клетки, сконструированные микроорганизмы, плазмиды и наборы для повышения продуцирования молекулы нуклеиновой кислоты, которая содержит неприродный нуклеотид. Некоторые варианты осуществления, также описанные в данном документе, включают клетки, сконструированные микроорганизмы, плазмиды и способы применения, в которых используются модифицированный белок, ассоциированный с транспозицией, модифицированный белок для репарации ДНК или их комбинация для повышения продуцирования молекулы нуклеиновой кислоты, которая содержит неприродный нуклеотид.

В аспектах, раскрытых в данном документе, представлены сконструированные клетки-хозяева, содержащие: первую молекулу нуклеиновой кислоты, содержащую неприродный нуклеотид; и необязательно вторую молекулу нуклеиновой кислоты, кодирующую модифицированный белок, ассоциированный с транспозицией, или транспонируемый элемент. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит третью молекулу нуклеиновой кислоты, кодирующую модифицированный транспортер нуклеозидтрифосфата, где третья молекула нуклеиновой кислоты встроена в геномную последовательность сконструированной клетки-хозяина, или содержит плазмиду, кодирующую модифицированный транспортер нуклеозидтрифосфата. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата характеризуется повышенной стабильностью экспрессии в сконструированной клетке-хозяине по сравнению с экспрессией в эквивалентной сконструированной клетке-хозяине, которая не содержит вторую молекулу нуклеиновой кислоты, кодирующую модифицированный белок, ассоциированный с транспозицией. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата предусматривает делецию всей молекулы нуклеиновой кислоты, кодирующей транспортер нуклеозидтрифосфата, N-концевое усечение, С-концевое усечение или усечение обоих концов. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата включает транспортер нуклеозидтрифосфата из Phaeodactylum tricornutum (PtNTT2). В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата предусматривает делецию. В некоторых вариантах осуществления делеция представляет собой концевую делецию или внутреннюю делецию. В некоторых вариантах осуществления делеция представляет собой N-концевое усечение, C-концевое усечение или усечение обоих концов. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата предусматривает делецию, составляющую приблизительно 5, 10, 15, 20, 22, 25, 30, 40, 44, 50, 60, 66, 70 или больше аминокислотных остатков. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата на N-конце предусматривает делецию, составляющую приблизительно 5, 10, 15, 20, 22, 25, 30, 40, 44, 50, 60, 66, 70 или больше аминокислотных остатков. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата на N-конце предусматривает делецию, составляющую приблизительно 66 аминокислотных остатков. В некоторых вариантах осуществления PtNTT2 находится под контролем промотора, выбранного из промотора из плазмиды pSC или промотора из lac-оперона. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит полипептид Cas9 или его варианты и одиночную направляющую РНК (sgRNA), содержащую остов crRNA-tracrRNA, где комбинация полипептида Cas9 или его вариантов и sgRNA обеспечивает модуляцию репликации первой молекулы нуклеиновой кислоты, кодирующей неприродный нуклеотид. В некоторых вариантах осуществления sgRNA содержит целевой мотив, который распознает модификацию в положении неприродного нуклеотида в молекуле нуклеиновой кислоты. В некоторых вариантах осуществления sgRNA дополнительно содержит элемент распознавания мотива, прилегающего к протоспейсеру (PAM). В некоторых вариантах осуществления элемент PAM прилегает к 3'-концу целевого мотива. В некоторых вариантах осуществления длина целевого мотива составляет от 15 до 30 нуклеотидов. В некоторых вариантах осуществления комбинация полипептида Cas9 или его вариантов и sgRNA снижает скорость репликации молекулы нуклеиновой кислоты, содержащей модификацию, на приблизительно 80%, 85%, 95%, 99% или больше. В некоторых вариантах осуществления полипептид Cas9 представляет собой Cas9 дикого типа. В некоторых вариантах осуществления вторая молекула нуклеиновой кислоты содержит ген, предусматривающий ген каталазы (cat), ген белка insB-4 для IS1 (insB-4), ген белка insA-4 для IS1 (insA-4) или их комбинацию. В некоторых вариантах осуществления модифицированный белок, ассоциированный с транспозицией, предусматривает белок InsB4 для инсерционного элемента IS1, белок InsA4 для инсерционного элемента IS1 или их комбинацию; и где модифицированный транспонируемый элемент предусматривает IS1. В некоторых вариантах осуществления ген содержит одну или несколько делеций, где одна или несколько делеций предусматривают N-концевую делецию, C-концевую делецию, усечение на обоих концах, внутреннюю делецию и/или делецию всего гена. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит пятую молекулу нуклеиновой кислоты, кодирующую модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, где ответ, представляющий собой репарацию ДНК, представляет собой рекомбинационную репарацию, SOS-ответ, эксцизионную репарацию нуклеотидов или метил-направленную репарацию ошибочно спаренных оснований или их комбинацию. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, предусматривает RecA, Rad51, RadA или LexA или их комбинацию. В некоторых вариантах осуществления сконструированная клетка-хозяин представляет собой прокариотическую клетку, предусматривающую клетку Escherichia coli, клетку Escherichia coli BL21 (DE3). В некоторых вариантах осуществления неприродный нуклеотид содержит неприродное основание, выбранное из группы, состоящей из 2-аминоаденин-9-ила, 2-аминоаденина, 2-F-аденина, 2-тиоурацила, 2-тиотимина, 2-тиоцитозина, 2-пропильных и алкильных производных аденина и гуанина, 2-аминоаденина, 2-аминопропиладенина, 2-аминопиридина, 2-пиридона, 2'-дезоксиуридина, 2-амино-2'-дезоксиаденозина, 3-дезазагуанина, 3-дезазааденина, 4-тиоурацила, 4-тиотимина, урацил-5-ила, гипоксантин-9-ила (I), 5-метилцитозина, 5-гидроксиметилцитозина, ксантина, гипоксантина, 5-бром- и 5-трифторметилурацилов и цитозинов; 5-галогенурацила, 5-галогенцитозина, 5-пропинилурацила, 5-пропинилцитозина, 5-урацила, 5-замещенного, 5-галоген-, 5-замещенных пиримидинов, 5-гидроксицитозина, 5-бромцитозина, 5-бромурацила, 5-хлорцитозина, хлорированного цитозина, циклоцитозина, цитозинарабинозида, 5-фторцитозина, фторпиримидина, фторурацила, 5,6-дигидроцитозина, 5-йодцитозина, гидроксимочевины, йодурацила, 5-нитроцитозина, 5-бромурацила, 5-хлорурацила и 5-фторурацила, 5-йодурацила, 6-алкильных производных аденина и гуанина, 6-азапиримидинов, 6-азоурацила, 6-азоцитозина, азацитозина, 6-азотимина, 6-тиогуанина, 7-метилгуанина, 7-метиладенина, 7-дезазагуанина, 7-дезазагуанозина, 7-дезазааденина, 7-дезаза-8-азагуанина, 8-азагуанина, 8-азааденина, 8-галоген-, 8-амино-, 8-тиол-, 8-тиоалкил- и 8-гидроксил-замещенных аденинов и гуанинов; N4-этилцитозина, N-2-замещенных пуринов, N-6-замещенных пуринов, O-6-замещенных пуринов, тех, которые повышают стабильность образования дуплекса, универсальных нуклеиновых кислот, гидрофобных нуклеиновых кислот, промискуитентных нуклеиновых кислот, нуклеиновых кислот, увеличенных в размере, фторированных нуклеиновых кислот, трициклических пиримидинов, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3H)-он), фенотиазинцитидин(1H-пиримидо[5,4-b][1,4]бензотиазин-2(3Н)-он), гуанин-фиксирующих оснований (G-clamps), феноксазинцитидин(9-(2-аминоэтокси)-Н-пиримидо[5,4-b] [1,4-бензоксазин-2(3Н)-он), карбазолцитидин(2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин(H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), 5-фторурацила, 5-бромурацила, 5-хлорурацила, 5-йодурацила, гипоксантина, ксантина, 4-ацетилцитозина, 5-(карбоксигидроксиметил)урацила, 5-карбоксиметиламинометил-2-тиоуридина, 5-карбоксиметиламинометилурацила, дигидроурацила, бета-D-галактозилквеуозина, инозина, N6-изопентениладенина, 1-метилгуанина, 1-метилинозина, 2,2-диметилгуанина, 2-метиладенина, 2-метилгуанина, 3-метилцитозина, 5-метилцитозина, N6-аденина, 7-метилгуанина, 5-метиламинометилурацила, 5-метоксиаминометил-2-тиоурацила, бета-D-маннозилквеуозина, 5'-метоксикарбоксиметилурацила, 5-метоксиурацила, 2-метилтио-N6-изопентениладенина, урацил-5-оксиуксусной кислоты, вибутоксозина, псевдоурацила, квеуозина, 2-тиоцитозина, 5-метил-2-тиоурацила, 2-тиоурацила, 4-тиоурацила, 5-метилурацила, сложного метилового эфира урацил-5-оксиуксусной кислоты, урацил-5-оксиуксусной кислоты, 5-метил-2-тиоурацила, 3-(3-амино-3-N-2-карбоксипропил)урацила, (acp3)w и 2,6-диаминопурина и тех, в которых пуриновое или пиримидиновое основание заменено гетероциклом. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из:

В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный сахарный фрагмент. В некоторых вариантах осуществления неприродный сахарный фрагмент выбран из группы, состоящей из предусматривающего модификацию в 2'-положении: OH; замещенный низший алкил, алкарил, аралкил, O-алкарил или O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3, NH2F; O-алкил, S-алкил, N-алкил; О-алкенил, S-алкенил, N-алкенил; O-алкинил, S-алкинил, N-алкинил; O-алкил-O-алкил, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3, где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C110алкил, C210алкенил, C210алкинил, -O[(CH2)n O]mCH3, -O(CH2)nOCH3, -O(CH2)n NH2, -O(CH2)n CH3, -O(CH2)n -ONH2 и -O(CH2)nON[(CH2)n CH3)]2, где n и m составляют от 1 до приблизительно 10; и/или модификацию в 5'-положении: 5'-винил, 5'-метил (R или S), модификацию в 4'-положении, 4'-S, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, группу, расщепляющую РНК, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида и любую их комбинацию. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит полимеразу. В некоторых вариантах осуществления полимераза экспрессируется конститутивно. В некоторых вариантах осуществления полимераза сверхэкспрессируется. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу. В некоторых вариантах осуществления ДНК-полимераза представляет собой ДНК-полимеразу II. В некоторых вариантах осуществления полимераза кодируется геном polB. В некоторых вариантах осуществления ген polB является дерепрессированным. В некоторых вариантах осуществления ген polB дерепрессируется посредством интеграции на место полусайта оператора. В некоторых вариантах осуществления оператор представляет собой оператор lexA. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу I. В некоторых вариантах осуществления данная полимераза кодируется геном polA. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу III. В некоторых вариантах осуществления полимераза кодируется геном dnaQ.

В аспектах, раскрытых в данном документе, представлены способы повышения продуцирования молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, предусматривающие: инкубирование сконструированной клетки-хозяина со множеством неприродных нуклеотидов, где сконструированная клетка-хозяин содержит модифицированный транспортер нуклеозидтрифосфата и необязательно модифицированный белок, ассоциированный с транспозицией, или транспонируемый элемент; и встраивание нескольких неприродных нуклеотидов в одну или несколько новых синтезированных нитей ДНК, за счет чего образуется молекула неприродной нуклеиновой кислоты; где модифицированный белок, ассоциированный с транспозицией, или транспонируемый элемент и модифицированный транспортер нуклеозидтрифосфата обеспечивают повышение показателя сохранения неприродных пар оснований, предусматривающих неприродные нуклеотиды, в одной или нескольких новых синтезированных нитях ДНК. В некоторых вариантах осуществления модифицированный белок, ассоциированный с транспозицией, предусматривает белок InsB4 для инсерционного элемента IS1, белок InsA4 для инсерционного элемента IS1 или их комбинацию; и где модифицированный транспонируемый элемент предусматривает IS1. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата предусматривает кодон-оптимизированный транспортер нуклеозидтрифосфата из Phaeodactylum tricornutum (PtNTT2). В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата предусматривает делецию. В некоторых вариантах осуществления делеция представляет собой концевую делецию или внутреннюю делецию. В некоторых вариантах осуществления делеция представляет собой N-концевое усечение, C-концевое усечение или усечение обоих концов. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата предусматривает делецию, составляющую приблизительно 5, 10, 15, 20, 22, 25, 30, 40, 44, 50, 60, 66, 70 или больше аминокислотных остатков. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата на N-конце предусматривает делецию, составляющую приблизительно 5, 10, 15, 20, 22, 25, 30, 40, 44, 50, 60, 66, 70 или больше аминокислотных остатков. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата на N-конце предусматривает делецию, составляющую приблизительно 66 аминокислотных остатков. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит полипептид Cas9 или его варианты и одиночную направляющую РНК (sgRNA), содержащую остов crRNA-tracrRNA, где комбинация полипептида Cas9 или его вариантов и sgRNA обеспечивает модуляцию репликации первой молекулы нуклеиновой кислоты, кодирующей неприродный нуклеотид. В некоторых вариантах осуществления sgRNA содержит целевой мотив, который распознает модификацию в положении неприродного нуклеотида в молекуле нуклеиновой кислоты. В некоторых вариантах осуществления sgRNA дополнительно содержит элемент распознавания мотива, прилегающего к протоспейсеру (PAM). В некоторых вариантах осуществления элемент PAM прилегает к 3'-концу целевого мотива. В некоторых вариантах осуществления длина целевого мотива составляет от 15 до 30 нуклеотидов. В некоторых вариантах осуществления комбинация полипептида Cas9 или его вариантов и sgRNA снижает скорость репликации молекулы нуклеиновой кислоты, содержащей модификацию, на приблизительно 80%, 85%, 95%, 99% или больше. В некоторых вариантах осуществления полипептид Cas9 представляет собой Cas9 дикого типа. В некоторых вариантах осуществления неприродный нуклеотид содержит неприродное основание, выбранное из группы, состоящей из 2-аминоаденин-9-ила, 2-аминоаденина, 2-F-аденина, 2-тиоурацила, 2-тиотимина, 2-тиоцитозина, 2-пропильных и алкильных производных аденина и гуанина, 2-аминоаденина, 2-аминопропиладенина, 2-аминопиридина, 2-пиридона, 2'-дезоксиуридина, 2-амино-2'-дезоксиаденозина, 3-дезазагуанина, 3-дезазааденина, 4-тиоурацила, 4-тиотимина, урацил-5-ила, гипоксантин-9-ила (I), 5-метилцитозина, 5-гидроксиметилцитозина, ксантина, гипоксантина, 5-бром- и 5-трифторметилурацилов и цитозинов; 5-галогенурацила, 5-галогенцитозина, 5-пропинилурацила, 5-пропинилцитозина, 5-урацила, 5-замещенного, 5-галоген-, 5-замещенных пиримидинов, 5-гидроксицитозина, 5-бромцитозина, 5-бромурацила, 5-хлорцитозина, хлорированного цитозина, циклоцитозина, цитозинарабинозида, 5-фторцитозина, фторпиримидина, фторурацила, 5,6-дигидроцитозина, 5-йодцитозина, гидроксимочевины, йодурацила, 5-нитроцитозина, 5-бромурацила, 5-хлорурацила и 5-фторурацила, 5-йодурацила, 6-алкильных производных аденина и гуанина, 6-азапиримидинов, 6-азоурацила, 6-азоцитозина, азацитозина, 6-азотимина, 6-тиогуанина, 7-метилгуанина, 7-метиладенина, 7-дезазагуанина, 7-дезазагуанозина, 7-дезазааденина, 7-дезаза-8-азагуанина, 8-азагуанина, 8-азааденина, 8-галоген-, 8-амино-, 8-тиол-, 8-тиоалкил- и 8-гидроксил-замещенных аденинов и гуанинов; N4-этилцитозина, N-2-замещенных пуринов, N-6-замещенных пуринов, O-6-замещенных пуринов, тех, которые повышают стабильность образования дуплекса, универсальных нуклеиновых кислот, гидрофобных нуклеиновых кислот, промискуитентных нуклеиновых кислот, нуклеиновых кислот, увеличенных в размере, фторированных нуклеиновых кислот, трициклических пиримидинов, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3H)-он), фенотиазинцитидин(1H-пиримидо[5,4-b][1,4]бензотиазин-2(3Н)-он), гуанин-фиксирующих оснований (G-clamps), феноксазинцитидин(9-(2-аминоэтокси)-Н-пиримидо[5,4-b] [1,4-бензоксазин-2(3Н)-он), карбазолцитидин(2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин(H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), 5-фторурацила, 5-бромурацила, 5-хлорурацила, 5-йодурацила, гипоксантина, ксантина, 4-ацетилцитозина, 5-(карбоксигидроксиметил)урацила, 5-карбоксиметиламинометил-2-тиоуридина, 5-карбоксиметиламинометилурацила, дигидроурацила, бета-D-галактозилквеуозина, инозина, N6-изопентениладенина, 1-метилгуанина, 1-метилинозина, 2,2-диметилгуанина, 2-метиладенина, 2-метилгуанина, 3-метилцитозина, 5-метилцитозина, N6-аденина, 7-метилгуанина, 5-метиламинометилурацила, 5-метоксиаминометил-2-тиоурацила, бета-D-маннозилквеуозина, 5'-метоксикарбоксиметилурацила, 5-метоксиурацила, 2-метилтио-N6-изопентениладенина, урацил-5-оксиуксусной кислоты, вибутоксозина, псевдоурацила, квеуозина, 2-тиоцитозина, 5-метил-2-тиоурацила, 2-тиоурацила, 4-тиоурацила, 5-метилурацила, сложного метилового эфира урацил-5-оксиуксусной кислоты, урацил-5-оксиуксусной кислоты, 5-метил-2-тиоурацила, 3-(3-амино-3-N-2-карбоксипропил)урацила, (acp3)w и 2,6-диаминопурина и тех, в которых пуриновое или пиримидиновое основание заменено гетероциклом. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из:

В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный сахарный фрагмент. В некоторых вариантах осуществления неприродный сахарный фрагмент выбран из группы, состоящей из предусматривающего модификацию в 2'-положении: OH; замещенный низший алкил, алкарил, аралкил, O-алкарил или O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3, NH2F; O-алкил, S-алкил, N-алкил; О-алкенил, S-алкенил, N-алкенил; O-алкинил, S-алкинил, N-алкинил; O-алкил-O-алкил, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3, где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C110алкил, C210алкенил, C210алкинил, -O[(CH2)n O]mCH3, -O(CH2)nOCH3, -O(CH2)n NH2, -O(CH2)n CH3, -O(CH2)n -ONH2 и -O(CH2)nON[(CH2)n CH3)]2, где n и m составляют от 1 до приблизительно 10; и/или модификацию в 5'-положении: 5'-винил, 5'-метил (R или S), модификацию в 4'-положении, 4'-S, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, группу, расщепляющую РНК, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида и любую их комбинацию. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит полимеразу. В некоторых вариантах осуществления полимераза экспрессируется конститутивно. В некоторых вариантах осуществления полимераза сверхэкспрессируется. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу. В некоторых вариантах осуществления ДНК-полимераза представляет собой ДНК-полимеразу II. В некоторых вариантах осуществления полимераза кодируется геном polB. В некоторых вариантах осуществления ген polB является дерепрессированным. В некоторых вариантах осуществления ген polB дерепрессируется посредством интеграции на место полусайта оператора. В некоторых вариантах осуществления оператор представляет собой оператор lexA. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу I. В некоторых вариантах осуществления данная полимераза кодируется геном polA. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу III. В некоторых вариантах осуществления полимераза кодируется геном dnaQ.

В аспектах, раскрытых в данном документе, представлены способы получения модифицированного полипептида, содержащего неприродную аминокислоту, предусматривающие: инкубирование сконструированной клетки-хозяина со множеством неприродных нуклеотид, где сконструированная клетка-хозяин содержит модифицированный транспортер нуклеозидтрифосфата и необязательно модифицированный белок, ассоциированный с транспозицией, или транспонируемый элемент; и встраивание нескольких неприродных нуклеотидов в одну или несколько новых синтезированных нитей ДНК, за счет чего образуется молекула неприродной нуклеиновой кислоты; где модифицированный белок, ассоциированный с транспозицией, или транспонируемый элемент и модифицированный транспортер нуклеозидтрифосфата обеспечивают повышение показателя сохранения неприродных пар оснований, что способствует встраиванию нескольких неприродных нуклеотидов в новый синтезированный полипептид с получением модифицированного полипептида. В некоторых вариантах осуществления модифицированный белок, ассоциированный с транспозицией, предусматривает белок InsB4 для инсерционного элемента IS1, белок InsA4 для инсерционного элемента IS1 или их комбинацию; и где модифицированный транспонируемый элемент предусматривает IS1. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата предусматривает кодон-оптимизированный транспортер нуклеозидтрифосфата из Phaeodactylum tricornutum (PtNTT2). В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата предусматривает делецию. В некоторых вариантах осуществления делеция представляет собой концевую делецию или внутреннюю делецию. В некоторых вариантах осуществления делеция представляет собой N-концевое усечение, C-концевое усечение или усечение обоих концов. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата предусматривает делецию, составляющую приблизительно 5, 10, 15, 20, 22, 25, 30, 40, 44, 50, 60, 66, 70 или больше аминокислотных остатков. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата на N-конце предусматривает делецию, составляющую приблизительно 5, 10, 15, 20, 22, 25, 30, 40, 44, 50, 60, 66, 70 или больше аминокислотных остатков. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата на N-конце предусматривает делецию, составляющую приблизительно 66 аминокислотных остатков. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит полипептид Cas9 или его варианты и одиночную направляющую РНК (sgRNA), содержащую остов crRNA-tracrRNA, где комбинация полипептида Cas9 или его вариантов и sgRNA обеспечивает модуляцию репликации первой молекулы нуклеиновой кислоты, кодирующей неприродный нуклеотид. В некоторых вариантах осуществления sgRNA содержит целевой мотив, который распознает модификацию в положении неприродного нуклеотида в молекуле нуклеиновой кислоты. В некоторых вариантах осуществления sgRNA дополнительно содержит элемент распознавания мотива, прилегающего к протоспейсеру (PAM). В некоторых вариантах осуществления элемент PAM прилегает к 3'-концу целевого мотива. В некоторых вариантах осуществления длина целевого мотива составляет от 15 до 30 нуклеотидов. В некоторых вариантах осуществления комбинация полипептида Cas9 или его вариантов и sgRNA снижает скорость репликации молекулы нуклеиновой кислоты, содержащей модификацию, на приблизительно 80%, 85%, 95%, 99% или больше. В некоторых вариантах осуществления полипептид Cas9 представляет собой Cas9 дикого типа. В некоторых вариантах осуществления неприродный нуклеотид содержит неприродное основание, выбранное из группы, состоящей из 2-аминоаденин-9-ила, 2-аминоаденина, 2-F-аденина, 2-тиоурацила, 2-тиотимина, 2-тиоцитозина, 2-пропильных и алкильных производных аденина и гуанина, 2-аминоаденина, 2-аминопропиладенина, 2-аминопиридина, 2-пиридона, 2'-дезоксиуридина, 2-амино-2'-дезоксиаденозина, 3-дезазагуанина, 3-дезазааденина, 4-тиоурацила, 4-тиотимина, урацил-5-ила, гипоксантин-9-ила (I), 5-метилцитозина, 5-гидроксиметилцитозина, ксантина, гипоксантина, 5-бром- и 5-трифторметилурацилов и цитозинов; 5-галогенурацила, 5-галогенцитозина, 5-пропинилурацила, 5-пропинилцитозина, 5-урацила, 5-замещенного, 5-галоген-, 5-замещенных пиримидинов, 5-гидроксицитозина, 5-бромцитозина, 5-бромурацила, 5-хлорцитозина, хлорированного цитозина, циклоцитозина, цитозинарабинозида, 5-фторцитозина, фторпиримидина, фторурацила, 5,6-дигидроцитозина, 5-йодцитозина, гидроксимочевины, йодурацила, 5-нитроцитозина, 5-бромурацила, 5-хлорурацила и 5-фторурацила, 5-йодурацила, 6-алкильных производных аденина и гуанина, 6-азапиримидинов, 6-азоурацила, 6-азоцитозина, азацитозина, 6-азотимина, 6-тиогуанина, 7-метилгуанина, 7-метиладенина, 7-дезазагуанина, 7-дезазагуанозина, 7-дезазааденина, 7-дезаза-8-азагуанина, 8-азагуанина, 8-азааденина, 8-галоген-, 8-амино-, 8-тиол-, 8-тиоалкил- и 8-гидроксил-замещенных аденинов и гуанинов; N4-этилцитозина, N-2-замещенных пуринов, N-6-замещенных пуринов, O-6-замещенных пуринов, тех, которые повышают стабильность образования дуплекса, универсальных нуклеиновых кислот, гидрофобных нуклеиновых кислот, промискуитентных нуклеиновых кислот, нуклеиновых кислот, увеличенных в размере, фторированных нуклеиновых кислот, трициклических пиримидинов, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3H)-он), фенотиазинцитидин(1H-пиримидо[5,4-b][1,4]бензотиазин-2(3Н)-он), гуанин-фиксирующих оснований (G-clamps), феноксазинцитидин(9-(2-аминоэтокси)-Н-пиримидо[5,4-b] [1,4-бензоксазин-2(3Н)-он), карбазолцитидин(2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин(H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), 5-фторурацила, 5-бромурацила, 5-хлорурацила, 5-йодурацила, гипоксантина, ксантина, 4-ацетилцитозина, 5-(карбоксигидроксиметил)урацила, 5-карбоксиметиламинометил-2-тиоуридина, 5-карбоксиметиламинометилурацила, дигидроурацила, бета-D-галактозилквеуозина, инозина, N6-изопентениладенина, 1-метилгуанина, 1-метилинозина, 2,2-диметилгуанина, 2-метиладенина, 2-метилгуанина, 3-метилцитозина, 5-метилцитозина, N6-аденина, 7-метилгуанина, 5-метиламинометилурацила, 5-метоксиаминометил-2-тиоурацила, бета-D-маннозилквеуозина, 5'-метоксикарбоксиметилурацила, 5-метоксиурацила, 2-метилтио-N6-изопентениладенина, урацил-5-оксиуксусной кислоты, вибутоксозина, псевдоурацила, квеуозина, 2-тиоцитозина, 5-метил-2-тиоурацила, 2-тиоурацила, 4-тиоурацила, 5-метилурацила, сложного метилового эфира урацил-5-оксиуксусной кислоты, урацил-5-оксиуксусной кислоты, 5-метил-2-тиоурацила, 3-(3-амино-3-N-2-карбоксипропил)урацила, (acp3)w и 2,6-диаминопурина и тех, в которых пуриновое или пиримидиновое основание заменено гетероциклом. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из:

В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный сахарный фрагмент, выбранный из группы, состоящей из предусматривающего модификацию в 2'-положении: OH; замещенный низший алкил, алкарил, аралкил, O-алкарил или O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3, NH2F; O-алкил, S-алкил, N-алкил; О-алкенил, S-алкенил, N-алкенил; O-алкинил, S-алкинил, N-алкинил; O-алкил-O-алкил, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3, где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C110алкил, C210алкенил, C210алкинил, -O[(CH2)n O]mCH3, -O(CH2)nOCH3, -O(CH2)n NH2, -O(CH2)n CH3, -O(CH2)n -ONH2 и -O(CH2)nON[(CH2)n CH3)]2, где n и m составляют от 1 до приблизительно 10; и/или модификацию в 5'-положении: 5'-винил, 5'-метил (R или S), модификацию в 4'-положении, 4'-S, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, группу, расщепляющую РНК, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида и любую их комбинацию. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит полимеразу. В некоторых вариантах осуществления полимераза экспрессируется конститутивно. В некоторых вариантах осуществления полимераза сверхэкспрессируется. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу. В некоторых вариантах осуществления ДНК-полимераза представляет собой ДНК-полимеразу II. В некоторых вариантах осуществления полимераза кодируется геном polB. В некоторых вариантах осуществления ген polB является дерепрессированным. В некоторых вариантах осуществления ген polB дерепрессируется посредством интеграции на место полусайта оператора. В некоторых вариантах осуществления оператор представляет собой оператор lexA. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу I. В некоторых вариантах осуществления данная полимераза кодируется геном polA. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу III. В некоторых вариантах осуществления полимераза кодируется геном dnaQ.

В аспектах, раскрытых в данном документе, представлены сконструированные клетки-хозяева для продуцирования неприродного продукта, содержащего модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой рекомбинационную репарацию. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой SOS-ответ. В некоторых вариантах осуществления сконструированная клетка-хозяин представляет собой прокариотическую клетку, эукариотическую клетку или дрожжевую клетку. В некоторых вариантах осуществления сконструированная клетка-хозяин представляет собой прокариотическую клетку. В некоторых вариантах осуществления прокариотическая клетка представляет собой клетку Escherichia coli. В некоторых вариантах осуществления клетка Escherichia coli представляет собой клетку Escherichia coli BL21 (DE3). В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой RecA. В некоторых вариантах осуществления сконструированная клетка-хозяин сконструирована для экспрессии гена, кодирующего RecA. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой Rad51. В некоторых вариантах осуществления сконструированная клетка-хозяин сконструирована для экспрессии гена, кодирующего Rad51. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой RadA. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой LexA. В некоторых вариантах осуществления ген, кодирующий модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, содержит одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления ген содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA, rad51, и/или radA содержат одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления каждый из recA, rad51 и radA независимо содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит внутреннюю делецию остатков 2-347. В некоторых вариантах осуществления lexA содержит одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления lexA содержит мутацию в положении аминокислоты S119, необязательно мутацию S119A. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит полимеразу. В некоторых вариантах осуществления полимераза экспрессируется конститутивно. В некоторых вариантах осуществления полимераза сверхэкспрессируется. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу. В некоторых вариантах осуществления ДНК-полимераза представляет собой ДНК-полимеразу II. В некоторых вариантах осуществления полимераза кодируется геном polB. В некоторых вариантах осуществления ген polB является дерепрессированным. В некоторых вариантах осуществления ген polB дерепрессируется посредством интеграции на место полусайта оператора. В некоторых вариантах осуществления оператор представляет собой оператор lexA. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу I. В некоторых вариантах осуществления данная полимераза кодируется геном polA. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу III. В некоторых вариантах осуществления полимераза кодируется геном dnaQ.

В аспектах, раскрытых в данном документе, представлены сконструированные клетки-хозяева для получения неприродного продукта, содержащего модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, и полимеразу, где полимераза характеризуется повышенным уровнем экспрессии по сравнению с эквивалентной клеткой-хозяином, содержащей эквивалентную полимеразу с базальным уровнем экспрессии. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой рекомбинационную репарацию. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой SOS-ответ. В некоторых вариантах осуществления полимераза экспрессируется конститутивно. В некоторых вариантах осуществления полимераза представляет собой ДНК-полимеразу II. В некоторых вариантах ответ, представляющий собой репарацию ДНК, представляет собой рекомбинационную репарацию, SOS-ответ, эксцизионную репарацию нуклеотидов или метил-направленную репарацию ошибочно спаренных оснований. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой рекомбинационную репарацию. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой SOS-ответ. В некоторых вариантах осуществления сконструированная клетка-хозяин представляет собой прокариотическую клетку, эукариотическую клетку или дрожжевую клетку. В некоторых вариантах осуществления сконструированная клетка-хозяин представляет собой прокариотическую клетку. В некоторых вариантах осуществления прокариотическая клетка представляет собой клетку Escherichia coli. В некоторых вариантах осуществления клетка Escherichia coli представляет собой клетку Escherichia coli BL21 (DE3). В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой RecA. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой Rad51. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой RadA. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой LexA. В некоторых вариантах осуществления ген, кодирующий дефектный белок, содержит одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления ген содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA, rad51, и/или radA содержат одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления каждый из recA, rad51 и radA независимо содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит внутреннюю делецию остатков 2-347. В некоторых вариантах осуществления lexA содержит одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления lexA содержит мутацию в положении аминокислоты S119, необязательно мутацию S119A. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит транспортер нуклеозидтрифосфата из Phaeodactylum tricornutum (PtNTT2). В некоторых вариантах осуществления транспортер нуклеозидтрифосфата из PtNTT2 является модифицированным. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата кодируется молекулой нуклеиновой кислоты. В некоторых вариантах осуществления молекула нуклеиновой кислоты, кодирующая модифицированный транспортер нуклеозидтрифосфата, встроена в геномную последовательность сконструированной клетки-хозяина. В некоторых вариантах осуществления сконструированная клетка-хозяин содержит плазмиду, содержащую молекулу нуклеиновой кислоты, кодирующую модифицированный транспортер нуклеозидтрифосфата. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата является кодон-оптимизированным транспортером нуклеозидтрифосфата из Phaeodactylum tricornutum . В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата предусматривает делецию. В некоторых вариантах осуществления делеция представляет собой концевую делецию или внутреннюю делецию. В некоторых вариантах осуществления делеция представляет собой N-концевое усечение, C-концевое усечение или усечение обоих концов. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата предусматривает делецию, составляющую приблизительно 5, 10, 15, 20, 22, 25, 30, 40, 44, 50, 60, 66, 70 или больше аминокислотных остатков. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата на N-конце предусматривает делецию, составляющую приблизительно 5, 10, 15, 20, 22, 25, 30, 40, 44, 50, 60, 66, 70 или больше аминокислотных остатков. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата на N-конце предусматривает делецию, составляющую приблизительно 66 аминокислотных остатков. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата находится под контролем промотора, выбранного из промотора из плазмиды pSC или промотора из lac-оперона. В некоторых вариантах осуществления lac-оперон представляет собой lac-оперон E. coli. В некоторых вариантах осуществления lac-оперон выбран из Pbla, Plac, PlacUV5, PH207, Pλ, Ptac или PN25. В некоторых вариантах осуществления модифицированный транспортер нуклеозидтрифосфата находится под контролем промотора PlacUV5. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит полипептид Cas9 или его варианты и одиночную направляющую РНК (sgRNA), содержащую остов crRNA-tracrRNA, где комбинация полипептида Cas9 или его вариантов и sgRNA обеспечивает модуляцию репликации молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид. В некоторых вариантах осуществления sgRNA содержит целевой мотив, который распознает модификацию в положении неприродного нуклеотида в молекуле нуклеиновой кислоты. В некоторых вариантах осуществления sgRNA дополнительно содержит элемент распознавания мотива, прилегающего к протоспейсеру (PAM). В некоторых вариантах осуществления элемент PAM прилегает к 3'-концу целевого мотива. В некоторых вариантах осуществления длина целевого мотива составляет от 15 до 30 нуклеотидов. В некоторых вариантах осуществления комбинация полипептида Cas9 или его вариантов и sgRNA снижает скорость репликации молекулы нуклеиновой кислоты, содержащей модификацию, на приблизительно 80%, 85%, 95%, 99% или больше. В некоторых вариантах осуществления полипептид Cas9 представляет собой Cas9 дикого типа. В некоторых вариантах осуществления сконструированная клетка-хозяин дополнительно содержит неприродный нуклеотид. В некоторых вариантах осуществления неприродный нуклеотид содержит неприродное основание, выбранное из группы, состоящей из 2-аминоаденин-9-ила, 2-аминоаденина, 2-F-аденина, 2-тиоурацила, 2-тиотимина, 2-тиоцитозина, 2-пропильных и алкильных производных аденина и гуанина, 2-аминоаденина, 2-аминопропиладенина, 2-аминопиридина, 2-пиридона, 2'-дезоксиуридина, 2-амино-2'-дезоксиаденозина, 3-дезазагуанина, 3-дезазааденина, 4-тиоурацила, 4-тиотимина, урацил-5-ила, гипоксантин-9-ила (I), 5-метилцитозина, 5-гидроксиметилцитозина, ксантина, гипоксантина, 5-бром- и 5-трифторметилурацилов и цитозинов; 5-галогенурацила, 5-галогенцитозина, 5-пропинилурацила, 5-пропинилцитозина, 5-урацила, 5-замещенного, 5-галоген-, 5-замещенных пиримидинов, 5-гидроксицитозина, 5-бромцитозина, 5-бромурацила, 5-хлорцитозина, хлорированного цитозина, циклоцитозина, цитозинарабинозида, 5-фторцитозина, фторпиримидина, фторурацила, 5,6-дигидроцитозина, 5-йодцитозина, гидроксимочевины, йодурацила, 5-нитроцитозина, 5-бромурацила, 5-хлорурацила и 5-фторурацила, 5-йодурацила, 6-алкильных производных аденина и гуанина, 6-азапиримидинов, 6-азоурацила, 6-азоцитозина, азацитозина, 6-азотимина, 6-тиогуанина, 7-метилгуанина, 7-метиладенина, 7-дезазагуанина, 7-дезазагуанозина, 7-дезазааденина, 7-дезаза-8-азагуанина, 8-азагуанина, 8-азааденина, 8-галоген-, 8-амино-, 8-тиол-, 8-тиоалкил- и 8-гидроксил-замещенных аденинов и гуанинов; N4-этилцитозина, N-2-замещенных пуринов, N-6-замещенных пуринов, O-6-замещенных пуринов, тех, которые повышают стабильность образования дуплекса, универсальных нуклеиновых кислот, гидрофобных нуклеиновых кислот, промискуитентных нуклеиновых кислот, нуклеиновых кислот, увеличенных в размере, фторированных нуклеиновых кислот, трициклических пиримидинов, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3H)-он), фенотиазинцитидин(1H-пиримидо[5,4-b][1,4]бензотиазин-2(3Н)-он), гуанин-фиксирующих оснований (G-clamps), феноксазинцитидин(9-(2-аминоэтокси)-Н-пиримидо[5,4-b] [1,4-бензоксазин-2(3Н)-он), карбазолцитидин(2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин(H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), 5-фторурацила, 5-бромурацила, 5-хлорурацила, 5-йодурацила, гипоксантина, ксантина, 4-ацетилцитозина, 5-(карбоксигидроксиметил)урацила, 5-карбоксиметиламинометил-2-тиоуридина, 5-карбоксиметиламинометилурацила, дигидроурацила, бета-D-галактозилквеуозина, инозина, N6-изопентениладенина, 1-метилгуанина, 1-метилинозина, 2,2-диметилгуанина, 2-метиладенина, 2-метилгуанина, 3-метилцитозина, 5-метилцитозина, N6-аденина, 7-метилгуанина, 5-метиламинометилурацила, 5-метоксиаминометил-2-тиоурацила, бета-D-маннозилквеуозина, 5'-метоксикарбоксиметилурацила, 5-метоксиурацила, 2-метилтио-N6-изопентениладенина, урацил-5-оксиуксусной кислоты, вибутоксозина, псевдоурацила, квеуозина, 2-тиоцитозина, 5-метил-2-тиоурацила, 2-тиоурацила, 4-тиоурацила, 5-метилурацила, сложного метилового эфира урацил-5-оксиуксусной кислоты, урацил-5-оксиуксусной кислоты, 5-метил-2-тиоурацила, 3-(3-амино-3-N-2-карбоксипропил)урацила, (acp3)w и 2,6-диаминопурина и тех, в которых пуриновое или пиримидиновое основание заменено гетероциклом. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из

.

В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный сахарный фрагмент. В некоторых вариантах осуществления неприродный сахарный фрагмент выбран из группы, состоящей из предусматривающего модификацию в 2'-положении: OH; замещенный низший алкил, алкарил, аралкил, O-алкарил или O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3, NH2F; O-алкил, S-алкил, N-алкил; О-алкенил, S-алкенил, N-алкенил; O-алкинил, S-алкинил, N-алкинил; O-алкил-O-алкил, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3, где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C110алкил, C210алкенил, C210алкинил, -O[(CH2)n O]mCH3, -O(CH2)nOCH3, -O(CH2)n NH2, -O(CH2)n CH3, -O(CH2)n -ONH2 и -O(CH2)nON[(CH2)n CH3)]2, где n и m составляют от 1 до приблизительно 10; и/или модификацию в 5'-положении: 5'-винил, 5'-метил (R или S), модификацию в 4'-положении, 4'-S, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, группу, расщепляющую РНК, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида и любую их комбинацию. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из

. В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный остов. В некоторых вариантах осуществления неприродный остов выбран из группы, состоящей из фосфоротиоата, хирального фосфоротиоата, фосфородитиоата, сложного фосфотриэфира, сложного аминоалкилфосфотриэфира, C110фосфонатов, 3'-алкиленфосфоната, хиральных фосфонатов, фосфинатов, фосфорамидатов, 3'-аминофосфорамидата, аминоалкилфосфорамидатов, тионофосфорамидатов, тионоалкилфосфонатов, сложных тионоалкилфосфотриэфиров и боранофосфатов. В некоторых вариантах осуществления неприродный нуклеотид представляет собой dNaMTP и/или dTPT3TP. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в геном сконструированной клетки-хозяина. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в хромосому. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в локус arsB. В некоторых вариантах осуществления сконструированная клетка-хозяин обеспечивает сохранение неприродных пар оснований на приблизительно 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или больше по сравнению с эквивалентной сконструированной клетки-хозяина при отсутствии модифицированного белка, ассоциированного с ответом, представляющим собой репарацию ДНК, или при отсутствии модифицированного белка, ассоциированного с ответом, представляющим собой репарацию ДНК, в комбинации со сверхэкспрессируемой полимеразой. В некоторых вариантах осуществления сконструированная клетка-хозяин обеспечивает сохранение неприродных пар оснований на по меньшей мере 50% после более чем 50, более чем 100, более чем 120, более чем 130, более чем 150 или более чем 200 поколений. В некоторых вариантах осуществления сконструированная клетка-хозяин обеспечивает сохранение неприродных пар оснований на по меньшей мере 55% после более чем 50, более чем 100, более чем 120, более чем 130, более чем 137, более чем 150 или более чем 200 поколений. В некоторых вариантах осуществления неприродный продукт представляет собой молекулу нуклеиновой кислоты, содержащую неприродный нуклеотид. В некоторых вариантах осуществления неприродный продукт представляет собой полипептид, содержащий неприродную аминокислоту. В некоторых вариантах осуществления сконструированная клетка-хозяин представляет собой полусинтетический организм.

В аспектах, раскрытых в данном документе, представлены молекулы нуклеиновой кислоты, содержащие неприродный нуклеотид, продуцируемый сконструированной клеткой-хозяином, описанной в данном документе.

В аспектах, раскрытых в данном документе, представлен полипептид, содержащий одну или несколько неприродных аминокислот, продуцируемый сконструированной клеткой-хозяином, описанной в данном документе.

В аспектах, раскрытых в данном документе, представлены способы повышения точности репликации молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, предусматривающие: (a) инкубирование сконструированной клетки-хозяина, описанной в данном документе, со множеством неприродных нуклеотидов и (b) встраивание множества неприродных нуклеотидов в одну или несколько новых синтезированных нитей ДНК, за счет чего образуется молекула неприродной нуклеиновой кислоты; где модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемая полимераза повышают точность репликации неприродных пар оснований, в том числе неприродных нуклеотидов, в одной или нескольких новых синтезированных нитях ДНК. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой рекомбинационную репарацию. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой SOS-ответ. В некоторых вариантах осуществления продуцирование молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, повышено по сравнению с продуцированием молекулы нуклеиновой кислоты в эквивалентной клетке-хозяине при отсутствии модифицированного белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемой полимеразы. В некоторых вариантах осуществления повышенное продуцирование молекулы нуклеиновой кислоты на по меньшей мере 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% или 99% превышает продуцирование молекулы нуклеиновой кислоты в эквивалентной клетке-хозяине при отсутствии модифицированного белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемой полимеразы. В некоторых вариантах осуществления повышенное продуцирование молекулы нуклеиновой кислоты в более чем 1 раз, 2 раза, 3 раза, 4 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз, 100 раз или выше превышает продуцирование молекулы нуклеиновой кислоты в эквивалентной клетке-хозяине при отсутствии модифицированного белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемой полимеразы. В некоторых вариантах осуществления повышенное продуцирование молекулы нуклеиновой кислоты в 1-5 раз, 5-10 раз, 10-15 раз, 15-20 раз, 20-25 раз, 25-30 раз, 30-40 раз, 40-50 раз, 50-60 раз, 60-70 раз, 70-80 раз, 80-90 раз, 90-100 раз или 100-200 раз превышает продуцирование молекулы нуклеиновой кислоты в эквивалентной клетке-хозяине при отсутствии модифицированного белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемой полимеразы. В некоторых вариантах осуществления неприродный нуклеотид содержит неприродное основание, выбранное из группы, состоящей из 2-аминоаденин-9-ила, 2-аминоаденина, 2-F-аденина, 2-тиоурацила, 2-тиотимина, 2-тиоцитозина, 2-пропильных и алкильных производных аденина и гуанина, 2-аминоаденина, 2-аминопропиладенина, 2-аминопиридина, 2-пиридона, 2'-дезоксиуридина, 2-амино-2'-дезоксиаденозина, 3-дезазагуанина, 3-дезазааденина, 4-тиоурацила, 4-тиотимина, урацил-5-ила, гипоксантин-9-ила (I), 5-метилцитозина, 5-гидроксиметилцитозина, ксантина, гипоксантина, 5-бром- и 5-трифторметилурацилов и цитозинов; 5-галогенурацила, 5-галогенцитозина, 5-пропинилурацила, 5-пропинилцитозина, 5-урацила, 5-замещенного, 5-галоген-, 5-замещенных пиримидинов, 5-гидроксицитозина, 5-бромцитозина, 5-бромурацила, 5-хлорцитозина, хлорированного цитозина, циклоцитозина, цитозинарабинозида, 5-фторцитозина, фторпиримидина, фторурацила, 5,6-дигидроцитозина, 5-йодцитозина, гидроксимочевины, йодурацила, 5-нитроцитозина, 5-бромурацила, 5-хлорурацила и 5-фторурацила, 5-йодурацила, 6-алкильных производных аденина и гуанина, 6-азапиримидинов, 6-азоурацила, 6-азоцитозина, азацитозина, 6-азотимина, 6-тиогуанина, 7-метилгуанина, 7-метиладенина, 7-дезазагуанина, 7-дезазагуанозина, 7-дезазааденина, 7-дезаза-8-азагуанина, 8-азагуанина, 8-азааденина, 8-галоген-, 8-амино-, 8-тиол-, 8-тиоалкил- и 8-гидроксил-замещенных аденинов и гуанинов; N4-этилцитозина, N-2-замещенных пуринов, N-6-замещенных пуринов, O-6-замещенных пуринов, тех, которые повышают стабильность образования дуплекса, универсальных нуклеиновых кислот, гидрофобных нуклеиновых кислот, промискуитентных нуклеиновых кислот, нуклеиновых кислот, увеличенных в размере, фторированных нуклеиновых кислот, трициклических пиримидинов, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3H)-он), фенотиазинцитидин(1H-пиримидо[5,4-b][1,4]бензотиазин-2(3Н)-он), гуанин-фиксирующих оснований (G-clamps), феноксазинцитидин(9-(2-аминоэтокси)-Н-пиримидо[5,4-b] [1,4-бензоксазин-2(3Н)-он), карбазолцитидин(2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин(H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), 5-фторурацила, 5-бромурацила, 5-хлорурацила, 5-йодурацила, гипоксантина, ксантина, 4-ацетилцитозина, 5-(карбоксигидроксиметил)урацила, 5-карбоксиметиламинометил-2-тиоуридина, 5-карбоксиметиламинометилурацила, дигидроурацила, бета-D-галактозилквеуозина, инозина, N6-изопентениладенина, 1-метилгуанина, 1-метилинозина, 2,2-диметилгуанина, 2-метиладенина, 2-метилгуанина, 3-метилцитозина, 5-метилцитозина, N6-аденина, 7-метилгуанина, 5-метиламинометилурацила, 5-метоксиаминометил-2-тиоурацила, бета-D-маннозилквеуозина, 5'-метоксикарбоксиметилурацила, 5-метоксиурацила, 2-метилтио-N6-изопентениладенина, урацил-5-оксиуксусной кислоты, вибутоксозина, псевдоурацила, квеуозина, 2-тиоцитозина, 5-метил-2-тиоурацила, 2-тиоурацила, 4-тиоурацила, 5-метилурацила, сложного метилового эфира урацил-5-оксиуксусной кислоты, урацил-5-оксиуксусной кислоты, 5-метил-2-тиоурацила, 3-(3-амино-3-N-2-карбоксипропил)урацила, (acp3)w и 2,6-диаминопурина и тех, в которых пуриновое или пиримидиновое основание заменено гетероциклом. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из

.

В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный сахарный фрагмент. В некоторых вариантах осуществления неприродный сахарный фрагмент выбран из группы, состоящей из предусматривающего модификацию в 2'-положении: OH; замещенный низший алкил, алкарил, аралкил, O-алкарил или O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3, NH2F; O-алкил, S-алкил, N-алкил; О-алкенил, S-алкенил, N-алкенил; O-алкинил, S-алкинил, N-алкинил; O-алкил-O-алкил, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3, где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C110алкил, C210алкенил, C210алкинил, -O[(CH2)n O]mCH3, -O(CH2)nOCH3, -O(CH2)n NH2, -O(CH2)n CH3, -O(CH2)n -ONH2 и -O(CH2)nON[(CH2)n CH3)]2, где n и m составляют от 1 до приблизительно 10; и/или модификацию в 5'-положении: 5'-винил, 5'-метил (R или S), модификацию в 4'-положении, 4'-S, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, группу, расщепляющую РНК, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида и любую их комбинацию. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из

.

В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный остов. В некоторых вариантах осуществления неприродный остов выбран из группы, состоящей из фосфоротиоата, хирального фосфоротиоата, фосфородитиоата, сложного фосфотриэфира, сложного аминоалкилфосфотриэфира, C110фосфонатов, 3'-алкиленфосфоната, хиральных фосфонатов, фосфинатов, фосфорамидатов, 3'-аминофосфорамидата, аминоалкилфосфорамидатов, тионофосфорамидатов, тионоалкилфосфонатов, сложных тионоалкилфосфотриэфиров и боранофосфатов. В некоторых вариантах осуществления неприродный нуклеотид представляет собой dNaMTP и/или dTPT3TP. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в геном сконструированной клетки-хозяина. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в хромосому. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в локус arsB. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой RecA. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой Rad51. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой RadA. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой LexA. В некоторых вариантах осуществления ген, кодирующий модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, содержит одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления ген содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA, rad51, и/или radA содержат одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления каждый из recA, rad51 и radA независимо содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит внутреннюю делецию остатков 2-347. В некоторых вариантах осуществления lexA содержит одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления lexA содержит мутацию в положении аминокислоты S119, необязательно мутацию S119A.

В аспектах, раскрытых в данном документе, представлены способы повышения продуцирования молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, предусматривающие: (a) инкубирование сконструированной клетки-хозяина, описанной в данном документе, со множеством неприродных нуклеотидов и (b) встраивание множества неприродных нуклеотидов в одну или несколько новых синтезированных нитей ДНК, за счет чего образуется молекула неприродной нуклеиновой кислоты; где модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемая полимераза повышают показатель сохранения неприродных пар оснований, предусматривающих неприродные нуклеотиды, в одной или нескольких новых синтезированных нитях ДНК. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой рекомбинационную репарацию. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой SOS-ответ. В некоторых вариантах осуществления продуцирование молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, повышено по сравнению с продуцированием молекулы нуклеиновой кислоты в эквивалентной клетке-хозяине при отсутствии модифицированного белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемой полимеразы. В некоторых вариантах осуществления повышенное продуцирование молекулы нуклеиновой кислоты на по меньшей мере 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% или 99% превышает продуцирование молекулы нуклеиновой кислоты в эквивалентной клетке-хозяине при отсутствии модифицированного белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемой полимеразы. В некоторых вариантах осуществления повышенное продуцирование молекулы нуклеиновой кислоты в более чем 1 раз, 2 раза, 3 раза, 4 раза, 5 раз, 10 раз, 15 раз, 20 раз, 25 раз, 30 раз, 40 раз, 50 раз, 100 раз или выше превышает продуцирование молекулы нуклеиновой кислоты в эквивалентной клетке-хозяине при отсутствии модифицированного белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемой полимеразы. В некоторых вариантах осуществления повышенное продуцирование молекулы нуклеиновой кислоты в 1-5 раз, 5-10 раз, 10-15 раз, 15-20 раз, 20-25 раз, 25-30 раз, 30-40 раз, 40-50 раз, 50-60 раз, 60-70 раз, 70-80 раз, 80-90 раз, 90-100 раз или 100-200 раз превышает продуцирование молекулы нуклеиновой кислоты в эквивалентной клетке-хозяине при отсутствии модифицированного белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемой полимеразы. В некоторых вариантах осуществления неприродный нуклеотид содержит неприродное основание, выбранное из группы, состоящей из 2-аминоаденин-9-ила, 2-аминоаденина, 2-F-аденина, 2-тиоурацила, 2-тиотимина, 2-тиоцитозина, 2-пропильных и алкильных производных аденина и гуанина, 2-аминоаденина, 2-аминопропиладенина, 2-аминопиридина, 2-пиридона, 2'-дезоксиуридина, 2-амино-2'-дезоксиаденозина, 3-дезазагуанина, 3-дезазааденина, 4-тиоурацила, 4-тиотимина, урацил-5-ила, гипоксантин-9-ила (I), 5-метилцитозина, 5-гидроксиметилцитозина, ксантина, гипоксантина, 5-бром- и 5-трифторметилурацилов и цитозинов; 5-галогенурацила, 5-галогенцитозина, 5-пропинилурацила, 5-пропинилцитозина, 5-урацила, 5-замещенного, 5-галоген-, 5-замещенных пиримидинов, 5-гидроксицитозина, 5-бромцитозина, 5-бромурацила, 5-хлорцитозина, хлорированного цитозина, циклоцитозина, цитозинарабинозида, 5-фторцитозина, фторпиримидина, фторурацила, 5,6-дигидроцитозина, 5-йодцитозина, гидроксимочевины, йодурацила, 5-нитроцитозина, 5-бромурацила, 5-хлорурацила и 5-фторурацила, 5-йодурацила, 6-алкильных производных аденина и гуанина, 6-азапиримидинов, 6-азоурацила, 6-азоцитозина, азацитозина, 6-азотимина, 6-тиогуанина, 7-метилгуанина, 7-метиладенина, 7-дезазагуанина, 7-дезазагуанозина, 7-дезазааденина, 7-дезаза-8-азагуанина, 8-азагуанина, 8-азааденина, 8-галоген-, 8-амино-, 8-тиол-, 8-тиоалкил- и 8-гидроксил-замещенных аденинов и гуанинов; N4-этилцитозина, N-2-замещенных пуринов, N-6-замещенных пуринов, O-6-замещенных пуринов, тех, которые повышают стабильность образования дуплекса, универсальных нуклеиновых кислот, гидрофобных нуклеиновых кислот, промискуитентных нуклеиновых кислот, нуклеиновых кислот, увеличенных в размере, фторированных нуклеиновых кислот, трициклических пиримидинов, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3H)-он), фенотиазинцитидин(1H-пиримидо[5,4-b][1,4]бензотиазин-2(3Н)-он), гуанин-фиксирующих оснований (G-clamps), феноксазинцитидин(9-(2-аминоэтокси)-Н-пиримидо[5,4-b] [1,4-бензоксазин-2(3Н)-он), карбазолцитидин(2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин(H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), 5-фторурацила, 5-бромурацила, 5-хлорурацила, 5-йодурацила, гипоксантина, ксантина, 4-ацетилцитозина, 5-(карбоксигидроксиметил)урацила, 5-карбоксиметиламинометил-2-тиоуридина, 5-карбоксиметиламинометилурацила, дигидроурацила, бета-D-галактозилквеуозина, инозина, N6-изопентениладенина, 1-метилгуанина, 1-метилинозина, 2,2-диметилгуанина, 2-метиладенина, 2-метилгуанина, 3-метилцитозина, 5-метилцитозина, N6-аденина, 7-метилгуанина, 5-метиламинометилурацила, 5-метоксиаминометил-2-тиоурацила, бета-D-маннозилквеуозина, 5'-метоксикарбоксиметилурацила, 5-метоксиурацила, 2-метилтио-N6-изопентениладенина, урацил-5-оксиуксусной кислоты, вибутоксозина, псевдоурацила, квеуозина, 2-тиоцитозина, 5-метил-2-тиоурацила, 2-тиоурацила, 4-тиоурацила, 5-метилурацила, сложного метилового эфира урацил-5-оксиуксусной кислоты, урацил-5-оксиуксусной кислоты, 5-метил-2-тиоурацила, 3-(3-амино-3-N-2-карбоксипропил)урацила, (acp3)w и 2,6-диаминопурина и тех, в которых пуриновое или пиримидиновое основание заменено гетероциклом. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из

.

В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный сахарный фрагмент. В некоторых вариантах осуществления неприродный сахарный фрагмент выбран из группы, состоящей из предусматривающего модификацию в 2'-положении: OH; замещенный низший алкил, алкарил, аралкил, O-алкарил или O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3, NH2F; O-алкил, S-алкил, N-алкил; О-алкенил, S-алкенил, N-алкенил; O-алкинил, S-алкинил, N-алкинил; O-алкил-O-алкил, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3, где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C110алкил, C210алкенил, C210алкинил, -O[(CH2)n O]mCH3, -O(CH2)nOCH3, -O(CH2)n NH2, -O(CH2)n CH3, -O(CH2)n -ONH2 и -O(CH2)nON[(CH2)n CH3)]2, где n и m составляют от 1 до приблизительно 10; и/или модификацию в 5'-положении: 5'-винил, 5'-метил (R или S), модификацию в 4'-положении, 4'-S, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, группу, расщепляющую РНК, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида и любую их комбинацию. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из

.

В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный остов. В некоторых вариантах осуществления неприродный остов выбран из группы, состоящей из фосфоротиоата, хирального фосфоротиоата, фосфородитиоата, сложного фосфотриэфира, сложного аминоалкилфосфотриэфира, C110фосфонатов, 3'-алкиленфосфоната, хиральных фосфонатов, фосфинатов, фосфорамидатов, 3'-аминофосфорамидата, аминоалкилфосфорамидатов, тионофосфорамидатов, тионоалкилфосфонатов, сложных тионоалкилфосфотриэфиров и боранофосфатов. В некоторых вариантах осуществления неприродный нуклеотид представляет собой dNaMTP и/или dTPT3TP. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в геном сконструированной клетки-хозяина. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в хромосому. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в локус arsB. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой RecA. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой Rad51. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой RadA. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой LexA. В некоторых вариантах осуществления ген, кодирующий модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, содержит одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления ген содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA, rad51, и/или radA содержат одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления каждый из recA, rad51 и radA независимо содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит внутреннюю делецию остатков 2-347. В некоторых вариантах осуществления lexA содержит одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления lexA содержит мутацию в положении аминокислоты S119, необязательно мутацию S119A.

В аспектах, раскрытых в данном документе, представлены способы получения модифицированного полипептида, содержащего неприродную аминокислоту, предусматривающие: (a) инкубирование сконструированной клетки-хозяина, описанной в данном документе, со множеством неприродных аминокислот и (b) встраивание множества неприродных аминокислот в новый синтезированный полипептид, за счет чего образуется модифицированный полипептид; где модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемая полимераза повышают показатель сохранения неприродных пар оснований, что способствует встраиванию множества неприродных аминокислот в новый синтезированный полипептид с получением модифицированного полипептида. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой рекомбинационную репарацию. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой SOS-ответ. В некоторых вариантах осуществления модифицированный полипептид дополнительно конъюгируют с конъюгирующим фрагментом с получением модифицированного полипептидного конъюгата. В некоторых вариантах осуществления конъюгирующий фрагмент представляет собой белок или его связывающий фрагмент, полимер, терапевтическое средство, средство для визуализации или их комбинацию. В некоторых вариантах осуществления модифицированный полипептид дополнительно конъюгирован с терапевтическим средством. В некоторых вариантах осуществления модифицированный полипептид представляет собой средство для визуализации. В некоторых вариантах осуществления модифицированный полипептидный конъюгат дополнительно составляют с фармацевтическим вспомогательным средством с получением фармацевтической композиции. В некоторых вариантах осуществления неприродный нуклеотид содержит неприродное основание, выбранное из группы, состоящей из 2-аминоаденин-9-ила, 2-аминоаденина, 2-F-аденина, 2-тиоурацила, 2-тиотимина, 2-тиоцитозина, 2-пропильных и алкильных производных аденина и гуанина, 2-аминоаденина, 2-аминопропиладенина, 2-аминопиридина, 2-пиридона, 2'-дезоксиуридина, 2-амино-2'-дезоксиаденозина, 3-дезазагуанина, 3-дезазааденина, 4-тиоурацила, 4-тиотимина, урацил-5-ила, гипоксантин-9-ила (I), 5-метилцитозина, 5-гидроксиметилцитозина, ксантина, гипоксантина, 5-бром- и 5-трифторметилурацилов и цитозинов; 5-галогенурацила, 5-галогенцитозина, 5-пропинилурацила, 5-пропинилцитозина, 5-урацила, 5-замещенного, 5-галоген-, 5-замещенных пиримидинов, 5-гидроксицитозина, 5-бромцитозина, 5-бромурацила, 5-хлорцитозина, хлорированного цитозина, циклоцитозина, цитозинарабинозида, 5-фторцитозина, фторпиримидина, фторурацила, 5,6-дигидроцитозина, 5-йодцитозина, гидроксимочевины, йодурацила, 5-нитроцитозина, 5-бромурацила, 5-хлорурацила и 5-фторурацила, 5-йодурацила, 6-алкильных производных аденина и гуанина, 6-азапиримидинов, 6-азоурацила, 6-азоцитозина, азацитозина, 6-азотимина, 6-тиогуанина, 7-метилгуанина, 7-метиладенина, 7-дезазагуанина, 7-дезазагуанозина, 7-дезазааденина, 7-дезаза-8-азагуанина, 8-азагуанина, 8-азааденина, 8-галоген-, 8-амино-, 8-тиол-, 8-тиоалкил- и 8-гидроксил-замещенных аденинов и гуанинов; N4-этилцитозина, N-2-замещенных пуринов, N-6-замещенных пуринов, O-6-замещенных пуринов, тех, которые повышают стабильность образования дуплекса, универсальных нуклеиновых кислот, гидрофобных нуклеиновых кислот, промискуитентных нуклеиновых кислот, нуклеиновых кислот, увеличенных в размере, фторированных нуклеиновых кислот, трициклических пиримидинов, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3H)-он), фенотиазинцитидин(1H-пиримидо[5,4-b][1,4]бензотиазин-2(3Н)-он), гуанин-фиксирующих оснований (G-clamps), феноксазинцитидин(9-(2-аминоэтокси)-Н-пиримидо[5,4-b] [1,4-бензоксазин-2(3Н)-он), карбазолцитидин(2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин(H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), 5-фторурацила, 5-бромурацила, 5-хлорурацила, 5-йодурацила, гипоксантина, ксантина, 4-ацетилцитозина, 5-(карбоксигидроксиметил)урацила, 5-карбоксиметиламинометил-2-тиоуридина, 5-карбоксиметиламинометилурацила, дигидроурацила, бета-D-галактозилквеуозина, инозина, N6-изопентениладенина, 1-метилгуанина, 1-метилинозина, 2,2-диметилгуанина, 2-метиладенина, 2-метилгуанина, 3-метилцитозина, 5-метилцитозина, N6-аденина, 7-метилгуанина, 5-метиламинометилурацила, 5-метоксиаминометил-2-тиоурацила, бета-D-маннозилквеуозина, 5'-метоксикарбоксиметилурацила, 5-метоксиурацила, 2-метилтио-N6-изопентениладенина, урацил-5-оксиуксусной кислоты, вибутоксозина, псевдоурацила, квеуозина, 2-тиоцитозина, 5-метил-2-тиоурацила, 2-тиоурацила, 4-тиоурацила, 5-метилурацила, сложного метилового эфира урацил-5-оксиуксусной кислоты, урацил-5-оксиуксусной кислоты, 5-метил-2-тиоурацила, 3-(3-амино-3-N-2-карбоксипропил)урацила, (acp3)w и 2,6-диаминопурина и тех, в которых пуриновое или пиримидиновое основание заменено гетероциклом. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из

.

В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный сахарный фрагмент. В некоторых вариантах осуществления неприродный сахарный фрагмент выбран из группы, состоящей из предусматривающего модификацию в 2'-положении: OH; замещенный низший алкил, алкарил, аралкил, O-алкарил или O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3, NH2F; O-алкил, S-алкил, N-алкил; О-алкенил, S-алкенил, N-алкенил; O-алкинил, S-алкинил, N-алкинил; O-алкил-O-алкил, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3, где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C110алкил, C210алкенил, C210алкинил, -O[(CH2)n O]mCH3, -O(CH2)nOCH3, -O(CH2)n NH2, -O(CH2)n CH3, -O(CH2)n -ONH2 и -O(CH2)nON[(CH2)n CH3)]2, где n и m составляют от 1 до приблизительно 10; и/или модификацию в 5'-положении: 5'-винил, 5'-метил (R или S), модификацию в 4'-положении, 4'-S, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, группу, расщепляющую РНК, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида и любую их комбинацию. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из

. В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный остов. В некоторых вариантах осуществления неприродный остов выбран из группы, состоящей из фосфоротиоата, хирального фосфоротиоата, фосфородитиоата, сложного фосфотриэфира, сложного аминоалкилфосфотриэфира, C110фосфонатов, 3'-алкиленфосфоната, хиральных фосфонатов, фосфинатов, фосфорамидатов, 3'-аминофосфорамидата, аминоалкилфосфорамидатов, тионофосфорамидатов, тионоалкилфосфонатов, сложных тионоалкилфосфотриэфиров и боранофосфатов. В некоторых вариантах осуществления неприродный нуклеотид представляет собой dNaMTP и/или dTPT3TP. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в геном сконструированной клетки-хозяина. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в хромосому. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в локус arsB. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой RecA. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой Rad51. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой RadA. В некоторых вариантах осуществления модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, представляет собой LexA. В некоторых вариантах осуществления ген, кодирующий модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, содержит одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления ген содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA, rad51, и/или radA содержат одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления каждый из recA, rad51 и radA независимо содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит внутреннюю делецию остатков 2-347. В некоторых вариантах осуществления lexA содержит одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления lexA содержит мутацию в положении аминокислоты S119, необязательно мутацию S119A.

В аспектах, раскрытых в данном документе, представлены способы лечения заболевания или состояния, предусматривающие введение нуждающемуся в этом субъекту фармацевтической композиции, содержащей модифицированный полипептид, полученный с помощью способов, раскрытых в данном документе, за счет чего обеспечивается лечение заболевания или состояния.

В аспектах, раскрытых в данном документе, представлены наборы, содержащие сконструированные клетки-хозяева, описанные в данном документе.

В аспектах, раскрытых в данном документе, представлены сконструированные клетки-хозяева для продуцирования неприродного продукта, содержащего модифицированный RecA. В некоторых вариантах осуществления ген, кодирующий модифицированный RecA, содержит одну или несколько мутаций, одну или несколько делеций или их комбинацию. В некоторых вариантах осуществления ген содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит N-концевую делецию, C-концевую делецию, усечение на обоих концах или внутреннюю делецию. В некоторых вариантах осуществления recA содержит внутреннюю делецию остатков 2-347.

В аспектах, раскрытых в данном документе, представлены сконструированные клетки-хозяева для получения неприродного продукта, содержащего модифицированный RecA и сверхэкспрессируемую ДНК-полимеразу II, где уровень экспрессии сверхэкспрессируемой ДНК-полимеразы II определяют по сравнению с эквивалентной клеткой-хозяином, содержащей эквивалентную ДНК-полимеразу II с базальным уровнем экспрессии.

В аспектах, раскрытых в данном документе, представлены способы повышения продуцирования молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, предусматривающие: (a) инкубирование сконструированной клетки-хозяина со множеством неприродных нуклеотидов, где сконструированная клетка-хозяин содержит модифицированный RecA и необязательно сверхэкспрессируемую ДНК-полимеразу II, и где уровень экспрессии сверхэкспрессируемой ДНК-полимеразы II определяют по сравнению с эквивалентной клеткой-хозяином, содержащей эквивалентную ДНК-полимеразу II с базальным уровнем экспрессии и (b) встраивание множества неприродных нуклеотидов в одну или несколько новых синтезированных нитей ДНК, за счет чего образуется неприродная молекула нуклеиновой кислоты; где модифицированный белок, ассоциированный с транспозицией, и необязательно сверхэкспрессируемая полимераза повышают показатель сохранения неприродных пар оснований, предусматривающих неприродные нуклеотиды, в одной или нескольких новых синтезированных нитях ДНК.

В аспектах, раскрытых в данном документе, представлены способы получения модифицированного полипептида, содержащего неприродную аминокислоту, предусматривающие: (a) инкубирование сконструированной клетки-хозяина со множеством неприродных аминокислот, где сконструированная клетка-хозяин содержит модифицированный RecA и необязательно сверхэкспрессируемую ДНК-полимеразу II, и где уровень экспрессии сверхэкспрессируемой ДНК-полимеразы II определяют в сравнении с эквивалентной клеткой-хозяином, содержащей эквивалентную ДНК-полимеразу II с базальным уровнем экспрессии; и (b) встраивание множества неприродных аминокислот в новый синтезированный полипептид, за счет чего образуется модифицированный полипептид; где модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, и необязательно сверхэкспрессируемая полимераза повышают показатель сохранения неприродных пар оснований, что способствует встраиванию множества неприродных аминокислот в новый синтезированный полипептид с получением модифицированного полипептида. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой рекомбинационную репарацию. В некоторых вариантах осуществления ответ, представляющий собой репарацию ДНК, представляет собой SOS-ответ. В некоторых вариантах осуществления неприродный нуклеотид содержит неприродное основание, выбранное из группы, состоящей из 2-аминоаденин-9-ила, 2-аминоаденина, 2-F-аденина, 2-тиоурацила, 2-тиотимина, 2-тиоцитозина, 2-пропильных и алкильных производных аденина и гуанина, 2-аминоаденина, 2-аминопропиладенина, 2-аминопиридина, 2-пиридона, 2'-дезоксиуридина, 2-амино-2'-дезоксиаденозина, 3-дезазагуанина, 3-дезазааденина, 4-тиоурацила, 4-тиотимина, урацил-5-ила, гипоксантин-9-ила (I), 5-метилцитозина, 5-гидроксиметилцитозина, ксантина, гипоксантина, 5-бром- и 5-трифторметилурацилов и цитозинов; 5-галогенурацила, 5-галогенцитозина, 5-пропинилурацила, 5-пропинилцитозина, 5-урацила, 5-замещенного, 5-галоген-, 5-замещенных пиримидинов, 5-гидроксицитозина, 5-бромцитозина, 5-бромурацила, 5-хлорцитозина, хлорированного цитозина, циклоцитозина, цитозинарабинозида, 5-фторцитозина, фторпиримидина, фторурацила, 5,6-дигидроцитозина, 5-йодцитозина, гидроксимочевины, йодурацила, 5-нитроцитозина, 5-бромурацила, 5-хлорурацила и 5-фторурацила, 5-йодурацила, 6-алкильных производных аденина и гуанина, 6-азапиримидинов, 6-азоурацила, 6-азоцитозина, азацитозина, 6-азотимина, 6-тиогуанина, 7-метилгуанина, 7-метиладенина, 7-дезазагуанина, 7-дезазагуанозина, 7-дезазааденина, 7-дезаза-8-азагуанина, 8-азагуанина, 8-азааденина, 8-галоген-, 8-амино-, 8-тиол-, 8-тиоалкил- и 8-гидроксил-замещенных аденинов и гуанинов; N4-этилцитозина, N-2-замещенных пуринов, N-6-замещенных пуринов, O-6-замещенных пуринов, тех, которые повышают стабильность образования дуплекса, универсальных нуклеиновых кислот, гидрофобных нуклеиновых кислот, промискуитентных нуклеиновых кислот, нуклеиновых кислот, увеличенных в размере, фторированных нуклеиновых кислот, трициклических пиримидинов, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3H)-он), фенотиазинцитидин(1H-пиримидо[5,4-b][1,4]бензотиазин-2(3Н)-он), гуанин-фиксирующих оснований (G-clamps), феноксазинцитидин(9-(2-аминоэтокси)-Н-пиримидо[5,4-b] [1,4-бензоксазин-2(3Н)-он), карбазолцитидин(2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин(H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), 5-фторурацила, 5-бромурацила, 5-хлорурацила, 5-йодурацила, гипоксантина, ксантина, 4-ацетилцитозина, 5-(карбоксигидроксиметил)урацила, 5-карбоксиметиламинометил-2-тиоуридина, 5-карбоксиметиламинометилурацила, дигидроурацила, бета-D-галактозилквеуозина, инозина, N6-изопентениладенина, 1-метилгуанина, 1-метилинозина, 2,2-диметилгуанина, 2-метиладенина, 2-метилгуанина, 3-метилцитозина, 5-метилцитозина, N6-аденина, 7-метилгуанина, 5-метиламинометилурацила, 5-метоксиаминометил-2-тиоурацила, бета-D-маннозилквеуозина, 5'-метоксикарбоксиметилурацила, 5-метоксиурацила, 2-метилтио-N6-изопентениладенина, урацил-5-оксиуксусной кислоты, вибутоксозина, псевдоурацила, квеуозина, 2-тиоцитозина, 5-метил-2-тиоурацила, 2-тиоурацила, 4-тиоурацила, 5-метилурацила, сложного метилового эфира урацил-5-оксиуксусной кислоты, урацил-5-оксиуксусной кислоты, 5-метил-2-тиоурацила, 3-(3-амино-3-N-2-карбоксипропил)урацила, (acp3)w и 2,6-диаминопурина и тех, в которых пуриновое или пиримидиновое основание заменено гетероциклом.

В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из

.

В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный сахарный фрагмент. В некоторых вариантах осуществления неприродный сахарный фрагмент выбран из группы, состоящей из предусматривающего модификацию в 2'-положении: OH; замещенный низший алкил, алкарил, аралкил, O-алкарил или O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3, NH2F; O-алкил, S-алкил, N-алкил; О-алкенил, S-алкенил, N-алкенил; O-алкинил, S-алкинил, N-алкинил; O-алкил-O-алкил, 2'-F, 2'-OCH3, 2'-O(CH2)2OCH3, где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C110алкил, C210алкенил, C210алкинил, -O[(CH2)n O]mCH3, -O(CH2)nOCH3, -O(CH2)n NH2, -O(CH2)n CH3, -O(CH2)n -ONH2 и -O(CH2)nON[(CH2)n CH3)]2, где n и m составляют от 1 до приблизительно 10; и/или модификацию в 5'-положении: 5'-винил, 5'-метил (R или S), модификацию в 4'-положении, 4'-S, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, группу, расщепляющую РНК, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида и любую их комбинацию. В некоторых вариантах осуществления неприродное основание выбрано из группы, состоящей из

. В некоторых вариантах осуществления неприродный нуклеотид дополнительно содержит неприродный остов. В некоторых вариантах осуществления неприродный остов выбран из группы, состоящей из фосфоротиоата, хирального фосфоротиоата, фосфородитиоата, сложного фосфотриэфира, сложного аминоалкилфосфотриэфира, C110фосфонатов, 3'-алкиленфосфоната, хиральных фосфонатов, фосфинатов, фосфорамидатов, 3'-аминофосфорамидата, аминоалкилфосфорамидатов, тионофосфорамидатов, тионоалкилфосфонатов, сложных тионоалкилфосфотриэфиров и боранофосфатов. В некоторых вариантах осуществления неприродный нуклеотид представляет собой dNaMTP и/или dTPT3TP. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в геном сконструированной клетки-хозяина. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в хромосому. В некоторых вариантах осуществления неприродный нуклеотид интегрирован в локус arsB.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

Различные аспекты настоящего изобретения подробно изложены в прилагаемой формуле изобретения. Лучшее понимание признаков и преимуществ настоящего изобретения будет достигнуто со ссылкой на следующее подробное описание, в котором изложены иллюстративные варианты осуществления, в которых используются принципы настоящего изобретения, и прилагаемые графические материалы, в которых:

на фиг. 1A - фиг. 1E показаны неприродные пары оснований (UBP) и вклад сигнальных путей, связанных с переносимостью и повреждением ДНК, в их сохранение. На фиг. 1А показана UBP dNaM-dTPT3 и природная пара оснований dG-dC. На фиг. 1В показаны штаммы, дефектные по NER (ΔuvrC), MMR (ΔmutH) или RER (ΔrecA). На фиг. 1С показаны штаммы, дефектные по RER и SOS (ΔrecA), и штаммы, дефектные только по SOS (lexA (S119A)). На фигуре 1D показаны штаммы, дефектные по SOS-регулируемым полимеразам Pol II (ΔpolB), или Pol IV и Pol V (ΔdinBΔumuCD), или RER и SOS (ΔrecA). На фиг. 1E показаны штаммы с Pol Iexo- (polA(D424A, K890R)) или Pol IIIexo- (dnaQ(D12N)) на фоне дикого типа ΔpolB или ΔpolBΔrecA. В каждом случае указанные штаммы подвергали инфицированию с использованием реплицирующейся плазмиды с UBP, встроенной в указанную последовательность (X=dNaM). n ≥ 3 для всех показанных данных; точки представляют отдельные копии; столбцы представляют среднее значение выборки; планки погрешностей представляют S.D.

На фиг. 2A - фиг. 2C показаны результаты перепрограммирования реплисомы в отношении оптимизированного показателя сохранения UBP. На фиг. 2A показан данный показатель сохранения UBP в отдельных клонах WT-Opt (умеренно-серый цвет), ΔrecA-Opt (темно-серый цвет) и Pol II+ΔrecA-Opt (светло-серый цвет) после отбора на твердых ростовых средах. Каждый штамм подвергали инфицированию с использованием реплицирующихся pINF-переносимых UBP в контекстах последовательности различной сложности (GTAXAGA<TCCXCGT<TCCXGGT). Каждая точка представляет и отдельный клон, и n ≥ 12 для каждого распределения. На фиг. 2B показаны кривые роста хромосомных UBP-интегрантов клеток WT-Opt (умеренно-серый цвет), ΔrecA-Opt (темно-серый цвет) и Pol II+ΔrecA-Opt (светло-серый цвет) в ходе экспоненциальной фазы роста в средах с присутствием (круги/сплошные линии) и без присутствия (квадраты/пунктирные линии) dNaMTP и dTPT3TP. Данные приведены в соответствие с теоретическими экспоненциальными кривыми роста. n=3; маленькие точки представляют отдельные репликаты; большие точки представляют средние значения выборки; планки погрешностей для времени и OD600 представляют S.D. На фиг. 2C показано, что показатель сохранения хромосомной UBP dNaM-dTPT3 в клетках WT-Opt (умеренно-серый цвет), ΔrecA-Opt (темно-серый цвет) и Pol II+ΔrecA-Opt (светло-серый цвет) измеряли в течение длительного роста. n=3; маленькие точки представляют отдельные репликаты; большие точки представляют средние значения выборки; планки погрешностей представляют два S.D. как для удвоения клеток, так и для сохранения, за исключением данных для Pol II+ΔrecA-Opt. После примерно семидесяти удвоений один репликат штамма Pol II+ΔrecA-Opt был контаминирован клетками WT-Opt. Поэтому данные под черной стрелкой и после представляют собой среднее значение только для двух независимых экспериментов для Pol II+ΔrecA-Opt.

На фиг. 3 показана повышенная активность PtNTT2 на протяжении длительного роста (10 пассажей) у штаммов с нокаутом по IS1 по сравнению со штаммом YZ3, который сконструировали для конститутивной экспрессии модифицированного гена транспортера нуклеотидов PtNTT2 из хромосомного локуса lacZYA.

На фиг. 4A - фиг. 4C проиллюстрированы конструкции для экспрессии PtNTT2. Показаны конструкции для экспрессии PtNTT2(66-575). На фиг. 4A показано, что для получения всех данных, представленных на фигуре 1, за исключением штаммов Pol IIIExo- , использовали pACS2. На фиг. 4B показано, что для получения данных о штамме Pol IIIexo- использовали pACS2+dnaQ(D12N). На фиг. 4C показано, что для получения всех данных на фигуре 3 использовали хромосомную экспрессию из локуса lacZYA.

На фиг. 5 показаны данные репликации дефектных по экзонуклеазной активности полимераз, реплицирующих TCAXAGT pINF, для штаммов с полимеразами, дефектными по экзонуклеазной активности. Те же штаммы из фигуры 1E также тестировали в отношении их способности реплицировать TCAXAGT (X=dNaM). N> ≥ 3 для всех показанных данных; планки погрешностей представляют 95% доверительные интервалы, определенные методом эмпирического бутстрэпа.

На фиг. 6А - фиг. 6B показана конструкция polA (D424A, K890R), P_polB. Показаны стратегии конструирования polA (D424A, K890R) и дерепрессированного PpolB. На фиг. 6A показано, что polA был усечен до его 5'′--‐3'′ экзонуклеазного домена (соответствует PolA (1-341)). Затем осуществили введение требуемой мутации D424A. Мутацию K890R осуществляли с помощью ПЦР, и прогнозировали, что она оказывала ограниченное воздействие на функцию Pol I. На фиг. 6B показано, что PpolB был дерепрессирован (PPol II+) посредством интеграции на место одного из полусайтов оператора lexA (выделены жирным), присутствующих выше -35 последовательности промотора.

На фиг. 7A - фиг. 7C показана хромосомная интеграция UBP. На фиг. 7A показана стратегия конструирования интеграционной кассеты arsB::UBP. Интеграционную кассету сконструировали посредством ПЦР с перекрывающимися праймерами короткой ДНК, содержащей UBP, и кассеты neo плазмиды pKD13. На фиг. 7B показана успешная интеграция хромосомной UBP, подтвержденная с помощью ПЦР и ПЦР со смещением меченных биотином фрагментов. Показано подтверждение интегрантов ΔrecA-Opt и Pol II+ΔrecA-Opt SSO (соответственно, A2 и B3). Бирюзовые полосы указывают на передержку. На фиг. 7C показано, что при пересеве исходных интегрантов и выделении отдельных клонов быстро идентифицировали клоны со 100% показателем сохранением ΔrecA-Opt и Pol II+ΔrecA-Opt (соответственно, A2.1 и B3.1). Эта же процедура для интегранта WT-Opt (C1) не показала аналогичного результата. Показана репрезентативная субпопуляция пересеянных клонов. Красные полосы указывают на передержку. На панелях B и C идентификаторы наборов праймеров, использованных для получения результатов в каждом геле, приведены над каждым гелем. Молекулярные массы приведены рядом со стандартами размера в количестве пар оснований. Соответствующие значения % сдвига приведены под дорожками, а соединения стрептавидин-ДНК и ДНК обозначены соответственно черными и красными стрелками.

На фиг. 8A - фиг. 8B показаны характеристики перепрограммированных штаммов и времени удвоения для хромосомных интегрантов. На фиг. 8A показаны кривые роста для перепрограммированных штаммов без хромосомной UBP (WT-Opt (красным цветом), ΔrecA-Opt (синим цветом) и Pol II+ΔrecA-Opt (золотистым цветом)) и BL21(DE3) дикого типа с устойчивостью к хлорамфениколу (lacZYA::cat (черным цветом)). Кругами/сплошными линиями представлен рост в средах с dNaMTP и dTPT3TP. Квадратами/пунктирными линиями представлен рост в средах без dNaMTP и dTPT3TP. На фиг. 8B показаны средние измеренные показатели времени удвоения (n=3) для всех штаммов с хромосомной UBP и без нее, с добавлением и без добавления dXTP. На фиг. 6B раскрыты SEQ ID NO 28 и 29 соответственно в порядке появления.

На фиг. 9A - фиг. 9B показано контаминирование хромосомной UBP Pol II+ΔrecA-Opt клетками WT-Opt. Репликат 3 интегранта Pol II+ΔrecA-Opt был контаминирован клетками WT-Opt при пассаже 13. На фиг. 9A показано, что локус PpolB контролировали с помощью ПЦР образцов gDNA, полученных при пассаже репликата 3 интегранта Pol II+ΔrecA-Opt. Штаммы с мутацией PPol II+ продуцируют более крупный ампликон, чем BL21(DE3) дикого типа с устойчивостью к хлорамфениколу (lacZYA::cat) (a), что по результатам анализа Pol II+ΔrecA-Opt до интеграции UBP (b). На фиг. 9B показано, что локус recA контролировали с помощью ПЦР образцов gDNA, полученных при пассаже репликата 3 интегранта Pol II+ΔrecA-Opt. Штаммы с мутацией ΔrecA продуцируют ампликон меньшего размера, чем BL21(DE3) дикого типа с устойчивостью к хлорамфениколу (lacZYA::cat) (a), что видно из результатов анализа Pol II+ΔrecA-Opt до интеграции UBP (b).

На фиг. 10А - фиг. 10В показана мутация PtNTT2(66-575) хромосомных интегрантов UBP WT-Opt в ходе пассажирования. Изображена мутация PtNTT2(66-575) в ходе пассажирования WT-Opt и ее характеристика. На фиг. 10А показано, что в ходе пассажирования мутанты WT-Opt возникали тогда, когда участок между cat и IS1 (верхняя панель) был усечен до С-конца PtNTT2(66-575) и IS1 (средняя панель). Секвенирование подтвердило эту транспозицию (нижняя панель). На фиг. 10A раскрыты SEQ ID NO 30-32 соответственно в порядке появления. На фиг. 10В показана инактивация PtNTT2(66-575) транспозоном IS1, что контролировали с помощью ПЦР gDNA, полученной при пассажировании WT-Opt (см. таблицу S1 для праймеров). События транспозиции инактивируют PtNTT2(66-575) и имеют размер в диапазоне ~3000-4000 п.о. Инактивация происходит в ходе быстрой фазы потери UBP. Дополнительный ампликон (размером примерно 1500 п. о.) также получают при использовании данных праймеров в BL21(DE3) дикого типа с устойчивостью к хлорамфениколу (lacZYA::cat) (a), WT-Opt до интеграции UBP (b) и BL21(DE3) дикого типа (с).

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Разработка неприродной пары оснований (UBP), позволяющая клеткам хранить и извлекать увеличенное количество информации, оказывает глубокое влияние на практические применения, в том числе в сфере здравоохранения, за счет облегчения продуцирования белков, содержащих неприродные аминокислоты, с целью их дальнейшей разработки в качестве терапевтических средств. Однако сохранение UBP в популяции клеток зависит от последовательности, а в некоторых последовательностях UBP поддерживается на недостаточном или пониженном как для практических применений (например, для экспрессии белка) уровне, что ограничивает количество кодонов, доступных для использования.

Хотя потеря UBP в ходе длительного роста может быть уменьшена путем применения давления отбора в отношении поглощения трифосфата и сохранения UBP посредством экспрессии Cas9, направленной на расщепление, и, таким образом, на деградацию последовательностей ДНК, которые утратили UBP, сохранение остается проблематичным в некоторых контекстах последовательностей. Кроме того, данный подход требует оптимизации разных направляющих РНК для каждой последовательности, подлежащей сохранению, что является проблематичным для многих применений, например тех, которые включают размножение случайных последовательностей ДНК. Кроме того, ожидалось, что кодирование информации с помощью UBP в хромосоме в противоположность плазмиде несовместимо с применением этого давления отбора из-за нежелательного расщепления UBP-содержащих последовательностей и/или из-за того, что расщепление приведет к разрушению хромосомы в противоположность менее значимому устранению одной из многих копий плазмиды.

В настоящем описании в некоторых вариантах осуществления раскрыты способы, композиции, клетки, сконструированные микроорганизмы, плазмиды и наборы для повышенного сохранения UBP с использованием модифицированных белков, ассоциированных с репарацией ДНК, например белков, вовлеченных в рекомбинационную репарацию, SOS-ответ, эксцизионную репарацию нуклеотидов или метил-направленную репарацию ошибочно спаренных оснований и/или модифицированных белков, ассоциированных с транспозицией, например, белка InsB4 для инсерционного элемента IS1, белка InsA4 для инсерционного элемента IS1. В некоторых случаях конститутивная экспрессия или сверхэкспрессия белков, ассоциированных с репарацией ДНК, и/или делеция или сниженная экспрессия белков, ассоциированных с транспозицией, способствует повышенной стабильности транспортера нуклеозидтрифосфата, что приводит в результате к образованию SSO, характеризующихся повышенным сохранением хромосомной UBP.

В данном документе в определенных вариантах осуществления раскрыты способы, композиции, клетки, сконструированные микроорганизмы, плазмиды и наборы для повышения продуцирования молекул нуклеиновых кислот, которые содержат неприродный нуклеотид. В некоторых случаях, в данном документе раскрыты сконструированные клетки, содержащие: (a) первую молекулу нуклеиновой кислоты, содержащую неприродный нуклеотид; и (b) вторую молекулу нуклеиновой кислоты, кодирующую модифицированный белок, ассоциированный с транспозицией. В некоторых вариантах осуществления сконструированная клетка дополнительно содержит третью молекулу нуклеиновой кислоты, кодирующую модифицированный транспортер нуклеозидтрифосфата, где третья молекула нуклеиновой кислоты встроена в геномную последовательность сконструированной клетки-хозяина, или содержит плазмиду, кодирующую модифицированный транспортер нуклеозидтрифосфата. В некоторых вариантах осуществления сконструированная клетка дополнительно содержит полипептид Cas9 или его варианты и одиночную направляющую РНК (sgRNA), содержащую остов crRNA-tracrRNA, где комбинация полипептида Cas9 или его вариантов и sgRNA обеспечивает модуляцию репликации первой молекулы нуклеиновой кислоты, кодирующей неприродный нуклеотид. В определенных вариантах осуществления сконструированная клетка дополнительно содержит: (а) четвертую молекулу нуклеиновой кислоты, кодирующую полипептид Cas9 или его варианты; и (b) пятую молекулу нуклеиновой кислоты, кодирующую одиночную направляющую РНК (sgRNA), содержащую остов crRNA-tracrRNA. В некоторых случаях первая, вторая, третья, четвертая и пятая молекулы нуклеиновой кислоты кодируются одной или несколькими плазмидами, а sgRNA, кодируемая пятой молекулой нуклеиновой кислоты, содержит целевой мотив, который распознает модификацию в положении неприродного нуклеотида в первой молекуле нуклеиновой кислоты.

В некоторых вариантах осуществления, дополнительно представленных в данном документе, включена молекула нуклеиновой кислоты, содержащая неприродный нуклеотид, полученный с помощью способа, предусматривающего инкубирование сконструированной клетки с: (а) первой молекулой нуклеиновой кислоты, содержащей неприродный нуклеотид; (b) второй молекулой нуклеиновой кислоты, кодирующей модифицированный белок, ассоциированный с транспозицией; (в) третьей молекулой нуклеиновой кислоты, кодирующей модифицированный транспортер нуклеозидтрифосфата; (d) четвертой молекулой нуклеиновой кислоты, кодирующей полипептид Cas9 или его варианты; и (e) пятой молекулой нуклеиновой кислоты, кодирующей одиночную направляющую РНК (sgRNA), содержащую остов crRNA-tracrRNA. В некоторых случаях модификация в положении неприродного нуклеотида в первой молекуле нуклеиновой кислоты обеспечивает образование модифицированной первой молекулы нуклеиновой кислоты, а комбинация полипептида Cas9 или его вариантов с sgRNA обеспечивает модуляцию репликации модифицированной первой молекулы нуклеиновой кислоты, что в результате приводит к продуцированию молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид. В некоторых случаях экспрессия модифицированного белка, ассоциированного с транспозицией, в сконструированной клетке увеличивает стабильность транспортера трифосфата. В некоторых вариантах осуществления повышенная стабильность транспортера трифосфата способствует повышению (i) продуцирования модифицированного полипептида, содержащего неприродную аминокислоту, кодируемую неприродным нуклеотидом, и/или (ii) повышенному сохранению неприродного нуклеотида в геноме сконструированной клетки.

В некоторых вариантах осуществления, дополнительно представленных в данном документе, включен полусинтетический организм (SSO), полученный с помощью способа, предусматривающего инкубирование организма с: (а) первой молекулой нуклеиновой кислоты, содержащей неприродный нуклеотид; (b) второй молекулой нуклеиновой кислоты, кодирующей модифицированный белок, ассоциированный с транспозицией; (в) третьей молекулой нуклеиновой кислоты, кодирующей модифицированный транспортер нуклеозидтрифосфата; (d) четвертой молекулой нуклеиновой кислоты, кодирующей полипептид Cas9 или его варианты; и (e) пятой молекулой нуклеиновой кислоты, кодирующей одиночную направляющую РНК (sgRNA), содержащую остов crRNA-tracrRNA. В некоторых случаях модификация в положении неприродного нуклеотида в первой молекуле нуклеиновой кислоты обеспечивает образование модифицированной первой молекулы нуклеиновой кислоты, а комбинация полипептида Cas9 или его вариантов с sgRNA обеспечивает модуляцию репликации модифицированной первой молекулы нуклеиновой кислоты, что в результате приводит к продуцированию полусинтетического организма, содержащего молекулу нуклеиновой кислоты, содержащую неприродный нуклеотид. В некоторых случаях экспрессия модифицированного белка, ассоциированного с транспозицией, в сконструированной клетке увеличивает стабильность транспортера трифосфата. В некоторых вариантах осуществления повышенная стабильность транспортера трифосфата способствует повышению (i) продуцирования модифицированного полипептида, содержащего неприродную аминокислоту, кодируемую неприродным нуклеотидом, и/или (ii) повышенному сохранению неприродного нуклеотида в геноме SSO.

Аппарат репарации ДНК

Механизмы репарации ДНК включают эксцизионную репарацию нуклеотидов (NER), эксцизионную репарацию рибонуклеотидов (RER), SOS-ответ, метил-направленную репарацию ошибочно спаренных оснований (MMR) и рекомбинационную репарацию. NER, MMR, RER и SOS-ответ индуцируются сигналами, которые могут имитироваться за счет введения UBP в геном хозяина. Неограничивающие примеры ассоциированных с репарацией ДНК белков в прокариотических клетках, вовлеченных в рекомбинационную репарацию и/или SOS-ответ, включают RecA, Rad51, RadA и LexA. Неограничивающие примеры ассоциированных с репарацией ДНК белков в прокариотических клетках, вовлеченных в рекомбинационную репарацию, включают RecO, RecR, RecN и RuvABC. Неограничивающие примеры ассоциированных с репарацией ДНК белков в прокариотических клетках, вовлеченных в NER, включают UvrA и UvrB. Неограничивающие примеры ассоциированных с репарацией ДНК белков в прокариотических клетках, вовлеченных в MMR, включают MutS, MutH и MutL.

В некоторых вариантах осуществления модифицированные белки, ассоциированные с репарацией ДНК, вводят в сконструированную клетку или SSO, описанные в данном документе, с целью повышения сохранения хромосомной UBP. В некоторых вариантах осуществления модифицированные белки, ассоциированные с репарацией ДНК, содержат делецию RecA, Rad51, RadA, LexA, RecO, RecR, RecN, RuvABC, MutS, MutH, MutL, UvrA и/или UvrB. В некоторых вариантах осуществления делеция предусматривает N-концевую делецию, C-концевую делецию, усечение на обоих концах, внутреннюю делецию и/или делецию всего гена. В некоторых вариантах осуществления делеция или мутация в молекуле нуклеиновой кислоты, кодирующей белок, ассоциированный с репарацией ДНК, модифицирована с достижением делеции.

Белки, ассоциированные с транспозицией

В E. coli существуют репликативные и консервативные (нерепликативные) механизмы транспозиции транспонируемого элемента (например, IS1), содержащего последовательность нуклеиновой кислоты. В репликативном пути в событии транспонирования создается новая копия транспонируемого элемента. В результате транспонирования одна копия появляется в новом сайте, а одна копия остается в старом сайте. В консервативном пути репликация отсутствует. Вместо этого элемент вырезается из хромосомы или плазмиды и интегрируется в новый сайт. В этих случаях репликация ДНК в элементе не происходит, а происходит потеря элемента в сайте исходной хромосомы. Делеции транспонируемых элементов вызывают высокую частоту делеций в непосредственной близости от них (например, делеция транспонируемого элемента в дополнение к фланкирующей или окружающей ДНК).

Гены insB-4 и insA-4 кодируют два белка, InsB и InsA, необходимые для транспозиции транспозона IS1. Транспозиция IS1 приводит в результате к целевой дупликации от 9 до 8 пар оснований. Делеция insB-4 приводит в результате к репрессии аберрантных событий транспозиции, опосредованных InsB.

В некоторых вариантах осуществления способы, сконструированные клетки и полусинтетические организмы, описанные в данном документе, предусматривают модифицированную молекулу нуклеиновой кислоты, кодирующую белок, ассоциированный с транспозицией. В некоторых вариантах осуществления белок, ассоциированный с транспозицией, предусматривает insB и/или insA. В некоторых вариантах осуществления модифицированная молекула нуклеиновой кислоты, кодирующая белок, ассоциированный с транспозицией, предусматривает делецию или мутацию. В некоторых вариантах осуществления делеция предусматривает N-концевую делецию, C-концевую делецию, усечение на обоих концах, внутреннюю делецию и/или делецию всего гена. В некоторых вариантах осуществления мутация в результате приводит к снижению экспрессии insB и/или InsA. В некоторых вариантах осуществления делеция или мутация модифицированной молекулы нуклеиновой кислоты, кодирующей белок, ассоциированный с транспозицией, эффективна для стабилизации экспрессии и/или активности транспортера нуклеотидтрифосфатов, за счет чего повышается сохранение UBP.

В некоторых вариантах осуществления способы, сконструированные клетки и полусинтетические организмы, описанные в данном документе, предусматривают модифицированную молекулу нуклеиновой кислоты, кодирующую транспонируемый элемент IS1. В некоторых вариантах осуществления модифицированная молекула нуклеиновой кислоты, кодирующая транспонируемый элемент IS1, предусматривает делецию или мутацию. В некоторых вариантах осуществления делеция предусматривает нокаут или нокдаун всей или части молекулы нуклеиновой кислоты, кодирующей транспозон IS1. В некоторых вариантах осуществления мутация в результате приводит к снижению экспрессии транспозона IS1. В некоторых вариантах осуществления делеция или мутация модифицированной молекулы нуклеиновой кислоты, кодирующей транспозон IS1, является эффективной для стабилизации экспрессии и/или активности транспортера нуклеотидтрифосфатов, за счет чего повышается сохранение UBP. В некоторых случаях модифицированная молекула нуклеиновой кислоты, кодирующая транспонируемый элемент IS1, содержит SEQ ID NO: 4.

CRISPR/CRISPR-ассоциированная (Cas) редактирующая система

В некоторых вариантах осуществления в способах, клетках и сконструированных микроорганизмах, раскрытых в данном документе, используется CRISPR/CRISPR-ассоциированная (Cas) система для модификации молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид. В некоторых случаях система CRISPR/Cas модулирует сохранение модифицированной молекулы нуклеиновой кислоты, которая содержит модификацию в положении ее неприродного нуклеотида. В некоторых случаях сохранение представляет собой уменьшение репликации модифицированной молекулы нуклеиновой кислоты. В некоторых случаях система CRISPR/Cas обеспечивает создание двухнитевого разрыва в модифицированной молекуле нуклеиновой кислоты, что приводит к деградации с участием белков для репарации ДНК, такого как RecBCD и ассоциированные с ним нуклеазы.

В некоторых вариантах осуществления система CRISPR/Cas включает (1) интеграцию коротких участков генетического материала, которые гомологичны представляющей интерес молекуле нуклеиновой кислоты, содержащей неприродный нуклеотид, называемых "спейсерами", в кластерных массивах в геном хозяина, (2) экспрессию коротких направляющих РНК (crRNA) из спейсеров, (3) связывание crRNA со специфическими частями представляющей молекулы нуклеиновой кислоты, называемыми протоспейсерами, и (4) деградацию протоспейсеров CRISPR-ассоциированными нуклеазами (Cas). В некоторых случаях система CRISPR типа II была описана в бактерии Streptococcus pyogenes, в которой Cas9 и две некодирующие малые РНК (pre-crRNA и tracrRNA (транс-активирующая РНК CRISPR)) действуют согласованно для нацеливания на представляющую интерес молекулу нуклеиновой кислоты и ее деградации специфически в отношении последовательности (Jinek et al., "A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity," Science 337(6096):816-821 (август 2012 г., электронная публикация 28 июня 2012 г.)).

В некоторых случаях две некодирующие РНК затем сливаются в одну одиночную направляющую РНК (sgRNA). В некоторых случаях sgRNA содержит целевой мотив, который распознает модификацию в положении неприродного нуклеотида в представляющей интерес молекуле нуклеиновой кислоты. В некоторых вариантах осуществления модификация представляет собой замену, вставку или делецию. В некоторых случаях sgRNA содержит целевой мотив, который распознает замену в положении неприродного нуклеотида в представляющей интерес молекуле нуклеиновой кислоты. В некоторых случаях sgRNA содержит целевой мотив, который распознает делецию в положении неприродного нуклеотида в представляющей интерес молекуле нуклеиновой кислоты. В некоторых случаях sgRNA содержит целевой мотив, который распознает вставку в положении неприродного нуклеотида в представляющей интерес молекуле нуклеиновой кислоты.

В некоторых случаях длина целевого мотива составляет от 10 до 30 нуклеотидов. В некоторых случаях длина целевого мотива составляет от 15 до 30 нуклеотидов. В некоторых случаях длина целевого мотива составляет приблизительно 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов. В некоторых случаях длина целевого мотива составляет приблизительно 15, 16, 17, 18, 19, 20, 21 или 22 нуклеотидов.

В некоторых случаях sgRNA дополнительно содержит элемент распознавания мотива, прилегающего к протоспейсеру (PAM). В некоторых случаях PAM прилегает к 3'-концу целевого мотива. В некоторых случаях нуклеотид в целевом мотиве, который образует спаривание оснований по Уотсону-Крику, с модификацией в положении неприродного нуклеотида в представляющей интерес молекуле нуклеиновой кислоты, расположен на расстоянии 3-22, 5-20, 5-18, 5-15, 5-12 или 5-10 нуклеотидов от 5'-конца PAM. В некоторых случаях нуклеотид в целевом мотиве, который образует спаривание оснований по Уотсону-Крику, с модификацией в положении неприродного нуклеотида в представляющей интерес молекуле нуклеиновой кислоты, расположен на расстоянии приблизительно 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15 нуклеотидов от 5'-конца PAM.

В некоторых случаях в системе CRISPR/Cas используется полипептид Cas9 или его вариант. Cas9 представляет собой двухнитевую нуклеазу с двумя активными разрезающими сайтами, по одному на каждую нить двойной спирали. В некоторых случаях полипептид Cas9 или его варианты образуют двухнитевой разрыв. В некоторых случаях полипептид Cas9 представляет собой Cas9 дикого типа. В некоторых случаях полипептид Cas9 представляет собой оптимизированный Cas9 для экспрессии в клетке и/или сконструированном микроорганизме, описанном в данном документе.

В некоторых вариантах осуществления комплекс Cas9/sgRNA связывается с частью представляющей интерес молекулы нуклеиновой кислоты (например, ДНК), которая содержит последовательность, соответствующую, например, 17-20 нуклеотидам sgRNA выше PAM. После связывания каждый из двух независимых нуклеазных доменов Cas9 расщепляет одну из нитей ДНК на 3 основания выше PAM, оставляя двухнитевой разрыв (DSB) ДНК с тупым концом. Присутствие DSB затем приводит, в ряде случаев, к деградации представляющей интерес ДНК посредством RecBCD и ассоциированных с ним нуклеаз.

В некоторых случаях комплекс Cas9/sgRNA модулирует сохранение модифицированной молекулы нуклеиновой кислоты, которая содержит модификацию в положении неприродного нуклеотида. В некоторых случаях сохранение представляет собой уменьшение репликации модифицированной молекулы нуклеиновой кислоты. В некоторых случаях Cas9/sgRNA снижает скорость репликации модифицированной молекулы нуклеиновой кислоты на приблизительно 80%, 85%, 95%, 99% или выше.

В некоторых случаях продуцирование молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, повышается на приблизительно 30%, 40%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или выше. В некоторых случаях продуцирование молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, повышается на приблизительно 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или выше.

В некоторых случаях сохранение молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, повышается на приблизительно 30%, 40%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или выше. В некоторых случаях сохранение молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, повышается на приблизительно 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или выше.

В некоторых вариантах осуществления система CRISPR/Cas содержит две или более sgRNA. В некоторых случаях каждая из двух или более sgRNA содержит целевой мотив, который распознает модификацию в положении неприродного нуклеотида в представляющей интерес молекуле нуклеиновой кислоты. В некоторых вариантах осуществления модификация представляет собой замену, вставку или делецию. В некоторых случаях каждая из двух или более sgRNA содержит целевой мотив, который распознает замену в положении неприродного нуклеотида в представляющей интерес молекуле нуклеиновой кислоты. В некоторых случаях каждая из двух или более sgRNA содержит целевой мотив, который распознает делецию в положении неприродного нуклеотида в представляющей интерес молекуле нуклеиновой кислоты. В некоторых случаях каждая из двух или более sgRNA содержит целевой мотив, который распознает вставку в положении неприродного нуклеотида в представляющей интерес молекуле нуклеиновой кислоты.

В некоторых вариантах осуществления специфичность связывания компонентов CRISPR с представляющей интерес молекулой нуклеиновой кислоты контролируется неповторяющимися спейсерными элементами в pre-crRNA-части sgRNA, которая при транскрипции вместе с tracrRNA-частью направляет нуклеазу Cas9 к гетеродуплексу протоспейсер:crRNA и индуцирует образование двухнитевых разрывов (DSB). В некоторых случаях специфичность sgRNA составляет приблизительно 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или выше. В некоторых случаях sgRNA характеризуется показателем нецелевого связывания, составляющим менее приблизительно 20%, 15%, 10%, 5%, 3%, 1% или меньше.

Молекулы нуклеиновой кислоты

В некоторых вариантах осуществления нуклеиновая кислота (например, также упоминаемая в данном документе как представляющая интерес молекула нуклеиновой кислоты) происходит из любого источника или композиции, такой как ДНК, cDNA, gDNA (геномная ДНК), РНК, siRNA (короткая ингибирующая РНК), RNAi, tRNA, мРНК или rRNA (рибосомальная РНК), например, и находится в любой форме (например, линейной, циклической, сверхспирализованной, однонитевой, двухнитевой и т. п.). В некоторых вариантах осуществления нуклеиновые кислоты включают нуклеотиды, нуклеозиды или полинуклеотиды. В некоторых случаях нуклеиновые кислоты включают природные и неприродные нуклеиновые кислоты. В некоторых случаях нуклеиновая кислота также включает неприродные нуклеиновые кислоты, такие как аналоги ДНК или РНК (например, содержащие аналоги оснований, аналоги сахаров и/или ненативный остов и т. п.). Понятно, что термин "нуклеиновая кислота" не относится к конкретной длине полинуклеотидной цепи или не подразумевает ее, таким образом, полинуклеотиды и олигонуклеотиды также включены в определение. Иллюстративные природные нуклеотиды включают без ограничения ATP, UTP, CTP, GTP, ADP, UDP, CDP, GDP, AMP, UMP, CMP, GMP, dATP, dTTP, dCTP, dGTP, dADP, dTDP, dCDP, dGDP, dAMP, dTMP, dCMP и dGMP. Иллюстративные природные дезоксирибонуклеотиды включают dATP, dTTP, dCTP, dGTP, dADP, dTDP, dCDP, dGDP, dAMP, dTMP, dCMP и dGMP. Иллюстративные природные рибонуклеотиды включают ATP, UTP, CTP, GTP, ADP, UDP, CDP, GDP, AMP, UMP, CMP и GMP. Для РНК урациловое основание представляет собой уридин. Нуклеиновая кислота иногда представляет собой вектор, плазмиду, фагмиду, автономно реплицирующуюся последовательность (ARS), центромеру, искусственную хромосому, дрожжевую искусственную хромосому (например, YAC) или другую нуклеиновую кислоту, способную реплицироваться или реплицирующуюся в клетке-хозяине. В некоторых случаях неприродная нуклеиновая кислота является аналогом нуклеиновой кислоты. В дополнительных случаях неприродная нуклеиновая кислота происходит из внеклеточного источника. В других случаях неприродная нуклеиновая кислота доступна для внутриклеточного пространства организма, предусмотренного в данном документе, например, генетически модифицированного организма.

Неприродные нуклеиновые кислоты

Нуклеотидный аналог или неприродный нуклеотид включает нуклеотид, который содержит ту или иную модификацию основания, сахарного или фосфатного фрагментов. В некоторых вариантах осуществления модификация включает химическую модификацию. В некоторых случаях модификации происходят в группе 3'OΗ или 5'OΗ, в остове, в сахарном компоненте или в нуклеотидном основании. В некоторых случаях модификации необязательно включают не встречающиеся в природе линкерные молекулы и/или межнитевые или внутринитевые поперечные сшивки. В одном аспекте модифицированная нуклеиновая кислота содержит модификацию одного или нескольких из группы 3'OH или 5'OΗ, остова, сахарного компонента или нуклеотидного основания и/или добавление не встречающихся в природе линкерных молекул. В одном аспекте модифицированный остов включает остов, отличающийся от фосфодиэфирного остова. В одном аспекте модифицированный сахар включает сахар, отличный от дезоксирибозы (в модифицированной ДНК) или отличный от рибозы (в модифицированной РНК). В одном аспекте модифицированное основание включает основание, отличное от аденина, гуанина, цитозина или тимина (в модифицированной ДНК) или основание, отличное от аденина, гуанина, цитозина или урацила (в модифицированной РНК).

В некоторых вариантах осуществления нуклеиновая кислота содержит по меньшей мере одно модифицированное основание. В некоторых случаях нуклеиновая кислота содержит 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 или более модифицированных оснований. В некоторых случаях модификации фрагмента основания включают природные и синтетические модификации A, C, G и T/U, а также различные пуриновые или пиримидиновые основания. В некоторых вариантах осуществления модификация относится к модифицированной форме аденина, гуанина, цитозина или тимина (в модифицированной ДНК) или модифицированной форме аденина, гуанина, цитозина или урацила (в модифицированной РНК).

Модифицированное основание неприродной нуклеиновой кислоты включает без ограничения урацил-5-ил, гипоксантин-9-ил (I), 2-аминоаденин-9-ил, 5-метилцитозин (5-me-C), 5-гидроксиметилцитозин, ксантин, гипоксантин, 2-аминоаденин, 6-метил- и другие алкильные производные аденина и гуанина, 2-пропил- и другие алкильные производные аденина и гуанина, 2-тиоурацил, 2-тиотимин и 2-тиоцитозин, 5-галогенурацил и -цитозин, 5-пропинилурацил и -цитозин, 6-азоурацил, -цитозин и -тимин, 5-урацил (псевдоурацил), 4-тиоурацил, 8-галоген, 8-амино, 8-тиол, 8-тиоалкил, 8-гидроксил и другие 8-замещенные аденины и гуанины, 5-галоген, в частности 5-бром, 5-трифторметил и другие 5-замещенные урацилы и цитозины, 7-метилгуанин и 7-метиладенин, 8-азагуанин и 8-азааденин, 7-дезазагуанин и 7-дезазааденин, и 3-дезазагуанин и 3-дезазааденин. Определенные неприродные нуклеиновые кислоты, такие как 5-замещенные пиримидины, 6-азапиримидины и N-2-замещенные пурины, N-6-замещенные пурины, O-6-замещенные пурины, 2-аминопропиладенин, 5-пропинилурацил, 5-пропинилцитозин, 5-метилцитозин, те, которые повышают стабильность образования дуплекса, универсальные нуклеиновые кислоты, гидрофобные нуклеиновые кислоты, разнородные нуклеиновые кислоты, нуклеиновые кислоты с увеличенным размером, фторированные нуклеиновые кислоты, 5-замещенные пиримидины, 6-азапиримидины и N-2, N-6 и О-6 замещенные пурины, в том числе 2-аминопропиладенин, 5-пропинилурацил и 5-пропинилцитозин, 5-метилцитозин (5-me-C), 5-гидроксиметилцитозин, ксантин, гипоксантин, 2-аминоаденин, 6-метил, другие алкильные производные аденина и гуанина, 2-пропил и другие алкильные производные аденина и гуанина, 2-тиоурацил, 2-тиотимин и 2-тиоцитозин, 5-галогенурацил, 5-галогенцитозин, 5-пропинил (-C≡C-CI¼) урацил, 5-пропинилцитозин, другие алкинильные производные пиримидиновых нуклеиновых кислот, 6-азоурацил, 6-азоцитозин, 6-азотимин, 5-урацил (псевдоурацил), 4-тиоурацил, 8-галоген, 8-амино, 8-тиол, 8-тиоалкил, 8-гидроксил и другие 8-замещенные аденины и гуанины, 5-галоген, в частности 5-бром, 5-трифторметил, другие 5-замещенные урацилы и цитозины, 7-метилгуанин, 7-метиладенин, 2-F-аденин, 2-аминоаденин, 8-азагуанин, 8-азааденин, 7-дезазагуанин, 7-дезазааденин, 3-дезазагуанин, 3-дезазааденин, трициклические пиримидины, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3Н)-он), фенотиазинцитидин(1Н-пиримидо[5,4-b][1,4] бензотиазин-2(3H)-он), G-зажимы, феноксазинцитидин (например, 9-(2-аминоэтокси)-H-пиримидо[5,4-b][1,4]бензоксазин-2(3H)-он), карбазолцитидин (2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин (H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), те, в которых пуриновое или пиримидиновое основание заменено другими гетероциклами, 7-дезазааденин, 7-дезазагуанозин, 2-аминопиридин, 2-пиридон, азацитозин, 5-бромоцитозин, бромурацил, 5-хлорцитозин, хлорированный цитозин, циклоцитозин, цитозина арабинозид, 5-фторцитозин, фторпиримидин, фторурацил, 5,6-дигидроцитозин, 5-йодцитозин, гидроксимочевина, йодурацил, 5-нитроцитозин, 5-бромурацил, 5-хлорурацил, 5-фторурацил и 5-йодурацил, 2-аминоаденин, 6-тиогуанин, 2-тиотимин, 4-тиотимин, 5-пропинилурацил, 4-тиоурацил, N4-этилцитозин, 7-дезазагуанин, 7-дезаза-8-азагуанин, 5-гидроксицитозин, 2'-дезоксиуридин, 2-амино-2'-дезоксиаденозин и те, которые описаны в патентах США №№ 3687808; 4845205; 4910300; 4948882; 5093232; 5130302; 5134066; 5175273; 5367066; 5432272; 5457187; 5459255; 5484908; 5502177; 5525711; 5552540; 5587469; 5594121; 5596091; 5614617; 5645985; 5681941; 5750692; 5763588; 5830653 и 6005096; WO 99/62923; Kandimalla et al., (2001) Bioorg. Med. Chem. 9:807-813; The Concise Encyclopedia of Polymer Science and Engineering, Kroschwitz, J.I., Ed., John Wiley & Sons, 1990, 858-859; Englisch et al., Angewandte Chemie, International Edition, 1991, 30, 613 и Sanghvi, Chapter 15, Antisense Research and Applications, Crooke and Lebleu Eds., CRC Press, 1993, 273-288. Дополнительные модификации оснований можно найти, например, в патенте США № 3687808; Englisch et al., Angewandte Chemie, International Edition, 1991, 30, 613; и Sanghvi, Chapter 15, Antisense Research and Applications, страницы 289-302, Crooke and Lebleu ed., CRC Press, 1993.

Неприродные нуклеиновые кислоты, содержащие различные гетероциклические основания и различные сахарные фрагменты (и аналоги сахаров), доступны из уровня техники, и нуклеиновая кислота в некоторых случаях содержит одно или несколько гетероциклических оснований, отличных от основных пяти компонентов-оснований встречающихся в природе нуклеиновых кислот. Например, гетероциклическое основание включает в некоторых случаях урацил-5-ильные, цитозин-5-ильные, аденин-7-ильные, аденин-8-ильные, гуанин-7-ильные, гуанин-8-ильные, 4-аминопирроло[2,3-d]пиримидин-5-ильные, 2-амино-4-оксопирроло[2,3-d]пиримидин-5-ильные, 2-амино-4-оксопирроло[2,3-d]пиримидин-3-ильные группы, где пурины присоединены к сахарному фрагменту нуклеиновой кислоты через положение 9, пиримидины через положение 1, пирролопиримидины через положение 7 и пиразолопиримидины через положение 1.

В некоторых вариантах осуществления модифицированное основание неприродной нуклеиновой кислоты изображено ниже, где волнистая линия обозначает точку присоединения к (дезокси)рибозе или рибозе.

.

В некоторых вариантах осуществления нуклеотидные аналоги также модифицированы в фосфатном фрагменте. Модифицированные фосфатные фрагменты включают без ограничения фрагменты с модификацией в связи между двумя нуклеотидами и содержат, например, фосфоротиоат, хиральный фосфоротиоат, фосфородитиоат, фосфотриэфир, аминоалкилфосфотриэфир, метил и другие алкилфосфонаты, включая 3'-алкиленфосфонат и хиральные фосфонаты, фосфинаты, фосфорамидаты, включая 3'-аминофосфорамидат и аминоалкилфосфорамидаты, тионофосфорамидаты, тионоалкилфосфонаты, тионоалкилфосфотриэфиры и боранофосфаты. Понятно, что эти фосфатные или модифицированные фосфатные связи между двумя нуклеотидами образованы посредством 3'-5' связи или 2'-5' связи, и эта связь содержит обратную полярность, такую как с 3'-5' на 5'-3' или с 2'-5' на 5'-2'. Также включены различные соли, смешанные соли и формы свободной кислоты. Во многих патентах США описывается, как получать и применять нуклеотиды, содержащие модифицированные фосфаты, и они включают без ограничения №№ 3687808; 4469863; 4476301; 5023243; 5177196; 5188897; 5264423; 5276019; 5278302; 5286717; 5321131; 5399676; 5405939; 5453496; 5455233; 5466677; 5476925; 5519126; 5536821; 5541306; 5550111; 5563253; 5571799; 5587361 и 5625050.

В некоторых вариантах осуществления неприродные нуклеиновые кислоты включают 2',3'-дидезокси-2',3'-дидегидронуклеозиды (PCT/US2002/006460), 5'-замещенные производные ДНК и РНК (PCT/US2011/033961; Saha et al., J. Org Chem., 1995, 60, 788-789; Wang et al., Bioorganic & Medicinal Chemistry Letters, 1999, 9, 885-890; и Mikhailov et al., Nucleosides & Nucleotides, 1991, 10(1-3), 339-343; Leonid et al., 1995, 14(3-5), 901-905; и Eppacher et al., Helvetica Chimica Acta, 2004, 87, 3004-3020; PCT/JP2000/004720; PCT/JP2003/002342; PCT/JP2004/013216; PCT/JP2005/020435; PCT/JP2006/315479; PCT/JP2006/324484; PCT/JP2009/056718; PCT/JP2010/067560), или 5'-замещенные мономеры, полученные в виде монофосфата с модифицированными основаниями (Wang et al., Nucleosides Nucleotides & Nucleic Acids, 2004, 23 (1 & 2), 317-337).

В некоторых вариантах осуществления неприродные нуклеиновые кислоты содержат модификации в 5'-положении и 2'-положении сахарного кольца (PCT/US94/02993), такие как 5'-CH2-замещенные 2'-O-защищенные нуклеозиды (Wu et al., Helvetica Chimica Acta, 2000, 83, 1127-1143 и Wu et al., Bioconjugate Chem. 1999, 10, 921-924). В некоторых случаях неприродные нуклеиновые кислоты включают нуклеозидные димеры с амидной связью, полученные для включения в олигонуклеотиды, где 3'-связанный нуклеозид в димере (от 5' к 3') содержит 2'-OCH3 и 5'-(S)-CH3 (Mesmaeker et al., Synlett, 1997, 1287-1290). Неприродные нуклеиновые кислоты могут включать 2'-замещенные 5'-CH2 (или O) модифицированные нуклеозиды (PCT/US92/01020). Неприродные нуклеиновые кислоты могут включать 5'-метиленфосфонатные мономеры ДНК и РНК и димеры (Bohringer et al., Tet. Lett., 1993, 34, 2723-2726; Collingwood et al., Synlett, 1995, 7, 703-705; и Hutter et al., Helvetica Chimica Acta, 2002, 85, 2777-2806). Неприродные нуклеиновые кислоты могут включать 5'-фосфонатные мономеры, имеющие 2'-замену (US2006/0074035), и другие модифицированные 5'-фосфонатные мономеры (WO1997/35869). Неприродные нуклеиновые кислоты могут включать 5'-модифицированные метиленфосфонатные мономеры (EP614907 и EP629633). Неприродные нуклеиновые кислоты могут включать аналоги 5' или 6'-фосфонатных рибонуклеозидов, содержащие гидроксильную группу в 5'- и/или 6'-положении (Chen et al., Phosphorus, Sulfur and Silicon, 2002, 777, 1783-1786; Jung et al., Bioorg. Med. Chem., 2000, 8, 2501-2509; Gallier et al., Eur. J. Org. Chem., 2007, 925-933; и Hampton et al., J. Med. Chem., 1976, 19(8), 1029-1033). Неприродные нуклеиновые кислоты могут включать 5'-фосфонатные дезоксирибонуклеозидные мономеры и димеры, имеющие 5'-фосфатную группу (Nawrot et al., Oligonucleotides, 2006, 16(1), 68-82). Неприродные нуклеиновые кислоты могут включать нуклеозиды, имеющие 6'-фосфонатную группу, где 5'- или/и 6'-положение является незамещенным или замещенным тио-трет-бутильной группой (SC(CH3)3) (и ее аналогами); метиленаминогруппой (CH2NH2) (и ее аналогами) или цианогруппой (CN) (и ее аналогами) (Fairhurst et al., Synlett, 2001, 4, 467-472; Kappler et al., J. Med. Chem., 1986, 29, 1030-1038; Kappler et al., J. Med. Chem., 1982, 25, 1179-1184; Vrudhula et al., J. Med. Chem., 1987, 30, 888-894; Hampton et al., J. Med. Chem., 1976, 19, 1371-1377; Geze et al., J. Am. Chem. Soc, 1983, 105(26), 7638-7640; и Hampton et al., J. Am. Chem. Soc, 1973, 95(13), 4404-4414).

В некоторых вариантах осуществления неприродные нуклеиновые кислоты также включают модификации сахарного фрагмента. В некоторых случаях нуклеиновые кислоты содержат один или несколько нуклеозидов, где сахарная группа была модифицирована. Такие нуклеозиды с модифицированным сахаром могут придавать повышенную стабильность в отношении нуклеазы, повышенную аффинность связывания или некоторые другие полезные биологические свойства. В определенных вариантах осуществления нуклеиновые кислоты включают химически модифицированный фрагмент рибофуранозного кольца. Примеры химически модифицированных рибофуранозных колец включают без ограничения добавление замещающих групп (включая 5'- и/или 2'-замещающие группы), сшивание двух кольцевых атомов с образованием бициклических нуклеиновых кислот (BNA), замену атома кислорода рибозильного кольца на S, N(R) или C(Ri)(R2) (R=H, C112алкил или защитную группу) и их комбинации. Примеры химически модифицированных сахаров можно найти в WO2008/101157, US2005/0130923 и WO2007/134181.

В некоторых случаях модифицированная нуклеиновая кислота содержит модифицированные сахара или аналоги сахаров. Таким образом, в дополнение к рибозе и дезоксирибозе сахарный фрагмент может представлять собой пентозу, дезоксипентозу, гексозу, дезоксигексозу, глюкозу, арабинозу, ксилозу, ликсозу или циклопентильную группу, представляющую собой "аналог" сахаров. Сахар может быть в пиранозильной или фуранозильной форме. Сахарный фрагмент может представлять собой фуранозид рибозы, дезоксирибозы, арабинозы или 2'-O-алкилрибозы, и сахар может быть присоединен к соответствующим гетероциклическим основаниям либо в [альфа], либо в [бета]-аномерной конфигурации. Модификации сахара включают без ограничения 2'-алкокси-РНК-аналоги, 2'-амино-РНК-аналоги, 2'-фтор-ДНК и химеры 2'-алкокси- или амино-РНК/ДНК. Например, модификация сахара может включать 2'-O-метилуридин или 2'-O-метилцитидин. Модификации сахара включают 2'-O-алкилзамещенные дезоксирибонуклеозиды и 2'-O-этиленгликольподобные рибонуклеозиды. Известно получение этих сахаров или аналогов сахаров и соответствующих "нуклеозидов", где такие сахара или аналоги присоединены к гетероциклическому основанию (основанию нуклеиновой кислоты). Модификации сахара также могут быть выполнены и объединены с другими модификациями.

Модификации сахарного фрагмента включают природные модификации рибозы и дезоксирибозы, а также неприродные модификации. Модификации сахара включают без ограничения следующие модификации в 2'-положении: OH; F; O-, S- или N-алкил; O-, S- или N-алкенил; O-, S- или N-алкинил; или O-алкил-O-алкил, где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C110алкил или C210алкенил и алкинил. 2'-Модификации сахара также включают без ограничения -O[(CH2)nO]m CH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)nONH2 и -O(CH2)nON[(CH2)n CH3)]2, где n и m равняются от 1 до приблизительно 10.

Другие модификации в 2'-положении включают без ограничения низший C110алкил, замещенный низший алкил, алкарил, аралкил, O-алкарил, O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3, NH2, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, расщепляющую РНК группу, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида и другие заместители с аналогичными свойствами. Аналогичные модификации также могут быть осуществлены в других положениях в сахаре, в частности в 3'-положении сахара в 3'-концевом нуклеотиде или в олигонуклеотидах с 2'-5' связями и в 5'-положении 5'-концевого нуклеотида. Модифицированные сахара также включают те, которые содержат модификации в мостиковом кислороде кольца, такие как CH2 и S. Нуклеотиды с аналогами сахаров также могут содержать миметики сахаров, такие как циклобутильные фрагменты, вместо пентофуранозильного сахара. Существует множество патентов США, в которых описывается получение таких модифицированных структур сахаров и в которых подробно излагается и описывается ряд модификаций оснований, например, патенты США №№ 4981957; 5118800; 5319080; 5359044; 5393878; 5446137; 5466786; 5514785; 5519134; 5567811; 5576427; 5591722; 5597909; 5610300; 5627053; 5639873; 5646265; 5658873; 5670633; 4845205; 5130302; 5134066; 5175273; 5367066; 5432272; 5,457,187; 5459255; 5484908; 5502177; 5525711; 5552540; 5587469; 5594121, 5596091; 5614617; 5681941 и 5700920, каждый из которых включен в данный документ посредством ссылки во всей своей полноте.

Примеры нуклеиновых кислот, имеющих модифицированные сахарные фрагменты, включают без ограничения нуклеиновые кислоты, содержащие замещающие группы 5'-винильную, 5'-метильную (R или S), 4'-S, 2'-F, 2'-OCH3 и 2'-O(CH2)2OCH3. Заместитель в 2'-положении также может быть выбран из аллила, амино, азидо, тио, O-аллила, O-(C110алкила), OCF3, O(CH2)2SCH3, O(CH2)2-O-N(Rm)(Rn) и O-CH2-C(=O)-N(Rm)(Rn), где каждый Rm и Rn независимо представляет собой H или замещенный или незамещенный C110алкил.

В определенных вариантах осуществления нуклеиновые кислоты, описанные в данном документе, включают одну или несколько бициклических нуклеиновых кислот. В определенных таких вариантах осуществления бициклическая нуклеиновая кислота содержит мостик между 4' и 2' атомами рибозильного кольца. В определенных вариантах осуществления нуклеиновые кислоты, предусмотренные в данном документе, включают одну или несколько бициклических нуклеиновых кислот, где мостик содержит 4'-2' бициклическую нуклеиновую кислоту. Примеры таких 4'-2' бициклических нуклеиновых кислот включают без ограничения одну из следующих формул: 4'-(CH2)-O-2' (LNA); 4'-(CH2)-S-2'; 4'-(CH2)2-O-2' (ENA); 4'-CH(CH3)-O-2' и 4'-CH(CH2OCH3)-O-2' и их аналоги (см. патент США № 7399845); 4'-C(CH3)(CH3)-O-2' и ее аналоги (см. WO2009/006478, WO2008/150729, US2004/0171570, патент США № 7427672, Chattopadhyaya et al., J. Org. Chem., 209, 74, 118-134 и WO2008/154401). Также см., например, Singh et al., Chem. Commun., 1998, 4, 455-456; Koshkin et al., Tetrahedron, 1998, 54, 3607-3630; Wahlestedt et al., Proc. Natl. Acad. Sci. U. S. A., 2000, 97, 5633-5638; Kumar et al., Bioorg. Med. Chem. Lett., 1998, 8, 2219-2222; Singh et al., J. Org. Chem., 1998, 63, 10035-10039; Srivastava et al., J. Am. Chem. Soc., 2007, 129(26) 8362-8379; Elayadi et al., Curr. Opinion Invens. Drugs, 2001, 2, 558-561; Braasch et al., Chem. Biol, 2001, 8, 1-7; Oram et al., Curr. Opinion Mol. Ther., 2001, 3, 239-243; патенты США №№ 4849513; 5015733; 5118800; 5118802; 7053207; 6268490; 6770748; 6794499; 7034133; 6525191; 6670461 и 7399845; международные публикации №№ WO2004/106356, WO1994/14226, WO2005/021570, WO2007/090071 и WO2007/134181; публикации заявок на патент США №№ US2004/0171570, US2007/0287831 и US2008/0039618; предварительные заявки на патент США №№ 60/989574, 61/026995, 61/026998, 61/056564, 61/086,231, 61/097787 и 61/099844 и международные заявки №№ PCT/US2008/064591, PCT US2008/066154, PCT US2008/068922 и PCT/DK98/00393.

В определенных вариантах осуществления нуклеиновые кислоты включают связанные нуклеиновые кислоты. Нуклеиновые кислоты могут быть связаны вместе с применением любой связи между нуклеиновыми кислотами. Два основных класса групп, связывающих между собой нуклеиновые кислоты, определяются наличием или отсутствием атома фосфора. Типичные фосфорсодержащие связи между нуклеиновыми кислотами содержаться без ограничения в фосфодиэфирах, фосфотриэфирах, метилфосфонатах, фосфорамидатах и фосфоротиоатах (P=S). Типичные не содержащие фосфор группы, связывающие между собой нуклеиновые кислоты, включают без ограничения метиленметилимино (-CH2-N(CH3)-O-CH2-), тиодиэфир (-O-C(O)-S-), тионокарбамат (-O-C(O)(NH)-S-); силоксан (-O-Si(H)2-O-) и N, N*-диметилгидразин (-CH2-N(CH3)-N(CH3)). В определенных вариантах осуществления связи между нуклеиновыми кислотами, имеющие хиральный атом, можно получить в виде рацемической смеси, в виде отдельных энантиомеров, например, алкилфосфонатов и фосфоротиоатов. Неприродные нуклеиновые кислоты могут содержать одну модификацию. Неприродные нуклеиновые кислоты могут содержать несколько модификаций в одном из фрагментов или между различными фрагментами.

Модификации фосфата остова в нуклеиновой кислоте включают без ограничения метилфосфонат, фосфоротиоат, фосфорамидат (мостиковый или не мостиковый), фосфотриэфир, фосфородитиоат, фосфодитиоат и боранофосфат и могут применяться в любой комбинации. Другие нефосфатные связи также можно применять.

В некоторых вариантах осуществления модификации остова (например, метилфосфонатные, фосфоротиоатные, фосфорамидатные и фосфородитиоатные межнуклеотидные связи) могут придавать иммуномодулирующую активность модифицированной нуклеиновой кислоте и/или повышать ее стабильность in vivo.

В некоторых случаях производное фосфора (или модифицированная фосфатная группа) присоединена к сахарному фрагменту или фрагменту аналога сахаров и может представлять собой монофосфат, дифосфат, трифосфат, алкилфосфонат, фосфоротиоат, фосфородитиоат, фосфорамидат или тому подобное. Иллюстративные полинуклеотиды, содержащие модифицированные фосфатные связи или нефосфатные связи, можно найти в Peyrottes et al., 1996, Nucleic Acids Res. 24: 1841-1848; Chaturvedi et al., 1996, Nucleic Acids Res. 24:2318-2323; и Schultz et al., (1996) Nucleic Acids Res. 24:2966-2973; Matteucci, 1997, "Oligonucleotide Analogs: an Overview" in Oligonucleotides as Therapeutic Agents, (Chadwick and Cardew, ed.) John Wiley and Sons, New York, NY; Zon, 1993, "Oligonucleoside Phosphorothioates" в Protocols for Oligonucleotides and Analogs, Synthesis and Properties, Humana Press, pp. 165-190; Miller et al., 1971, JACS 93:6657-6665; Jager et al., 1988, Biochem. 27:7247-7246; Nelson et al., 1997, JOC 62:7278-7287; патент США № 5453496 и Micklefield, 2001, Curr. Med. Chem. 8: 1157-1179.

В некоторых случаях модификация остова включает замену фосфодиэфирной связи альтернативным фрагментом, таким как анионная, нейтральная или катионная группа. Примеры таких модификаций включают анионную межнуклеозидную связь; модификацию фосфорамидата N3'-P5'; боранофосфатную ДНК; проолигонуклеотиды; нейтральные межнуклеозидные связи, такие как метилфосфонаты; ДНК с амидной связью; метиленовые(метилимино) связи; формацетальные и тиоформацетальные связи; остовы, содержащие сульфонильные группы; морфолиноолигонуклеотиды; пептидные нуклеиновые кислоты (PNA) и положительно заряженные дезоксирибонуклеиновые гуанидиновые (DNG) олигонуклеотиды (Micklefield, 2001, Current Medicinal Chemistry 8: 1157-1179). Модифицированная нуклеиновая кислота может содержать химерный или смешанный остов, содержащий одну или несколько модификаций, например, комбинацию фосфатных связей, такую как комбинация фосфодиэфирных и фосфоротиоатных связей.

Заместители для фосфата включают, например, алкильные или циклоалкильные межнуклеозидные связи с короткой цепью, смешанные гетероатомные и алкильные или циклоалкильные межнуклеозидные связи или одну или несколько гетероатомных или гетероциклических межнуклеозидных связей с короткой цепью. К ним относятся те, которые имеют морфолиновые связи (образованные частично из сахарной части нуклеозида); силоксановые остовы; сульфидные, сульфоксидные и сульфоновые остовы; формацетильные и тиоформацетильные остовы; метиленформацетильные и тиоформацетильные остовы; алкенсодержащие остовы; сульфаматные остовы; метилениминовые и метиленгидразиновые остовы; сульфонатные и сульфонамидные остовы; амидные остовы и другие, имеющие смешанные части компонентов N, O, S и CH2. Во многих патентах США раскрывают, как получать и применять эти типы заменителей фосфата, и они включают без ограничения патенты США №№ 5034506; 5166315; 5185444; 5214134; 5216141; 5235033; 5264562; 5264564; 5405938; 5434257; 5466677; 5470967; 5489677; 5541307; 5561225; 5596086; 5602240; 5610289; 5602240; 5608046; 5610289; 5618704; 5623070; 5663312; 5633360; 5677437 и 5677439. Также понятно, что при замене нуклеотида можно заменить как сахарный, так и фосфатный фрагменты нуклеотида, например, с помощью связи амидного типа (аминоэтилглицин) (PNA). В патентах США №№ 5539082; 5714331 и 5719262 описывается, как получать и применять молекулы PNA, каждый из которых включен в данный документ посредством ссылки. См. также Nielsen et al., Science, 1991, 254, 1497-1500. Также возможно связать другие типы молекул (конъюгатов) с нуклеотидами или аналогами нуклеотидов, чтобы усилить, например, клеточный захват. Конъюгаты могут быть химически связаны с нуклеотидами или аналогами нуклеотидов. Такие конъюгаты включают без ограничения липидные фрагменты, такие как холестериновый фрагмент (Letsinger et al., Proc. Natl. Acad. Sci. USA, 1989, 86, 6553-6556), холиновую кислоту (Manoharan et al., Bioorg. Med. Chem. Let., 1994, 4, 1053-1060), простой тиоэфир, например, гексил-S-тритилтиол (Manoharan et al., Ann. KY. Acad. Sci., 1992, 660, 306-309; Manoharan et al., Bioorg. Med. Chem. Let., 1993, 3, 2765-2770), тиохолестерин (Oberhauser et al., Nucl. Acids Res., 1992, 20, 533-538), алифатическую цепь, например, додекандиоловые или ундециловые остатки (Saison-Behmoaras et al., EM5OJ, 1991, 10, 1111-1118; Kabanov et al., FEBS Lett., 1990, 259, 327-330; Svinarchuk et al., Biochimie, 1993, 75, 49-54), фосфолипид, например, ди-гексадецил-рац-глицерин или 1-ди-O-гексадецил-рац-глицеро-S-H-фосфонат триэтиламмония (Manoharan et al., Tetrahedron Lett., 1995, 36, 3651-3654; Shea et al., Nucl. Acids Res., 1990, 18, 3777-3783), полиаминовую или полиэтиленгликолевую цепь (Manoharan et al., Nucleosides & Nucleotides, 1995, 14, 969-973) или адамантануксусную кислоту (Manoharan et al., Tetrahedron Lett., 1995, 36, 3651-3654), пальмитиловый фрагмент (Mishra et al., Biochem. Biophys. Acta, 1995, 1264, 229-237) или октадециламиновый или гексиламинокарбонилоксихолестериновый фрагмент (Crooke et al., J. Pharmacol. Exp. Ther., 1996, 277, 923-937). Во множестве патентов США описывается получение таких конъюгатов, и они включают без ограничения патенты США №№ 4828979; 4948882; 5218105; 5525465; 5541313; 5545730; 5552538; 5578717, 5580731; 5580731; 5591584; 5109124; 5118802; 5138045; 5414077; 5486603; 5512439; 5578718; 5608046; 4587044; 4605735; 4667025; 4762779; 4789737; 4824941; 4835263; 4876335; 4904582; 4958013; 5082830; 5112963; 5214136; 5082830; 5112963; 5214136; 5245022; 5254469; 5258506; 5262536; 5272250; 5292873; 5317098; 5371241, 5391723; 5416203, 5451463; 5510475; 5512667; 5514785; 5565552; 5567810; 5574142; 5585481; 5587371; 5595726; 5597696; 5599923; 5599928 и 5688941.

Свойства спаривания оснований нуклеиновых кислот

В некоторых вариантах осуществления неприродная нуклеиновая кислота образует пару оснований с другой нуклеиновой кислотой. В некоторых вариантах осуществления стабильно интегрированная неприродная нуклеиновая кислота представляет собой неприродную нуклеиновую кислоту, которая может образовывать пару оснований с другой нуклеиновой кислотой, например, природной или неприродной нуклеиновой кислотой. В некоторых вариантах осуществления стабильно интегрированная неприродная нуклеиновая кислота представляет собой неприродную нуклеиновую кислоту, которая может образовывать пару оснований с другой неприродной нуклеиновой кислотой (неприродная пара оснований нуклеиновых кислот (UBP)). Например, первая неприродная нуклеиновая кислота может образовывать пару оснований со второй неприродной нуклеиновой кислотой. Например, одна пара неприродных нуклеотидтрифосфатов, которые могут образовывать пару оснований при встраивании в нуклеиновые кислоты, включает трифосфат d5SICS (d5SICSTP) и трифосфат dNaM (dNaMTP). Такие неприродные нуклеотиды могут иметь рибозный или дезоксирибозный сахарный фрагмент. В некоторых вариантах осуществления неприродная нуклеиновая кислота по сути не образует пару оснований с азотистыми основаниями природной нуклеиновой кислотой (A, T, G, C). В некоторых вариантах осуществления стабильно интегрированная неприродная нуклеиновая кислота может образовывать пару оснований с природной нуклеиновой кислотой.

В некоторых вариантах осуществления стабильно интегрированная неприродная нуклеиновая кислота представляет собой неприродную нуклеиновую кислоту, которая может образовывать UBP, но по сути не образует пару оснований с каждым из четырех оснований природных нуклеиновых кислот. В некоторых вариантах осуществления стабильно интегрированная неприродная нуклеиновая кислота представляет собой неприродную нуклеиновую кислоту, которая может образовывать UBP, но по сути не образует пару оснований с одной или несколькими природными нуклеиновыми кислотами. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с A, T и C, но может образовывать пару оснований с G. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с A, T и G, но может образовывать пару оснований с C. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с C, G и A, но может образовывать пару оснований с T. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с C, G и T, но может образовывать пару оснований с A. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с A и T, но может образовывать пару оснований с C и G. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с A и C, но может образовывать пару оснований с T и G. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с A и G, но может образовывать пару оснований с C и T. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с C и T, но может образовывать пару оснований с A и G. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с C и G, но может образовывать пару оснований с T и G. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с T и G, но может образовывать пару оснований с A и G. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с G, но может образовывать пару оснований с A, T и C. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с A, но может образовывать пару оснований с G, T и C. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с T, но может образовывать пару оснований с G, A и C. Например, стабильно интегрированная неприродная нуклеиновая кислота может по сути не образовывать пару оснований с C, но может образовывать пару оснований с G, T и A.

Иллюстративные неприродные нуклеотиды, способные образовывать неприродную пару оснований ДНК или РНК (UBP) в условиях in vivo, включают без ограничения 5SICS, d5SICS, NAM, dNaM, dTPT3 и их комбинации. В некоторых вариантах осуществления неприродные нуклеотиды включают:

.

Сконструированный организм

В некоторых вариантах осуществления способы и плазмиды, раскрытые в данном документе, дополнительно применяют для получения сконструированного организма, например, организма, который включает и реплицирует неприродный нуклеотид или неприродную пару оснований нуклеиновых кислот (UBP) с улучшенным сохранением UBP, а также транскрибирует и транслирует нуклеиновую кислоту, содержащую неприродный нуклеотид или неприродную пару оснований нуклеиновых кислот, в белок, содержащий неприродный аминокислотный остаток. В некоторых случаях организм представляет собой полусинтетический организм (SSO). В некоторых случаях SSO представляет собой клетку.

В некоторых случаях применяемую клетку генетически трансформируют с помощью кассеты экспрессии, кодирующей гетерологичный белок, например, нуклеозидтрифосфатный транспортер, способный транспортировать неприродные нуклеотидтрифосфаты в клетку, модифицированный белок, связанный с транспозицией, для повышения стабильности нуклеотидтрифосфатного транспортера, систему CRISPR/Cas9 для удаления модификаций в положениях неприродного нуклеотидтрифосфата и/или полимеразу с высокой точностью для неприродной нуклеиновой кислоты, таким образом, что неприродные нуклеотиды встраиваются в нуклеиновые кислоты клетки и, например, образуют неприродные пары оснований в условиях in vivo. В некоторых случаях клетки дополнительно обладают повышенной активностью в отношении поглощения неприродных нуклеиновых кислот. В некоторых случаях клетки дополнительно обладают повышенной активностью в отношении импорта неприродных нуклеиновых кислот. В некоторых случаях клетки дополнительно обладают повышенной полимеразной активностью в отношении неприродных нуклеиновых кислот.

В некоторых вариантах осуществления Cas9 и sgRNA кодируются в отдельных плазмидах. В некоторых случаях Cas9 и sgRNA кодируются в той же плазмиде. В некоторых случаях молекула нуклеиновой кислоты, кодирующая Cas9, sgRNA или молекула нуклеиновой кислоты, содержащая неприродный нуклеотид, расположены в одной или нескольких плазмидах. В некоторых случаях Cas9 кодируется в первой плазмиде, а sgRNA и молекула нуклеиновой кислоты, содержащая неприродный нуклеотид, кодируются во второй плазмиде. В некоторых случаях Cas9, sgRNA и молекула нуклеиновой кислоты, содержащая неприродный нуклеотид, кодируются в той же плазмиде. В некоторых случаях молекула нуклеиновой кислоты содержит два или более неприродных нуклеотидов.

В некоторых случаях первую плазмиду, кодирующую Cas9 и sgRNA, и вторую плазмиду, кодирующую молекулу нуклеиновой кислоты, содержащую неприродный нуклеотид, вводят в сконструированный микроорганизм. В некоторых случаях первую плазмиду, кодирующую Cas9, и вторую плазмиду, кодирующую sgRNA и молекулу нуклеиновой кислоты, содержащую неприродный нуклеотид, вводят в сконструированный микроорганизм. В некоторых случаях плазмиду, кодирующую Cas9, sgRNA и молекулу нуклеиновой кислоты, содержащую неприродный нуклеотид, вводят в сконструированный микроорганизм. В некоторых случаях молекула нуклеиновой кислоты содержит два или более неприродных нуклеотидов.

В некоторых вариантах осуществления получают живую клетку, которая встраивает в свои нуклеиновые кислоты по меньшей мере один неприродный нуклеотид и/или по меньшей мере одну неприродную пару оснований (UBP). В некоторых случаях неприродная пара оснований включает пару неприродных взаимно спаривающихся нуклеотидов, способных образовывать неприродную пару оснований в условиях in vivo, когда неприродные взаимно спаривающиеся нуклеотиды в виде соответствующих трифосфатов попадают в клетку под действием нуклеотидтрифосфатного транспортера. Клетка может быть генетически трансформирована с помощью кассеты экспрессии, кодирующей нуклеотидтрифосфатный транспортер, так что нуклеотидтрифосфатный транспортер экспрессируется и становится доступным для транспорта неприродных нуклеотидов в клетку. Клетка может быть генетически трансформирована с помощью кассеты экспрессии, кодирующей полимеразу, так что полимераза экспрессируется и доступна для встраивания неприродных нуклеотидов в нуклеиновые кислоты клетки. Клетка может представлять собой прокариотическую или эукариотическую клетку, и пара неприродных взаимно спаривающихся нуклеотидов в виде их соответствующих трифосфатов может представлять собой трифосфат d5SICS (d5SICSTP) и трифосфат dNaM (dNaMTP).

В некоторых вариантах осуществления клетки являются генетически трансформированными клетками с нуклеиновой кислотой, например, кассетой экспрессии, кодирующей нуклеотидтрифосфатный транспортер, способный транспортировать такие неприродные нуклеотиды в клетку. Клетка может содержать гетерологичный нуклеотидтрифосфатный транспортер, где гетерологичный нуклеотидтрифосфатный транспортер может транспортировать природные и неприродные нуклеотидтрифосфаты в клетку. Клетка может содержать гетерологичную полимеразу, где гетерологичная полимераза обладает активностью в отношении неприродной нуклеиновой кислоты.

В некоторых случаях способ, описанный в данном документе, также включает приведение в контакт генетически трансформированной клетки с соответствующими трифосфатными формами неприродных нуклеотидов в присутствии фосфата калия и/или ингибитора фосфатаз или нуклеотидаз. Во время или после такого контакта клетку можно помещать в жизнеобеспечивающую среду, подходящую для роста и репликации клетки. Клетку можно содержать в поддерживающей среде, так что соответствующие трифосфатные формы неприродных нуклеотидов встраиваются в нуклеиновые кислоты в клетках и проходят через по меньшей мере один цикл репликации клетки. Пара неприродных взаимно спаривающихся нуклеотидов в виде соответствующего трифосфата может содержать трифосфат d5SICS (d5SICSTP) и трифосфат dNaM (dNaMTP), при этом клетка может представлять собой E. coli, и при этом d5SICSTP и dNaMTP могут эффективно импортироваться в E. coli транспортером PtNTT2, где полимераза E. coli, такая как Pol I, может эффективно использовать неприродные трифосфаты для репликации ДНК, тем самым встраивая неприродные нуклеотиды и/или неприродные пары оснований в нуклеиновые кислоты клетки в клеточной среде.

При реализации на практике способа по настоящему изобретению специалист в данной области может получить популяцию живых и размножающихся клеток, которая содержит по меньшей мере один неприродный нуклеотид и/или по меньшей мере одну неприродную пару оснований (UBP) в пределах по меньшей мере одной нуклеиновой кислоты, содержащейся в по меньшей мере некоторых из отдельных клеток, где по меньшей мере одна нуклеиновая кислота стабильно репродуцируется в клетке и где клетка экспрессирует нуклеотидтрифосфатный транспортер, подходящий для обеспечения клеточного захвата трифосфатных форм одного или нескольких неприродных нуклеотидов при контакте с неприродным(неприродными) нуклеотидом(нуклеотидами) (например, выращивании в его(их) присутствии) в жизнеобеспечивающей среде, подходящей для роста и репликации организма.

После транспорта в клетку с помощью нуклеотидтрифосфатного транспортера неприродные спаривающиеся нуклеотиды встраиваются в нуклеиновые кислоты в клетке с помощью клеточного механизма, например, собственных ДНК- и/или РНК-полимераз клетки, гетерологичной полимеразы или полимеразы, которая была разработана с применением направленной эволюции (Chen T, Romesberg FE, FEBS Lett. 2014 Jan 21;588(2):219-29; Betz K et al., J Am Chem Soc. 2013 Dec 11;135(49):18637-43). Неприродные нуклеотиды могут быть встроены в нуклеиновые кислоты клетки, такие как геномная ДНК, геномная РНК, мРНК, структурная РНК, микроРНК и автономно реплицирующиеся нуклеиновые кислоты (например, плазмиды, вирусы или векторы).

В некоторых случаях полученные методами генной инженерии клетки получают путем введения нуклеиновых кислот, например, гетерологичных нуклеиновых кислот, в клетки. Любая клетка, описанная в данном документе, может представлять собой клетку-хозяина и может содержать вектор экспрессии. В одном варианте осуществления клетка-хозяин представляет собой прокариотическую клетку. В другом варианте осуществления клетка-хозяин представляет собой E. coli. В некоторых вариантах осуществления клетка содержит один или несколько гетерологичных полинуклеотидов. Реагенты на основе нуклеиновых кислот можно вводить в микроорганизмы с применением различных методик. Неограничивающие примеры способов, используемых для введения гетерологичных нуклеиновых кислот в различные организмы, включают трансформацию, трансфекцию, трансдукцию, электропорацию, опосредованную ультразвуком трансформацию, бомбардировку частицами и т. п. В некоторых случаях добавление молекул-носителей (например, бис-бензимдазолильных соединений, например, см. патент США № 5595899) может обеспечить увеличение захвата ДНК в клетках, которые, как правило, трудно трансформировать обычными способами. Обычные способы трансформации легко доступны специалисту в данной области техники и их можно найти в Maniatis, T., E. F. Fritsch and J. Sambrook (1982) Molecular Cloning: a Laboratory Manual; Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.

В некоторых случаях генетическую трансформацию получают с применением прямого переноса кассеты экспрессии без ограничения в плазмидах, вирусных векторах, вирусных нуклеиновых кислотах, фаговых нуклеиновых кислотах, фагах, космидах и искусственных хромосомах или путем переноса генетического материала в клетках или носителях, таких как катионные липосомы. Такие способы доступны из уровня техники и легко адаптируются для применения в способе, описанном в данном документе. Векторы для переноса могут представлять собой любую нуклеотидную конструкцию, применяемую для доставки генов в клетки (например, плазмиду), или часть общей стратегии доставки генов, например, часть рекомбинантного ретровируса или аденовируса (Ram et al. Cancer Res. 53:83-88, (1993)). Подходящие средства для трансфекции, включая вирусные векторы, химические трансфектанты или физико-механические способы, такие как электропорация и прямая диффузия ДНК, описаны, например, у Wolff, J. A., et al., Science, 247, 1465-1468, (1990); и Wolff, J. A. Nature, 352, 815-818, (1991).

Например, нуклеотидтрифосфатный транспортер или молекулу полимеразы нуклеиновых кислот, кассету экспрессии и/или вектор можно вводить в клетку любым способом, включая без ограничения опосредованную кальцием трансформацию, электропорацию, микроинъекцию, липофекцию, бомбардировку частицами и т. п.

В некоторых случаях клетка содержит неприродные нуклеотидтрифосфаты, встроенные в одну или несколько нуклеиновых кислот в клетке. Например, клетка может представлять собой живую клетку, способную к встраиванию по меньшей мере одного неприродного нуклеотида в ДНК или РНК, содержащихся в клетке. В клетку также можно встраивать по меньшей мере одну неприродную пару оснований (UBP), содержащую пару неприродных взаимно спаривающихся нуклеотидов, в нуклеиновые кислоты внутри клетки в условиях in vivo, где неприродные взаимно спаривающиеся нуклеотиды, например, их соответствующие трифосфаты, попадают в клетку под действием нуклеотидтрифосфатного транспортера, ген которого присутствует (например, был введен) в клетку путем генетической трансформации. Например, после встраивания в нуклеиновую кислоту, содержащуюся в клетке, d5SICS и dNaM могут образовывать стабильную неприродную пару оснований, которая может стабильно репродуцироваться посредством механизма репликации ДНК организма, например, при выращивании в жизнеобеспечивающей среде, содержащей d5SICS и dNaM.

В некоторых случаях клетки способны реплицировать неприродную нуклеиновую кислоту. Такие способы могут включать генетическую трансформацию клетки с помощью кассеты экспрессии, кодирующей нуклеотидтрифосфатный транспортер, способный транспортировать в клетку в виде соответствующего трифосфата один или несколько неприродных нуклеотидов в условиях in vivo. В качестве альтернативы можно применять клетку, которая ранее была генетически трансформирована с помощью кассеты экспрессии, которая может экспрессировать закодированный нуклеотидтрифосфатный транспортер. Способ также может включать приведение в контакт или подвергание генетически трансформированной клетки воздействию фосфата калия и соответствующих трифосфатных форм по меньшей мере одного неприродного нуклеотида (например, двух взаимно спаривающихся нуклеотидов, способных образовывать неприродную пару оснований (UBP)) в поддерживающей жизнь среде, подходящей для роста и репликации клетки, и содержание трансформированной клетки в жизнеобеспечивающей среде в присутствии соответствующих трифосфатных форм по меньшей мере одного неприродного нуклеотида (например, двух взаимно спаривающихся нуклеотидов, способных образовывать неприродную пару оснований (UBP) в условиях in vivo в течение по меньшей мере одного цикла репликации клетки.

В некоторых вариантах осуществления клетка содержит стабильно встроенную неприродную нуклеиновую кислоту. Некоторые варианты осуществления предусматривают клетку (например, как E. coli), в которую стабильно встроены нуклеотиды, отличные от A, G, T и C, в нуклеиновых кислотах, содержащихся в клетке. Например, нуклеотиды, отличные от A, G, T и C, могут представлять собой d5SICS, dNaM и dTPT3, которые при встраивании в нуклеиновые кислоты клетки могут образовывать стабильную неприродную пару оснований в нуклеиновых кислотах. В одном аспекте неприродные нуклеотиды и неприродные пары оснований могут стабильно репродуцироваться с помощью аппарата репликации организма, когда организм, трансформированный геном для трифосфатного транспортера, выращивают в жизнеобеспечивающей среде, которая содержит фосфат калия и трифосфатные формы d5SICS, dNaM и dTPT3.

В некоторых случаях клетка содержит расширенный генетический алфавит. Клетка может содержать стабильно встроенную неприродную нуклеиновую кислоту. В некоторых вариантах осуществления клетка с расширенным генетическим алфавитом содержит неприродную нуклеиновую кислоту, которая может образовывать пару оснований (bp) с другой нуклеиновой кислотой, например, природной или неприродной нуклеиновой кислотой. В некоторых вариантах осуществления клетка с расширенным генетическим алфавитом содержит неприродную нуклеиновую кислоту, которая связана водородной связью с другой нуклеиновой кислотой. В некоторых вариантах осуществления клетка с расширенным генетическим алфавитом содержит неприродную нуклеиновую кислоту, которая не связана водородной связью с другой нуклеиновой кислотой, с которой она является спаренной основаниями. В некоторых вариантах осуществления клетка с расширенным генетическим алфавитом содержит неприродную нуклеиновую кислоту, которая спаривается основаниями с другой нуклеиновой кислотой посредством гидрофобных взаимодействий. В некоторых вариантах осуществления клетка с расширенным генетическим алфавитом содержит неприродную нуклеиновую кислоту, которая спаривается основаниями с другой нуклеиновой кислотой посредством взаимодействий, отличных от водородной связи. Клетка с расширенным генетическим алфавитом может представлять собой клетку, которая способна копировать гомологичную нуклеиновую кислоту с образованием нуклеиновой кислоты, предусматривающей неприродную нуклеиновую кислоту. Клетка с расширенным генетическим алфавитом может представлять собой клетку, содержащую неприродное основание нуклеиновой кислоты, спаренное с другой неприродной нуклеиновой кислотой (неприродная пара оснований нуклеиновых кислот (UBP)).

В некоторых вариантах осуществления клетки образуют неприродные пары оснований ДНК (UBP) из импортированных неприродных нуклеотидов в условиях in vivo. В некоторых вариантах осуществления фосфат калия и/или ингибиторы фосфатазной и/или нуклеотидазной активности могут облегчать транспорт неприродных нуклеиновых кислот. Способы включают применение клетки, которая экспрессирует гетерологичный нуклеотидтрифосфатный транспортер. Когда такая клетка вступает в контакт с одним или несколькими нуклеотидтрифосфатами, нуклеотидтрифосфаты транспортируются в клетку. Клетка может находиться в присутствии фосфата калия и/или ингибиторов фосфатазы и нуклеотидазы. Неприродные нуклеотидтрифосфаты могут быть встроены в нуклеиновые кислоты в клетке с помощью природного механизма клетки и, например, могут взаимно спариваться с образованием неприродных пар оснований в нуклеиновых кислотах клетки.

В некоторых вариантах осуществления UBP может быть встроена в клетку или популяцию клеток при воздействии неприродных трифосфатов. В некоторых вариантах осуществления UBP может быть встроена в клетку или популяцию клеток при по сути постоянном воздействии неприродных трифосфатов. В некоторых вариантах осуществления репликация UBP не приводит к существенному снижению скорости роста. В некоторых вариантах осуществления при репликации экспрессия гетерологичного белка, например, нуклеотидтрифосфатного транспортера, не приводит к существенному снижению скорости роста.

В некоторых вариантах осуществления индуцирование экспрессии гетерологичного гена, например, NTT, в клетке может приводить к более медленному росту клеток и увеличению поглощения неприродных нуклеиновых кислот по сравнению с ростом и поглощением клетки без индуцирования экспрессии гетерологичного гена. В некоторых вариантах осуществления индуцирование экспрессии гетерологичного гена, например, NTT, в клетке может приводить к увеличению роста клеток и увеличению поглощения неприродных нуклеиновых кислот по сравнению с ростом и поглощением клетки без индуцирования экспрессии гетерологичного гена.

В некоторых вариантах осуществления UBP встраивается во время логарифмической фазы роста. В некоторых вариантах осуществления UBP встраивается во время нелогарифмической фазы роста. В некоторых вариантах осуществления UBP встраивается во время по сути линейной фазы роста. В некоторых вариантах осуществления UBP стабильно встраивается в клетку или популяцию клеток после роста в течение некоторого периода времени. Например, UBP может стабильно встраиваться в клетку или популяцию клеток после роста в течение по меньшей мере приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45 или 50 или больше удвоений. Например, UBP может стабильно встраиваться в клетку или популяцию клеток после роста в течение по меньшей мере приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 или 24 часов роста. Например, UBP может стабильно встраиваться в клетку или популяцию клеток после роста в течение по меньшей мере приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или 31 дня роста. Например, UBP может стабильно встраиваться в клетку или популяцию клеток после роста в течение по меньшей мере приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 или 12 месяцев роста. Например, UBP может стабильно встраиваться в клетку или популяцию клеток после роста в течение по меньшей мере приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 50 лет роста.

В некоторых вариантах осуществления в клетке дополнительно применяют полимеразу, описанную в данном документе, для получения мутантной мРНК, которая содержит мутантный кодон, содержащий одно или несколько неприродных оснований нуклеиновых кислот. В некоторых случаях в клетке дополнительно применяют полимеразу, раскрытую в данном документе, для получения мутантной tRNA, которая содержит мутантный антикодон, содержащий одно или несколько неприродных оснований нуклеиновых кислот. В некоторых случаях мутантный антикодон представляет собой неприродную аминокислоту. В некоторых случаях антикодон мутантной tRNA образует пару с кодоном мутантной мРНК во время трансляции для синтеза белка, который содержит неприродную аминокислоту.

Используемый в данном документе термин "аминокислотный остаток" может относиться к молекуле, содержащей как аминогруппу, так и карбоксильную группу. Подходящие аминокислоты включают без ограничения как D-, так и L-изомеры встречающихся в природе аминокислот, а также не встречающихся в природе аминокислот, полученных посредством органического синтеза или других путей метаболизма. Используемый в данном документе термин "аминокислота" включает без ограничения α-аминокислоты, природные аминокислоты, не являющиеся природными аминокислоты и аминокислотные аналоги.

Термин "α-аминокислота" может относиться к молекуле, содержащей как аминогруппу, так и карбоксильную группу, связанную с углеродом, который обозначен как α-углерод.

Термин "β-аминокислота" может относиться к молекуле, содержащей как аминогруппу, так и карбоксильную группу в β-конфигурации.

Термин "встречающаяся в природе аминокислота" может относиться к любой из двадцати аминокислот, обычно встречающихся в пептидах, синтезируемых в природе, и известных под однобуквенными сокращениями A, R, N, C, D, Q, E, G, H, I, L, K, M, F, P, S, T, W, Y и V.

В следующей таблице приведено краткое описание свойств природных аминокислот.

3- 1- боковой боковой цепи Буквен-ный Букве-ный цепи Заряд Гидрофо-ности Аминокислота код код Полярность (pH 7,4) Индекс Аланин Ala A неполярная нейтральный 1,8 Аргинин Arg R полярная положительный -4,5 Аспарагин Asn N полярная нейтральный -3,5 Аспарагиновая кислота Asp D полярная отрицательный -3,5 Цистеин Cys C полярная нейтральный 2,5 Глутаминовая кислота Glu E полярная отрицательный -3,5 Глутамин Gln Q полярная нейтральный -3,5 Глицин Gly G неполярная нейтральный -0,4 Гистидин His H полярная положительный (10%) -3,2 нейтральный (90%) Изолейцин Ile I неполярная нейтральный 4,5 Лейцин Leu L неполярная нейтральный 3,8 Лизин Lys K полярная положительный -3,9 Метионин Met M неполярная нейтральный 1,9 Фенилаланин Phe F неполярная нейтральный 2,8 Пролин Pro P неполярная нейтральный -1,6 Серин Ser S полярная нейтральный -0,8 Треонин Thr T полярная нейтральный -0,7 Триптофан Trp W неполярная нейтральный -0,9 Тирозин Tyr Y полярная нейтральный -1,3 Валин Val V неполярная нейтральный 4,2

Термин "гидрофобные аминокислоты" включают небольшие гидрофобные аминокислоты и крупные гидрофобные аминокислоты. "Небольшая гидрофобная аминокислота" может представлять собой глицин, аланин, пролин и их аналоги. "Крупные гидрофобные аминокислоты" могут представлять собой валин, лейцин, изолейцин, фенилаланин, метионин, триптофан и их аналоги. "Полярные аминокислоты" могут представлять собой серин, треонин, аспарагин, глутамин, цистеин, тирозин и их аналоги. "Заряженные аминокислоты" могут представлять собой лизин, аргинин, гистидин, аспартат, глутамат и их аналоги.

"Аминокислотный аналог" может представлять собой молекулу, которая структурно аналогична аминокислоте и которая может заменить аминокислоту при образовании пептидомиметического макроцикла. Аминокислотные аналоги включают без ограничения β-аминокислоты и аминокислоты, где амино- или карбоксигруппа замещена аналогичной реакционноспособной группой (например, замещение первичного амина вторичным или третичным амином или замещение карбоксигруппы сложным эфиром).

"Не являющаяся природной аминокислота" может представлять собой аминокислоту, которая не является одной из двадцати аминокислот, обычно встречающихся в пептидах, синтезируемых в природе, и известных под однобуквенными сокращениями A, R, N, C, D, Q, E, G, H, I, L, K, M, F, P, S, T, W, Y и V.

Аминокислотные аналоги могут включать аналоги β-аминокислот. Примеры аналогов β-аминокислот включают без ограничения следующие: циклические аналоги β-аминокислот; β-аланин; (R)-β-фенилаланин; (R)-1,2,3,4-тетрагидроизохинолин-3-уксусная кислота; (R)-3-амино-4-(1-нафтил)-масляная кислота; (R)-3-амино-4-(2,4-дихлорфенил)-масляная кислота; (R)-3-амино-4-(2-хлорфенил)-масляная кислота; (R)-3-амино-4-(2-цианофенил)-масляная кислота; (R)-3-амино-4-(2-фторфенил)-масляная кислота; (R)-3-амино-4-(2-фурил)-масляная кислота; (R)-3-амино-4-(2-метилфенил)-масляная кислота; (R)-3-амино-4-(2-нафтил)-масляная кислота; (R)-3-амино-4-(2-тиенил)-масляная кислота; (R)-3-амино-4-(2-трифторметилфенил)-масляная кислота; (R)-3-амино-4-(3,4-дихлорфенил)-масляная кислота; (R)-3-амино-4-(3,4-дифторфенил)-масляная кислота; (R)-3-амино-4-(3-бензотиенил)-масляная кислота; (R)-3-амино-4-(3-хлорфенил)-масляная кислота; (R)-3-амино-4-(3-цианофенил)-масляная кислота; (R)-3-амино-4-(3-фторфенил)-масляная кислота; (R)-3-амино-4-(3-метилфенил)-масляная кислота; (R)-3-амино-4-(3-пиридил)-масляная кислота; (R)-3-амино-4-(3-тиенил)-масляная кислота; (R)-3-амино-4-(3-трифторметилфенил)-масляная кислота; (R)-3-амино-4-(4-бромфенил)-масляная кислота; (R)-3-амино-4-(4-хлорфенил)-масляная кислота; (R)-3-амино-4-(4-цианофенил)-масляная кислота; (R)-3-амино-4-(4-фторфенил)-масляная кислота; (R)-3-амино-4-(4-йодфенил)-масляная кислота; (R)-3-амино-4-(4-метилфенил)-масляная кислота; (R)-3-амино-4-(4-нитрофенил)-масляная кислота; (R)-3-амино-4-(4-пиридил)-масляная кислота; (R)-3-амино-4-(4-трифторметилфенил)-масляная кислота; (R)-3-амино-4-пентафторфенилмасляная кислота; (R)-3-амино-5-гексеновая кислота; (R)-3-амино-5-гексиновая кислота; (R)-3-амино-5-фенилпентановая кислота; (R)-3-амино-6-фенил-5-гексеновая кислота; (S)-1,2,3,4-тетрагидроизохинолин-3-уксусная кислота; (S)-3-амино-4-(1-нафтил)-масляная кислота; (S)-3-амино-4-(2,4-дихлорфенил)-масляная кислота; (S)-3-амино-4-(2-хлорфенил)-масляная кислота; (S)-3-амино-4-(2-цианофенил)-масляная кислота; (S)-3-амино-4-(2-фторфенил)-масляная кислота; (S)-3-амино-4-(2-фурил)-масляная кислота; (S)-3-амино-4-(2-метилфенил)-масляная кислота; (S)-3-амино-4-(2-нафтил)-масляная кислота; (S)-3-амино-4-(2-тиенил)-масляная кислота; (S)-3-амино-4-(2-трифторметилфенил)-масляная кислота; (S)-3-амино-4-(3,4-дихлорфенил)-масляная кислота; (S)-3-амино-4-(3,4-дифторфенил)-масляная кислота; (S)-3-амино-4-(3-бензотиенил)-масляная кислота; (S)-3-амино-4-(3-хлорфенил)-масляная кислота; (S)-3-амино-4-(3-цианофенил)-масляная кислота; (S)-3-амино-4-(3-фторфенил)-масляная кислота; (S)-3-амино-4-(3-метилфенил)-масляная кислота; (S)-3-амино-4-(3-пиридил)-масляная кислота; (S)-3-амино-4-(3-тиенил)-масляная кислота; (S)-3-амино-4-(3-трифторметилфенил)-масляная кислота; (S)-3-амино-4-(4-бромфенил)-масляная кислота; (S)-3-амино-4-(4-хлорфенил)-масляная кислота; (S)-3-амино-4-(4-цианофенил)-масляная кислота; (S)-3-амино-4-(4-фторфенил)-масляная кислота; (S)-3-амино-4-(4-йодфенил)-масляная кислота; (S)-3-амино-4-(4-метилфенил)-масляная кислота; (S)-3-амино-4-(4-нитрофенил)-масляная кислота; (S)-3-амино-4-(4-пиридил)-масляная кислота; (S)-3-амино-4-(4-трифторметилфенил)-масляная кислота; (S)-3-амино-4-пентафторфенилмасляная кислота; (S)-3-амино-5-гексеновая кислота; (S)-3-амино-5-гексиновая кислота; (S)-3-амино-5-фенилпентановая кислота; (S)-3-амино-6-фенил-5-гексеновая кислота; 1,2,5,6-тетрагидропиридин-3-карбоновая кислота; 1,2,5,6-тетрагидропиридин-4-карбоновая кислота; 3-амино-3-(2-хлорфенил)-пропионовая кислота; 3-амино-3-(2-тиенил)-пропионовая кислота; 3-амино-3-(3-бромфенил)-пропионовая кислота; 3-амино-3-(4-хлорфенил)-пропионовая кислота; 3-амино-3-(4-метоксифенил)-пропионовая кислота; 3-амино-4,4,4-трифтормасляная кислота; 3-аминоадипиновая кислота; D-β-фенилаланин; β-лейцин; L-β-гомоаланин; γ-бензиловый эфир L-β-гомоаспарагиновой кислоты; Δ-бензиловый эфир L-β-гомоглутаминовой кислоты; L-β-гомоизолейцин; L-β-гомолейцин; L-β-гомометионин; L-β-гомофенилаланин; L-β-гомопролин; L-β-гомотриптофан; L-β-гомовалин; L-Nω-бензилоксикарбонил-β-гомолизин; Nω-L-β-гомоаргинин; O-бензил-L-β-гомогидроксипролин; O-бензил-L-β-гомосерин; O-бензил-L-β-гомотреонин; O-бензил-L-β-гомотирозин; γ-тритил-L-β-гомоаспарагин; (R)-β-фенилаланин; γ-трет-бутиловый эфир L-β-гомоаспарагиновой кислоты; Δ-трет-бутиловый эфир L-β-гомоглутаминовой кислоты; L-Nω-β-гомолизин; NΔ-тритил-L-β-гомоглутамин; Nω-2,2,4,6,7-пентаметилдигидробензофуран-5-сульфонил-L-β-гомоаргинин; O-трет-бутил-L-β-гомогидроксипролин; O-трет-бутил-L-β-гомосерин; O-трет-бутил-L-β-гомотреонин; O-трет-бутил-L-β-гомотирозин; 2-аминоциклопентанкарбоновая кислота и 2-аминоциклогексанкарбоновая кислота.

Аминокислотные аналоги могут включать аналоги аланина, валина, глицина или лейцина. Примеры аминокислотных аналогов аланина, валина, глицина и лейцина включают без ограничения следующие: α-метоксиглицин; α-аллил-L-аланин; α-аминоизомасляная кислота; α-метиллейцин; β-(1-нафтил)-D-аланин; β-(1-нафтил)-L-аланин; β-(2-нафтил)-D-аланин; β-(2-нафтил)-L-аланин; β-(2-пиридил)-D-аланин; β-(2-пиридил)-L-аланин; β-(2-тиенил)-D-аланин; β-(2-тиенил)-L-аланин; β-(3-бензотиенил)-D-аланин; β-(3-бензотиенил)-L-аланин; β-(3-пиридил)-D-аланин; β-(3-пиридил)-L-аланин; β-(4-пиридил)-D-аланин; β-(4-пиридил)-L-аланин; β-хлор-L-аланин; β-циано-L-аланин; β-циклогексил-D-аланин; β-циклогексил-L-аланин; β-циклопентен-1-илаланин; β-циклопентилаланин; дициклогексиламмониевая соль β-циклопропил-L-Ala-OH; β-трет-бутил-D-аланин; β-трет-бутил-L-аланин; γ-аминомасляная кислота; L-α,β-диаминопропионовая кислота; 2,4-динитрофенилглицин; 2,5-дигидро-D-фенилглицин; 2-амино-4,4,4-трифтормасляная кислота; 2-фторфенилглицин; 3-амино-4,4,4-трифтормасляная кислота; 3-фторвалин; 4,4,4-трифторвалин; дициклогексиламмониевая соль 4,5-дегидро-L-leu-OH; 4-фтор-D-фенилглицин; 4-фтор-L-фенилглицин; 4-гидрокси-D-фенилглицин; 5,5,5-трифторлейцин; 6-аминогексановая кислота; дициклогексиламмониевая соль циклопентил-D-Gly-OH; дициклогексиламмониевая соль циклопентил-Gly-OH; D-α,β-диаминопропионовая кислота; D-α-аминомасляная кислота; D-α-трет-бутилглицин; D-(2-тиенил)глицин; D-(3-тиенил)глицин; D-2-аминокапроновая кислота; D-2-инданилглицин; D-аллилглициндициклогексиламмониевая соль; D-циклогексилглицин; D-норвалин; D-фенилглицин; β-аминомасляная кислота; β-аминоизомасляная кислота; (2-бромфенил)глицин; (2-метоксифенил)глицин; (2-метилфенил)глицин; (2-тиазоил)глицин; (2-тиенил)глицин; 2-амино-3-(диметиламино)-пропионовая кислота; L-α,β-диаминопропионовая кислота; L-α-аминомасляная кислота; L-α-трет-бутилглицин; L-(3-тиенил)глицин; L-2-амино-3-(диметиламино)-пропионовая кислота; дициклогексиламмониевая соль L-2-аминокапроновой кислоты; L-2-инданилглицин; дициклогексиламмониевая соль L-аллилглицина; L-циклогексилглицин; L-фенилглицин; L-пропаргилглицин; L-норвалин; N-α-аминометил-L-аланин; D-α,γ-диаминомасляная кислота; L-α,γ-диаминомасляная кислота; β-циклопропил-L-аланин; (N-β-(2,4-динитрофенил))-L-α,β-диаминопропионовая кислота; (N-β-1-(4,4-диметил-2,6-диоксоциклогекс-1-илиден)этил)-D-α,β-диаминопропионовая кислота; (N-β-1-(4,4-диметил-2,6-диоксоциклогекс-1-илиден)этил)-L-α,β-диаминопропионовая кислота; (N-β-4-метилтритил)-L-α,β-диаминопропионовая кислота; (N-β-аллилоксикарбонил)-L-α,β-диаминопропионовая кислота; (N-γ-1-(4,4-диметил-2,6-диоксоциклогекс-1-илиден)этил)-D-α,γ-диаминомасляная кислота; (N-γ-1-(4,4-диметил-2,6-диоксоциклогекс-1-илиден)этил)-L-α,γ-диаминомасляная кислота; (N-γ-4-метилтритил)-D-α,γ-диаминомасляная кислота; (N-γ-4-метилтритил)-L-α,γ-диаминомасляная кислота; (N-γ-аллилоксикарбонил)-L-α,γ-диаминомасляная кислота; D-α,γ-диаминомасляная кислота; 4,5-дегидро-L-лейцин; циклопентил-D-Gly-OH; циклопентил-Gly-OH; D-аллилглицин; D-гомоциклогексилаланин; L-1-пиренилаланин; L-2-аминокапроновая кислота; L-аллилглицин; L-гомоциклогексилаланин и N-(2-гидрокси-4-метокси-Bzl)-Gly-OH.

Аминокислотные аналоги могут включать аналоги аргинина или лизина. Примеры аминокислотных аналогов аргинина и лизина включают без ограничения следующие: цитруллин; L-2-амино-3-гуанидинпропионовая кислота; L-2-амино-3-уреидопропионовая кислота; L-цитруллин; Lys(Me)2-OH; Lys(N3)-OH; NΔ-бензилоксикарбонил-L-орнитин; Nω-нитро-D-аргинин; Nω-нитро-L-аргинин; α-метилорнитин; 2,6-диаминогептандикарбоновая кислота; L-орнитин; (NΔ-1-(4,4-диметил-2,6-диоксоциклогекс-1-илиден)этил)-D-орнитин; (NΔ-1-(4,4-диметил-2,6-диоксоциклогекс-1-илиден)этил)-L-орнитин; (NΔ-4-метилтритил)-D-орнитин; (NΔ-4-метилтритил)-L-орнитин; D-орнитин; L-орнитин; Arg(Me)(Pbf)-OH; Arg(Me)2-OH (асимметричный); Arg(Me)2-OH (симметричный); Lys(ivDde)-OH; Lys(Me)2-OH·HCl; хлорид Lys(Me3)-OH; Nω-нитро-D-аргинин и Nω-нитро-L-аргинин.

Аминокислотные аналоги могут включать аналоги аспарагиновой или глутаминовой кислот. Примеры аминокислотных аналогов аспарагиновой и глутаминовой кислот включают без ограничения следующие: α-метил-D-аспарагиновая кислота; α-метилглутаминовая кислота; α-метил-L-аспарагиновая кислота; γ-метиленглутаминовая кислота; (N-γ-этил)-L-глутамин; [N-α-(4-аминобензоил)]-L-глутаминовая кислота; 2,6-диаминопимелиновая кислота; L-α-аминосубериновая кислота; D-2-аминоадипиновая кислота; D-α-аминосубериновая кислота; α-аминопимелиновая кислота; иминодиуксусная кислота; L-2-аминоадипиновая кислота; трео-β-метиласпарагиновая кислота; γ,γ-ди-трет-бутиловый эфир γ-карбокси-D-глутаминовой кислоты; γ,γ-ди-трет-бутиловый эфир γ-карбокси-L-глутаминовой кислоты; Glu(OAll)-OH; L-Asu(OtBu)-OH и пироглутаминовая кислота.

Аминокислотные аналоги могут включать аналоги цистеина и метионина. Примеры аминокислотных аналогов цистеина и метионина включают без ограничения Cys(фарнезил)-OH, Cys(фарнезил)-OMe, α-метилметионин, Cys(2-гидроксиэтил)-OH, Cys(3-аминопропил)-OH, 2-амино-4-(этилтио)-масляную кислоту, бутионин, бутионинсульфоксимин, этионин, метилметионинсульфония хлорид, селенометионин, цистеиновую кислоту, [2-(4-пиридил)этил]-DL-пеницилламин, [2-(4-пиридил)этил]-L-цистеин, 4-метоксибензил-D-пеницилламин, 4-метоксибензил-L-пеницилламин, 4-метилбензил-D-пеницилламин, 4-метилбензил-L-пеницилламин, бензил-D-цистеин, бензил-L-цистеин, бензил-DL-гомоцистеин, карбамоил-L-цистеин, карбоксиэтил-L-цистеин, карбоксиметил-L-цистеин, дифенилметил-L-цистеин, этил-L-цистеин, метил-L-цистеин, трет-бутил-D-цистеин, тритил-L-гомоцистеин, тритил-D-пеницилламин, цистатионин, гомоцистин, L-гомоцистин, (2-аминоэтил)-L-цистеин, селено-L-цистин, цистатионин, Cys(StBu)-OH и ацетамидометил-D-пеницилламин.

Аминокислотные аналоги могут включать аналоги фенилаланина и тирозина. Примеры аминокислотных аналогов фенилаланина и тирозина включают β-метилфенилаланин, β-гидроксифенилаланин, α-метил-3-метокси-DL-фенилаланин, α-метил-D-фенилаланин, α-метил-L-фенилаланин, 1,2,3,4-тетрагидроизохинолин-3-карбоновую кислоту, 2,4-дихлорфенилаланин, 2-(трифторметил)-D-фенилаланин, 2-(трифторметил)-L-фенилаланин, 2-бром-D-фенилаланин, 2-бром-L-фенилаланин, 2-хлор-D-фенилаланин, 2-хлор-L-фенилаланин, 2-циано-D-фенилаланин, 2-циано-L-фенилаланин, 2-фтор-D-фенилаланин, 2-фтор-L-фенилаланин, 2-метил-D-фенилаланин, 2-метил-L-фенилаланин, 2-нитро-D-фенилаланин, 2-нитро-L-фенилаланин, 2;4;5-тригидроксифенилаланин, 3,4,5-трифтор-D-фенилаланин, 3,4,5-трифтор-L-фенилаланин, 3,4-дихлор-D-фенилаланин, 3,4-дихлор-L-фенилаланин, 3,4-дифтор-D-фенилаланин, 3,4-дифтор-L-фенилаланин, 3,4-дигидрокси-L-фенилаланин, 3,4-диметокси-L-фенилаланин, 3,5,3′-трийод-L-тиронин, 3,5-дийод-D-тирозин, 3,5-дийод-L-тирозин, 3,5-дийод-L-тиронин, 3-(трифторметил)-D-фенилаланин, 3-(трифторметил)-L-фенилаланин, 3-амино-L-тирозин, 3-бром-D-фенилаланин, 3-бром-L-фенилаланин, 3-хлор-D-фенилаланин, 3-хлор-L-фенилаланин, 3-хлор-L-тирозин, 3-циано-D-фенилаланин, 3-циано-L-фенилаланин, 3-фтор-D-фенилаланин, 3-фтор-L-фенилаланин, 3-фтортирозин, 3-йод-D-фенилаланин, 3-йод-L-фенилаланин, 3-йод-L-тирозин, 3-метокси-L-тирозин, 3-метил-D-фенилаланин, 3-метил-L-фенилаланин, 3-нитро-D-фенилаланин, 3-нитро-L-фенилаланин, 3-нитро-L-тирозин, 4-(трифторметил)-D-фенилаланин, 4-(трифторметил)-L-фенилаланин, 4-амино-D-фенилаланин, 4-амино-L-фенилаланин, 4-бензоил-D-фенилаланин, 4-бензоил-L-фенилаланин, 4-бис(2-хлорэтил)амино-L-фенилаланин, 4-бром-D-фенилаланин, 4-бром-L-фенилаланин, 4-хлор-D-фенилаланин, 4-хлор-L-фенилаланин, 4-циано-D-фенилаланин, 4-циано-L-фенилаланин, 4-фтор-D-фенилаланин, 4-фтор-L-фенилаланин, 4-йод-D-фенилаланин, 4-йод-L-фенилаланин, гомофенилаланин, тироксин, 3,3-дифенилаланин, тиронин, этилтирозин и метилтирозин.

Аминокислотные аналоги могут включать аналоги пролина. Примеры аминокислотных аналогов пролина включают без ограничения 3,4-дегидропролин, 4-фторпролин, цис-4-гидроксипролин, тиазолидин-2-карбоновую кислоту и транс-4-фторпролин.

Аминокислотные аналоги могут включать аналоги серина и треонина. Примеры аминокислотных аналогов серина и треонина включают без ограничения 3-амино-2-гидрокси-5-метилгексановую кислоту, 2-амино-3-гидрокси-4-метилпентановую кислоту, 2-амино-3-этоксибутановую кислоту, 2-амино-3-метоксибутановую кислоту, 4-амино-3-гидрокси-6-метилгептановую кислоту, 2-амино-3-бензилоксипропионовую кислоту, 2-амино-3-бензилоксипропионовую кислоту, 2-амино-3-этоксипропионовую кислоту, 4-амино-3-гидроксибутановую кислоту и α-метилсерин.

Аминокислотные аналоги могут включать аналоги триптофана. Примеры аминокислотных аналогов триптофана включают без ограничения следующие: α-метилтриптофан; β-(3-бензотиенил)-D-аланин; β-(3-бензотиенил)-L-аланин; 1-метилтриптофан; 4-метилтриптофан; 5-бензилокситриптофан; 5-бромтриптофан; 5-хлортриптофан; 5-фтортриптофан; 5-гидрокситриптофан; 5-гидрокси-L-триптофан; 5-метокситриптофан; 5-метокси-L-триптофан; 5-метилтриптофан; 6-бромтриптофан; 6-хлор-D-триптофан; 6-хлортриптофан; 6-фтортриптофан; 6-метилтриптофан; 7-бензилокситриптофан; 7-бромтриптофан; 7-метилтриптофан; D-1,2,3,4-тетрагидроноргарман-3-карбоновая кислота; 6-метокси-1,2,3,4-тетрагидроноргарман-1-карбоновая кислота; 7-азатриптофан; L-1,2,3,4-тетрагидроноргарман-3-карбоновая кислота; 5-метокси-2-метилтриптофан и 6-хлор-L-триптофан.

Аминокислотные аналоги могут быть рацемическими. В некоторых случаях применяют D-изомер аминокислотного аналога. В некоторых случаях применяют L-изомер аминокислотного аналога. В некоторых случаях аминокислотный аналог содержит хиральные центры, которые находятся в R- или S-конфигурации. Иногда аминогруппа(аминогруппы) аналога β-аминокислоты замещена защитной группой, например, трет-бутилоксикарбонилом (группой BOC), 9-флуоренилметилоксикарбонилом (FMOC), тозилом и т. п. Иногда функциональная группа карбоновой кислоты аналога β-аминокислоты защищена и находится, например, в виде ее сложноэфирного производного. В некоторых случаях применяют соль аналога аминокислоты.

В некоторых вариантах осуществления неприродная аминокислота представляет собой неприродную аминокислоту, описанную в Liu C.C., Schultz, P.G. Annu. Rev. Biochem. 2010, 79, 413. В некоторых вариантах осуществления неприродная аминокислота включает N6(2-азидоэтокси)-карбонил-L-лизин.

Типы клеток

В некоторых вариантах осуществления многие типы клеток/микроорганизмов применяют, например, для трансформации или генной инженерии. В некоторых вариантах осуществления клетка представляет собой прокариотическую или эукариотическую клетку. В некоторых случаях клетка представляет собой микроорганизм, такой как бактериальная клетка, клетка гриба, дрожжи или одноклеточное простейшее. В других случаях клетка представляет собой эукариотическую клетку, такую как культивируемая клетка животного, растения или человека. В дополнительных случаях клетка присутствует в организме, таком как растение или животное.

В некоторых вариантах осуществления сконструированный микроорганизм представляет собой одноклеточный организм, часто способный делиться и пролиферировать. Микроорганизм может иметь один или несколько из следующих признаков: аэроб, анаэроб, нитчатый, ненитчатый, моноплоидный, диплоидный, ауксотрофный и/или неауксотрофный. В некоторых вариантах осуществления сконструированный микроорганизм представляет собой прокариотический микроорганизм (например, бактерию), и в определенных вариантах осуществления сконструированный микроорганизм представляет собой микроорганизм, не являющийся прокариотическим. В некоторых вариантах осуществления сконструированный микроорганизм представляет собой эукариотический микроорганизм (например, дрожжи, грибы, амебу). В некоторых вариантах осуществления сконструированный микроорганизм представляет собой гриб. В некоторых вариантах осуществления сконструированный организм представляет собой дрожжи.

Любые подходящие дрожжи могут быть выбраны в качестве микроорганизма-хозяина, сконструированного микроорганизма, генетически модифицированного организма или источника гетерологичного или модифицированного полинуклеотида. Дрожжи включают без ограничения дрожжи Yarrowia (например, Y. lipolytica (ранее классифицированные как Candida lipolytica)), дрожжи Candida (например, C. revkaufi, C. viswanathii, C. pulcherrima, C. tropicalis, C. utilis), дрожжи Rhodotorula (например, R. glutinus, R. graminis), дрожжи Rhodosporidium (например, R. toruloides), дрожжи Saccharomyces (например, S. cerevisiae, S. bayanus, S. pastorianus, S. carlsbergensis), дрожжи Cryptococcus, дрожжи Trichosporon (например, T. pullans, T. cutaneum), дрожжи Pichia (например, P. pastoris) и дрожжи Lipomyces (например, L. starkeyii, L. lipoferus). В некоторых вариантах осуществления подходящие дрожжи происходят из рода Arachniotus, Aspergillus, Aureobasidium, Auxarthron, Blastomyces, Candida, Chrysosporuim, Chrysosporuim, Debaryomyces, Coccidiodes, Cryptococcus, Gymnoascus, Hansenula, Histoplasma, Issatchenkia, Kluyveromyces, Lipomyces, Lssatchenkia, Microsporum, Myxotrichum, Myxozyma, Oidiodendron, Pachysolen, Penicillium, Pichia, Rhodosporidium, Rhodotorula, Rhodotorula, Saccharomyces, Schizosaccharomyces, Scopulariopsis, Sepedonium, Trichosporon или Yarrowia. В некоторых вариантах осуществления подходящие дрожжи относятся к виду Arachniotus flavoluteus, Aspergillus flavus, Aspergillus fumigatus, Aspergillus niger, Aureobasidium pullulans, Auxarthron thaxteri, Blastomyces dermatitidis, Candida albicans, Candida dubliniensis, Candida famata, Candida glabrata, Candida guilliermondii, Candida kefyr, Candida krusei, Candida lambica, Candida lipolytica, Candida lustitaniae, Candida parapsilosis, Candida pulcherrima, Candida revkaufi, Candida rugosa, Candida tropicalis, Candida utilis, Candida viswanathii, Candida xestobii, Chrysosporuim keratinophilum, Coccidiodes immitis, Cryptococcus albidus var. diffluens, Cryptococcus laurentii, Cryptococcus neofomans, Debaryomyces hansenii, Gymnoascus dugwayensis, Hansenula anomala, Histoplasma capsulatum, Issatchenkia occidentalis, Isstachenkia orientalis, Kluyveromyces lactis, Kluyveromyces marxianus, Kluyveromyces thermotolerans, Kluyveromyces waltii, Lipomyces lipoferus, Lipomyces starkeyii, Microsporum gypseum, Myxotrichum deflexum, Oidiodendron echinulatum, Pachysolen tannophilis, Penicillium notatum, Pichia anomala, Pichia pastoris, Pichia stipitis, Rhodosporidium toruloides, Rhodotorula glutinus, Rhodotorula graminis, Saccharomyces cerevisiae, Saccharomyces kluyveri, Schizosaccharomyces pombe, Scopulariopsis acremonium, Sepedonium chrysospermum, Trichosporon cutaneum, Trichosporon pullans, Yarrowia lipolytica или Yarrowia lipolytica (ранее классифицированные как Candida lipolytica). В некоторых вариантах осуществления дрожжи представляют собой один из штаммов Y. lipolytica, которые включают без ограничения штаммы ATCC20362, ATCC8862, ATCC18944, ATCC20228, ATCC76982 и LGAM S(7)1 (Papanikolaou S., and Aggelis G., Bioresour. Technol. 82(1):43-9 (2002)). В определенных вариантах осуществления дрожжи представляют собой дрожжи вида Candida (т. e., Candida spp.). Любые подходящие виды Candida можно применять и/или генетически модифицировать для получения жирной дикарбоновой кислоты (например, октандикарбоновой кислоты, декандикарбоновой кислоты, додекандикарбоновой кислоты, тетрадекандикарбоновой кислоты, гексадекандикарбоновой кислоты, октадекандикарбоновой кислоты, эйкозандикарбоновой кислоты). В некоторых вариантах осуществления подходящие виды Candida включают без ограничения Candida albicans, Candida dubliniensis, Candida famata, Candida glabrata, Candida guilliermondii, Candida kefyr, Candida krusei, Candida lambica, Candida lipolytica, Candida lustitaniae, Candida parapsilosis, Candida pulcherrima, Candida revkaufi, Candida rugosa, Candida tropicalis, Candida utilis, Candida viswanathii, Candida xestobii и любые другие дрожжи Candida spp., описанные в данном документе. Неограничивающие примеры штаммов Candida spp. включают без ограничения штаммы sAA001 (ATCC20336), sAA002 (ATCC20913), sAA003 (ATCC20962), sAA496 (US2012/0077252), sAA106 (US2012/0077252), SU-2 (ura3-/ura3-), H5343 (блокировано бета-окисление; патент США № 5648247). Любые подходящие штаммы дрожжей Candida spp. можно применять в качестве родительских штаммов для генетической модификации.

Роды, виды и штаммы дрожжей часто являются настолько близкородственными по генетическому составу, что их трудно различить, классифицировать и/или назвать. В некоторых случаях штаммы C. lipolytica и Y. lipolytica трудно различить, классифицировать и/или назвать, и в некоторых случаях их можно принять за тот же организм. В некоторых случаях различные штаммы C. tropicalis и C. viswanathii трудно различить, классифицировать и/или назвать (например, см. Arie et.al., J. Gen. Appl.Microbiol., 46, 257-262 (2000). Некоторые штаммы C. tropicalis и C. viswanathii, полученные из ATCC, а также из других коммерческих или академических источников, могут считаться эквивалентными и одинаково подходящими для вариантов осуществления, описанных в данном документе. В некоторых вариантах осуществления считается, что некоторые родительские штаммы C. tropicalis и C. viswanathii отличаются только названием.

Любой подходящий гриб может быть выбран в качестве микроорганизма-хозяина, сконструированного микроорганизма или источника гетерологичного полинуклеотида. Неограничивающие примеры грибов включают без ограничения грибы Aspergillus (например, A. parasiticus, A. nidulans), грибы Thraustochytrium, грибы Schizochytrium и грибы Rhizopus (например, R. arrhizus, R. oryzae, R. nigricans). В некоторых вариантах осуществления гриб относится к штамму A. parasiticus, который включает без ограничения штамм ATCC24690, и в определенных вариантах осуществления гриб относится к штамму A. nidulans, который включает без ограничения штамм ATCC38163.

Любой подходящий прокариот может быть выбран в качестве микроорганизма-хозяина, сконструированного микроорганизма или источника гетерологичного полинуклеотида. Могут быть выбраны грамотрицательные или грамположительные бактерии. Примеры бактерий включают без ограничения бактерии Bacillus (например, B. subtilis, B. megaterium), бактерии Acinetobacter, бактерии Norcardia, бактерии Xanthobacter, бактерии Escherichia (например, E. coli (например, штаммы DH10B, Stbl2, DH5-alpha, DB3, DB3.1, DB4, DB5, JDP682 и ccdA-over (например, заявка на патент США № 09/518188))), бактерии Streptomyces, бактерии Erwinia, бактерии Klebsiella, бактерии Serratia (например, S. marcessans), бактерии Pseudomonas (например, P. aeruginosa), бактерии Salmonella (например, S. typhimurium, S. typhi), бактерии Megasphaera (например, Megasphaera elsdenii). Бактерии также включают без ограничения фотосинтезирующие бактерии (например, зеленые бактерии, не относящиеся к серобактериям (например, бактерии Choroflexus (например, C. aurantiacus), бактерии Chloronema (например, C. gigateum)), зеленые серобактерии (например, бактерии Chlorobium (например, C. limicola), бактерии Pelodictyon (например, P. luteolum), пурпурные серобактерии (например, бактерии Chromatium (например, C. okenii)) и пурпурные бактерии, не относящиеся к серобактериям (например, бактерии Rhodospirillum (например, R. rubrum), бактерии Rhodobacter (например, R. sphaeroides, R. capsulatus) и бактерии Rhodomicrobium (например, R. vanellii)).

Клетки из организмов, не относящихся к микробным, можно применять в качестве микроорганизма-хозяина, сконструированного микроорганизма или источника гетерологичного полинуклеотида. Примеры таких клеток включают без ограничения клетки насекомых (например, Drosophila (например, D. melanogaster), Spodoptera (например, клетки Sf9 или Sf21 из S. frugiperda) и Trichoplusa (например, клетки High-Five); клетки нематоды (например, клетки C. elegans); клетки птиц; клетки амфибий (например, клетки Xenopus laevis); клетки рептилий; клетки млекопитающих (например, клетки NIH3T3, 293, CHO, COS, VERO, C127, BHK, Per-C6, меланомы Боуэса и HeLa) и клетки растений (например, Arabidopsis thaliana, Nicotania tabacum, Cuphea acinifolia, Cuphea aequipetala, Cuphea angustifolia, Cuphea appendiculata, Cuphea avigera, Cuphea avigera var. pulcherrima, Cuphea axilliflora, Cuphea bahiensis, Cuphea baillonis, Cuphea brachypoda, Cuphea bustamanta, Cuphea calcarata, Cuphea calophylla, Cuphea calophylla subsp. mesostemon, Cuphea carthagenensis, Cuphea circaeoides, Cuphea confertiflora, Cuphea cordata, Cuphea crassiflora, Cuphea cyanea, Cuphea decandra, Cuphea denticulata, Cuphea disperma, Cuphea epilobiifolia, Cuphea ericoides, Cuphea flava, Cuphea flavisetula, Cuphea fuchsiifolia, Cuphea gaumeri, Cuphea glutinosa, Cuphea heterophylla, Cuphea hookeriana, Cuphea hyssopifolia (мексиканский вереск), Cuphea hyssopoides, Cuphea ignea, Cuphea ingrata, Cuphea jorullensis, Cuphea lanceolata, Cuphea linarioides, Cuphea llavea, Cuphea lophostoma, Cuphea lutea, Cuphea lutescens, Cuphea melanium, Cuphea melvilla, Cuphea micrantha, Cuphea micropetala, Cuphea mimuloides, Cuphea nitidula, Cuphea palustris, Cuphea parsonsia, Cuphea pascuorum, Cuphea paucipetala, Cuphea procumbens, Cuphea pseudosilene, Cuphea pseudovaccinium, Cuphea pulchra, Cuphea racemosa, Cuphea repens, Cuphea salicifolia, Cuphea salvadorensis, Cuphea schumannii, Cuphea sessiliflora, Cuphea sessilifolia, Cuphea setosa, Cuphea spectabilis, Cuphea spermacoce, Cuphea splendida, Cuphea splendida var. viridiflava, Cuphea strigulosa, Cuphea subuligera, Cuphea teleandra, Cuphea thymoides, Cuphea tolucana, Cuphea urens, Cuphea utriculosa, Cuphea viscosissima, Cuphea watsoniana, Cuphea wrightii, Cuphea lanceolata).

Микроорганизмы или клетки, применяемые в качестве организмов-хозяев или источника гетерологичного полинуклеотида, являются коммерчески доступными. Микроорганизмы и клетки, описанные в данном документе, и другие подходящие микроорганизмы и клетки доступны, например, от Invitrogen Corporation (Карлсбад, Калифорния), Американской коллекции типовых культур (Манассас, Вирджиния) и Коллекции сельскохозяйственных исследовательских культур (NRRL; Пеория, Иллинойс). Микроорганизмы-хозяева и сконструированные микроорганизмы могут быть предоставлены в любой подходящей форме. Например, такие микроорганизмы могут быть предоставлены в жидкой культуре или твердой культуре (например, в среде на основе агара), которая может представлять собой первичную культуру или может быть пересеяна (например, разбавлена и культивирована) один или несколько раз. Микроорганизмы также могут быть предоставлены в замороженном виде или в сухом виде (например, лиофилизированном). Микроорганизмы могут быть предоставлены в любой подходящей концентрации.

Полимераза

Особенно применимая функция полимеразы состоит в том, чтобы катализировать полимеризацию нити нуклеиновой кислоты с применением существующей нуклеиновой кислоты в качестве матрицы. Другие применимые функции описаны в другой части данного документа. Примеры применимых полимераз включают ДНК-полимеразы и РНК-полимеразы.

Способность улучшать специфичность, процессивность или другие свойства полимераз неприродных нуклеиновых кислот была бы весьма необходима в различных контекстах, где, например, требуется встраивание неприродных нуклеиновых кислот, включая амплификацию, секвенирование, мечение, детекцию, клонирование и многие другие. В настоящем изобретении предусматриваются полимеразы с модифицированными свойствами для неприродных нуклеиновых кислот, способы получения таких полимераз, способы применения таких полимераз и многие другие признаки, которые станут очевидными после полного обзора нижеследующего.

В некоторых случаях раскрытое в данном документе включает полимеразы, которые встраивают неприродные нуклеиновые кислоты в растущую копию матрицы, например, во время амплификации ДНК. В некоторых вариантах осуществления полимеразы могут быть модифицированы таким образом, что активный сайт полимеразы модифицируется для уменьшения стерического ингибирования проникновения неприродной нуклеиновой кислоты в активный сайт. В некоторых вариантах осуществления полимеразы могут быть модифицированы для обеспечения комплементарности с одним или несколькими неприродными признаками неприродных нуклеиновых кислот. Такие полимеразы можно сконструировать или обеспечить их экспрессию в клетках для стабильного встраивания UBP в клетки. Соответственно, настоящее изобретение предусматривает композиции, которые содержат гетерологичную или рекомбинантную полимеразу, и способы их применения.

Полимеразы могут быть модифицированы с применением способов, относящихся к белковой инженерии. Например, молекулярное моделирование можно провести на основе кристаллических структур, чтобы идентифицировать местоположения в полимеразах, где можно выполнить мутации для модификации целевой активности. Остаток, идентифицированный как мишень для замены, можно заменить остатком, выбранным с применением моделирования минимизации энергии, моделирования гомологии и/или консервативных аминокислотных замен, таких как описано в Bordo, et al. J Mol Biol 217: 721-729 (1991) и Hayes, et al. Proc Natl Acad Sci, USA 99: 15926-15931 (2002).

Любую из множества полимераз можно применять в способе или композиции, изложенных в данном документе, включая, например, ферменты на основе белка, выделенные из биологических систем, и их функциональные варианты. Следует понимать, что ссылка на конкретную полимеразу, такую как полимеразы, приведенные ниже, включает ее функциональные варианты, если не указано иное. В некоторых вариантах осуществления полимераза представляет собой полимеразу дикого типа. В некоторых вариантах осуществления полимераза представляет собой модифицированную или мутантную полимеразу.

Также можно применять полимеразы со свойствами, обеспечивающими улучшение проникновения неприродных нуклеиновых кислот в области активного сайта и координации с неприродными нуклеотидами в области активного сайта. В некоторых вариантах осуществления модифицированная полимераза имеет модифицированный сайт связывания нуклеотидов.

В некоторых вариантах осуществления модифицированная полимераза характеризуется специфичностью к неприродной нуклеиновой кислоте, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности полимеразы дикого типа по отношению к неприродной нуклеиновой кислоте. В некоторых вариантах осуществления модифицированная полимераза или полимераза дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте, содержащей модифицированный сахар, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности полимеразы дикого типа по отношению к природной нуклеиновой кислоте и/или неприродной нуклеиновой кислоте без модифицированного сахара. В некоторых вариантах осуществления модифицированная полимераза или полимераза дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте, содержащей модифицированное основание, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности полимеразы дикого типа по отношению к природной нуклеиновой кислоте и/или неприродной нуклеиновой кислоте без модифицированного основания. В некоторых вариантах осуществления модифицированная полимераза или полимераза дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте, содержащей трифосфат, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности полимеразы дикого типа по отношению к нуклеиновой кислоте, содержащей трифосфат, и/или неприродной нуклеиновой кислоте без трифосфата. Например, модифицированная полимераза или полимераза дикого типа может характеризоваться специфичностью к неприродной нуклеиновой кислоте, содержащей трифосфат, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности полимеразы дикого типа по отношению к неприродной нуклеиновой кислоте с дифосфатом или монофосфатом, или без фосфата, или с их комбинацией.

В некоторых вариантах осуществления модифицированная полимераза или полимераза дикого типа характеризуется ослабленной специфичностью к неприродной нуклеиновой кислоте. В некоторых вариантах осуществления модифицированная полимераза или полимераза дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте и специфичностью к природной нуклеиновой кислоте, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности полимеразы дикого типа по отношению к природной нуклеиновой кислоте. В некоторых вариантах осуществления модифицированная полимераза или полимераза дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте, содержащей модифицированный сахар, и специфичностью к природной нуклеиновой кислоте, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности полимеразы дикого типа по отношению к природной нуклеиновой кислоте. В некоторых вариантах осуществления модифицированная полимераза или полимераза дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте, содержащей модифицированное основание, и специфичностью к природной нуклеиновой кислоте, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности полимеразы дикого типа по отношению к природной нуклеиновой кислоте.

Отсутствие экзонуклеазной активности может быть характеристикой дикого типа или характеристикой, придаваемой вариантной или сконструированной полимеразе. Например, фрагмент Кленова exo minus является мутированной версией фрагмента Кленова, у которого отсутствует 3'-5'-корректирующая экзонуклеазная активность.

Способ по настоящему изобретению можно применять для расширения диапазона субстратов любой ДНК-полимеразы, которая не обладает собственной 3'-5'-корректирующей экзонуклеазной активностью или у которой 3'-5'-корректирующая экзонуклеазная активность была заблокирована, например, посредством мутации. Примеры ДНК-полимераз включают polA, polB (см., например, Parrel & Loeb, Nature Struc Biol 2001), polC, polD, polY, polX и обратные транскриптазы (RT), но предпочтительно представляют собой процессивные полимеразы высокой точности (PCT/GB2004/004643). В некоторых вариантах осуществления модифицированная полимераза или полимераза дикого типа по сути не характеризуется 3'-5'-корректирующей экзонуклеазной активностью. В некоторых вариантах осуществления модифицированная полимераза или полимераза дикого типа по сути не характеризуется 3'-5'-корректирующей экзонуклеазной активностью в отношении неприродной нуклеиновой кислоты. В некоторых вариантах осуществления модифицированная полимераза или полимераза дикого типа характеризуется 3'-5'-корректирующей экзонуклеазной активностью. В некоторых вариантах осуществления модифицированная полимераза или полимераза дикого типа характеризуется 3'-5'-корректирующей экзонуклеазной активностью в отношении природной нуклеиновой кислоты и по сути не характеризуется 3'-5'-корректирующей экзонуклеазной активностью в отношении неприродной нуклеиновой кислоты.

В некоторых вариантах осуществления модифицированная полимераза характеризуется 3'-5'-корректирующей экзонуклеазной активностью, которая составляет по меньшей мере приблизительно 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% корректирующей экзонуклеазной активности полимеразы дикого типа. В некоторых вариантах осуществления модифицированная полимераза характеризуется 3'-5'-корректирующей экзонуклеазной активностью в отношении неприродной нуклеиновой кислоты, которая составляет по меньшей мере приблизительно 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% корректирующей экзонуклеазной активности полимеразы дикого типа в отношении природной нуклеиновой кислоте. В некоторых вариантах осуществления модифицированная полимераза характеризуется 3'-5'-корректирующей экзонуклеазной активностью в отношении неприродной нуклеиновой кислоты и 3'-5'-корректирующей экзонуклеазной активностью в отношении природной нуклеиновой кислоты, которая составляет по меньшей мере приблизительно 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% корректирующей экзонуклеазной активности полимеразы дикого типа в отношении природной нуклеиновой кислоте. В некоторых вариантах осуществления модифицированная полимераза характеризуется 3'-5'-корректирующей экзонуклеазной активностью в отношении природной нуклеиновой кислоты, которая составляет по меньшей мере приблизительно 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% корректирующей экзонуклеазной активности полимеразы дикого типа в отношении природной нуклеиновой кислоте.

В некоторых вариантах осуществления характеристики полимераз определяют в зависимости от скорости их диссоциации с нуклеиновыми кислотами. В некоторых вариантах осуществления полимераза характеризуется относительно низкой скоростью диссоциации для одной или нескольких природных и неприродных нуклеиновых кислот. В некоторых вариантах осуществления полимераза характеризуется относительно высокой скоростью диссоциации для одной или нескольких природных и неприродных нуклеиновых кислот. Скорость диссоциации представляет собой активность полимеразы, которую можно регулировать для настройки скоростей реакции в способах, изложенных в данном документе.

В некоторых вариантах осуществления характеристики полимераз определяют в зависимости от их точности при применении с конкретной природной и/или неприродной нуклеиновой кислотой или коллекциями природных и/или неприродных нуклеиновых кислот. Под точностью обычно понимают безошибочность, с которой полимераза встраивает надлежащие нуклеиновые кислоты в растущую цепь нуклеиновой кислоты при получении копии матрицы нуклеиновой кислоты. Точность ДНК-полимеразы может измеряться в виде соотношения надлежащих и ненадлежащих включений природной и неприродной нуклеиновой кислоты, когда присутствуют природная и неприродная нуклеиновая кислота, например, в равных концентрациях, для конкуренции за синтез нити в том же сайте двойного комплекса полимераза-нить-матрица нуклеиновой кислоты. Точность ДНК-полимеразы можно рассчитать как соотношение (kcat/Km) для природной и неприродной нуклеиновой кислоты и (kcat/Km) для ненадлежащей природной и неприродной нуклеиновой кислоты; где kcat и Km представляют собой параметры Михаэлиса-Ментена для кинетики ферментов в равновесном состоянии (Fersht, A. R. (1985) Enzyme Structure and Mechanism, 2nd ed., p 350, W. H. Freeman & Co., New York., включенная в данный документ посредством ссылки). В некоторых вариантах осуществления полимераза характеризуется значением точности, составляющим по меньшей мере приблизительно 100, 1000, 10000, 100000 или 1×106, с корректирующей активностью или без нее.

В некоторых вариантах осуществления полимеразы из нативных источников или их варианты подвергают скринингу с применением анализа, который обеспечивает обнаружение встраивания неприродной нуклеиновой кислоты, характеризующейся конкретной структурой. В одном примере полимеразы можно подвергать скринингу в отношении способности встраивать неприродную нуклеиновую кислоту или UBP; например, d5SICSTP, dNaMTP или d5SICSTP-dNaMTP UBP. Можно применять полимеразу, например, гетерологичную полимеразу, которая проявляет модифицированное свойство в отношении неприродной нуклеиновой кислоты по сравнению с полимеразой дикого типа. Например, модифицированным свойством может быть, например, Km, kcat, Vmax, процессивность полимеразы в присутствии неприродной нуклеиновой кислоты (или встречающегося в природе нуклеотида), средняя длина считывания матрицы полимеразой в присутствии неприродной нуклеиновой кислоты, специфичность полимеразы к неприродной нуклеиновой кислоте, скорость связывания неприродной нуклеиновой кислоты, скорость высвобождения продукта (пирофосфата, трифосфата и т. д.), скорость ветвления или любая их комбинация. В одном варианте осуществления модифицированное свойство представляет собой пониженную Km для неприродной нуклеиновой кислоты и/или повышенное kcat/Km или Vmax/Km для неприродной нуклеиновой кислоты. Аналогично, полимераза необязательно характеризуется повышенной скоростью связывания неприродной нуклеиновой кислоты, повышенной скоростью высвобождения продукта и/или пониженной скоростью ветвления по сравнению с полимеразой дикого типа.

В то же время полимераза может встраивать природные нуклеиновые кислоты, например, A, C, G и T, в растущую копию нуклеиновой кислоты. Например, полимераза необязательно проявляет специфическую активность в отношении природной нуклеиновой кислоты, которая на по меньшей мере приблизительно 5% выше (например, 5%, 10%, 25%, 50%, 75%, 100% или выше), чем у соответствующей полимеразы дикого типа, и процессивность с природными нуклеиновыми кислотами в присутствии матрицы, которая на по меньшей мере 5% выше (например, 5%, 10%, 25%, 50%, 75%, 100% или выше), чем у полимеразы дикого типа в присутствии природной нуклеиновой кислоты. Необязательно полимераза проявляет kcat/Km или Vmax/Km в отношении встречающегося в природе нуклеотида, которое на по меньшей мере приблизительно 5% выше (например, приблизительно на 5%, 10%, 25%, 50%, 75% или 100% или выше), чем у полимеразы дикого типа.

Используемые в данном документе полимеразы, которые способны встраивать неприродную нуклеиновую кислоту определенной структуры, также можно получать с применением подхода направленной эволюции. Анализ синтеза нуклеиновой кислоты можно применять для скрининга вариантов полимеразы, характеризующихся специфичностью к любой из множества неприродных нуклеиновых кислот. Например, варианты полимеразы могут быть подвергнуты скринингу в отношении способности встраивать неприродную нуклеиновую кислоту или UBP, например, d5SICSTP, dNaMTP или d5SICSTP-dNaMTP UBP, в нуклеиновые кислоты. В некоторых вариантах осуществления такой анализ представляет собой анализ in vitro, например, с применением рекомбинантного варианта полимеразы. В некоторых вариантах осуществления такой анализ представляет собой анализ in vivo, например, экспрессию варианта полимеразы в клетке. Такие методики направленной эволюции можно применять для скрининга вариантов любой подходящей полимеразы в отношении активности по отношению к любой из неприродных нуклеиновых кислот, изложенных в данном документе.

Модифицированные полимеразы описанных композиций могут необязательно представлять собой модифицированную и/или рекомбинантную ДНК-полимеразу типа Φ29. Необязательно полимераза может представлять собой модифицированную и/или рекомбинантную полимеразу Φ29, B103, GA-1, PZA, Φ15, BS32, M2Y, Nf, G1, Cp-1, PRD1, PZE, SF5, Cp-5, Cp-7, PR4, PR5, PR722 или L17.

Модифицированные полимеразы описанных композиций необязательно могут представлять собой модифицированную и/или рекомбинантную прокариотическую ДНК-полимеразу, например, ДНК-полимеразу II (Pol II), ДНК-полимеразу III (Pol III), ДНК-полимеразу IV (Pol IV), ДНК-полимеразу V (Pol V). В некоторых вариантах осуществления модифицированные полимеразы включают полимеразы, которые опосредуют синтез ДНК между поврежденными неинструктивными нуклеотидами. В некоторых вариантах осуществления гены, кодирующие Pol I, Pol II (polB), Poll IV (dinB) и/или Pol V (umuCD), конститутивно экспрессируются или сверхэкспрессируются в сконструированной клетке или SSO. В некоторых вариантах осуществления повышение экспрессии или сверхэкспрессии Pol II способствует увеличению сохранения неприродных пар оснований (UBP) в сконструированной клетке или SSO.

Полимеразы нуклеиновых кислот, обычно применимые в настоящем изобретении, включают ДНК-полимеразы, РНК-полимеразы, обратные транскриптазы и их мутантные или измененные формы. ДНК-полимеразы и их свойства подробно описаны, в частности, в DNA Replication 2nd edition, Kornberg and Baker, W. H. Freeman, New York, N. Y. (1991). Известные обычные ДНК-полимеразы, применимые в настоящем изобретении, включают без ограничения ДНК-полимеразу Pyrococcus furiosus (Pfu) (Lundberg et al., 1991, Gene, 108: 1, Stratagene), ДНК-полимеразу Pyrococcus woesei (Pwo) (Hinnisdaels et al., 1996, Biotechniques, 20:186-8, Boehringer Mannheim), ДНК-полимеразу Thermus thermophilus (Tth) (Myers and Gelfand 1991, Biochemistry 30:7661), ДНК-полимеразу Bacillus stearothermophilus (Stenesh and McGowan, 1977, Biochim Biophys Acta 475:32), ДНК-полимеразу Thermococcus litoralis (TIi) (также называемую ДНК-полимеразой Vent™, Cariello et al, 1991, Polynucleotides Res, 19: 4193, New England Biolabs), ДНК-полимеразу 9°Nm™ (New England Biolabs), фрагмент Штоффеля, Thermo Sequenase® (Amersham Pharmacia Biotech UK), Therminator™ (New England Biolabs), ДНК-полимеразу Thermotoga maritima (Tma) (Diaz and Sabino, 1998 Braz J Med. Res, 31:1239), ДНК-полимеразу Thermus aquaticus (Taq) (Chien et al, 1976, J. Bacteoriol, 127: 1550), ДНК-полимеразу, ДНК-полимеразу Pyrococcus kodakaraensis KOD (Takagi et al., 1997, Appl. Environ. Microbiol. 63:4504), ДНК-полимеразу JDF-3 (из Thermococcus sp. JDF-3, заявка на патент № WO 0132887), ДНК-полимеразу Pyrococcus GB-D (PGB-D) (также называемую ДНК-полимеразой Deep Vent™, Juncosa-Ginesta et al., 1994, Biotechniques, 16:820, New England Biolabs), ДНК-полимеразу UlTma (из термофильной Thermotoga maritima; Diaz and Sabino, 1998 Braz J. Med. Res, 31:1239; PE Applied Biosystems), ДНК-полимеразу Tgo (из Thermococcus gorgonarius, Roche Molecular Biochemicals), ДНК-полимеразу I из E. coli (Lecomte and Doubleday, 1983, Polynucleotides Res. 11:7505), ДНК-полимеразу T7 (Nordstrom et al, 1981, J Biol. Chem. 256:3112) и ДНК-полимеразу II DP1I/DP2 из простейших (Cann et al, 1998, Proc. Natl. Acad. Sci. USA 95:14250). Рассматриваются как мезофильные полимеразы, так и термофильные полимеразы. Термофильные ДНК-полимеразы включают без ограничения ThermoSequenase®, 9°Nm™, Therminator™, Taq, Tne, Tma, Pfu, TfI, Tth, TIi, фрагмент Штоффеля, ДНК-полимеразу Vent™ и Deep Vent™, ДНК-полимеразу KOD, Tgo, JDF-3 и их мутанты, варианты и производные. Полимераза, которая является 3'-экзонуклеазо-дефицитным мутантом, также рассматривается. Обратные транскриптазы, применимые в настоящем изобретении, включают без ограничения обратные транскриптазы из HIV, HTLV-I, HTLV-II, FeLV, FIV, SIV, AMV, MMTV, MoMuLV и других ретровирусов (см. Levin, Cell 88:5-8 (1997); Verma, Biochim Biophys Acta. 473:1-38 (1977); Wu et al, CRC Crit Rev Biochem. 3:289-347(1975)). Дополнительные примеры полимераз включают без ограничения ДНК-полимеразу 9°N, ДНК-полимеразу Taq, ДНК-полимеразу Phusion®, ДНК-полимеразу Pfu, ДНК-полимеразу RB69, ДНК-полимеразу KOD и ДНК-полимеразу VentR® Gardner et al. (2004) "Comparative Kinetics of Nucleotide Analog Incorporation by Vent DNA Polymerase (J. Biol. Chem., 279(12), 11834-11842; Gardner and Jack "Determinants of nucleotide sugar recognition in an archaeon DNA polymerase" Nucleic Acids Research, 27(12) 2545-2553.) Полимеразы, выделенные из нетермофильных организмов, могут быть инактивируемыми при нагревании. Примерами являются ДНК-полимеразы из фага. Понятно, что полимеразы из любого из множества источников могут быть модифицированы для повышения или снижения их устойчивости к условиям высокой температуры. В некоторых вариантах осуществления полимераза может быть термофильной. В некоторых вариантах осуществления термофильная полимераза может быть инактивируемой при нагревании. Термофильные полимеразы обычно применимы в условиях высокой температуры или в условиях термоциклирования, таких как те, которые применяются в методиках полимеразной цепной реакции (ПЦР).

В некоторых вариантах осуществления полимераза включает Φ29, B103, GA-1, PZA, Φ15, BS32, M2Y, Nf, G1, Cp-1, PRD1, PZE, SF5, Cp-5, Cp-7, PR4, PR5, PR722, L17, ThermoSequenase®, 9°Nm™, ДНК-полимеразу Therminator™, Tne, Tma, TfI, Tth, TIi, фрагмент Штоффеля, ДНК-полимеразу Vent™ и Deep Vent™, ДНК-полимеразу KOD, Tgo, JDF-3, Pfu, Taq, ДНК-полимеразу T7, РНК-полимеразу T7, PGB-D, ДНК-полимеразу UlTma, ДНК-полимеразу I из E. coli, ДНК-полимеразу III из E. coli, ДНК-полимеразу II DP1I/DP2 из простейших, ДНК-полимеразу 9°N, ДНК-полимеразу Taq, ДНК-полимеразу Phusion®, ДНК-полимеразу Pfu, РНК-полимеразу SP6, ДНК-полимеразу RB69, обратную транскриптазу вируса птичьего миелобластоза (AMV), обратную транскриптазу вируса мышиного лейкоза Молони (MMLV), обратную транскриптазу SuperScript® II и обратную транскриптазу SuperScript® III.

В некоторых вариантах осуществления полимераза представляет собой фрагмент Кленова ДНК-полимеразы 1, полимеразу Vent, ДНК-полимеразу Phusion®, ДНК-полимеразу KOD, Taq-полимеразу, ДНК-полимеразу T7, РНК-полимеразу T7, ДНК-полимеразу Therminator™, полимеразу POLB, РНК-полимеразу SP6, ДНК-полимеразу I из E. coli, ДНК-полимеразу III из E. coli, обратную транскриптазу вируса птичьего миелобластоза (AMV), обратную транскриптазу вируса мышиного лейкоза Молони (MMLV), обратную транскриптазу SuperScript® II или обратную транскриптазу SuperScript® III.

Кроме того, такие полимеразы могут быть использованы для вариантов применения в амплификации и/или секвенировании ДНК, включая варианты применения в реальном времени, например, в контексте амплификации или секвенирования, которые включают встраивание неприродных остатков нуклеиновой кислоты в ДНК с помощью полимеразы. В других вариантах осуществления неприродная нуклеиновая кислота, которая встроена, может быть такой же, как природный остаток, например, когда метку или другой фрагмент неприродной нуклеиновой кислоты удаляют под действием полимеразы во время встраивания, или неприродная нуклеиновая кислота может иметь один или несколько признаков, которые отличают ее от природной нуклеиновой кислоты.

Транспортер нуклеотидов

Транспортеры нуклеотидов (NT) представляют собой группу мембранных транспортных белков, которые способствуют проникновению нуклеозидных субстратов через клеточные мембраны и везикулы. В некоторых вариантах осуществления есть два типа транспортеров нуклеозидов, концентрирующие транспортеры нуклеозидов и равновесные транспортеры нуклеозидов. В некоторых случаях NT также охватывают транспортеры органических анионов (ΌαΤ) и транспортеры органических катионов (OCT). В некоторых случаях транспортер нуклеотидов является транспортером нуклеозидтрифосфата.

В некоторых вариантах осуществления транспортер нуклеотидтрифосфата (NTT) происходит из бактерии, растения или водоросли. В некоторых вариантах осуществления транспортер нуклеотид/нуклеозидтрифосфата представляет собой TpNTT1, TpNTT2, TpNTT3, TpNTT4, TpNTT5, TpNTT6, TpNTT7, TpNTT8 (T. pseudonana), PtNTT1, PtNTT2, PtNTT3, PtNTT4, PtNTT5, PtNTT6 (P. tricornutum), GsNTT (Galdieria sulphuraria), AtNTT1, AtNTT2 (Arabidopsis thaliana), CtNTT1, CtNTT2 (Chlamydia trachomatis), PamNTT1, PamNTT2 (Protochlamydia amoebophila), CcNTT (Caedibacter caryophilus), RpNTT1 (Rickettsia prowazekii).

В некоторых вариантах осуществления NTT представляет собой CNT1, CNT2, CNT3, ENT1, ENT2, OAT1, OAT3 или OCT1.

В некоторых вариантах осуществления NTT импортирует неприродные нуклеиновые кислоты в организм, например, в клетку. В некоторых вариантах осуществления NTT могут быть модифицированы таким образом, что сайт связывания нуклеотидов NTT модифицируется для уменьшения стерического ингибирования проникновения неприродной нуклеиновой кислоты в сайт связывания нуклеотидов. В некоторых вариантах осуществления NTT могут быть модифицированы для обеспечения повышенного взаимодействия с одной или несколькими неприродными характеристиками неприродных нуклеиновых кислот. Такие NTT можно сконструировать или обеспечить их экспрессию в клетках для стабильного импортирования UBP в клетки. Соответственно, настоящее изобретение предусматривает композиции, которые содержат гетерологичный или рекомбинантный NTT, и способы их применения.

NTT могут быть модифицированы с применением способов, относящихся к белковой инженерии. Например, молекулярное моделирование можно провести на основе кристаллических структур, чтобы идентифицировать местоположения в NTT, где можно выполнить мутации для модификации целевой активности или сайта связывания. Остаток, идентифицированный как мишень для замены, можно заменить остатком, выбранным с применением моделирования минимизации энергии, моделирования гомологии и/или консервативных аминокислотных замен, таких как описано в Bordo, et al. J Mol Biol 217: 721-729 (1991) и Hayes, et al. Proc Natl Acad Sci, USA 99: 15926-15931 (2002).

Любой из множества NTT можно применять в способе или композиции, изложенных в данном документе, включая, например, ферменты на основе белка, выделенные из биологических систем, и их функциональные варианты. Следует понимать, что ссылка на конкретный NTT, такой как NTT, приведенный ниже, включает его функциональные варианты, если не указано иное. В некоторых вариантах осуществления NTT представляет собой NTT дикого типа. В некоторых вариантах осуществления NTT представляет собой модифицированный или мутантный NTT.

Также можно применять NTT со свойствами, обеспечивающими улучшение проникновения неприродных нуклеиновых кислот в клетки и координации с неприродными нуклеотидами в области связывания нуклеотидов. В некоторых вариантах осуществления модифицированный NTT имеет модифицированный сайт связывания нуклеотидов. В некоторых вариантах осуществления модифицированный NTT или NTT дикого типа характеризуется ослабленной специфичностью к неприродной нуклеиновой кислоте.

В некоторых вариантах осуществления модифицированный NTT характеризуется специфичностью к неприродной нуклеиновой кислоте, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности NTT дикого типа по отношению к неприродной нуклеиновой кислоте. В некоторых вариантах осуществления модифицированный NTT или NTT дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте, содержащей модифицированный сахар, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности NTT дикого типа по отношению к природной нуклеиновой кислоте и/или неприродной нуклеиновой кислоте без модифицированного сахара. В некоторых вариантах осуществления модифицированный NTT или NTT дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте, содержащей модифицированное основание, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности NTT дикого типа по отношению к природной нуклеиновой кислоте и/или неприродной нуклеиновой кислоте без модифицированного основания. В некоторых вариантах осуществления модифицированный NTT или NTT дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте, содержащей трифосфат, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности NTT дикого типа по отношению к нуклеиновой кислоте, содержащей трифосфат, и/или неприродной нуклеиновой кислоте без трифосфата. Например, модифицированный NTT или NTT дикого типа может характеризоваться специфичностью к неприродной нуклеиновой кислоте, содержащей трифосфат, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности NTT дикого типа по отношению к неприродной нуклеиновой кислоте с дифосфатом или монофосфатом, или без фосфата, или с их комбинацией.

В некоторых вариантах осуществления модифицированный NTT или NTT дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте и специфичностью к природной нуклеиновой кислоте, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности NTT дикого типа по отношению к природной нуклеиновой кислоте. В некоторых вариантах осуществления модифицированный NTT или NTT дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте, содержащей модифицированный сахар, и специфичностью к природной нуклеиновой кислоте, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности NTT дикого типа по отношению к природной нуклеиновой кислоте. В некоторых вариантах осуществления модифицированный NTT или NTT дикого типа характеризуется специфичностью к неприродной нуклеиновой кислоте, содержащей модифицированное основание, и специфичностью к природной нуклеиновой кислоте, которая составляет по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 99,5%, 99,99% специфичности NTT дикого типа по отношению к природной нуклеиновой кислоте.

Характеристики NTT можно определить в зависимости от скорости их диссоциации с нуклеиновыми кислотами. В некоторых вариантах осуществления NTT характеризуется относительно низкой скоростью диссоциации для одной или нескольких природных и неприродных нуклеиновых кислот. В некоторых вариантах осуществления NTT характеризуется относительно высокой скоростью диссоциации для одной или нескольких природных и неприродных нуклеиновых кислот. Скорость диссоциации представляет собой активность NTT, которую можно регулировать для настройки скоростей реакции в способах, изложенных в данном документе.

NTT из нативных источников или их варианты можно подвергать скринингу с применением анализа, который обеспечивает обнаружение импортирования неприродной нуклеиновой кислоты, характеризующейся конкретной структурой. В одном примере NTT можно подвергать скринингу в отношении способности импортировать неприродную нуклеиновую кислоту или UBP; например, d5SICSTP, dNaMTP или d5SICSTP-dNaMTP UBP. Можно применять NTT, например, гетерологичный NTT, который проявляет модифицированное свойство в отношении неприродной нуклеиновой кислоты по сравнению с NTT дикого типа. Например, модифицированным свойством может быть, например, Km, kcat, Vmax, импортирование NTT в присутствии неприродной нуклеиновой кислоты (или встречающегося в природе нуклеотида), средняя длина считывания матрицы клеткой с NTT в присутствии неприродной нуклеиновой кислоты, специфичность NTT к неприродной нуклеиновой кислоте, скорость связывания неприродной нуклеиновой кислоты или скорость высвобождения продукта или любая их комбинация. В одном варианте осуществления модифицированное свойство представляет собой пониженную Km для неприродной нуклеиновой кислоты и/или повышенное kcat/Km или Vmax/Km для неприродной нуклеиновой кислоты. Аналогично, NTT необязательно характеризуется повышенной скоростью связывания неприродной нуклеиновой кислоты, повышенной скоростью высвобождения продукта и/или повышенной скоростью импортирования в клетку по сравнению с NTT дикого типа.

В то же время NTT может импортировать природные нуклеиновые кислоты, например, A, C, G и T, в клетку. Например, NTT необязательно проявляет специфическую активность импортирования в отношении природной нуклеиновой кислоты, которая на по меньшей мере приблизительно 5% выше (например, 5%, 10%, 25%, 50%, 75%, 100% или выше), чем у соответствующего NTT дикого типа. Необязательно NTT проявляет kcat/Km или Vmax/Km в отношении встречающегося в природе нуклеотида, которое на по меньшей мере приблизительно 5% выше (например, приблизительно на 5%, 10%, 25%, 50%, 75% или 100% или выше), чем у NTT дикого типа.

Используемые в данном документе NTT, которые способны импортировать неприродную нуклеиновую кислоту определенной структуры, также можно получать с применением подхода направленной эволюции. Анализ синтеза нуклеиновой кислоты можно применять для скрининга вариантов NTT, характеризующихся специфичностью к любой из множества неприродных нуклеиновых кислот. Например, варианты NTT могут быть подвергнуты скринингу в отношении способности импортировать неприродную нуклеиновую кислоту или UBP; например, d5SICSTP, dNaMTP или d5SICSTP-dNaMTP UBP, в нуклеиновые кислоты. В некоторых вариантах осуществления такой анализ представляет собой анализ in vitro, например, с применением рекомбинантного варианта NTT. В некоторых вариантах осуществления такой анализ представляет собой анализ in vivo, например, экспрессию варианта NTT в клетке. Такие методики направленной эволюции можно применять для скрининга вариантов любого подходящего NTT в отношении активности по отношению к любой из неприродных нуклеиновых кислот, изложенных в данном документе.

Инструментарий и реагенты на основе нуклеиновых кислот

Реагент на основе нуклеиновых кислот для применения со способом, клеткой или сконструированным микроорганизмом, описанным в данном документе, содержит одну или несколько ORF. ORF может быть из любого подходящего источника, иногда из геномной ДНК, мРНК, обратно транскрибированной РНК или комплементарной ДНК (cDNA) или библиотеки нуклеиновых кислот, включающей одно или несколько из вышеперечисленных, и из любого вида организмов, который содержит представляющую интерес последовательность нуклеиновой кислоты, представляющий интерес белок или имеет представляющую интерес активность. Неограничивающие примеры организмов, из которых можно получить ORF, включают, например, бактерии, дрожжи, грибы, человека, насекомое, нематоду, корову, лошадь, собаку, кошку, крысу или мышь. В некоторых вариантах осуществления реагент на основе нуклеиновых кислот или другой реагент, описанный в данном документе, выделяют или очищают.

Реагент на основе нуклеиновых кислот иногда содержит нуклеотидную последовательность, смежную с ORF, которая транслируется вместе с ORF и кодирует аминокислотную метку. Кодирующая метку нуклеотидная последовательность расположена на 3' и/или 5' ORF в реагенте на основе нуклеиновых кислот, тем самым кодируя метку на С-конце или N-конце белка или пептида, кодируемого ORF. Любая метка, которая не отменяет транскрипцию и/или трансляцию in vitro, может быть использована и может быть надлежащим образом выбрана специалистом в данной области техники. Метки могут облегчать выделение и/или очистку требуемого продукта ORF из культуральной или ферментационной среды.

Нуклеиновая кислота или реагент на основе нуклеиновых кислот может содержать определенные элементы, например, регуляторные элементы, часто выбираемые в соответствии с предполагаемым применением нуклеиновой кислоты. Любой из следующих элементов может быть включен в реагент на основе нуклеиновых кислот или исключен из него. Реагент на основе нуклеиновых кислот например, может включать один или несколько или все из следующих нуклеотидных элементов: один или несколько промоторных элементов, один или несколько 5'-нетранслируемых участков (5'UTR), один или несколько участков, в которые может быть вставлена целевая нуклеотидная последовательность ("инсерционный элемент"), один или несколько целевых нуклеотидных последовательностей, один или несколько 3'-нетранслируемых участков (3'UTR) и один или несколько элементов отбора. Реагент на основе нуклеиновых кислот может быть предусмотрен с одним или несколькими такими элементами, и другие элементы могут быть вставлены в нуклеиновую кислоту до того, как эту нуклеиновую кислоту встраивают в требуемый организм. В некоторых вариантах осуществления предусмотренный реагент на основе нуклеиновых кислот содержит промотор, 5'UTR, необязательный 3'UTR и инсерционный(-е) элемент(-ы), с помощью которого(-ых) целевую нуклеотидную последовательность вставляют (то есть клонируют) в реагент на основе нуклеиновых кислот. В определенных вариантах осуществления предусмотренный реагент на основе нуклеиновых кислот содержит промотор, инсерционный(-е) элемент(-ы) и необязательный 3'UTR, и 5'UTR/целевую нуклеотидную последовательность вставляют с необязательным 3'UTR. Элементы могут располагаться в любом порядке, подходящем для экспрессии в выбранной системе экспрессии (например, экспрессии в выбранном организме или экспрессии в бесклеточной системе, например), и в некоторых вариантах осуществления реагент на основе нуклеиновых кислот содержит следующие элементы в направление от 5' к 3': (1) промоторный элемент, 5'UTR и инсерционный(-е) элемент(-ы); (2) промоторный элемент, 5'UTR и целевая нуклеотидная последовательность; (3) промоторный элемент, 5'UTR, инсерционный(-е) элемент(-ы) и 3'UTR; и (4) промоторный элемент, 5'UTR, целевая нуклеотидная последовательность и 3'UTR.

Реагенты на основе нуклеиновых кислот, например, кассеты экспрессии и/или векторы экспрессии, могут содержать множество регуляторных элементов, включая промоторы, энхансеры, последовательности инициации трансляции, последовательности терминации транскрипции и другие элементы. "Промотор", как правило, представляет собой последовательность или последовательности ДНК, которые функционируют, когда находятся в относительно фиксированном местоположении по отношению к сайту начала транскрипции. Например, промотор может находиться выше сегмента нуклеиновой кислоты нуклеотидтрифосфатного транспортера. "Промотор" содержит ключевые элементы, необходимые для первичного взаимодействия РНК-полимеразы и факторов транскрипции, и может содержать расположенные выше элементы и элементы ответа. "Энхансер" обычно относится к последовательности ДНК, которая функционирует на нефиксированном расстоянии от сайта начала транскрипции и может находиться или на 5' или на 3'' от единицы транскрипции. Кроме того, энхансеры могут находиться как внутри интрона, так и внутри самой кодирующей последовательности. Обычно они составляют от 10 до 300 п. н. в длину и функционируют в цис-положении. Функция энхансера состоит в увеличении транскрипции от ближайших промоторов. Энхансеры, как и промоторы, также часто содержат элементы ответа, которые опосредуют регуляцию транскрипции. Энхансеры часто определяют регуляцию экспрессии.

Как отмечено выше, реагенты на основе нуклеиновых кислот также могут содержать одну или несколько 5'UTR и один или несколько 3'UTR. Например, векторы экспрессии, используемые в эукариотических клетках-хозяевах (например, клетках дрожжей, грибов, насекомых, растений, животных, людей или ядросодержащих клетках) и прокариотических клетках-хозяевах (например, вирусах, бактериях), могут содержать последовательности, которые сигнализируют о терминации транскрипции, что может влиять на экспрессию мРНК. Эти области могут транскрибироваться как полиаденилированные сегменты в нетранслируемой части мРНК, кодирующей белок тканевого фактора. 3''-нетранслируемые области также содержат сайты терминации транскрипции. В некоторых предпочтительных вариантах осуществления единица транскрипции содержит область полиаденилирования. Одним из преимуществ этой области является то, что она обеспечивает увеличение вероятности того, что транскрибированная единица будет процессироваться и транспортироваться как мРНК. Идентификация и применение сигналов полиаденилирования в экспрессионных конструкциях хорошо известны. В некоторых предпочтительных вариантах осуществления гомологичные сигналы полиаденилирования можно использовать в трансгенных конструкциях.

5'UTR может содержать один или несколько элементов, эндогенных по отношению к нуклеотидной последовательности, из которой она происходит, и иногда содержит один или несколько экзогенных элементов. 5'UTR может происходить из любой подходящей нуклеиновой кислоты, такой как геномная ДНК, плазмидная ДНК, РНК или мРНК, например, из любого подходящего организма (например, вируса, бактерии, дрожжей, грибов, растения, насекомого или млекопитающего). Специалист в данной области техники может выбрать подходящие элементы для 5'UTR на основе выбранной системы экспрессии (например, экспрессия в выбранном организме или экспрессия в бесклеточной системе, например). 5'UTR иногда содержит один или несколько из следующих элементов, известных специалисту в данной области техники: энхансерные последовательности (например, транскрипционные или трансляционные), сайт инициации транскрипции, сайт связывания фактора транскрипции, сайт регуляции трансляции, сайт инициации трансляции, сайт связывания фактора трансляции, сайт связывания вспомогательного белка, сайты связывания с регулятором обратной связи, бокс Pribnow, бокс TATA, элемент -35, E-box (связывающий элемент спираль-петля-спираль), сайт связывания рибосомы, репликон, внутренний участок посадки рибосомы (IRES), сайленсерный элемент и т. п. В некоторых вариантах осуществления промоторный элемент может быть выделен таким образом, что все элементы 5'UTR, необходимые для надлежащей обусловленной регуляции, содержатся во фрагменте промоторного элемента или в функциональной подпоследовательности фрагмента промоторного элемента.

5'UTR в реагенте на основе нуклеиновых кислот может содержать нуклеотидную последовательность трансляционного энхансера. Нуклеотидная последовательность трансляционного энхансера часто располагается между промотором и целевой нуклеотидной последовательностью в реагенте на основе нуклеиновых кислот. Последовательность трансляционного энхансера часто связывается с рибосомой, иногда представляет собой рибонуклеотидную последовательность, связывающуюся с 18S rRNA (т. е. последовательность, связывающую рибосому 40S), и иногда является внутренним участком посадки рибосомы (IRES). IRES обычно образует каркас РНК с точно расположенными третичными структурами РНК, которые вступают в контакт с рибосомальной субъединицей 40S посредством ряда специфических межмолекулярных взаимодействий. Примеры рибосомальных энхансерных последовательностей известны и могут быть идентифицированы специалистом в данной области техники (например, Mignone et al., Nucleic Acids Research 33: D141-D146 (2005); Paulous et al., Nucleic Acids Research 31: 722-733 (2003); Akbergenov et al., Nucleic Acids Research 32: 239-247 (2004); Mignone et al., Genome Biology 3(3): reviews 0004.1-0001.10 (2002); Gallie, Nucleic Acids Research 30: 3401-3411 (2002); Shaloiko et al., DOI: 10.1002/bit.20267 и Gallie et al., Nucleic Acids Research 15: 3257-3273 (1987)).

Последовательность трансляционного энхансера иногда представляет собой эукариотическую последовательность, такую как консенсусная последовательность Kozak или другая последовательность (например, последовательность гидроидных полипов, номер доступа в GenBank U07128). Последовательность трансляционного энхансера иногда представляет собой прокариотическую последовательность, такую как консенсусная последовательность Шайна-Дальгарно. В определенных вариантах осуществления последовательность трансляционного энхансера представляет собой вирусную нуклеотидную последовательность. Последовательность трансляционного энхансера иногда происходит из 5'UTR вируса растения, такого как вирус табачной мозаики (TMV), вирус мозаики люцерны (AMV); вирус гравировки табака (ETV); Y-вирус картофеля (PVY); вирус мозаики турнепса (poty) и вирус мозаики гороха, например. В определенных вариантах осуществления омега-последовательность длиной приблизительно 67 оснований из TMV включена в реагент на основе нуклеиновых кислот в качестве последовательности трансляционного энхансера (например, лишена нуклеотидов гуанозина и содержит центральную область поли(САА) длиной 25 нуклеотидов).

3'UTR может содержать один или несколько элементов, эндогенных по отношению к нуклеотидной последовательности, из которой она происходит, и иногда содержит один или несколько экзогенных элементов. 3'UTR может происходить из любой подходящей нуклеиновой кислоты, такой как геномная ДНК, плазмидная ДНК, РНК или мРНК, например, из любого подходящего организма (например, вируса, бактерии, дрожжей, грибов, растения, насекомого или млекопитающего). Специалист в данной области техники может выбрать подходящие элементы для 3'UTR на основе выбранной системы экспрессии (например, экспрессия в выбранном организме, например). 3'UTR иногда содержит один или несколько из следующих элементов, известных специалисту в данной области техники: сайт регуляции транскрипции, сайт инициации транскрипции, сайт терминации транскрипции, сайт связывания фактора транскрипции, сайт регуляции трансляции, сайт терминации трансляции, сайт инициации трансляции, сайт связывания фактора трансляции, сайт связывания рибосомы, репликон, энхансерный элемент, сайленсерный элемент и полиаденозиновый хвост. 3'UTR часто содержит полиаденозиновый хвост, а иногда его нет, и, если присутствует полиаденозиновый хвост, один или несколько фрагментов аденозина могут быть добавлены или удалены из него (например, приблизительно 5, приблизительно 10, приблизительно 15, приблизительно 20, приблизительно 25, приблизительно 30, приблизительно 35, приблизительно 40, приблизительно 45 или приблизительно 50 фрагментов аденозина могут быть добавлены или удалены).

В некоторых вариантах осуществления модификацию 5'UTR и/или 3'UTR применяют для изменения (например, увеличения, добавления, снижения или уменьшения или по сути устранения) активности промотора. Изменение активности промотора может, в свою очередь, изменять активность пептида, полипептида или белка (например, активность фермента, например) путем изменения транскрипции представляющей(-их) интерес нуклеотидной(-ых) последовательности(-ей) из функционально связанного промоторного элемента, содержащего модифицированную 5' или 3'UTR. Например, микроорганизм может быть сконструирован путем генетической модификации для обеспечения экспрессии реагента на основе нуклеиновых кислот, содержащего модифицированную 5' или 3'UTR, который может обеспечить добавление новой активность (например, активности, обычно не обнаруживаемой у организма-хозяина) или увеличение экспрессии существующей активности путем увеличения транскрипции с гомологичного или гетерологичного промотора, функционально связанного с представляющей интерес нуклеотидной последовательностью (например, представляющей интерес гомологичной или гетерологичной нуклеотидной последовательностью), в определенных вариантах осуществления. В некоторых вариантах осуществления микроорганизм может быть сконструирован путем генетической модификации для обеспечения экспрессии реагента на основе нуклеиновых кислот, содержащего модифицированную 5' или 3'UTR, который может обеспечить снижение экспрессии активности путем уменьшения или по сути устранения транскрипции с гомологичного или гетерологичного промотора, функционально связанного с представляющей интерес нуклеотидной последовательностью, в определенных вариантах осуществления.

Экспрессия нуклеотидтрифосфатного транспортера с кассеты экспрессии или вектора экспрессии может контролироваться любым промотором, способным к экспрессии в прокариотических клетках или эукариотических клетках. Промоторный элемент обычно требуется для синтеза ДНК и/или синтеза РНК. Промоторный элемент часто содержит участок ДНК, который может облегчать транскрипцию конкретного гена, обеспечивая сайт начала для синтеза РНК, соответствующей гену. Промоторы обычно расположены рядом с генами, которые они регулируют, расположены выше гена (например, в направлении 5' от гена) и в некоторых вариантах осуществления находятся в той же нити ДНК, что и смысловая нить гена. В некоторых вариантах осуществления промоторный элемент можно выделить из гена или организма и вставить в функциональной связи с полинуклеотидной последовательностью для обеспечения измененной и/или регулируемой экспрессии. Ненативный промотор (например, промотор, обычно не связанный с данной последовательностью нуклеиновой кислоты), применяемый для экспрессии нуклеиновой кислоты, часто называют гетерологичным промотором. В определенных вариантах осуществления гетерологичный промотор и/или 5'UTR могут быть вставлены в функциональной связи с полинуклеотидом, который кодирует полипептид, имеющий требуемую активность, как описано в данном документе. Термины "функционально связанный" и "в функциональной связи с", используемые в данном документе в отношении промоторов, относятся к взаимосвязи между кодирующей последовательностью и промоторным элементом. Промотор функционально связан или находится в функциональной связи с кодирующей последовательностью, когда экспрессия с кодирующей последовательности посредством транскрипции регулируется или контролируется промоторным элементом. Термины "функционально связан" и "в функциональной связи с" используются в данном документе взаимозаменяемо в отношении промоторных элементов.

Промотор часто взаимодействует с РНК-полимеразой. Полимераза представляет собой фермент, который катализирует синтез нуклеиновых кислот с применением ранее существующего реагента на основе нуклеиновых кислот. Когда матрица представляет собой матрицу ДНК, молекула РНК транскрибируется до синтеза белка. Ферменты, имеющие полимеразную активность, подходящие для применения в способах по настоящему изобретению, включают любую полимеразу, которая активна в выбранной системе с выбранной матрицей для синтеза белка. В некоторых вариантах осуществления промотор (например, гетерологичный промотор), также упоминаемый в данном документе как промоторный элемент, может быть функционально связан с нуклеотидной последовательностью или открытой рамкой считывания (ORF). Транскрипция с промоторного элемента может катализировать синтез РНК, соответствующей нуклеотидной последовательности или последовательности ORF, функционально связанной с промотором, что, в свою очередь, приводит к синтезу требуемого пептида, полипептида или белка.

Промоторные элементы иногда демонстрируют чувствительность к регуляторному контролю. Промоторные элементы также иногда могут регулироваться селективным средством. То есть транскрипция с промоторных элементов иногда может быть включена, выключена, активирована или подавлена в ответ на изменение условий окружающей среды, питания или внутренних условий или сигналов (например, индуцируемые теплом промоторы, регулируемые светом промоторы, регулируемые по механизму обратной связи промоторы, промоторы под влиянием гормонов, тканеспецифичные промоторы, промоторы под влиянием кислорода и рН, промоторы, которые реагируют на селективные средства (например, канамицин) и т. п., например). Промоторы, на которые влияют сигналы окружающей среды, пищевые или внутренние сигналы, часто находятся под влиянием сигнала (прямого или косвенного), который связывается с промотором или рядом с ним и обеспечивает увеличение или снижение экспрессии целевой последовательности в определенных условиях.

Неограничивающие примеры селективных или регуляторных средств, которые влияют на транскрипцию с промоторного элемента, используемого в вариантах осуществления, описанных в данном документе, включают без ограничения (1) сегменты нуклеиновых кислот, кодирующие продукты, которые обеспечивают устойчивость к токсичным в противном случае соединениям (например, антибиотикам); (2) сегменты нуклеиновых кислот, кодирующие продукты, которые в противном случае отсутствуют в клетке реципиента (например, незаменимые продукты, гены tRNA, ауксотрофные маркеры); (3) сегменты нуклеиновых кислот, кодирующие продукты, которые подавляют активность генного продукта; (4) сегменты нуклеиновых кислот, кодирующие продукты, которые могут быть легко идентифицированы (например, фенотипические маркеры, такие как антибиотики (например, β-лактамаза), β-галактозидаза, зеленый флуоресцентный белок (GFP), желтый флуоресцентный белок (YFP), красный флуоресцентный белок (RFP), голубой флуоресцентный белок (CFP) и белки клеточной поверхности); (5) сегменты нуклеиновых кислот, связывающие продукты, которые в противном случае вредны для выживания и/или функционирования клеток; (6) сегменты нуклеиновых кислот, которые иным образом ингибируют активность любого из сегментов нуклеиновой кислоты, описанных в пунктах 1-5 выше (например, антисмысловые олигонуклеотиды); (7) сегменты нуклеиновых кислот, связывающие продукты, которые модифицируют субстрат (например, эндонуклеазы рестрикции); (8) сегменты нуклеиновых кислот, которые можно использовать для выделения или идентификации требуемой молекулы (например, специфические сайты связывания белка); (9) сегменты нуклеиновых кислот, кодирующие специфическую нуклеотидную последовательность, которая в противном случае может быть нефункциональной (например, для ПЦР-амплификации субпопуляций молекул); (10) сегменты нуклеиновых кислот, которые при отсутствии прямо или косвенно придают устойчивость или чувствительность к конкретным соединениям; (11) сегменты нуклеиновых кислот, кодирующие продукты, которые либо являются токсичными, либо преобразуют относительно нетоксичное соединение в токсичное соединение (например, тимидинкиназа Herpes simplex, цитозиндеаминаза) в клетках реципиента; (12) сегменты нуклеиновых кислот, ингибирующие репликацию, разделение или наследуемость молекул нуклеиновых кислот, которые их содержат; и/или (13) сегменты нуклеиновых кислот, которые кодируют функции зависящей от условий репликации, например, репликацию у определенных хозяев или штаммов клеток-хозяев или при определенных условиях окружающей среды (например, температура, условия питания и т. п.). В некоторых вариантах осуществления регуляторное или селективное средство можно добавлять для изменения существующих условий роста, которым подвергается организм (например, рост в жидкой культуре, рост в ферментере, рост на чашках с твердой питательной средой и т. п., например).

В некоторых вариантах осуществления регуляцию промоторного элемента можно применять для изменения (например, увеличения, добавления, уменьшения или по сути устранения) активности пептида, полипептида или белка (например, активности фермента, например). Например, микроорганизм может быть сконструирован путем генетической модификации для обеспечения экспрессии реагента на основе нуклеиновых кислот, который может обеспечить добавление новой активность (например, активности, обычно не обнаруживаемой у организма-хозяина) или увеличение экспрессии существующей активности путем увеличения транскрипции с гомологичного или гетерологичного промотора, функционально связанного с представляющей интерес нуклеотидной последовательностью (например, представляющей интерес гомологичной или гетерологичной нуклеотидной последовательностью), в определенных вариантах осуществления. В некоторых вариантах осуществления микроорганизм может быть сконструирован путем генетической модификации для обеспечения экспрессии реагента на основе нуклеиновых кислот, который может обеспечить снижение экспрессии активности путем уменьшения или по сути устранения транскрипции с гомологичного или гетерологичного промотора, функционально связанного с представляющей интерес нуклеотидной последовательностью, в определенных вариантах осуществления.

Нуклеиновые кислоты, кодирующие гетерологичные белки, например, нуклеотидтрифосфатные транспортеры, можно применять с любой подходящей системой экспрессии или вставлять в нее. В некоторых вариантах осуществления реагент на основе нуклеиновых кислот иногда стабильно интегрируется в хромосому организма-хозяина, или реагент на основе нуклеиновых кислот может представлять собой делецию части хромосомы хозяина в определенных вариантах осуществления (например, в генетически модифицированных организмах, где изменение генома хозяина дает возможность избирательно или предпочтительно поддерживать требуемый организм, несущий генетическую модификацию). Такие реагенты на основе нуклеиновых кислот (например, нуклеиновые кислоты или генетически модифицированные организмы, чей измененный геном придает организму селектируемый признак) могут быть выбраны по их способности направлять продуцирование требуемого белка или молекулы нуклеиновой кислоты. При необходимости реагент на основе нуклеиновых кислот можно изменить так, что кодоны кодируют (i) ту же аминокислоту с применением другой tRNA, чем та, которая указана в нативной последовательности, или (ii) другую аминокислоту, отличную от нормальной, включая нестандартные или неприродные аминокислоты (в том числе детектируемые меченые аминокислоты).

Рекомбинантная экспрессия успешно осуществляется с применением кассеты экспрессии, которая может быть частью вектора, такого как плазмида. Вектор может содержать промотор, функционально связанный с нуклеиновой кислотой, кодирующей нуклеотидтрифосфатный транспортер. Вектор также может содержать другие элементы, необходимые для транскрипции и трансляции, как описано в данном документе. Кассета экспрессии, вектор экспрессии и последовательности в кассете или векторе могут быть гетерологичными по отношению к клетке, с которой вступают в контакт неприродные нуклеотиды. Например, последовательность нуклеотидтрифосфатного транспортера может быть гетерологичной по отношению к клетке.

Можно получить разнообразные прокариотические и эукариотические векторы экспрессии, подходящие для переноса, кодирования и/или экспрессии нуклеотидтрифосфатных транспортеров. Такие векторы экспрессии включают, например, pET, pET3d, pCR2.1, pBAD, pUC и дрожжевые векторы. Векторы могут быть использованы, например, в различных ситуациях in vivo и in vitro. Неограничивающие примеры прокариотических промоторов, которые можно использовать, включают SP6, T7, T5, tac, bla, trp, gal, lac или мальтозные промоторы. Неограничивающие примеры эукариотических промоторов, которые можно использовать, включают конститутивные промоторы, например, вирусные промоторы, такие как промоторы CMV, SV40 и RSV, а также регулируемые промоторы, например, индуцибельный или репрессируемый промотор, такой как промотор tet, промотор hsp70 и синтетический промотор, регулируемый CRE. Векторы для бактериальной экспрессии включают pGEX-5X-3, а для эукариотической экспрессии включают pCIneo-CMV. Вирусные векторы, которые можно использовать, включают те, которые относятся к лентивирусу, аденовирусу, аденоассоциированному вирусу, вирусу герпеса, вирусу коровьей оспы, вирусу полиомиелита, вирусу СПИДа, вирусу нервной трофики, Синдбис и другим вирусам. Также применимы любые семейства вирусов, которые обладают свойствами этих вирусов, делающими их пригодными для применения в качестве векторов. Ретровирусные векторы, которые можно использовать, включают те, которые описаны в Verma, American Society for Microbiology, pp. 229-232, Washington, (1985). Например, такие ретровирусные векторы могут включать вирус мышиного лейкоза Малони, MMLV и другие ретровирусы, которые проявляют требуемые свойства. Как правило, вирусные векторы содержат неструктурные ранние гены, структурные поздние гены, транскрипт РНК-полимеразы III, инвертированные концевые повторы, необходимые для репликации и инкапсидирования, и промоторы для контроля транскрипции и репликации вирусного генома. При конструировании в качестве векторов у вирусов, как правило, удаляют один или несколько ранних генов и ген или кассету ген/промотор вставляют в вирусный геном вместо удаленной вирусной нуклеиновой кислоты.

Клонирование

Любую удобную стратегию клонирования, известную из уровня техники, можно использовать для встраивания элемента, такого как ORF, в реагент на основе нуклеиновых кислот. Известные способы можно использовать для вставки элемента в матрицу независимо от инсерционного элемента, такие как (1) расщепление матрицы в одном или нескольких существующих сайтах рестрикционных ферментов и лигирование представляющего интерес элемента и (2) добавление сайтов рестрикционных ферментов в матрицу путем гибридизации олигонуклеотидных праймеров, которые содержат один или несколько подходящих сайтов рестрикционных ферментов, и амплификацию с помощью полимеразной цепной реакции (более подробно описанную в данном документе). В других стратегиях клонирования используют преимущества одного или нескольких сайтов встраивания, присутствующих или встроенных в реагент на основе нуклеиновых кислот, таких как, например, сайт гибридизации олигонуклеотидного праймера для ПЦР и другие, описанные в данном документе. В некоторых вариантах осуществления стратегию клонирования можно комбинировать с генетическими манипуляциями, такими как рекомбинация (например, рекомбинация реагента на основе нуклеиновых кислот с представляющей интерес последовательностью нуклеиновой кислоты в геноме организма, подлежащего модификации, как дополнительно описано в данном документе). В некоторых вариантах осуществления клонированная(-ые) ORF может(могут) обеспечивать продуцирование (прямо или косвенно) модифицированных нуклеотидтрифосфатных транспортеров и/или полимераз или нуклеотидтрифосфатных транспортеров и/или полимераз дикого типа при конструировании микроорганизма с одной или несколькими представляющими интерес ORF, при этом у микроорганизма предусмотрены измененные виды активности, представляющие собой активность нуклеотидтрифосфатного транспортера или полимеразную активность.

Нуклеиновую кислоту можно специфически расщепить посредством приведения в контакт нуклеиновой кислоты с одним или несколькими средствами для специфического расщепления. Средства для специфического расщепления часто будут специфически расщеплять в соответствии с конкретной нуклеотидной последовательностью в конкретном сайте. Примеры ферментных средств для специфического расщепления включают без ограничения эндонуклеазы (например, ДНКазу (например, ДНКазу I, II); РНКазу (например, РНКазу E, F, H, P); фермент Cleavase™; ДНК-полимеразу Taq; ДНК-полимеразу I из E. coli и эукариотические специфические в отношении структуры эндонуклеазы, мышиные эндонуклеазы FEN-1, рестрикционные эндонуклеазы типа I, II или III, такие как Acc I, Afl III, Alu I, Alw44 I, Apa I, Asn I, Ava I, Ava II, BamH I, Ban II, Bcl I, Bgl I, Bgl II, Bln I, BsaI, Bsm I, BsmBI, BssH II, BstE II, Cfo I, CIa I, Dde I, Dpn I, Dra I, EcIX I, EcoR I, EcoR I, EcoR II, EcoR V, Hae II, Hae II, Hind II, Hind III, Hpa I, Hpa II, Kpn I, Ksp I, Mlu I, MIuN I, Msp I, Nci I, Nco I, Nde I, Nde II, Nhe I, Not I, Nru I, Nsi I, Pst I, Pvu I, Pvu II, Rsa I, Sac I, Sal I, Sau3A I, Sca I, ScrF I, Sfi I, Sma I, Spe I, Sph I, Ssp I, Stu I, Sty I, Swa I, Taq I, Xba I, Xho I); гликозилазы (например, урацил-ДНК-гликолизилазу (UDG), 3-метиладенин-ДНК-гликозилазу, 3-метиладенин-ДНК-гликозилазу II, пиримидингидрат-ДНК-гликозилазу, FaPy-ДНК-гликозилазу, ошибочную по тимину ДНК-гликозилазу, гипоксантин-ДНК-гликозилазу, 5-гидроксиметилурацил-ДНК-гликозилазу (HmUDG), 5-гидроксиметилцитозин-ДНК-гликозилазу или 1,N6-этеноаденин-ДНК-гликозилазу); экзонуклеазы (например, экзонуклеазу III); рибозимы и ДНКзимы. Образец нуклеиновой кислоты можно обработать химическим средством или синтезировать с применением модифицированных нуклеотидов, и модифицированную нуклеиновую кислоту можно расщепить. В неограничивающих примерах образец нуклеиновой кислоты можно обработать (i) алкилирующими средствами, такими как метилнитрозомочевина, которая обеспечивает получение нескольких алкилированных оснований, включая N3-метиладенин и N3-метилгуанин, которые распознаются и расщепляются алкил-пурин-ДНК-гликозилазой; (ii) бисульфитом натрия, который вызывает дезаминирование остатков цитозина в ДНК с образованием остатков урацила, которые могут расщепляться урацил-N-гликозилазой; и (iii) химическим средством, которое превращает гуанин в его окисленную форму, 8-гидроксигуанин, который может расщепляться формамидопиримидин-ДНК-N-гликозилазой. Примеры процессов химического расщепления включают без ограничения алкилирование (например, алкилирование модифицированной фосфоротиоатом нуклеиновой кислоты); расщепление кислотонеустойчивого участка P3'-N5'-фосфороамидатсодержащей нуклеиновой кислоты; обработку нуклеиновой кислоты тетроксидом осмия и пиперидином.

В некоторых вариантах осуществления реагент на основе нуклеиновых кислот содержит один или несколько сайтов встраивания рекомбиназы. Сайт встраивания рекомбиназы представляет собой последовательность распознавания в молекуле нуклеиновой кислоты, которая участвует в реакции интеграции/рекомбинации при воздействии рекомбинационных белков. Например, сайтом рекомбинации для рекомбиназы Cre является loxP, который представляет собой последовательность из 34 пар оснований, состоящую из двух инвертированных повторов из 13 пар оснований (служащих сайтами связывания рекомбиназы), фланкирующих основную последовательность из 8 пар оснований (например, Sauer, Curr. Opin. Biotech. 5:521-527 (1994)). Другие примеры сайтов рекомбинации включают последовательности attB, attP, attL и attR и их мутанты, фрагменты, варианты и производные, которые распознаются рекомбинационным белком λ Int и клеточным фактором интеграции вспомогательных белков (IHF), FIS и эксцизионазой (Xis) (например, патенты США №№ 5888732; 6143557; 6171861; 6270969; 6277608; 6720140; заявки на патент США №№ 09/517466 и 09/732914; публикация заявки на патент США № US2002/0007051 и Landy, Curr. Opin. Biotech. 3:699-707 (1993)).

Примеры нуклеиновых кислот с рекомбинационным клонированием находятся в системах Gateway® (Invitrogen, Калифорния), которые содержат по меньшей мере один сайт рекомбинации для клонирования требуемых молекул нуклеиновой кислоты in vivo или in vitro. В некоторых вариантах осуществления в системе используют векторы, которые содержат по меньшей мере два разных сайт-специфических сайта рекомбинации, часто основанных на системе бактериофага лямбда (например, att1 и att2) и мутированных из сайтов дикого типа (att0). Каждый мутированный сайт характеризуется уникальной специфичностью для сайта att своего родственного партнера (т. е. сайта рекомбинации своего партнера по связыванию) того же типа (например, attB1 с attP1 или attL1 с attR1) и не будет перекрестно реагировать с сайтами рекомбинации другого мутантного типа или с сайтом att0 дикого типа. Различные специфичности сайта обеспечивают возможность направленного клонирования или связывания требуемых молекул, таким образом обеспечивая требуемую ориентацию клонированных молекул. Фрагменты нуклеиновой кислоты, фланкированные сайтами рекомбинации, клонируют и субклонируют с применением системы Gateway® путем замены селектируемого маркера (например, ccdB), фланкированного сайтами att на молекуле реципиентной плазмиды, иногда называемой вектором назначения. Требуемые клоны затем отбирают путем трансформации чувствительного к ccdB штамма-хозяина и положительного отбора на маркер на реципиентной молекуле. Аналогичные стратегии отрицательного отбора (например, с применением токсичных генов) можно использовать в других организмах, например, тимидинкиназу (ТК) у млекопитающих и насекомых.

Реагент на основе нуклеиновых кислот иногда содержит один или несколько элементов начала репликации (ORI). В некоторых вариантах осуществления матрица содержит два или более ORI, где один эффективно функционирует в одном организме (например, бактерии), а другой эффективно функционирует в другом организме (например, эукариоте, таком как дрожжи, например). В некоторых вариантах осуществления один ORI может эффективно функционировать у одного вида (например, S. cerevisiae, например), а другой ORI может эффективно функционировать у отличающегося вида (например, S. pombe, например). Реагент на основе нуклеиновых кислот также иногда содержит один или несколько сайтов регуляции транскрипции.

Реагент на основе нуклеиновых кислот, например, кассета экспрессии или вектор, может содержать последовательность нуклеиновой кислоты, кодирующую маркерный продукт. Маркерный продукт используют для определения того, был ли ген доставлен в клетку и экспрессируется ли после доставки. Примеры маркерных генов включают ген lacZ из E. coli, который кодирует β-галактозидазу и зеленый флуоресцентный белок. В некоторых вариантах осуществления маркер может быть селектируемым маркером. Когда такие селектируемые маркеры успешно переносятся в клетку-хозяина, трансформированная клетка-хозяин может выжить, если находится под давлением отбора. Существуют две отличающиеся широко используемые категории схем отбора. Первая категория основана на метаболизме клеток и применении мутантной клеточной линии, которая лишена способности расти независимо от добавленной среды. Вторая категория представляет собой доминантный отбор, который относится к схеме отбора, используемой в клетках любого типа, и не требует применения мутантной клеточной линии. В этих схемах обычно применяют лекарственное средство для остановки роста клетки-хозяина. Те клетки, которые имеют новый ген, будут экспрессировать белок, сообщающий устойчивость к лекарственному средству, и выживут при отборе. В примерах такого доминантного отбора применяют лекарственные средства неомицин (Southern et al., J. Molec. Appl. Genet. 1: 327 (1982)), микофеноловую кислоту, (Mulligan et al., Science 209: 1422 (1980)) или гигромицин (Sugden, et al., Mol. Cell. Biol. 5: 410-413 (1985)).

Реагент на основе нуклеиновых кислот может содержать один или несколько элементов отбора (например, элементы для отбора присутствия реагента на основе нуклеиновых кислот, а не для активации промоторного элемента, который можно селективно регулировать). Элементы отбора часто используют с применением известных способов для определения того, включен ли реагент на основе нуклеиновых кислот в клетку. В некоторых вариантах осуществления реагент на основе нуклеиновых кислот содержит два или более элементов отбора, где один эффективно функционирует в одном организме, а другой эффективно функционирует в другом организме. Примеры элементов отбора включают без ограничения (1) сегменты нуклеиновых кислот, кодирующие продукты, которые обеспечивают устойчивость к токсичным в противном случае соединениям (например, антибиотикам); (2) сегменты нуклеиновых кислот, кодирующие продукты, которые в противном случае отсутствуют в клетке реципиента (например, незаменимые продукты, гены tRNA, ауксотрофные маркеры); (3) сегменты нуклеиновых кислот, кодирующие продукты, которые подавляют активность генного продукта; (4) сегменты нуклеиновых кислот, кодирующие продукты, которые могут быть легко идентифицированы (например, фенотипические маркеры, такие как антибиотики (например, β-лактамаза), β-галактозидаза, зеленый флуоресцентный белок (GFP), желтый флуоресцентный белок (YFP), красный флуоресцентный белок (RFP), голубой флуоресцентный белок (CFP) и белки клеточной поверхности); (5) сегменты нуклеиновых кислот, связывающие продукты, которые в противном случае вредны для выживания и/или функционирования клеток; (6) сегменты нуклеиновых кислот, которые иным образом ингибируют активность любого из сегментов нуклеиновой кислоты, описанных в пунктах 1-5 выше (например, антисмысловые олигонуклеотиды); (7) сегменты нуклеиновых кислот, связывающие продукты, которые модифицируют субстрат (например, эндонуклеазы рестрикции); (8) сегменты нуклеиновых кислот, которые можно использовать для выделения или идентификации требуемой молекулы (например, специфические сайты связывания белка); (9) сегменты нуклеиновых кислот, кодирующие специфическую нуклеотидную последовательность, которая в противном случае может быть нефункциональной (например, для ПЦР-амплификации субпопуляций молекул); (10) сегменты нуклеиновых кислот, которые при отсутствии прямо или косвенно придают устойчивость или чувствительность к конкретным соединениям; (11) сегменты нуклеиновых кислот, кодирующие продукты, которые либо являются токсичными, либо преобразуют относительно нетоксичное соединение в токсичное соединение (например, тимидинкиназа Herpes simplex, цитозиндеаминаза) в клетках реципиента; (12) сегменты нуклеиновых кислот, ингибирующие репликацию, разделение или наследуемость молекул нуклеиновых кислот, которые их содержат; и/или (13) сегменты нуклеиновых кислот, которые кодируют функции зависящей от условий репликации, например, репликацию у определенных хозяев или штаммов клеток-хозяев или при определенных условиях окружающей среды (например, температура, условия питания и т. п.).

Реагент на основе нуклеиновых кислот может иметь любую форму, применимую для транскрипции и/или трансляции in vivo. Нуклеиновая кислота иногда представляет собой плазмиду, такую как сверхспирализованная плазмида, иногда представляет собой дрожжевую искусственную хромосому (например, YAC), иногда представляет собой линейную нуклеиновую кислоту (например, линейную нуклеиновую кислоту, получаемую с помощью ПЦР, или фрагмент рестрикции), иногда является однонитевой, а иногда двухнитевой. Реагент на основе нуклеиновых кислот иногда получают с помощью способа, предусматривающего амплификацию, такого как способ полимеразной цепной реакции (ПЦР) или способ амплификации, опосредованной транскрипцией (ТМА). В ТМА два фермента используют в изотермической реакции с получением продуктов амплификации, детектируемых с помощью оптического излучения (например, Biochemistry, 1996 Jun 25;35(25):8429-38). Стандартные способы ПЦР известны (например, патенты США №№ 4683202; 4683195; 4965188 и 5656493) и обычно проводятся циклами. Каждый цикл включает тепловую денатурацию, при которой гибридные нуклеиновые кислоты диссоциируют; охлаждение, при котором олигонуклеотиды праймера гибридизируются; и удлинение олигонуклеотидов с помощью полимеразы (то есть Taq-полимеразы). Примером циклического способа ПЦР является обработка образца при 95°С в течение 5 минут; повторение сорока пяти циклов, предусматривающих 95°С в течение 1 минуты, 59°С в течение 1 минуты 10 секунд и 72°С в течение 1 минуты 30 секунд; и затем обработка образца при 72°С в течение 5 минут. Многократные циклы часто выполняют с применением коммерчески доступного термоциклера. Продукты амплификации ПЦР иногда хранят в течение некоторого времени при более низкой температуре (например, при 4°С) и иногда замораживают (например, при -20°С) до анализа.

Наборы/готовые изделия

В данном документе в определенных вариантах осуществления раскрыты наборы и готовые изделия для применения с одним или несколькими способами, описанными в данном документе. Такие наборы включают носитель, упаковку или контейнер, который разделен на части для приема одного или нескольких контейнеров, таких как флаконы, пробирки и т. п., причем каждый из контейнеров содержит один из отдельных элементов, которые должны использоваться в способе, описанном в данном документе. Подходящие контейнеры включают, например, бутылки, флаконы, шприцы и пробирки. В одном варианте осуществления контейнеры изготовлены из различных материалов, таких как стекло или пластик.

В некоторых вариантах осуществления набор включает подходящий упаковочный материал для размещения содержимого набора. В некоторых случаях упаковочный материал изготавливают хорошо известными способами предпочтительно с обеспечением стерильной неконтаминированной среды. Используемые в данном документе упаковочные материалы могут включать, например, материалы, обычно используемые в коммерческих наборах, продаваемых для применения с системами секвенирования нуклеиновых кислот. Иллюстративные упаковочные материалы включают без ограничения стекло, пластик, бумагу, фольгу и т. п., способные удерживать в установленных пределах компонент, изложенный в данном документе.

Упаковочный материал может предусматривать этикетку, на которой указано конкретное применение компонентов. Применение набора, которое указано на этикетке, может представлять собой один или несколько способов, изложенных в данном документе, в зависимости от конкретной комбинации компонентов, присутствующих в наборе. Например, на этикетке может быть указано, что набор применим для способа синтеза полинуклеотида или для способа определения последовательности нуклеиновой кислоты.

Инструкции по применению упакованных реагентов или компонентов также могут быть включены в набор. Инструкции, как правило, включают материальное выражение, описывающее параметры реакции, такие как относительные количества компонентов набора и образца, подлежащие смешиванию, периоды сохранения при смешивании реагента/образца, температура, буферные условия и т. п.

Понятно, что не все компоненты, необходимые для конкретной реакции, должны присутствовать в конкретном наборе. Скорее один или несколько дополнительных компонентов могут быть предоставлены из других источников. В инструкциях, поставляемых с набором, может(-гут) идентифицироваться дополнительный(-е) компонент(-ы), который(-е) должны быть предоставлены, и где их можно получить.

В некоторых вариантах осуществления предусматривается набор, который применим для стабильного встраивания неприродной нуклеиновой кислоты в клеточную нуклеиновую кислоту, например, с применением способов, предусмотренных настоящим изобретением для получения полученных методами генной инженерии клеток. Водном варианте осуществления набор, описанный в данном документе, включает полученную методами генной инженерии клетку и одну или несколько неприродных нуклеиновых кислот. В другом варианте осуществления описанный в данном документе набор включает выделенную и очищенную плазмиду, содержащую последовательность, выбранную из SEQ ID NO: 1-32.

В дополнительных вариантах осуществления в наборе, описанном в данном документе, предоставляют клетку и молекулу нуклеиновой кислоты, содержащую гетерологичный ген, для встраивания в клетку, чтобы тем самым обеспечить полученную методами генной инженерии клетку, такую как векторы экспрессии, содержащие нуклеиновую кислоту по любому из вариантов осуществления, описанных выше в данном параграфе.

Определенная терминология

Если не указано иное, все технические и научные термины, используемые в данном документе, имеют то же значение, которое обычно подразумевается специалистом в данной области техники, к которой принадлежит заявленный объект изобретения. Следует понимать, что приведенное выше общее описание и нижеследующее подробное описание являются лишь иллюстративными и пояснительными и не ограничивают какой-либо заявленный объект изобретения. В данной заявке применение единственного числа включает множественное число, если специально не указано иное. Следует отметить, что использованные в описании и прилагаемой формуле изобретения формы единственного числа, включают определяемые объекты во множественном числе, если из контекста явно не следует иное. В данной заявке применение "или" означает "и/или", если не указано иное. Кроме того, применение термина "включая", а также других форм, таких как "включать", "включает" и "включенный", не является ограничивающим.

Как используется в данном документе, диапазоны и количества могут быть выражены как "приблизительно" конкретное значение или диапазон. Термин "приблизительно" также включает точное количество. Следовательно "приблизительно 5 мкл" означает "приблизительно 5 мкл", а также "5 мкл." Как правило, термин "приблизительно" включает количество, которое, как ожидается, будет находиться в пределах ошибки эксперимента.

Применяемые в данном документе заголовки разделов служат только в организационных целях и не должны пониматься как ограничивающие описываемый объект.

ПРИМЕРЫ

Данные примеры представлены исключительно в иллюстративных целях и не ограничивают объем представленной в данном документе формулы изобретения.

Пример 1. Определение способности клеток удерживать или терять UBP в E. coli

В условиях равновесного состояния ДНК, содержащая UBP dNaM-dTPT3, реплицировалась in vitro с эффективностью, близкой к эффективности полностью природного аналога; однако эти показатели, вероятно, ограничены диссоциацией продукта. Репликация in vivo является более процессивной и, соответственно, с меньшей вероятностью будет ограничена диссоциацией продукта. Следовательно, репликация ДНК, содержащей UBP, в SSO может быть менее эффективной, чем репликация полностью природной ДНК, и, в свою очередь, может привести к прерыванию репликативных вилок. Кроме того, исследования структур показали, что UBP принимает форму подобной модели Уотсона-Крика структуры во время вставки трифосфата, но после вставки UBP принимает форму интеркалированной структуры с перекрещивающейся нитью, которая индуцирует локальные нарушения спирали.8,9 Клетки воспринимают как прерванные репликативные вилки, так и нарушения спирали как признаки повреждения ДНК и инициируют программы восстановления или допускают нуклеотиды, приводящие к нарушениям, что, как предполагают авторы настоящего изобретения, может способствовать потере UBP.

Чтобы определить, как клетки сохраняют или теряют UBP, изучали эффекты блокирования этих путей. Результаты показывают, что ни эксцизионная репарация нуклеотидов (NER), ни SOS-ответ не вносят значительного вклада в сохранение или потерю UBP. И наоборот, все из нормальной полимеразы в реплисоме, ДНК-полимеразы III (Pol III), Pol II и метил-направленной репарации ошибочно спаренных оснований (MMR) способствуют сохранению UBP; в то время как рекомбинационная репарация (RER) репликативных вилок, которые прерываются, обеспечивает основной путь к потере UBP. Затем реплисома SOO перепрограммировалась с обеспечением способности не только лучше удерживать UBP в плазмиде, но также стабильно сохранять UBP в ее хромосоме.

Эксцизионная репарация нуклеотидов не способствует сохранению или потере UBP

Как правило, E. coli реагирует на повреждение ДНК посредством прямого обращения повреждения, эксцизионной репарации оснований, NER, MMR, RER и SOS-ответа. Ни прямое обращение повреждения, ни эксцизионная репарация оснований, вероятно, не способствуют сохранению или потере UBP, потому что эти пути зависят от ферментов, которые распознают специфические формы повреждения ДНК, которые с низкой вероятностью будут имитироваться UBP. Напротив, NER, MMR, RER и SOS-ответ индуцируются сигналами, менее специфическими в отношении структуры. Чтобы начать исследовать, как клеткам удается удерживать UBP в своих ДНК, исследовали NER, которая опосредована независимо от репликации комплексом белков, которые сканируют ДНК на предмет нарушений, возникающих в результате объемных повреждений, которые могут имитироваться UBP. Вклад NER в сохранение или потерю UBP изучали путем делеции uvrC, которая кодирует важный компонент NER, из родительского SSO (E. coli BL21(DE3)+pACS2 (фигура 4)). Репликация ДНК, содержащей UBP dNaM-dTPT3, расположенной в двух разных контекстах последовательности в плазмидах pINF1 и pINF2, не была затронута делецией uvrC, что указывает на то, что NER не вносит вклад в сохранение или потерю UBP (фигура 1B).

Метил-направленная репарация ошибочно спаренных оснований повышает сохранение UBP

Затем исследовали MMR, которая обеспечивает критическую первую проверку новой синтезированной ДНК, когда она выходит из ДНК-полимеразы во время репликации и опосредуется комплексом белков, который распознает нарушения спирали, вызванные ошибочно спаренными природными нуклеотидами. При выявлении ошибки комплекс MMR разрывает новую синтезированную неметилированную нить, что, в свою очередь, приводит к образованию гэпа и последующему повторному синтезу ДНК. В отличие от NER, инактивация MMR посредством делеции mutH приводила к снижению сохранения UBP как в отношении pINF1, так и в отношении pINF2 (фигура 1B). Эти результаты показывают, что нарушения спирали, связанные с UBP, не являются достаточно серьезными, чтобы активировать MMR, или что неприродные нуклеотиды не могут быть удалены, но при этом нарушения, вызванные спариванием неприродного и природного нуклеотида, распознаются и обрабатываются посредством MMR. Таким образом, MMR, по-видимому, эффективно распознает UBP как подобную природной и селективно удаляет ошибочно спаренные природные нуклеотиды, тем самым поддерживая стабильное расширение генетического алфавита.

Рекомбинационная репарация обеспечивает основной путь к потере UBP

RER опосредуется RecA, который формирует филаменты на однонитевой ДНК перед прерванными репликативными вилками, что, в свою очередь, способствует образованию промежуточных продуктов рекомбинации и переключению на гомологичную матрицу для продолжения репликации ДНК. SOS-ответ индуцируется, когда одни и те же филаменты, сформированные с помощью RecA, способствуют расщеплению SOS-репрессора LexA, что приводит к дерепрессии ряда генов, связанных устойчивостью к повреждению ДНК/репарацией поврежденной ДНК, что вызывает прерывание вилки. Авторы настоящего изобретения исследовали совокупный вклад RER и SOS-ответа посредством делеции recA и наблюдали значительное повышение сохранения UBP в отношении pINF1 (фигура 1B). Для дальнейшего изучения вклада RecA сохранение UBP в более проблематичных последовательностях, обеспечиваемых pINF3, pINF4 и pINF5, измеряли в ΔrecA SSO (фигура 1C). В этих контекстах последовательности отсутствие recA приводило к более значительному повышению сохранения UBP.

Чтобы определить, облегчает ли делеция recA сохранение UBP путем абляции RER или путем предотвращения индукции SOS-ответа, исследовали SSO, который не способен индуцировать SOS-ответ, но который является компетентным в отношении RER (SSO lexA(S119A)) (фигура 1C). В то время как селективное подавление SOS-ответа приводило к умеренному повышению сохранения UBP в отношении pINF3, это повышение было меньше, чем наблюдаемое с ΔrecA SSO. В отношении pINF4 и pINF5 селективное подавление SOS-ответа приводило только к умеренным повышениям сохранения UBP, которое было значительно ниже наблюдаемых с recA SSO. Эти результаты демонстрируют, что потеря UBP, опосредованная RecA, в большей степени происходит посредством RER, а не посредством индукции SOS-ответа.

Pol II способствует репликации ДНК, содержащей UBP

Хотя данные свидетельствуют о том, что потеря UBP в большей степени опосредуется RER, предельное и специфическое в отношении последовательности повышение сохранения UBP с lexA(S119A) SSO указывает на то, что один или несколько белков, регулируемых SOS-ответом, также могут вносить свой вклад. Исследовали вклад трех SOS-регулируемых ДНК-полимераз Pol II, Pol IV и Pol V. Действительно, Pol IV и Pol V являются полимеразами, участвующими в синтезе ДНК "через повреждения", которые хорошо известны своей способностью опосредовать синтез ДНК через "неинструктивные" поврежденные нуклеотиды. Однако делеция и dinB, и umuCD (которые кодируют Pol IV и предшественника Pol V, соответственно) не влияла на сохранение UBP ни в отношении pINF1, ни в отношении pINF2 (фигура 1D). В отличие от ΔdinBΔumuDC SSO делеция polB (который кодирует Pol II) приводила к резкому повышению потери UBP как в отношении pINF1, так и в отношении pINF2 (фигура 1D). В целом, эти данные демонстрируют, что RER представляет основной путь к потере UBP, и что Pol II обеспечивает важный путь для сохранения UBP. В то время как продуцирование Pol II повышается вследствие индукции SOS-ответа, данные свидетельствуют о том, что его полезные эффекты превышаются вредными эффектами параллельно индуцированной RER.

ДНК-полимеразы III также способствуют репликации ДНК, содержащей UBP

Уменьшенное, но все еще выявляемое сохранение UBP в ΔpolB SSO, наряду с незначительными эффектами делеции генов, кодирующих Pol IV и Pol V, убедительно свидетельствуют о том, что одна или обе оставшиеся ДНК-полимеразы Pol I и Pol III также должны способствовать сохранению UBP. Чтобы специфически исследовать, способствуют ли Pol I или Pol III репликации ДНК, содержащей UBP, авторы настоящего изобретения сконструировали и охарактеризовали штаммы, у которых их 3'-5'-экзонуклеазная ("корректирующая") активность была устранена или нарушена мутацией (Pol Iexo-, polA(D424A, K890R) и Pol IIIexo-, dnaQ(D12N), соответственно (фигура 4 и фигура 6). Хотя устранение экзонуклеазной активности Pol I не влияло на сохранение UBP, мутант с дефицитом экзонуклеазы Pol III продемонстрировал резкое снижение сохранения UBP. Эти данные четко показывают то, что в клетках дикого типа Pol III, но не Pol I, способствует репликации ДНК, содержащей UBP.

Чтобы определить, были ли какие-либо эффекты мутаций Pol I или Pol III замаскированы посредством активностей Pol II и/или RER, исследовали сохранение UBP в ΔpolB или ΔpolBΔrecA SSO. Результаты показывают, что UBP хорошо удерживалась с ΔpolBΔrecA SSO, демонстрируя, что полимеразы, отличные от Pol II, способны опосредовать высокий уровень сохранения UBP в отсутствие конкуренции с потерей, опосредованной RER (фигура 1D). Мутант экзонуклеазы Pol III снова показал снижение сохранение UBP как в ΔpolB, так и в ΔpolBΔrecA SSO. Однако в отличие от клеток дикого типа устранение активности экзонуклеазы Pol I имело значительные и противоположные эффекты в отношении ΔpolB и ΔpolBΔrecA SSO, при которых сохранение повышалось и снижалось, соответственно. Эти данные показывают, что в дополнение к Pol II Pol III способствует сохранению UBP, а в отсутствие RER Pol I также способствует этому.

Модель для репликации ДНК, содержащей UBP

Не ограничиваясь какой-либо конкретной теорией, результаты, описанные в данном документе, подсказывают следующую модель для репликации ДНК, содержащей dNaM-dTPT3 UBP в E. coli SSO (фигура 2). Если реплисома с Pol III встречается с неприродным нуклеотидом в ходе процессивной репликации ведущей или отстающей нити, Pol III включает либо природный, либо неприродный нуклеотид. Если включается природный нуклеотид, то скорость коррекции является конкурентоспособной и, возможно, более эффективной, чем продолжающееся удлинение, и, таким образом, природный нуклеотид обычно вырезается вследствие корректирующей активности Pol III. Однако, если синтезируется корректная UBP, более эффективное удлинение предотвращает вырезание, и реплисома продолжает синтезировать ДНК. При выходе из полимеразы растущий дуплекс сканируется комплексом MMR, что дополнительно повышает сохранение UBP, преимущественно устраняя любые ошибочно спаренные природные нуклеотиды, которые избежали коррекции.

Поскольку удлинение даже корректной UBP, вероятно, будет менее эффективным, чем природный синтез, Pol III также может диссоциировать. Прерванная вилка, вероятно, с удлиняющейся нитью, оканчивающейся непосредственно перед неприродным нуклеотидом в матрице, теперь является субстратом для RER, которая повторно инициирует синтез с использованием гомологичной природной последовательности и, таким образом, обеспечивает доминантный механизм потери UBP. Однако в конкуренции с RER, опосредованной RecA, Pol II может спасти прерванную вилку и возобновить синтез с высоким уровнем сохранения UBP, после чего она предположительно уступает Pol III и восстановлению нормальной репликативной вилки. Вклад Pol I является более сложным. В клетках дикого типа Pol I, по-видимому, не способствует репликации ДНК, содержащей UBP. Напротив, в отсутствие Pol II и RecA Pol I действительно вносит вклад, и, соответственно, устранение экзонуклеазной активности Pol I приводит к снижению сохранения UBP. Однако, если экзонуклеазная активность устраняется, Pol I может вносить свой вклад, если Pol II устраняется, и в этом случае она повышает показатель сохранения за счет конкуренции с RER.

Принято считать, что Pol II выполняет две предполагаемые роли: (1) при повторном старте репликации, когда Pol II спасает прерванные вилки после того, как в результате синтеза с участием Pol III образуется ошибочное спаривание, которое она не может эффективно удлинить; и (2) Pol II должна конкурировать с RER, чтобы заполнить гэпы, созданные NER, как часть клеточного ответа на ДНК с межнитевой поперечной сшивкой. Интересно отметить, что вызванная роль Pol II в спасении репликативных вилок, прерванных на UBP, в конкуренции с RER, поразительно похожа на аспекты обеих предполагаемых природных ролей. Однако этот эффект в отношении репликации ДНК, содержащей UBP, приводит к образованию наиболее значимого фенотипа, когда-либо наблюдавшегося при его устранении.

Оптимизация SSO

Удержание UBP может быть оптимизировано путем манипуляции с RecA и Pol II. Чтобы исследовать эту возможность, SSO оптимизировали с отсутствием recA и с или без Pol II, конститутивно экспрессируемой на SOS-дерепрессируемых уровнях (ΔrecA и Pol II+ΔrecA, соответственно (фигура 6). Эти штаммы (YZ3) также экспрессировали оптимизированный транспортер PtNTT2 из хромосомного локуса (ΔlacZYA::PlacUV5-PtNTT2(66-575)) (фигура 4). Для сравнения использовали штамм дикого типа с тем же интегрированным в хромосому транспортером (WT-Opt). SSO трансформировали с помощью pINF1, pINF5 или pINF6 (фигура 3А), при этом pINF6 встраивала UBP в последовательность, где его сохранение является особенно проблематичным, и плазмиды извлекали из отдельных колоний для характеристики сохранения UBP. В этом случае вводили отбор на твердой ростовой среде для анализа сохранения UBP в отдельных клонах, в отличие от средних сохранений UBP, определяемых в предыдущих экспериментах. Распределение сохранений UBP наблюдали с каждой плазмидой во всех SSO, однако распределения были смещены в сторону более высокого уровня сохранения с ΔrecA-Opt и особенно Pol II+ΔrecA SSO по сравнению с WT-Opt SSO. Кроме того, только Pol II+ΔrecA SSO продуцировал клоны с не поддающейся выявлению потерей UBP в контексте каждой исследемой последовательности. Следует отметить, что это было даже верно для pINF6, для которой сохранение в SSO дикого типа не поддавалось выявлению, и только умеренным (<60%), при обеспечении отбором с помощью Cas9.

Оценивали способность генетически оптимизированных ΔrecA-Opt и Pol II+ΔrecA SSO облегчать интеграцию UBP в хромосому. Конструировали интеграционную кассету, которая нацеливает последовательность GTAXTGA (X=NaM) в локус arsB, и использовали метод рекомбинационной инженерии с Lambda Red для интеграции кассеты в хромосомы WT-Opt, ΔrecA-Opt и Pol II+ΔrecA SSO. В результате скрининга интегрантов в отношении сохранения UBP идентифицировали клоны со 100% сохранением из ΔrecA-Opt и Pol II+ΔrecA SSO, но, несмотря на значительные усилия, авторам настоящего изобретения не удалось выделить клоны WT-Opt с более чем 91% сохранением UBP (фигура 7), что свидетельствует о том, что значительная потеря UBP произошла во время необходимой стадии роста. Чтобы охарактеризовать эффект интегрированной в хромосому UBP, аликвоты клеток в середине логарифмической фазы роста инокулировали в ростовую среду с dNaMTP и dTPT3TP или без таковых (фигура 3B, фигура 8). Интегранты ΔrecA-Opt и Pol II+ΔrecA плохо росли, если не было обеспечено наличие не встречающихся в природе трифосфатов, что согласуется с моделью, согласно которой RER требуется для эффективного обхода неприродного нуклеотида в матрице. Однако этот дефект роста был почти полностью устранен в обоих SSO при обеспечении dNaMTP и dTPT3TP. Таким образом, делеция recA и надэкспрессия Pol II способствуют высокому уровню сохранения UBP в хромосоме только лишь с минимальными последствиями для приспособленности.

Наконец, оценивали, способствуют ли генетически оптимизированные штаммы долгосрочной стабильности интегрированной в хромосому UBP. Предыдущие исследования продемонстрировали, что без Cas9-опосредованного отбора в отношении сохранения передающаяся через плазмиду UBP утрачивается во время длительного роста. Интегранты WT-Opt, ΔrecA-Opt и Pol II+ΔrecA последовательно пересевали на протяжении периода роста многих поколений и характеризовали сохранение UBP (фигура 3C). С WT-Opt потеря UBP происходила медленно примерно к 40му поколению, а затем происходила быстрее с полной потерей, наблюдаемой в 90ом поколении. По-видимому, двухфазная кинетика потери предполагает, что по меньшей мере один дополнительный процесс вносит вклад в дополнение к RER. В самом деле, секвенирование выявило крупную хромосомную перестройку, в результате которой происходило устранение гена PtNTT2 во время резкого снижения сохранения UBP (фигура 10). В отличие от WT-Opt, как ΔrecA-Opt, так и Pol II+ΔrecA SSO PtNTT2 оставался интактным и сохранение геномной UBP оставалось высоким, особенно с Pol II+ΔrecA SSO, где оно оставалось > 55% после 137 поколений.

Эти результаты демонстрируют, что делеция recA не только способствует сохранению UBP во время репликации, но и значительно повышает стабильность транспортера при длительном росте. Наблюдаемое сохранение соответствует точности на удвоение, превышающей 99,6%, что, в свою очередь, соответствует потере хромосомной UBP только в небольшой части клеток (< 0,4%) на удвоение. Таким образом, наряду с системой устранения ошибок Cas9, которая не использовалась в данной работе, эта система предотвращения ошибок должна обеспечивать сохранение UBP в широком диапазоне контекстов последовательности, что, в свою очередь, должно обеспечивать возможность сохранения совокупности новой информации, обеспечиваемой за счет UBP.

Со времени последнего общего предка всего живого на Земле биологическая информация хранилась в четырехбуквенном алфавите. Перепрограммированная реплисома Pol II+ΔrecA SSO представляет значительный прогресс в направлении неограниченного расширения этого алфавита, и первый прогресс был опосредован оптимизацией самой клетки. В то время как основные цели исследования заключались в том, чтобы понять, как реплицируется UBP, и использовать эту информацию для оптимизации SSO, результаты также обеспечивают новый путь к изучению того, как обычно управляется проблематичная репликация. Например, хотя данные свидетельствуют о том, что значительная часть ДНК, содержащей UBP, реплицируется с помощью Pol III, также четко показано, что значительное количество не делает этого, и в этих случаях данные показывают интересную конкуренцию между опосредованным Pol II повторным стартом репликации и RecA-опосредованной RER. Такие виды конкуренции могут быть распространены во время проблематичной репликации, которая могла способствовать проблемам в идентификации обычных ролей Pol II. Более того, неспособность MMR распознавать UBP позволяет предположить, что одних только нарушений спирали недостаточно, и что процесс требует специфических взаимодействий с нуклеотидными основаниями, которые недоступны с неприродными нуклеотидами. Наконец, повышенная генетическая стабильность, обеспечиваемая делецией recA, может также иметь существенное значение для способов, направленных на расширение генетического кода посредством амбер-супрессии, поскольку при осуществлении этих способов также возникают трудности вследствие генетической нестабильности при длительном росте.23 Независимо от этих интересных вопросов, теперь перепрограммированный SSO позволяет более стабильно удерживать расширенную биологическую информацию, в том числе в пределах его хромосомы, и с предыдущей демонстрацией того, что эта информация может быть получена в форме белков с неканоническими аминокислотами, должна обеспечивать платформу для достижения центральной цели синтетической биологии - создания жизни с новыми формами и функциями.

Пример 2. Способы и материалы

Конструкция на основе ДНК, содержащая pINF/UBP

pINF (фигура S8) конструировали посредством сборки Golden Gate pUCX2 и вставки dsDNA, содержащей пару dNaM-dTPT3, как описано ранее3 со следующими модификациями. dsDNA, содержащую UBP, получали посредством ПЦР с объемом реакционной смеси 50 мкл с химически синтезированными содержащими UBP олигонуклеотидами (0,025 нг/мкл), праймерами, обеспечивающими введение сайтов BsaI и характеризующимися гомологией по отношению к вектору (1 мкМ, таблица S1), dTPT3TP (100 мкМ), dNaMTP (100 мкМ), dNTP (200 мкМ), MgSO4 (1,2 мМ), ДНК-полимеразой OneTaq (0,025 ед./мкл) и стандартным реакционным буфером OneTaq (1×, New England Biolabs). Реакцию периодически повторяли в следующем температурном режиме в системе MJ Research PTC-200 (время в минутах:секундах): [94°C 00:30 | 25 × (94°C 00:30 | 47°C 00:30 | 68°C 04:00)]. Полученную dsDNA, содержащую UBP, очищали с использованием DNA Clean & Concentrator-5 (Zymo Research) в соответствии с рекомендациями производителя. Для сборки pINF объединяли pUCX2 (1 мкг) и вставленную ДНК при молярном соотношении 1:4 в реакционном объеме 80 мкл с АТФ (1 мМ), T4 ДНК-лигазой (6,65 ед./мкл, New England Biolabs), BsaI-HF (0,66 ед./мкл, New England Biolabs) и буфером CutSmart (1×, New England Biolabs) и подвергали следующему температурному режиму: [37°C 20 мин. | 40 × (37°C 5 мин. | 16°C 10 мин. | 22°C 5 мин.) | 37°C 20 мин. | 50°C 15 мин. | 70°C 30 мин.]. Затем добавляли BsaI-HF (0,33 ед./мкл) и экзонуклеазу T5 (0,16 ед./мкл, New England Biolabs) и реакционную смесь инкубировали при 37°C в течение 1 часа для удаления какого-либо pUCX2 без вставки. Эту реакционную смесь очищали с использованием DNA Clean & Concentrator-5 в соответствии с рекомендациями производителя, за исключением того, что реакционные смеси смешивали с 3 объемами 1:1 буфера для промывания ДНК:буфера для связывания ДНК перед связыванием с колонкой с диоксидом кремния.

Получали кассету нокина UBP для локуса arsB (фигура S4) посредством ПЦР с перекрывающимися праймерами с участием dsDNA размером 150 п. о., содержащей UBP и ген устойчивости к канамицину pKD13. ДНК размером 150 п. о. получали посредством ПЦР с объемом реакционной смеси 50 мкл с использованием тех же условий для реакционного раствора, что описаны выше, и следующего температурного режима (время в минутах:секундах): [98°C 02:00 | 5 × (98°C 00:10 | 50°C 00:10 | 68°C 04:00) | 15 × (98°C 00:10 | 58°C 00:10 | 68°C 04:00)]. Ампликон гена устойчивости к канамицину получали посредством ПЦР-амплификации pKD13 с использованием ДНК-полимеразы Q5 согласно рекомендациям производителя. Амплификацию длинных ДНК (приблизительно 200 п. о. или длиннее) ингибировали присутствием dTPT3TP. Поэтому, выполняли сборочную ПЦР с перекрыванием ампликона, содержащего UBP, и ампликона гена устойчивости к канамицину в большом масштабе (2 мл реакционной смеси, разделенной на 40 отдельных реакционных объемов по 50 мкл) со следующими условиями для раствора: Ампликон, содержащий UBP (0,02 нг/мкл), ампликон гена устойчивости к канамицину (0,02 нг/мкл), праймеры (1 мкМ, таблица S1), dTPT3TP (5 мкМ), dNaMTP (100 мкМ), dNTP (200 мкМ), MgSO4 (1,2 мМ), ДНК-полимераза OneTaq (0,025 ед./мкл) и стандартный реакционный буфер OneTaq (1×). Реакционные смеси подвергали следующему температурному режиму (время в минутах:секундах): [98°C 02:00 | 5 × (98°C 00:10 | 50°C 00:10 | 68°C 04:00) | 15 × (98°C 00:10 | 58°C 00:10 | 68°C 04:00)]. Данные реакционные смеси объединяли и концентрировали с использованием DNA Clean & Concentrator-5 в соответствии с рекомендациями производителя.

Репликация UBP in vivo в клетках с нокаутом генов

Все генетические нокауты (фигура 1 и фигура S2) анализировали по их способности реплицировать переносимые pINF UBP согласно следующему протоколу. Электрокомпетентные клетки получали из 45 мл культуры клеток в середине логарифмической фазы роста (OD600 0,35-0,7) путем осаждения клеток центрифугированием и двукратного промывания с 50 мл стерильной diH2O при 4°C. Промытые клетки повторно суспендировали в стерильной diH2O при 4°C при конечной OD600 40-60. 50 мкл клеток смешивали с 2 нг собранной посредством Golden Gate pINF и переносили в кювету для электропорации (с 2 мм щелью, № по каталогу FB102, Fisher Scientific). Электропорацию выполняли с использованием Gene Pulser II (BioRad) в соответствии с рекомендациями производителя (напряжение 25 кВ, конденсатор 2,5 мкФ, резистор 200 ω). Трансформированные клетки разбавляли в 950 мкл 2×YT, содержащей хлорамфеникол (33 мкг/мл) и фосфат калия (50 мМ, pH 7). 40 мкл разбавленных клеток далее разбавляли в конечном объеме 200 мкл 2×YT, содержащей хлорамфеникол (33 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и KPi (50 мМ, pH 7), переносили в пробирку объемом 1,5 мл, и обеспечивали восстановление в течение 1 часа при 37°C и 230 об./мин. 10 мкл восстановленных клеток разбавляли в конечном объеме 100 мкл 2×YT, содержащей хлорамфеникол (33 мкг/мл) и ампициллин (100 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и фосфат калия (50 мМ, pH 7), в лунке 96-луночного планшета (исходный № 655161, Greiner Bio-One). Кроме того, восстановленные клетки высевали на агаровую 2×YT (2%), содержащую ампициллин (100 мкг/мл) и фосфат калия (50 мМ, pH 7), для оценивания эффективности трансформации. 96-Луночный планшет и планшет для оценивания эффективности трансформации держали при 4°C и 37°C на протяжении ночи (приблизительно 12 часов), соответственно. Планшет для оценивания эффективности трансформации проверяли, чтобы убедиться, что все образцы в 96-луночном планшете получали по меньшей мере 50 колониеобразующих единиц перед охлаждением. Затем 96-луночному планшету обеспечивали условия 37°C и 230 об./мин. Клетки осаждали посредством центрифугирования, декантировали и замораживали после достижения 0,6-0,92 OD600. Реплицированные in vivo pINF выделяли с использованием набора ZR Plasmid Miniprep-Classic (Zymo Research) и 5-мкг колонки с диоксидом кремния (№ по каталогу D4003, Zymo Research) в соответствии с рекомендациями производителя и переходили к ПЦР-анализу со сдвигом биотина (см. вспомогательную информацию). Эту процедуру выполняли по меньшей мере в трех параллелях для каждого нокаутного штамма, начиная с получения электрокомпетентных клеток.

Следует отметить, что при данных условиях репликаты и штаммы подвергаются сходному, но не идентичному числу удвоений клеток в ходе эксперимента по репликации pINF. Однако из-за нерегулируемого начала репликации pINF совпадение удвоений клеток между репликатами и штаммами действительно соответствует совпадению числа событий репликации pINF. Следовательно, данные на фигурах 1 и 3А представлены в виде значений сохранения в % (см. дополнительную информацию для дальнейшего обсуждения) в отличие от оцениваемых значений точности и должны интерпретироваться как таковые.

Изучение клональных pINF

Способность оптимизированных штаммов клонировать pINF оценивали (фигура 3А), как описано выше, со следующими модификациями. После восстановления разбавления восстановленной культуры высевали на 2×YT, содержащую агар (2%), карбенициллин (100 мкг/мл), хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и KPi (50 мМ, pH 7). Планшеты инкубировали при 37°C в течение приблизительно 12 часов. Отдельные колонии отбирали и переносили в 100 мкл 2×YT, содержащей карбенициллин (100 мкг/мл), хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и KPi (50 мМ, pH 7), в лунке 96-луночного планшета. 96-луночный планшет держали при 4°C в течение приблизительно 12 часов, а затем ему обеспечивали условия 37°C и 230 об./мин. Клетки осаждали посредством центрифугирования, декантировали и замораживали после достижения OD600 0,6-0,9. Реплицированные in vivo pINF выделяли с использованием набора ZR Plasmid Miniprep-Classic в соответствии с рекомендациями производителя и передавали на ПЦР-анализ со сдвигом биотина (см. вспомогательную информацию).

Следует отметить, что штамм Pol II+ΔrecA, используемый в данных экспериментах (фигура 3A), имел кассету neo в прежнем локусе recA (P_polB(-)lexA-polB+FRT+ΔrecA+KanR+lacZYA:: P_lacUV5-ΔΔ(CoOp) col 2.1, таблица S1).

Интеграция UBP в arsB

Интеграционную кассету UBP для локуса arsB конструировали, как описано выше и изображено на фигуре S4. Интеграцию этой кассеты выполняли с использованием стандартного метода рекомбинационной инженерии с Lambda Red 24 со следующими модификациями. Инкубируемые на протяжении ночи культуры штаммов (WT-Opt, ΔrecA-Opt и Pol II+ΔrecA-Opt в 2×YT, содержащей хлорамфеникол (5 мкг/мл) и KPi (50 мМ, pH 7)), имеющих pKD46, разбавляли до 0,03 OD600 в 2×YT, содержащей ампициллин (100 мкг/мл), хлорамфеникол (5 мкг/мл) и KPi (50 мМ, pH 7). Культуры выращивали до приблизительно 0,1 OD600, затем индуцировали с помощью 0,4% L-(+)-арабинозы и обеспечивали продолжение роста до приблизительно 0,4 OD600. Из этих культур получали электрокомпетентные клетки, как описано выше. Смешивали 50 мкл электрокомпетентных клеток с 960 нг (5 мкл при 192 нг/мкл) интеграционной кассеты, описанной выше и электропорировали, как описано выше. Трансформированные клетки разбавляли до конечного объема 1 мл 2×YT, содержащей хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и KPi (50 мМ, pH 7), переносили в пробирку объемом 1,5 мл, и обеспечивали восстановление в течение 2 часов при 37°C и 230 об./мин. Клетки осаждали посредством центрифугирования и повторно суспендировали в 115 мкл 2×YT, содержащей хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ), KPi (50 мМ, pH 7). 15 мкл образцов этой клеточной суспензии высевали на 2×YT, содержащую агар (2%), канамицин (50 мкг/мл), хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и KPi (50 мМ, pH 7). Планшеты инкубировали в течение 14-24 часов при 37°C. Колонии отбирали и переносили в 500 мкл 2×YT, содержащей канамицин (50 мкг/мл), хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ), KPi (50 мМ, pH 7) в 48-луночный планшет (исходный № 677180, Greiner Bio-One). Планшеты либо охлаждали при 4°C в течение ~ 12 часов с последующей инкубацией при 37°C и 230 об./мин., либо подвергали непосредственно инкубации. После достижения 0,6-1 OD600 из культур отбирали образцы следующим образом: 100 мкл объединяли с 100 мкл глицерина (50%) и замораживали при -80°C; 350 мкл осаждали посредством центрифугирования и замораживали для дальнейшего выделения геномной ДНК; 50 мкл осаждали посредством центрифугирования, один раз промывали 200 мкл diH2O, осаждали посредством центрифугирования и повторно суспендировали в 200 мкл.

Клеточные суспензии анализировали посредством ПЦР со сдвигом биотина в колонии (см. вспомогательную информацию). Геномную ДНК выделяли из сохраненных замороженных клеточных осадков для образцов, которые демонстрировали высокие процентные значения сдвига в отношении ПЦР со сдвигом биотина в колонии (≥ 80%) с набором PureLink Genomic DNA Mini (Thermo Fisher Scientific) в соответствии с рекомендациями производителя. Геномную ДНК анализировали посредством ПЦР со сдвигом биотина (см. вспомогательную информацию). Этот анализ выявил клоны с высоким уровнем сохранения (сохранениеВ ≥ 90%) для всех генетических фонов. Хотя эти результаты подтвердили успешную хромосомную интеграцию UBP и чрезвычайно высокий уровень сохранения UBP в хромосомной ДНК, предполагалось, что клетки расходовали dTPT3TP и dNaMTP в своей среде во время протокола интеграции с учетом требования протокола инкубировать клетки при высокой плотности клеток. Известно, что активно растущие культуры E. coli разлагают внеклеточные dTPT3TP и dNaMTP до соответствующих им ди- и монофосфата и нуклеозидных соединений.5 Чтобы оценить эту возможность, исходные глицериновые растворы образцов с наивысшим уровнем сохранения использовали для инокуляции 100 мкл 2×YT, содержащей канамицин (50 мкг/мл), хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и KPi (50 мМ, pH 7), в 96-луночном планшете. Культуры выращивали до приблизительно 0,6 OD600 при 37°C и 230 об./мин. Клетки из этой культуры высевали, отбирали, выращивали и отбирали из них образцы, как описано выше. С помощью этой процедуры "пересева" быстро выявляли клоны из ΔrecA-Opt и Pol II+ΔrecA-Opt SSO с не поддающейся выявлению хромосомной потерей UBP (сохранениеВ=100%). Однако несмотря на скрининг 12 клонов для WT-Opt SSO клоны с сохранениемВ > 91% не обнаруживали. Поэтому авторы настоящего изобретения решили использовать интегрант WT-Opt (сохранениеВ=91%), который не подвергался процедуре пересева для экспериментов по времени удвоения и пассажированию. В случае ΔrecA-Opt и Pol II+ΔrecA-Opt авторы настоящего изобретения отбирали по одному клону с сохранениемВ=100% для экспериментов по времени удвоения и пассажированию.

Следует отметить, что штамм Pol II+ΔrecA, используемый в данных экспериментах (фигура 3B и фигура 3C), не имел кассеты neo в прежнем локусе recA (P_polB(-)lexA-polB+ΔrecA+FRT+lacZYA: :P_lacUV5-ΔΔ(CoOp) col 1.1, таблица S1).

Определение времени удвоения для штамма

Клетки в середине логарифмической фазы роста WT-Opt, ΔrecA-Opt и Pol II+ΔrecA-Opt SSO и соответствующие им интегранты хромосомной UBP (описанные выше) получали с использованием следующей процедуры. Насыщенные инкубированные на протяжении ночи культуры получали путем инокуляции 2×YT, содержащей хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и KPi (50 мМ, pH 7), из исходных культур, хранящихся в глицериновом растворе, посредством укола в столбик со средой и выращивания на протяжении ночи (приблизительно 14 часов) при 37°C и 230 об./мин. Эти клетки разбавляли до 0,03 OD600 в 500 мкл 2×YT, содержащей хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и KPi (50 мМ, pH 7), и выращивали при 37°C и 230 об./мин. Рост контролировали с помощью OD600. Как только клетки достигли середины логарифмической фазы роста (0,3-0,5 OD600), их разбавляли до 0,013 OD600 в 500 мкл 2×YT, содержащей хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и KPi (50 мМ, pH 7), или 2×YT, содержащей хлорамфеникол (5 мкг/мл) и KPi (50 мМ, pH 7), в 48-луночном планшете и выращивали при 37°C и 230 об./мин. OD600 измеряли каждые 30 минут. Эту процедуру выполняли в трех параллелях для каждого штамма, начиная с инокуляции инкубированных на протяжении ночи культур.

Данные OD600 каждого эксперимента анализировали для получения теоретического времени удвоения клеток (фигура 3B и фигура S5). Измерения OD600, соответствующие экспоненциальной фазе роста (0,01-0,9), соответствовали следующей модели экспоненциального роста с использованием версии R 3.2.4:25

где ODi представляет собой OD600 в момент времени (t), OD0 представляет собой минимальное значение OD600 для данного набора данных, и СРост представляет собой константу роста. СРост подбирали с использованием команды "nls()". Время удвоения (DT) вычисляли с использованием следующего уравнения:

Пассажирование штаммов, несущих геномную UBP

Исходные культуры, хранящиеся в глицериновом растворе, интегрантов хромосомной UBP из WT-Opt, ΔrecA-Opt, и Pol II+ΔrecA-Opt SSO (описанной выше), полученные посредством укола в столбик со средой, использовали для инокуляции 500 мкл 2×YT, содержащей канамицин (50 мкг/мл), хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и KPi (50 мМ, pH 7). Клетки выращивали до середины логарифмической фазы роста (0,5-0,8 OD600) при 37°C и 230 об./мин, а затем разбавляли до 0,03 OD600 в 500 мкл 2×YT, содержащей канамицин (50 мкг/мл), хлорамфеникол (5 мкг/мл), dTPT3TP (37,5 мкМ), dNaMTP (150 мкМ) и KPi (50 мМ, pH 7), в 48-луночном планшете и выращивали при 37°C и 230 об./мин. Культуры, инокулированные при 0,03 OD600, считали отправной точкой (удвоения=0) для пассажирования. Культуры выращивали до 1-1,5 OD600, что соответствует приблизительно 5 удвоениям клеток. Этот рост от 0,03 до 1-1,5 OD600 считали одним "пассажем", при этом один пассаж соответствует приблизительно 5 удвоениям клеток. После достижения этими образцами 1-1,5 OD600 начинали другой пассаж путем разбавления клеток до 0,03 OD600 в свежей среде того же состава. После разбавления из культуры с 1-1,5 OD600 отбирали образцы следующим образом: 100 мкл объединяли со 100 мкл глицерина (50%) и замораживали при -80°C; 350 мкл осаждали посредством центрифугирования и замораживали для дальнейшего выделения геномной ДНК; и 50 мкл осаждали посредством центрифугирования, один раз промывали 200 мкл diH2O, осаждали посредством центрифугирования и повторно суспендировали в 200 мкл. Процесс пассажирования повторяли для в общей сложности 15 пассажей, что соответствует приблизительно 80 удвоениям клеток для всех трех штаммов.

На протяжении пассажирования проводили ПЦР-анализ со сдвигом биотина в колонии (см. вспомогательную информацию) в образцах клеточной суспензии. Это показало, что сохранение снизилось до < 10% в WT-Opt после 15 пассажей. Следовательно, этот штамм больше не пассажировали. Напротив, сохранение оставалось на уровне 60-80% в ΔrecA-Opt и Pol II+ΔrecA-Opt. Поэтому для этих штаммов был выполнен дополнительный пассаж, как указано выше. Теперь сохранение оставалось без изменений всего 16 пассажей. Следовательно, данные штаммы подвергали 4 дополнительным пассажам при более высоком коэффициенте разбавления, который соответствовал приблизительно 13 удвоениям клеток на пассаж (рост от приблизительно 0,0001 до 1-1,5 OD600). К этому моменту интегранты ΔrecA-Opt и Pol II+ΔrecA-Opt испытывали приблизительно 130 удвоений клеток, и сохранение UBP оставалось на уровне > 40% согласно ПЦР-анализу со сдвигом биотина в колонии. Дальнейшее пассажирование считали ненужным и эксперимент останавливали для более тщательного анализа образцов геномной ДНК, собранных во время пассажирования. Этот эксперимент выполняли в трех параллелях, начиная с инокуляции среды исходными культурами геномных интегрантов, хранящимися в глицериновом растворе, полученными посредством укола в столбик со средой.

После завершения эксперимента с пассажированием геномную ДНК выделяли и анализировали с помощью ПЦР со сдвигом биотина (фигура 3C) (см. вспомогательную информацию). Медленная, а затем быстрая потеря UBP в WT-Opt предполагала, что потере UBP способствовали несколько процессов. Предполагалось, что PlacUV5-PtNTT2(66-575) мог мутировать во время эксперимента, так как экспрессия PtNTT2 вызывает незначительный дефект роста.3 Таким образом, клетки, которые инактивируют транспортер посредством мутации, приобретают преимущество в отношении приспособленности, и могут быстро доминировать в экспериментальной популяции. Эту гипотезу изучали путем выделения отдельных клонов после окончания пассажирования WT-Opt и ПЦР-анализа очищенной геномной ДНК (см. вспомогательную информацию и фигуру S7). Праймер, "блуждающий" по нескольким клонам, показал, что все гены между cat и insB-4, включая PtNTT2 (66-575), были делетированы в этих клетках. Ген insB-4 кодирует один из двух белков, необходимых для транспозиции транспозона IS1.26 Секвенирование одного клона подтвердило, что IS1 вставлен в PtNTT2 (66-575) (T1495), что соответствует делеции пары оснований 15890.

После подтверждения события мутации PtNTT2 (66-575) появление делеционных мутантов оценивали с помощью ПЦР-анализа образцов геномной ДНК из пассажирования интегранта WT-Opt (см. вспомогательную информацию и фигуру S7B). Этот анализ показал, что несколько ампликонов с размерами, соответствующими IS1-опосредованным событиям делеции PtNTT2 (66-575), появляются в образцах пассажирования во время быстрой фазы потери UBP.

Также наблюдали, что один репликат интегранта Pol II+ΔrecA-Opt быстро терял UBP за то же время, что и интегранты WT-Opt, что убедительно свидетельствует о том, что этот репликат мог быть загрязнен клетками WT-Opt во время пассажирования. Эту возможность подтверждали с помощью ПЦР-анализа в колонии, который показал, что этот репликат загрязнялся клетками WT-Opt при пассажах, соответствующих быстрой потере UBP (см. вспомогательную информацию и фигуру S6). Поэтому данные по этому репликату использовали только из образцов без загрязнения клетками WT-Opt.

Бактериальные штаммы и плазмиды

Все штаммы, использованные в этом исследовании (таблица S1; предоставлена в виде отдельного вспомогательного файла), конструировали из E. coli-BL21 (DE3) посредством метода рекомбинационной инженерии с Lambda Red, если не указано иное. Кассеты нокаута гена получали посредством ПЦР-амплификации (с использованием либо OneTaq, либо Q5 в соответствии с рекомендациями производителя (New England Biolabs)) либо геномной ДНК штаммов из коллекции Keio, либо pKD13 с соответствующими праймерами (таблица S1). Функциональные генетические кассеты нокина polA(D424A, K890R) и Pol II+ (фигура S4) конструировали посредством ПЦР с перекрывающимися праймерами. Штаммы делали компетентными для импорта dXTP либо путем трансформации с помощью pACS2 или pACS2-dnaQ(D12N), либо путем интеграции кассеты PlacUV5-PtNTT2(66-575)+cat в локус lacZYA (фигура S1). Конструкция pACS2 и PlacUV5-PtNTT2 (66-575)+cat была описана ранее.3 pACS2-dnaQ(D12N) конструировали посредством сборки ПЦР-ампликонов методом Гибсона. Функцию PtNTT2 подтверждали в каждом соответствующем штамме с использованием анализа поглощения радиоактивного dATP.

Дефицит экзонуклеаз Pol I и III

Гены ДНК Pol I и III являются условно необходимыми и незаменимыми соответственно. Следовательно, в отличие от SOS-регулируемых полимераз, они не могут быть исследованы с помощью генетического нокаута. Вместо этого авторы настоящего изобретения конструировали мутантов с дефицитом 3'-5'-экзонуклеазы для этих ферментов. Pol I (polA) делали дефицитной по 3'-5'-экзонуклеазе путем мутации активного сайта его домена экзонуклеазы (D424A). Это осуществляли посредством двух фаз метода рекомбинационной инженерии с Lambda Red (фигура S4). Первую polA усекали до ее домена 5'-3'-экзонуклеазы (удаляя домены как полимеразы, так и 3'-5'-экзонуклеазы). Вторые домены полимеразы и 3'-5'-экзонуклеазы повторно вводили с мутацией D424A. Из-за длины гена ПЦР-мутации создавали в ампликоне, используемом для интеграций. Это привело к мутации K890R. Однако, поскольку K890 представляет собой поверхностный остаток в неупорядоченной петле белка, предполагали, что его мутация с заменой на аргинин будет оказывать минимальное влияние на функцию белка. Более того, мутация с заменой лизина на аргинин поддерживает приблизительный заряд и размер остатка.

Полный фермент ДНК Pol III представляет собой мультиферментный комплекс с отдельными ферментами полимеразы и 3'-5'-экзонуклеазы. Считают, что экзонуклеазный фермент (dnaQ) играет структурную роль в полном ферменте Pol III в дополнение к его редактирующей активности. Следовательно, делеция dnaQ устраняет редактирующую активность Pol III, а также предотвращает рост клеток, если только компенсаторные мутации не добавлены в другие части полного фермента. Поэтому авторы настоящего изобретения решили исследовать роль Pol III в репликации UBP посредством экспрессии мутанта мутатора dnaQ (D12N) из плазмиды pACS2+dnaQ(D12N) (фигура S1). Ранее было продемонстрировано, что экспрессия dnaQ(D12N) из мультикопийной плазмиды приводит к образованию фенотипа доминантного мутатора в E. coli, несмотря на экспрессию DnaQ дикого типа из хромосомной копии гена. pACS2+dnaQ(D12N) экспрессирует dnaQ(D12N) с обоими промоторами нативного гена.

Затраты на приспособленность генетической оптимизации SSO

Делеция recA явно приводит к значительному улучшению сохранения UBP во многих последовательностях. Хотя и очень желательная, делеция recA действительно влечет за собой определенные затраты на приспособленность. Известно, что штаммы с дефицитом recA характеризуются меньшей переносимостью повреждения ДНК. Однако, учитывая, что все краткосрочные применения SSO будут осуществляться в строго контролируемых средах, авторы настоящего изобретения предполагают, что это не будет проблематичным. Кроме того, делеция recA увеличивает время удвоения, как показано на фигуре S5. Однако эти эксперименты выполняли главным образом для иллюстрации различия в скорости роста для несущих хромосомную UBP штаммов, выращиваемых в присутствии или в отсутствии dNaMTP и dTPT3TP. Несколько факторов усложняют непосредственное отношение приспособленности штамма к измеряемому времени удвоения. Основным осложнением является то, что клетки в растворе могут увеличивать OD600, изменяя свою морфологию, а не увеличивая фактическое количество клеток. Несмотря на это, измеряемое время удвоения для L recA-Opt (на ~ 18 минут дольше, чем для WT-Opt) предполагает, что делеция recA приводит к значительному снижению скорости роста. Однако, учитывая преимущества этой модификации, эта сниженная скорость роста является приемлемым компромиссом. Следует также отметить, что некоторые точки данных на фигуре 8 трудно рационализировать. Например, присутствие хромосомной UBP, по-видимому, уменьшает время удвоения L recA-Opt и Pol II+L recA-Opt.

Анализ со сдвигом биотина

Сохранение UBP в pINF и хромосомной ДНК измеряли, как описано ранее, со следующими модификациями. Все ПЦР со сдвигом биотина выполняли в 15 мкл объеме с праймерами (1 мкМ, таблица S1), d5SICSTP (65 мкМ), dMMO2bioTP (65 мкМ), dNTP (400 мкМ), MgSO4 (2,2 мМ), ДНК-полимеразой OneTaq (0,018 ед./мкл), ДНК-полимеразой DeepVent (0,007 ед./мкл, New England Biolabs), SYBR Green I (1x, Thermo Fisher Scientific) и стандартным реакционным буфером OneTaq (1x). Количество ДНК образца, добавленное в ПЦР со сдвигом биотина, и температурный режим варьировали в зависимости от природы образца.

Для in vivo реплицированных pINF (фигура 1) из экспериментов с генетическим нокаутом точная концентрация ДНК pINF не может быть определена, поскольку ДНК pINF и pACS2 захватывали с помощью набора ZR Plasmid Miniprep-Classic. Поэтому 0,5 мкл (приблизительно 3 нг общей ДНК) очищенного образца использовали в качестве ДНК-матрицы для ПЦР со сдвигом биотина. Реакционные смеси подвергали следующему температурному режиму (время в минутах:секундах) с CFX Connect Real-Time PCR Detection System (BioRad): [96°C 02:00 | 12-18 x (96°C 00:15 | 48°C 00:15 | 68°C 04:00)]. Протекание реакции контролировали с помощью флуоресценции SYBR Green I, реакции останавливали и реакционные смеси хранили при 4°C в конце стадии с 68°C сразу после того, как реакция выходила из экспоненциальной фазы ПЦР (обычно 17 циклов) Для экспериментов с клональной pINF (фигура 3А) 3 нг очищенной плазмидной ДНК использовали в качестве ДНК-матрицы для ПЦР-анализа со сдвигом биотина. Реакционные смеси подвергали тому же температурному режиму и контролю, описанному выше.

Сконструированные с помощью Golden Gate pINF и содержащие UBP олигонуклеотиды амплифицировали, как описано выше, с использованием 1 нг и 7,5 пг, соответственно, образца в качестве ДНК-матрицы для ПЦР со сдвигом биотина.

Для экспериментов с хромосомной UBP выполняли ПЦР со сдвигом биотина в колонии и ПЦР-амплификацию со сдвигом биотина очищенной геномной ДНК. Для ПЦР со сдвигом биотина в колонии 2 мкл клеточной суспензии (см. выше) добавляли к смеси для ПЦР со сдвигом биотина в качестве матрицы. Реакционные смеси подвергали следующему температурному режиму и контролировали, как описано выше (время в минутах:секундах): [96°C 02:00 | 5 x (96°C 00:15 | 60°C 00:15 | 68°C 04:00) | 20-22 x (96°C 00:15 | 48°C 00:15 | 68°C 04:00)]. Для ПЦР-амплификации со сдвигом биотина очищенной геномной ДНК использовали 30-125 нг очищенной геномной ДНК в качестве матрицы для ПЦР со сдвигом биотина. Эти реакционные смеси подвергали следующему температурному режиму и контролировали, как описано выше (время в минутах:секундах): [96°C 02:00 | 5 x (96°C 00:15 | 60°C 00:15 | 68°C 04:00) | 10-16 x (96°C 00:15 | 48°C 00:15 | 68°C 04:00)].

Процент меченных биотином ампликонов из любой из описанных выше ПЦР со сдвигом биотина определяли путем смешивания 1 мкл реакционной смеси для ПЦР со сдвигом биотина с 2,5 мкл стрептавидина (2 мкг/мкл, Promega) и 1 мкл Purple Loading Dye (6x, New England Biolabs) и разделения комплексов стрептавидин-ДНК в нативном 6% полиакриламидном геле. Гели окрашивали в 50 мл TBE 1x SYBR Gold (Thermo Fisher Scientific). Гели визуализировали с помощью Molecular Imager Gel Doc XR System (Bio-Rad, Hercules, CA) с фильтром 520DF30 62 мм (Bio-Rad). Время экспозиции изображения ограничивали, чтобы предотвратить насыщение CCD для пикселей в представляющих интерес полосах. Интенсивность флуоресценции полос ДНК и стрептавидина-ДНК определяли количественно с использованием программного обеспечения Quantity One v4.6.9 (Bio-Rad) с использованием локального вычитания фона. Затем рассчитывали процент сдвига (S) для каждого образца на основе объема пикселей в полосах ДНК (VDNA) и стрептавидина-ДНК (VSA-DNA).

Для количественного определения сохранения UBP с помощью ПЦР-анализа со сдвигом биотина требуется нормализация значений сдвига образца до значения сдвига сконструированной in vitro ДНК, содержащей UBP. Для экспериментов по репликации in vivo в клетках с нокаутом генов (фигура 1) значения процента сдвига образца (SS) нормализовали по проценту сдвига собранной с помощью Golden Gate pINF (SGG), используемой для инициации эксперимента по репликации in vivo (сохранениеА).

Хотя было показано, что dTPT3-dNaM и родственные аналоги должны реплицироваться при ПЦР с высокой точностью10 и с ограниченным смещением контекста последовательности11, UBP при ПЦР мутирует с некоторой частотой. Следовательно, получение pINF путем сборки Golden Gate полученной с помощью ПЦР ДНК, содержащей UBP, приводит к получению некоторых мутантных полностью природных pINF. Учитывая, что в экспериментах, представленных на фигуре 1, не выделяли отдельные трансформанты pINF, эти полностью природные pINF будут трансформированы в экспериментальные клетки и реплицированы совместно с содержащими UBP pINF. Это накладывает верхнюю границу на теоретическое максимальное значение процента сдвига для данного образца. Если потеря UBP не происходит in vivo, процент сдвига образца in vivo будет равен таковому собранной с помощью Golden Gate pINF, использованной для инициации эксперимента (сохранениеА=100%). Некоторые репликаты (особенно на фонах ΔrecA) демонстрируют превышающее 100% сохранениеА. Это, вероятно, является результатом выборки собранных с помощью Golden Gate pINF. Если в результате трансформации происходит трансформация только содержащих UBP плазмид, и клетки реплицируют эти плазмиды без потери UBP, то нормализация SS по SGG приведет к значению, превышающему 100%. Если репликация UBP происходит с безупречной точностью, та же логика применяется к любой выборке собранных с помощью Golden Gate pINF, что приводит к более высокому проценту содержащих UBP pINF в клетках, чем у полученных с помощью Golden Gate продуктов. Таким образом, это наиболее очевидно у штаммов с ΔrecA из-за их высокого уровня сохранения UBP.

Эксперименты по клональной pINF и хромосомной UBP (фигура 3) действительно исследовали отдельные трансформанты pINF. Следовательно, мутированные с помощью ПЦР полностью природные pINF могут продуцировать отдельные клоны, которые демонстрируют отсутствие сохранения UBP (SS=0%), но они не влияют на сохранение других клонов, которые получили содержащую UBP pINF. Таким образом, можно ожидать, что SSO, которые получают и точно реплицируют содержащую UBP pINF, имеют значения сдвига, которые соответствуют значению сдвига в ПЦР-анализе со сдвигом биотина химически синтезированного содержащего UBP олигонуклеотида (предполагается, наличие 100% содержания UBP). Чтобы преобразовать значения сдвига образца в значения сохранения (сохранениеВ) для экспериментов, показанных на фигуре 3, значения сдвига образца (SS) нормализовали по значениям сдвига химически синтезированных содержащих UBP олигонуклеотидов (SO). Если потеря UBP не происходит in vivo, процент сдвига образца in vivo будет равен таковому химически синтезированного содержащего UBP олигонуклеотида (сохранениеВ=100%).

Удаление выпадающих и низких значений в отношении собранных с помощью Golden Gate pINF

Все собранные данные представлены со следующими исключениями. Одно выпадание (по критерию Граббса) было удалено с фигуры 1B. Эта точка данных не показала сохранения для мутанта ΔuvrC, реплицирующего последовательность TCAXAGT. Как описано выше, сохранение UBP в собранных с помощью Golden Gate pINF, используемых для инициирования экспериментов, показанных на фигуре 1, устанавливает верхнюю границу сохранения, достигаемую после репликации in vivo. Некоторые препараты собранных с помощью Golden Gate pINF демонстрировали очень низкий уровень сохранения. Данные репликации in vivo, собранные с помощью этих конструкций, не представлены. В частности, данные отбрасывали, если значения % сдвига собранных с помощью Golden Gate pINF были ниже следующих порогов отсечения для каждой последовательности: GTAXAGA-60%, TCAXAGT-70%, TCGXGGT-55%, TCTXGGT-50%, TCCXCGT-55% и TCCXGGT-55%.

Пример 3. Нокаут IS1 повышает стабильность транспортера нуклеозидтрифосфата PtNTT2

Чтобы оценить, способствовало ли отклонение транспонируемого элемента IS1 повышению стабильности (о чем свидетельствует активность) транспортера нуклеозидтрифосфата PtNTT2 во время длительного роста, YZ3 и ΔIS1 серийно пассажировали в трех параллелях на 2xYT+50 мМ KPi+5 мкг/мл Chlor (Media) и анализировали на предмет активности PtNTT2 (Rad/OD600). Пассаж 1 начинали с инокуляции 700 мкл среды культурами, хранящимися в глицериновом растворе, полученными посредством укола в столбик со средой. Культуры выращивали на протяжении ночи (~ 15 часов) до насыщения. Клетки разбавляли в 350 раз в 700 мкл свежей среды. Это повторяли для 6 полных пассажей. Затем клетки пассажировали еще 4 раза с коэффициентом разбавления, увеличенным в 350000 раз. Оценка пассажированных популяций по активности PtNTT2 показывает, что штамм ΔIS1 поддерживает более высокую активность PtNTT2 на протяжении периода длительного роста, предположительно, за счет исключения пути опосредованной IS1 делеции PtNTT2. Поскольку делеция PtNTT2 способствовала потере неприродных пар оснований (UBP), эти результаты свидетельствуют о том, что модифицированная методами генной инженерии клетка-хозяин или полусинтетический организм, лишенный пути опосредованной IS1 делеции PtNTT2, будет демонстрировать повышенное сохранение неприродных пар оснований, и, таким образом, увеличение в продуцировании полипептидов, содержащих неприродные аминокислоты, а также молекул нуклеиновых кислот, кодирующих их.

Хотя предпочтительные варианты осуществления настоящего изобретения были показаны и описаны в данном документе, для специалистов в данной области будет очевидно, что такие варианты осуществления представлены исключительно в качестве примера. Специалисты в данной области теперь смогут осуществить многочисленные вариации, изменения и замещения без отступления от настоящего изобретения. Следует понимать, что различные альтернативы вариантам осуществления настоящего изобретения, описанные в данном документе, могут использоваться при осуществлении на практике настоящего изобретения. Предполагается, что следующая формула изобретения определяет объем настоящего изобретения, и что таким образом охватывает способы и структуры в пределах объема формулы изобретения и их эквиваленты.

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> SYNTHORX, INC.

<120> КОМПОЗИЦИИ НА ОСНОВЕ НЕПРИРОДНЫХ ПАР ОСНОВАНИЙ И СПОСОБЫ ИХ ПРИМЕНЕНИЯ

<130> 46085-712.601

<140>

<141>

<150> 62/612,062

<151> 2017-12-29

<160> 32

<170> PatentIn версия 3.5

<210> 1

<211> 2540

<212> ДНК

<213> Escherichia coli

<400> 1

aaaccaggct cccccaagcc tggttgtagg ctggagctgc ttcgaagttc ctatactttc 60

tagagaatag gaacttcgaa ctgcaggtcg acggatcccc ggaatttttt tataaataca 120

cagccaatca aacgaaacca ggctataatc aagcctggtt ttttgatgga attacagcgt 180

ggcgcaggca ggttttatct taacccgaca ctggcgggac accccgcaag ggacagaagt 240

ctccttctgg ctggcgacgg acaacgggcc gttgcaggtt acgcttgcac cgcaagagtc 300

cgtggcgttt attcccgccg atcaggttcc ccgcgctcag catattttgc agggtgaaca 360

aggcgttcgc ctgacaccgc tggcgttaaa ggattttcac cgccagccgg tgtatggcct 420

ttactgtcgc gcccatcgcc aattgatgaa ttacgaaaag cgcctgcgtg aaggtggcgt 480

taccgtctac gaggccgatg tgcgcccgcc agaacgctat ctgatggagc ggtttatcac 540

ctcaccggtg tgggtcgagg gtgatatgca caatggcgct atcgttaatg cccgtctgaa 600

accgcatccc gactatcgtc cgccgctcaa gtgggtttct attgatattg aaaccacccg 660

ccacggtgag ctgtactgca tcggcctgga aggctgcggg cagcgcatcg tttatatgct 720

ggggccagag aatggcgacg cctccgcgct cgattttgaa ctggaatacg tcgccagccg 780

cccgcagcta ctggaaaaac tcaacgcctg gtttgccaac tacgatcctg atgtgatcat 840

cggttggaac gtggtgcagt tcgatctgcg aatgctgcaa aaacatgccg agcgttaccg 900

tattccgctg cggctggggc gcgataacag tgagctggag tggcgcgagc acggctttaa 960

aaacggcgtc ttttttgccc aggctaaagg tcggctaatt atcgacggta tcgaggcgct 1020

gaaatccgcg ttctggaatt tctcttcatt ctcgctggaa accgtcgctc aggagttatt 1080

aggcgaagga aaatctatcg ataacccgtg ggatcgaatg gacgaaattg accgccgttt 1140

cgccgaagat aaacctgcgc tggcgactta taacctgaaa gattgcgagc tggtgacgca 1200

gattttccat aaaactgaaa tcatgccatt tttactcgaa cgagcgacgg tgaacggcct 1260

gccggtagac cgccacgggg gatcggtggc ggcgtttggt catctctatt ttcctcgtat 1320

gcaccgcgct ggttatgtcg cgcctaatct cggcgaagtg ccgccacacg ccagccctgg 1380

cggctacgtg atggattcac ggccagggct ttatgattcg gtactggtgc tggactataa 1440

aagcctgtac ccgtcgatca tccgcacctt tctgattgat cccgtcgggc tggtggaagg 1500

catggcgcag cctgatccag agcacagtac cgaaggtttt ctcgatgcct ggttctcgcg 1560

agaaaaacat tgcctgccgg agattgtgac taacatctgg cacgggcgcg atgaagccaa 1620

acgccagggt aacaaaccgc tgtcgcaggc gctgaaaatc atcatgaatg ccttttatgg 1680

cgtgctcggc accaccgcct gccgcttctt cgatccgcgg ctggcatcgt cgatcaccat 1740

gcgtggtcat cagatcatgc ggcaaaccaa agcgttgatt gaagcacagg gctacgacgt 1800

tatctacggc gataccgact caacgtttgt ctggctgaaa ggcgcacatt cggaagaaga 1860

agcggcgaaa atcggtcgtg cactggtgca gcacgttaac gcctggtggg cggaaacgct 1920

gcaaaaacaa cggctgacca gcgcattaga actggagtat gaaacccatt tctgccgttt 1980

tctgatgcca accattcgcg gagccgatac cggcagtaaa aagcgttatg ccggactgat 2040

tcaggagggc gacaagcagc ggatggtgtt taaagggctg gaaaccgtgc gcaccgactg 2100

gacgccgctg gcccagcagt ttcagcagga gctatacctg cgcatcttcc gcaacgagcc 2160

atatcaggaa tatgtacgcg aaaccatcga caaactgatg gcgggtgaac tggatgcgcg 2220

actggtttac cgtaaacgcc ttcgccgtcc gctgagcgag tatcagcgta atgtgccgcc 2280

tcatgtacgc gccgctcgcc ttgccgatga agaaaaccaa aagcgtggtc gccccttgca 2340

atatcagaat cgcggcacca ttaagtacgt atggaccacc aacggcccgg agccgctgga 2400

ctaccaacgt tcaccactgg attacgaaca ctatctgacc cgccagctac aacccgtggc 2460

ggagggaata ctccctttta ttgaggataa ttttgctaca cttatgaccg ggcaacttgg 2520

gctattttga gcaaaaaaaa 2540

<210> 2

<211> 2436

<212> ДНК

<213> Escherichia coli

<400> 2

tgactgtata aaaccacagc caatcaaacg aaaccaggct ataatcaagc ctggtttttt 60

gatggaatta cagcgtggcg caggcaggtt ttatcttaac ccgacactgg cgggacaccc 120

cgcaagggac agaagtctcc ttctggctgg cgacggacaa cgggccgttg caggttacgc 180

ttgcaccgca agagtccgtg gcgtttattc ccgccgatca ggttccccgc gctcagcata 240

ttttgcaggg tgaacaaggc gttcgcctga caccgctggc gttaaaggat tttcaccgcc 300

agccggtgta tggcctttac tgtcgcgccc atcgccaatt gatgaattac gaaaagcgcc 360

tgcgtgaagg tggcgttacc gtctacgagg ccgatgtgcg cccgccagaa cgctatctga 420

tggagcggtt tatcacctca ccggtgtggg tcgagggtga tatgcacaat ggcgctatcg 480

ttaatgcccg tctgaaaccg catcccgact atcgtccgcc gctcaagtgg gtttctattg 540

atattgaaac cacccgccac ggtgagctgt actgcatcgg cctggaaggc tgcgggcagc 600

gcatcgttta tatgctgggg ccagagaatg gcgacgcctc cgcgctcgat tttgaactgg 660

aatacgtcgc cagccgcccg cagctactgg aaaaactcaa cgcctggttt gccaactacg 720

atcctgatgt gatcatcggt tggaacgtgg tgcagttcga tctgcgaatg ctgcaaaaac 780

atgccgagcg ttaccgtatt ccgctgcggc tggggcgcga taacagtgag ctggagtggc 840

gcgagcacgg ctttaaaaac ggcgtctttt ttgcccaggc taaaggtcgg ctaattatcg 900

acggtatcga ggcgctgaaa tccgcgttct ggaatttctc ttcattctcg ctggaaaccg 960

tcgctcagga gttattaggc gaaggaaaat ctatcgataa cccgtgggat cgaatggacg 1020

aaattgaccg ccgtttcgcc gaagataaac ctgcgctggc gacttataac ctgaaagatt 1080

gcgagctggt gacgcagatt ttccataaaa ctgaaatcat gccattttta ctcgaacgag 1140

cgacggtgaa cggcctgccg gtagaccgcc acgggggatc ggtggcggcg tttggtcatc 1200

tctattttcc tcgtatgcac cgcgctggtt atgtcgcgcc taatctcggc gaagtgccgc 1260

cacacgccag ccctggcggc tacgtgatgg attcacggcc agggctttat gattcggtac 1320

tggtgctgga ctataaaagc ctgtacccgt cgatcatccg cacctttctg attgatcccg 1380

tcgggctggt ggaaggcatg gcgcagcctg atccagagca cagtaccgaa ggttttctcg 1440

atgcctggtt ctcgcgagaa aaacattgcc tgccggagat tgtgactaac atctggcacg 1500

ggcgcgatga agccaaacgc cagggtaaca aaccgctgtc gcaggcgctg aaaatcatca 1560

tgaatgcctt ttatggcgtg ctcggcacca ccgcctgccg cttcttcgat ccgcggctgg 1620

catcgtcgat caccatgcgt ggtcatcaga tcatgcggca aaccaaagcg ttgattgaag 1680

cacagggcta cgacgttatc tacggcgata ccgactcaac gtttgtctgg ctgaaaggcg 1740

cacattcgga agaagaagcg gcgaaaatcg gtcgtgcact ggtgcagcac gttaacgcct 1800

ggtgggcgga aacgctgcaa aaacaacggc tgaccagcgc attagaactg gagtatgaaa 1860

cccatttctg ccgttttctg atgccaacca ttcgcggagc cgataccggc agtaaaaagc 1920

gttatgccgg actgattcag gagggcgaca agcagcggat ggtgtttaaa gggctggaaa 1980

ccgtgcgcac cgactggacg ccgctggccc agcagtttca gcaggagcta tacctgcgca 2040

tcttccgcaa cgagccatat caggaatatg tacgcgaaac catcgacaaa ctgatggcgg 2100

gtgaactgga tgcgcgactg gtttaccgta aacgccttcg ccgtccgctg agcgagtatc 2160

agcgtaatgt gccgcctcat gtacgcgccg ctcgccttgc cgatgaagaa aaccaaaagc 2220

gtggtcgccc cttgcaatat cagaatcgcg gcaccattaa gtacgtatgg accaccaacg 2280

gcccggagcc gctggactac caacgttcac cactggatta cgaacactat ctgacccgcc 2340

agctacaacc cgtggcggag ggaatactcc cttttattga ggataatttt gctacactta 2400

tgaccgggca acttgggcta ttttgagcaa aaaaaa 2436

<210> 3

<211> 2008

<212> ДНК

<213> Escherichia coli

<400> 3

ttattgcacg aagcgcgagg taacgtactg gctgtaatca ttcgctacag ccgggacctt 60

gccctgctct ttcaaaaact gcgcggtgtc gatgatcgct ttgttcaccg gtccggtcag 120

ttctgccgtt tgttgctgcg gcgtcagata ggtattcccc ttcaccagcc ccggaacgtc 180

accttcaggc acgccgctta accgcgccag tttgctgatg ttttccggct gtttcagcca 240

cgcgtctggg ttagcaatgt acggttgctg agcatcgatg gcgcttttgg cgaacgcttt 300

caccacctca ggatgtttct cggcaaaatc tttgcgcacc acccagacgt ccagcgttgg 360

cgcaccccac tgcccgacct gttcagaatc ggtcagcact ttgccgtctt tttccagggc 420

gttaaccgcc ggtgcccaga cataagcacc atcaatatct ccccgctgcc atgcagcgat 480

aatcgcgggc ggctgcaggt tcacaatctc cacttgccca ggtttaatgc cccagtgttt 540

cagcgctgcc agcaggctgt agtgggtggt agagataaac ggtacggcga tgcgtttgcc 600

aatcagatct tccggtttgc tgatagtttt ctttaccacc agcgcttctg agttacccag 660

ttttgacgcc agcaagaaga cttcaatcgg cacctgttgg ctggctgcaa ccgctaacgg 720

gctggaacca aggttgccga tttgcacgtc gccagaagcc agcgcccgca cgatgctggc 780

tccgctgtca aacttacgcc agtccacggt tgctccgctt tctttagcaa aggtgttgtc 840

ggcctgagcc actttcgccg gttcggctga ggtttgatac gccacggtga cgttcaccgc 900

ctgtgcctga aaagcgatga atgccagtgc ggcaagaagt gtgtttcgcg atgaaattgc 960

catgattgtc tgctcccctg tcttgttatg ggagcagtat tcaggaataa aaacattcat 1020

taaaagaatt agtcgttatc gcacagatga ttttattctt agcaaaaaaa cggtgatgct 1080

gccaacttac tgatttagtg tatgatggtg tttttgaggt gctccagtgg cttctgtttc 1140

tatcagctgt ccctcctgtt cagctactga cggggtggtg cgtaacggca aaagcaccgc 1200

cggacatcag cgctatctct gctctcactg ccgtaaaaca tggcaactgc agttcactta 1260

caccgcttct caacccggta cgcaccagaa aatcattgat atggccatga atggcgttgg 1320

atgccgggca actgcccgca ttatgggcgt tggcctcaac acgattttac gtcacttaaa 1380

aaactcaggc cgcagtcggt aacctcgcgc atacagccgg gcagtgacgt catcgtctgc 1440

gcggaaatgg acgaacagtg gggctatgtc ggggctaaat cgcgccagcg ctggctgttt 1500

tacgcgtatg acaggctccg gaagacggtt gttgcgcacg tattcggtga acgcactatg 1560

gcgacgctgg ggcgtcttat gagcctgatg tcaccctttg acgtggtgat atggatgacg 1620

gatggctggc cgctgtatga atcccgcctg aagggaaagc tgcacgtaat cagcaagcga 1680

tatacgcagc gaattgagcg gcataacctg aatctgaggc agcacctggc acggctggga 1740

cggaagtcgc tgtcgttctc aaaatcggtg gagctgcatg acaaagtcat cgggcattat 1800

ctgaacataa aacactatca ataagttgga gtcattacca ggccgacaaa atggaggcaa 1860

agaccaacaa agaaaagtag ttaacctagg ctgctgccac cgctgagcaa taagactcct 1920

gttgatagat ccagtaatga cctcagaact ccatctggat ttgttcagaa cgctcggttg 1980

ccgccgggcg ttttttattg gtgagaat 2008

<210> 4

<211> 17210

<212> ДНК

<213> Escherichia coli

<400> 4

ttattgcacg aagcgcgagg taacgtactg gctgtaatca ttcgctacag ccgggacctt 60

gccctgctct ttcaaaaact gcgcggtgtc gatgatcgct ttgttcaccg gtccggtcag 120

ttctgccgtt tgttgctgcg gcgtcagata ggtattcccc ttcaccagcc ccggaacgtc 180

accttcaggc acgccgctta accgcgccag tttgctgatg ttttccggct gtttcagcca 240

cgcgtctggg ttagcaatgt acggttgctg agcatcgatg gcgcttttgg cgaacgcttt 300

caccacctca ggatgtttct cggcaaaatc tttgcgcacc acccagacgt ccagcgttgg 360

cgcaccccac tgcccgacct gttcagaatc ggtcagcact ttgccgtctt tttccagggc 420

gttaaccgcc ggtgcccaga cataagcacc atcaatatct ccccgctgcc atgcagcgat 480

aatcgcgggc ggctgcaggt tcacaatctc cacttgccca ggtttaatgc cccagtgttt 540

cagcgctgcc agcaggctgt agtgggtggt agagataaac ggtacggcga tgcgtttgcc 600

aatcagatct tccggtttgc tgatagtttt ctttaccacc agcgcttctg agttacccag 660

ttttgacgcc agcaagaaga cttcaatcgg cacctgttgg ctggctgcaa ccgctaacgg 720

gctggaacca aggttgccga tttgcacgtc gccagaagcc agcgcccgca cgatgctggc 780

tccgctgtca aacttacgcc agtccacggt tgctccgctt tctttagcaa aggtgttgtc 840

ggcctgagcc actttcgccg gttcggctga ggtttgatac gccacggtga cgttcaccgc 900

ctgtgcctga aaagcgatga atgccagtgc ggcaagaagt gtgtttcgcg atgaaattgc 960

catgattgtc tgctcccctg tcttgttatg ggagcagtat tcaggaataa aaacattcat 1020

taaaagaatt agtcgttatc gcacagatga ttttattctt agcaaaaaaa ctgtaggctg 1080

gagctgcttg aagttcctat actttctaga gaataggaac ttcgaactgc aggtcgacgg 1140

atccccggaa ttagaacgta atttacctgc cggaacttat tcactccgac aagaacttat 1200

ccgtacagga gattaaaatg ataaaacgga cgttattagc ggcggccatt tttagcgcat 1260

tgcccgctta tgccgggtta acttccatta ccgcgggcta cgattttacc gattattctg 1320

gcgatcatgg caaccgtaat ttagcgtatg ctgaactggt ggcgaaagtt gaaaacgcaa 1380

cgctgctttt taatctttcc caggggcgtc gtgattatga aactgaacat ttcaatgcca 1440

ctcgcggtca gggtgcggtc tggtataaat ggaataactg gctgacaacc cgaacgggta 1500

ttgcctttgc ggataatacg ccggtctttg cccgccagga ttttcgtcag gatattaacc 1560

tggccctgtt gccaaaaacg cttttcacga ccggttatcg ctacactaaa tattacgatg 1620

atgtcgaagt cgatgcctgg caaggcggcg tatcactcta tactggcccg gtgatcacca 1680

gctaccgcta tacccattat gactccagcg atgcaggtgg tagttatagc aatatgattt 1740

ccgtgcgtct gaatgacccg cgcggcactg gttatacgca actatggcta agccgcggaa 1800

caggcgctta cacctatgac tggacgccag aaacacgcta cggcagcatg aagagcgtca 1860

gtctgcaacg tattcaaccg ctgactgagc aacttaatct cgggctgacg gcaggtaaag 1920

tgtggtacga caccccaacc gatgattata acggtctgca acttgcagcc catctgacct 1980

ggaaattctg attccttctg ccgcccgcta tccggggcgg ccttccctgc cgattagccc 2040

ccccctttcc tctttgtttt ccgaccacat tcaccggata aattttattc tccagtgtta 2100

tatactatag gggggtatgc attgacatat agcatacccc cctatagtat attgcgtgca 2160

gataatgagg tgcgaaatgc ccagtactcc ggaagagaag aaaaaggtcc ttactcgagt 2220

tcgtcgtatt cgagggcaga ttgatgctct ggaacggtcg ctggagggtg atgccgaatg 2280

ccgtgccata ctccaacaga tcgctgccgt tcggggcgcg gctaatgggc tgatggcaga 2340

agtgcttgaa agccatatcc gggaaacgtt tgaccgaaat gactgctaca gccgcgaagt 2400

cagccaatcc gttgacgaca ctattgaact ggttcgagcc tatcttaaat agctgaatct 2460

attaccatat tgaggaagag cgagagatga aatcacgtgc tgccgttgca tttgctcccg 2520

gtaaaccgct ggaaatcgtt gaaattgacg ttgcaccacc gaaaaaaggt gaagtgctga 2580

ttaaagtcac ccataccggc gtttgccata ccgacgcatt taccctctcc ggggatgacc 2640

cggaaggtgt attcccggtg gttctcggtc acgaaggggc cggcgttgtg gttgaagtcg 2700

gtgaaggcgt aaccagcgtc aaacctggcg accatgtgat cccgctttac accgcggagt 2760

gcggcgagtg tgagttctgt cgttctggca aaactaacct ctgtgttgcg gttcgcgaaa 2820

cccagggtaa aggcttgatg ccagacggca ccacccgttt ttcttacaac gggcagccgc 2880

tttatcacta catgggatgc tcaacattca gtgaatacac cgtggtcgcg gaagtgtctc 2940

tggccaaaat taatccagaa gcaaaccatg aacacgtctg cctgctgggc tgtggcgtga 3000

ccaccggtat tggcgcggtg cacaacacag ctaaagtcca gccaggtgat tctgttgccg 3060

tgtttggtct tggcgcgatt ggtctggcag tggttcaggg cgcgcgtcag gcgaaagcgg 3120

gacggattat cgctatcgat accaacccga agaaattcga tctggctcgt cgcttcggtg 3180

ctaccgactg cattaacccg aatgactacg acaaaccgat taaagatgtc ctgctggata 3240

tcaacaaatg gggtatcgac catacctttg aatgcatcgg taacgtcaac gtgatgcgtg 3300

cggcgctgga aagtgcgcac cgcggctggg gtcagtcggt gatcatcggg gtagcaggtg 3360

ccggtcagga aatctccacc cgaccattcc agttggtcac cggtcgcgta tggaaaggtt 3420

ccgcgtttgg cggcgtgaaa ggtcgttccc agttaccggg tatggttgaa gatgcgatga 3480

aaggtgatat cgatctggaa ccgtttgtca cgcataccat gagccttgat gaaattaatg 3540

acgccttcga cctgatgcat gaaggcaaat ccattcgaac cgtaattcgt tactgatttc 3600

ccgcaggtat accccgtcca cttcagacgg ggttcttaat actctccctg ggcagccgtc 3660

cgggggatta accgtgagat aatgactgat ggaactcatt gaaaaacatg ccagctttgg 3720

cggctggcaa aatgtgtatc ggcattattc ccaatcactg aaatgtgaaa tgaatgtcgg 3780

cgtctatctc ccaccaaaag ccgcgaatga aaaattgccg gtgttgtact ggctttcagg 3840

cctgacttgc aacgagcaga atttcattac taaatcgggg atgcagcgtt acgcggctga 3900

gcacaacatt attgttgttg cgccggacac cagtccgcga ggcagtcatg tcgcagatgc 3960

tgaccgttac gatctcgggc aaggtgccgg gttttacctg aacgcgacgc aagcgccgtg 4020

gaatgaacat tacaaaatgt atgactatat ccgcaacgag ctgccggatt tagtgatgca 4080

tcattttccg gcaacggcca aaaagtctat ctctggtcat tctatgggcg ggctgggcgc 4140

gctggtgctg gcgttacgta acccagatga atatgtcagc gtctcggcgt tttcgcccat 4200

tgtctcccca tcgcaagtgc cgtggggaca gcaagccttt gctgcatatc ttgctgaaaa 4260

taaagatgcc tggttggatt acgacccggt gagtcttatt tcacaaggtc aacgcgttgc 4320

ggaaatcatg gttgatcagg ggttgagtga tgatttttac gcagaacagc tgcggactcc 4380

aaatcttgaa aagatctgcc aggagatgaa tatcaagacg ttaatccgtt atcacgaggg 4440

ttatgatcac agctattatt ttgtctccag ttttattggc gagcatattg cctaccacgc 4500

caataaactg aatatgcgtt gataatagtg cacgactgcc ggatgcggcg tgaacgcctt 4560

atccggccta cacttcgccc gtaaaccgta ggcctgataa gacgcgcaaa gcgtcgcatc 4620

aggcatggcg cacgactgcc ggatgcggcg tgaacgcctt atccggtcta cacttcgccc 4680

ataaaccgta ggcctgataa gacgcgcata gcgtcgcatc aggcatctgc gcacgactta 4740

tctatgttta ccacatcaaa tcatcaggca ctttgaagtc ggcatacggg tcgtcttcat 4800

cctgctcttc ggcgctgagc gcgctgtgca acactatact gctggcatcg cgctgagcaa 4860

ttttatcggc aacgctggcg ggaataatgg cgtattcacc ttcgctattg ttatcgacca 4920

acaagcgggc aatcgccaga cgaccattaa tcaactgcgc ctgtgtgagc ttatcgacaa 4980

aaatcttctt aatcagattg ccgtcagtga agttaaaacc aatatcgcca ttggcaatgg 5040

tgattcggtt catttcaata agctgcttca cctgagcttt atattctttc gccaacgccg 5100

cttgtttttg ctgttcgcta agctgtttat cacgctcaag ctgtgccttt ttattttctt 5160

ctaccgccgc ccgagcttca cgcgcctgaa cgcgcgattt tttcgccgtt ctctccacct 5220

tcgccgcttt tttgctggtg actaatcctg ctttgagcaa ctgctcttgt aaggtaagtt 5280

ttgccatctt tgtttccaaa cccgctgaat aatttttagc gagtatacct gtaaacgccg 5340

taggtgtatt ggggtgaagt ccctttcgcc cctgcctaat aaggcacgtc aggcatcggc 5400

gcacggctgt attcgtgatc tccggctcat caaaataaac accgccaacc cagcaacaag 5460

aatacccggt gcagaagcgg ccattacgcc gaccgtgcca gtgcctaatg ccagcatttt 5520

cccggccagt aacggaccgc tcatagcccc cagacgccct accgccacgg ctgttcccac 5580

acctgttgcg cggatctgcg aactgtaaaa caacggtgcc agggcataca aaacgctttg 5640

cccacctgtc gcaaacaacc ccgcgacaaa tcccgccagc aacataccgt taaatgacga 5700

caccgttcca agcgccagca gcgaagctaa catgccgcta taaatcagta gcgacatggt 5760

tactggacgc agcttatcca tcaatgcgcc caacattaac gtcccgcttg ccgcccccat 5820

ttgcagggca aacatcaccc ctgccgcctg cgatggctgg aatccttgct ccaccaaaag 5880

tagcggtagc cagttgatca acatgtagac caccagcaga gtgaagaaat aacacaacca 5940

cagcagcagc gtcgcggttg ccgtttctgg cgcaaataag gcacgcagtg gtggcgcaga 6000

ctgtttttcg ccagcgaaaa ccgccgactc cggcagccag cgcattaata gcggcaccag 6060

aatcaacggc accacaccac ctacccaaaa caccgtttgc catgctaagt ttgcccccgc 6120

gaaacccagt gtcgccgcca gcgccgcgcc aatgggaaca ccgcaataca tcaggctcac 6180

tgccgtccca cgaaaacgtg gacccgcggc ttcagacgtc agggcgataa gattcggcaa 6240

cgccgccccc agcccgacac cggtcatcag ccgcgcaaag accagtgagg ggaaatccca 6300

ggcaatcgcc gttgccagtg agaacaaacc aaacagcgca actgagccaa tcaaaatacg 6360

cttacgacca taacggtccg ccagcattcc gccaaccaac gcgccgggta gcaaaccgag 6420

tattccggcg ctaaatatcc agcccatttg cattttatcg agtgcgaaag cctgggcgat 6480

gccacccgcc gcaatgccag ccgcctgaag atccagccct tccatcagag cgaccaaaaa 6540

acaaagcccg atggtcagca tcaggcggga tgaagatgat gaaggggtac gagtcgacat 6600

aagatgaacc tcattgcgag tgcaggtgaa tcgcgactga tacattgcca gccgcgtaat 6660

cagaactatt gaatgactgc ctacgggcga aatgtaggcc ggataaggcg ttcacgccgc 6720

atccggcagt cgtgtgcaga tgcctgatgc gacgcttgcg cgtcttatca ggcctacaaa 6780

ttcccgcgcc atccgtaggc cggataaggc gtttacgccg catccggcag tcgtgcgcag 6840

atgcctgatg cgacgctaac gcgtcttatc aggcctacaa attctcgcgc catccgtagg 6900

ccggacaaga cgttcacgcc gcatccggca gtcgtgctgg gatgggcata caaaatgcac 6960

attctcggca gtcaatatta tttgttgttg cgcagatcca gcgccacgtc gacgatcata 7020

tcctcctggc cgccaaccat ccggcgtttg cccagctcaa cgagaatatc caccgcgctt 7080

aagccataac gcgccgccgc cgtttcacag tgacgcagga agctggagta aacaccagcg 7140

tatcccagcg ccagcgtttc gcgatcgact cgtaccggtc gatcctgcaa cggacgcacc 7200

aggtcgtcag cggcatccat taacgcatag agatcggtcc catgctgcca gcccagttta 7260

tccgcggcgg caataaatac ttccagcggc gcgttacctg cgcccgcgcc cattcccgcg 7320

aggctggcgt cgattcggtc gcagccctct tccaccgcct cgatagagtt cgccacgcca 7380

agactcaggt tatggtgagc gtgcatgccg gtttgcgttt ctggtttcaa cactgctttc 7440

agggcgcgga aacggtcacg gatatcgctc atgttcatcg caccgccaga atccaccaca 7500

taaatacagg tcgcaccgta gccttccatc agctttgcct gctttgcgag attctctggc 7560

gtggtcatat ggctcatcat cagaaaacca acggtgtcca ttccgagctc gcgggcatac 7620

tgaatatgct gggcggaaac atcagcttcg gtacagtgcg tagccacacg aaccacccgc 7680

gcgccagctt gccaggcatt tttcagatcg tgaatagtgc cgattcctgg cagcaacaac 7740

gtcgcgattt tggcgtgctt caccacatcc gccgctgctt caatccattc aaggtcgcta 7800

tgtgcgccga aaccatagtt aaagctggaa ccctgcaaac cgtcgccgtg ggccacttca 7860

atcgaatcca cgtgggcatc gtccagtgct ttggcaatct ggcgaacgtt ttccagcgaa 7920

tactgatgac gaatggcgtg cataccgtca cgcaacgtga cgtccgagat ataaagtttt 7980

ttaccgttca tgccgcttct cctgccttgc gcgccagtga ctgggccatt ttttccgctg 8040

tcgccagcgc actggaagtc ataatgtcga ggttgcccgc ataggcaggc agataatgcg 8100

ctgcgccttc gacttccagc cagaccgctg ttttcagtcc ggagaattgc cccacgcccg 8160

gtaaattgac cggtttatcc tgcgggataa cttcaaactg cacgcgctgt ttcaggcgat 8220

aacccggtac gtaagcctgc accgcctcag ccatttcatt gattgaggct tcgatatcat 8280

cttgtgaagc ttcgtcgctc aatacataca ccgtgtcacg catcatcaac ggtggctctg 8340

ctgggttaag cacaataatc gccttccctt ttgccgcgcc gcccaccact tcaatggctc 8400

gggaagtggt ttccgtaaat tcatcgatat tggcacgcgt gccaggtccg gcagatttac 8460

tggcgataga agcgataatt tcggcgtaat gaacacgcgc cacgcgtgaa actgccgcca 8520

ccattggaat ggtggcctgg ccgccgcagg tgaccatgtt gacgttcagt tgatcgacgt 8580

tcgcctcgag gttaaccacc ggcacgcagt aagggccgat ggcagcaggc gtcaggtcaa 8640

ttaagcgaat atccggtttc gcttcgcgta aagcggcatc gtttttcaca tgagcaccgg 8700

cgctggtcgc atcaaataca atgtcgatat cagcaaattc aggcatgttc atcagtccga 8760

tcaccccttc atgggtggtg gcgacgccca tacgtctggc gcgcgccaga ccgtcggact 8820

gaggatcaat gccaaccatc accgccatct ccagatgctg accgtgacgc aaaattttaa 8880

tcatcagatc ggtgccaatg ttgccagaac cgataatggc gactttacgc ttactcatga 8940

cagacttcct tttggggctg cgcttgaaaa tgtcgcagca actgaaccta tgccttcaat 9000

atgggcttca aaacgatcgc ccgcattcac cgccaccatc ggacctaatg ccccggtaag 9060

aatgatatct ccggtgcgca gcggttcacc cagactggcc attttgcgtg ccagccagac 9120

ggccgcatta agcggatgtc ccaggcattc gctgccgcgc ccgctagaaa cctcttcgtt 9180

attacgcgtc atcttcatgg cgcagttttt caggtctaac cccgccggac gttgcgccgg 9240

accgccgatg acatacaccc cacaggaggc gttatctgcc acggtatcga caaactgaat 9300

cgaccagtcg cgaatgcggc tccccaccac ttccagcgcc ggaagtaccc attcaatggc 9360

gttatacaat tcgtcgaagg tgatatcggt tgcgggcaaa tcgcggttca acaccagtgc 9420

gatctccgct tcaatgcggg gttgcagaac acgggaaaaa ggaatgattt cgttatcgcc 9480

ataacacatg tcggcaaata atgtcccgaa atccggttga tcaacgccca gttgttgctg 9540

cactttcgga tgcgtcaggc ccactttacg ccctaccacg cgacgcccct gcgcaacgtc 9600

atattgcaca tttatgtgct gaatggcgta ggccgcttca gcgttatcga taccaatcag 9660

atcgcgcagc ggcgcaatcg cttcgccctg ctctgcggcg cggcgtaaat ccgccgccag 9720

ttgctcaaga gtatgcttcg tcatgaccat tccttaaggg cgtgcgagga aattcagcac 9780

caattgattg aaagcgtcgg catgttccca ctgcgcccag tgaccacagt cgcggaagat 9840

atgcagttca gaaccggcaa tgccggacag cagacgcaga cccgcatcca tcggcacaaa 9900

gcggtcgttg cgcccccaga caatcagggt ttgcgctttg atttccgcca gacgtgggcc 9960

aaaatccggg aactgtttcg gattagcttc caggctctta acgaagtttt ccaggtgatc 10020

gcggcgcgac agcatattat tcaggcgcgc ttcaaacagg gcgtcggtca aatcgctggt 10080

atcgaaaacg aagatatcca tcatcagctt caggttttcg atagtcggct gacgataaag 10140

ctgattcagt cgcttaatac cttcggttgg catcggcgta aacaaactca tgccgcccgt 10200

accgccgccc atcagcacca gtttgccgac gcgctccggc cagttaaggg tgaacgccac 10260

agaactatgg ccgcccatcg agttgcccag caggtggatt ttggcgatat ccagttgatc 10320

caccacgctt ttcaggattc gtgcattaag atccgatcgt gaaccactat taacgatcga 10380

atcgcttttg ccccaacccg gacaatccag caggatcacc cgatagcccg cctctaccag 10440

cggatcgata ttgcggctga agttcgccca gccagtagca cccgggccgg aaccatgcag 10500

caggacaacg gtttcgtcgc cttgtccgca gtcattaaaa tggatgcgca gcgttttacc 10560

cgcttcttct acattcagaa aacggctggt ggcggcttcg gtttgtggct gataactcat 10620

catcttctcc tgcatattca gttctctgtt ctggcgctta acgagccaaa tccggcaatc 10680

cactccggga ttgggcggta ataacgccct tcgctacgcc agttgccaaa tgcagaaata 10740

gcggcaaaag cggcgaccca ggttttgatt tcatgtgtcg actttccggc aatggcggaa 10800

agctcttcgt tactgacggc atccagttcc tgtatgcgtc cctgctccag caaagtcatg 10860

aactggttat cccaaatcgg gttgagcgga tgcagagttc tctgatcctc aacaaacttc 10920

tcagcggcgc taatcacccg ttgctgacgc aattcgcgct cactggcggg taaatctttc 10980

ccgctcccca acagacggtc gcgcatatgg gcatcggctt tcgccagttc gggcaccggc 11040

ggctgatggg aaagcccacc ggaacccagg aacagcacgc gtttattgag agtgctggtg 11100

aaacgtccaa tggcttcacc caacatgcgg gtacgctgga aaccgggcag cggcgtggcg 11160

acaccgttga tgaacacagg cagaactggc accttatcca gcccgccgag caggaactcc 11220

agtggctggg cgaacccgtg gtccacctgc atacagtaag aaacggcaag atcgatcccg 11280

ctcttcatga cggcatgcgc acaggcctcc gccagctcca caggcacggg cagctctcct 11340

gccgcactgc cgaaatcacc aattgccgtc gccccaacgc ctaaacagaa cggtggcatc 11400

acgtcataga aaaagccgtt gtagtgatct ggcgcaaaca gcaccaccag ttcaggggag 11460

aaagccgcaa tacgctcgcg ggcgctggca atcacgccat tgacctcatc gagtacctct 11520

tgcgccgggt cgacatatcc caccagcggc gagtgggaaa gacagtgaag ataagcgtgc 11580

atatcaggct accttttcga cagaaacgtc ggcatcaggg cgggtcagcg tcatcaccga 11640

cgccagttta ttcagcgtat tacccagggt ttgcggaatg gcggtggcgg caacaaagcg 11700

atccgggcgc atcaccacca gcgaagcatt atgttgtgcg aaccagctac gcaggcgacc 11760

ttgcgtatcc cccacgcgta gtacgccgtc gtggttatcc tgtgcggtat gaatttgcac 11820

ttccggcacc acctgaatga agcgggtgcc caacgcgcgc cactgctgga tttgctcgtc 11880

gctcatcccc cacagtggat tgcatcccca gccaattacc gcgaagttcg cgccgatcgc 11940

gttatcgagc agcgtcacgt cgccgttttc cagcgtgact ttcggctgaa taaacatctt 12000

gccgaccgga gagtgcttcg cttcgccctc tcgcaccagc gcaccgccgt aatattgcgg 12060

catcggcttg aagcgcattt cgaggaagta gcgttttact ggcggcagat aattcaacag 12120

ccaggaaacg ccgtcacgta acgtaccctg ccagcgtttc ggcggagcca gcacgttgcc 12180

cgccgtcacg gacaggtcaa tcatcgcttt ggcgtgatcg cgtcgttctt gttgataggt 12240

atcgagcagc gcatcacggg ctttcccctg gataaccaac gccagtttcc aggcgaggtt 12300

aaaggcgtcg cgcataccgc tgttatagcc ctgcccctgc cataccggca tgatgtgcgc 12360

ggcatcgccc gccagcagta cgcgatcaat acggaaacgt tgcgccagtc gcgcgttgtg 12420

ggtgtagaca cgctggcgaa tcaattcaac attgtccgga ttaggcagca ctttgcttaa 12480

cagcttgcgc atattttgcg gctcacgcag ctgttcttcg gtttctcctg gcatcaccat 12540

aaattcaaag cgacgtaccg catgaggtag cgcggcagaa acatacgggc gcaccggatc 12600

gcaacacaaa tagatatgcg gcgtacttaa cggatcgttg gcgatatcta ccacaatcca 12660

ctgatttggc gcagttttac cttcaaacgg cacattcagg gtgcgacgga caaaacttgc 12720

cccaccatca caggccacca gccactgggc tttgactatt tcccgctgcc cttctgccgt 12780

tttcaggtgc aaggtcactt cgtcatcttg ctgactgaag gcctccagct cgcgggaaaa 12840

caagcagcgc acattcggaa aacgcgacac cccttccagc atcaccgcat cgacctgcgg 12900

ctgaataaag gcgttacggc gcggccagcc aaattcatcg gtcattggct gaatatcagc 12960

aaaacagcgg cctttcgggg tgagaaaacg catcgcgtgc cacggcgtag tgtgcggcag 13020

aacatcatcg accaggccga ccgactgcat ggtgcgcagc gcctcgtcat caataccaat 13080

cgcacgcggg tagtcgatca acttatcgag tttctccacc accagcacgt caatgcccat 13140

ctggccgaga tagttcgcca tcatcagccc aaccgggccg gcaccagcga tcgccacctg 13200

aacgctatgg ttaacagcag gctggatgtc agggtgttgt attgccattt cagtacctca 13260

cgactcggac aaaatgtcgt tgcgcgcaca gtacagcgca acttattttg ttaaaaacat 13320

gtaaatgatt ttttattgtg cgctcagtat aggaagggtg ttttcggcta caatcaaaac 13380

atgcccgaat gtgcaccagg tgcaccacgt tgttttaact atagaaatgt caattaatat 13440

gcagaacaat gagcagacgg aatacaaaac cgtgcgcggc ttaacccgcg gtctaatgtt 13500

attaaatatg ttaaataaac ttgatggcgg tgccagcgtc gggctgctgg cggaactcag 13560

cggcctgcat cgcaccactg tgcggcgact gctggagacg ctgcaggaag agggatatgt 13620

ccgccgtagc ccctccgatg atagttttcg actgaccatc aaagtgcggc aattaagcga 13680

aggatttcgt gacgaacagt ggatttctgc actggcggcc ccactgctgg gcgatctgtt 13740

gcgcgaagtg gtatggccga cagatgtgtc cacgctggat gttgatgcaa tggtggtacg 13800

cgaaaccact caccgtttca gccgcttatc ctttcaccgg gcaatggtcg ggcgacgttt 13860

gccgcttctg aaaaccgcct cgggcctgac ctggctggcc ttttgcccgg aacaagaccg 13920

caaggaatta atcgaaatgt tagcctcccg ccccggtgat gactatcaac tggcacggga 13980

accgttaaag ctggaagcca ttctggcgcg cgcgcgcaaa gagggttacg gacagaacta 14040

ccgcggctgg gatcaggagg agaagatcgc ctctatcgcc gtaccgctgc gcagtgaaca 14100

acgggtgatt ggctgtctga atctggtgta tatggcgagc gcaatgacca ttgaacaggc 14160

agcggaaaag catcttccgg cgctacaacg ggtagcaaaa cagatcgaag aaggggttga 14220

atcgcaggct attctggtgg ccggaaggcg aagcggcatg catttacgtt gacaccatcg 14280

aatggcgcaa aacctttcgc ggtatggcat gatagcgccc ggaagagagt caattcaggg 14340

tggtgaatgt gaaaccagta acgttatacg atgtcgcaga gtatgccggt gtctcttatc 14400

agaccgtttc ccgcgtggtg aaccaggcca gccacgtttc tgcgaaaacg cgggaaaaag 14460

tggaagcggc gatggcggag ctgaattaca ttcccaaccg cgtggcacaa caactggcgg 14520

gcaaacagtc gttgctgatt ggcgttgcca cctccagtct ggccctgcac gcgccgtcgc 14580

aaattgtcgc ggcgattaaa tctcgcgccg atcaactggg tgccagcgtg gtggtgtcga 14640

tggtagaacg aagcggcgtc gaagcctgta aagcggcggt gcacaatctt ctcgcgcaac 14700

gcgtcagtgg gctgatcatt aactatccgc tggatgacca ggatgccatt gctgtggaag 14760

ctgcctgcac taatgttccg gcgttatttc ttgatgtctc tgaccagaca cccatcaaca 14820

gtattatttt ctcccatgaa gacggtacgc gactgggcgt ggagcatctg gtcgcattgg 14880

gtcaccagca aatcgcgctg ttagcgggcc cattaagttc tgtctcggcg cgtctgcgtc 14940

tggctggctg gcataaatat ctcactcgca atcaaattca gccgatagcg gaacgggaag 15000

gcgactggag tgccatgtcc ggttttcaac aaaccatgca aatgctgaat gagggcatcg 15060

ttcccactgc gatgctggtt gccaacgatc agatggcgct gggcgcaatg cgcgccatta 15120

ccgagtccgg gctgcgcgtt ggtgcggata tctcggtagt gggatacgac gataccgaag 15180

acagctcatg ttatatcccg ccgttaacca ccatcaaaca ggattttcgc ctgctggggc 15240

aaaccagcgt ggaccgcttg ctgcaactct ctcagggcca ggcggtgaag ggcaatcagc 15300

tgttgcccgt ctcactggtg aaaagaaaaa ccaccctggc gcccaatacg caaaccgcct 15360

ctccccgcgc gttggccgat tcattaatgc agctggcacg acaggtttcc cgactggaaa 15420

gcgggcagtg agcgcaacgc aattaatgta actaggcacc ccaggcttta cactttatgc 15480

ttccggctgg tataatgtgt ggacctgtag aaataatttt gtttaacttt aataaggaga 15540

tataccatgg gaggcagtac tgttgcacca actacaccgt tggcaaccgg cggtgcgctc 15600

cgcaaagtgc gacaagccgt ctttcccatc tacggaaacc aagaagtcac caaatttctg 15660

ctcatcggat ccattaaatt ctttataatc ttggcactca cgctcacgcg tgataccaag 15720

gacacgttga ttgtcacgca atgtggtgcc gaagcgattg cctttctcaa aatatacggg 15780

gtgctacccg cagcgaccgc atttatcgcg ctctattcca aaatgtccaa cgccatgggc 15840

aaaaaaatgc tattttattc cacttgcatt cctttcttta cctttttcgg gctgtttgat 15900

gttttcattt acccgaacgc ggagcgactg caccctagtt tggaagccgt gcaggcaatt 15960

ctcccgggcg gtgccgcatc tggcggcatg gcggttctgg ccaagattgc gacacactgg 16020

acatcggcct tattttacgt catggcggaa atatattctt ccgtatcggt ggggctattg 16080

ttttggcagt ttgcgaacga cgtcgtcaac gtggatcagg ccaagcgctt ttatccatta 16140

tttgctcaaa tgagtggcct cgctccagtt ttagcgggcc agtatgtggt acggtttgcc 16200

agcaaagcgg tcaactttga ggcatccatg catcgactca cggcggccgt aacatttgct 16260

ggtattatga tttgcatctt ttaccaactc agttcgtcat atgtggagcg aacggaatca 16320

gcaaagccag cggcagataa cgagcagtct atcaaaccga aaaagaagaa acccaaaatg 16380

tccatggttg aatcggggaa atttctcgcg tcaagtcagt acctgcgtct aattgccatg 16440

ctggtgctgg gatacggcct cagtattaac tttaccgaaa tcatgtggaa aagcttggtg 16500

aagaaacaat atccagaccc gctagattat caacgattta tgggtaactt ctcgtcagcg 16560

gttggtttga gcacatgcat tgttattttc ttcggtgtgc acgtgatccg tttgttgggg 16620

tggaaagtcg gagcgttggc tacacctggg atcatggcca ttctagcgtt accctttttt 16680

gcttgcattt tgttgggttt ggatagtcca gcacgattgg agatcgccgt aatctttgga 16740

acaattcaga gtttgctgag caaaacctcc aagtatgccc ttttcgaccc taccacacaa 16800

atggcttata ttcctctgga cgacgaatca aaggtcaaag gaaaagcggc aattgatgtt 16860

ttgggatcgc ggattggcaa gagtggaggc tcactgatcc agcagggctt ggtctttgtt 16920

tttggaaata tcattaatgc cgcacctgta gtaggggttg tctactacag tgtccttgtt 16980

gcgtggatga gcgcagctgg ccgactaagt gggctttttc aagcacaaac agaaatggat 17040

aaggccgaca aaatggaggc aaagaccaac aaagaaaagt agttaaccta ggctgctgcc 17100

accgctgagc aataagactc ctgttgatag atccagtaat gacctcagaa ctccatctgg 17160

atttgttcag aacgctcggt tgccgccggg cgttttttat tggtgagaat 17210

<210> 5

<211> 17898

<212> ДНК

<213> Escherichia coli

<400> 5

ttattgcacg aagcgcgagg taacgtactg gctgtaatca ttcgctacag ccgggacctt 60

gccctgctct ttcaaaaact gcgcggtgtc gatgatcgct ttgttcaccg gtccggtcag 120

ttctgccgtt tgttgctgcg gcgtcagata ggtattcccc ttcaccagcc ccggaacgtc 180

accttcaggc acgccgctta accgcgccag tttgctgatg ttttccggct gtttcagcca 240

cgcgtctggg ttagcaatgt acggttgctg agcatcgatg gcgcttttgg cgaacgcttt 300

caccacctca ggatgtttct cggcaaaatc tttgcgcacc acccagacgt ccagcgttgg 360

cgcaccccac tgcccgacct gttcagaatc ggtcagcact ttgccgtctt tttccagggc 420

gttaaccgcc ggtgcccaga cataagcacc atcaatatct ccccgctgcc atgcagcgat 480

aatcgcgggc ggctgcaggt tcacaatctc cacttgccca ggtttaatgc cccagtgttt 540

cagcgctgcc agcaggctgt agtgggtggt agagataaac ggtacggcga tgcgtttgcc 600

aatcagatct tccggtttgc tgatagtttt ctttaccacc agcgcttctg agttacccag 660

ttttgacgcc agcaagaaga cttcaatcgg cacctgttgg ctggctgcaa ccgctaacgg 720

gctggaacca aggttgccga tttgcacgtc gccagaagcc agcgcccgca cgatgctggc 780

tccgctgtca aacttacgcc agtccacggt tgctccgctt tctttagcaa aggtgttgtc 840

ggcctgagcc actttcgccg gttcggctga ggtttgatac gccacggtga cgttcaccgc 900

ctgtgcctga aaagcgatga atgccagtgc ggcaagaagt gtgtttcgcg atgaaattgc 960

catgattgtc tgctcccctg tcttgttatg ggagcagtat tcaggaataa aaacattcat 1020

taaaagaatt agtcgttatc gcacagatga ttttattctt agcaaaaaaa cggtgatgct 1080

gccaacttac tgatttagtg tatgatggtg tttttgaggt gctccagtgg cttctgtttc 1140

tatcagctgt ccctcctgtt cagctactga cggggtggtg cgtaacggca aaagcaccgc 1200

cggacatcag cgctatctct gctctcactg ccgtaaaaca tggcaactgc agttcactta 1260

caccgcttct caacccggta cgcaccagaa aatcattgat atggccatga atggcgttgg 1320

atgccgggca actgcccgca ttatgggcgt tggcctcaac acgattttac gtcacttaaa 1380

aaactcaggc cgcagtcggt aacctcgcgc atacagccgg gcagtgacgt catcgtctgc 1440

gcggaaatgg acgaacagtg gggctatgtc ggggctaaat cgcgccagcg ctggctgttt 1500

tacgcgtatg acaggctccg gaagacggtt gttgcgcacg tattcggtga acgcactatg 1560

gcgacgctgg ggcgtcttat gagcctgatg tcaccctttg acgtggtgat atggatgacg 1620

gatggctggc cgctgtatga atcccgcctg aagggaaagc tgcacgtaat cagcaagcga 1680

tatacgcagc gaattgagcg gcataacctg aatctgaggc agcacctggc acggctggga 1740

cggaagtcgc tgtcgttctc aaaatcggtg gagctgcatg acaaagtcat cgggcattat 1800

ctgaacataa aacactatca ataagttgga gtcattacct agaacgtaat ttacctgccg 1860

gaacttattc actccgacaa gaacttatcc gtacaggaga ttaaaatgat aaaacggacg 1920

ttattagcgg cggccatttt tagcgcattg cccgcttatg ccgggttaac ttccattacc 1980

gcgggctacg attttaccga ttattctggc gatcatggca accgtaattt agcgtatgct 2040

gaactggtgg cgaaagttga aaacgcaacg ctgcttttta atctttccca ggggcgtcgt 2100

gattatgaaa ctgaacattt caatgccact cgcggtcagg gtgcggtctg gtataaatgg 2160

aataactggc tgacaacccg aacgggtatt gcctttgcgg ataatacgcc ggtctttgcc 2220

cgccaggatt ttcgtcagga tattaacctg gccctgttgc caaaaacgct tttcacgacc 2280

ggttatcgct acactaaata ttacgatgat gtcgaagtcg atgcctggca aggcggcgta 2340

tcactctata ctggcccggt gatcaccagc taccgctata cccattatga ctccagcgat 2400

gcaggtggta gttatagcaa tatgatttcc gtgcgtctga atgacccgcg cggcactggt 2460

tatacgcaac tatggctaag ccgcggaaca ggcgcttaca cctatgactg gacgccagaa 2520

acacgctacg gcagcatgaa gagcgtcagt ctgcaacgta ttcaaccgct gactgagcaa 2580

cttaatctcg ggctgacggc aggtaaagtg tggtacgaca ccccaaccga tgattataac 2640

ggtctgcaac ttgcagccca tctgacctgg aaattctgat tccttctgcc gcccgctatc 2700

cggggcggcc ttccctgccg attagccccc ccctttcctc tttgttttcc gaccacattc 2760

accggataaa ttttattctc cagtgttata tactataggg gggtatgcat tgacatatag 2820

catacccccc tatagtatat tgcgtgcaga taatgaggtg cgaaatgccc agtactccgg 2880

aagagaagaa aaaggtcctt actcgagttc gtcgtattcg agggcagatt gatgctctgg 2940

aacggtcgct ggagggtgat gccgaatgcc gtgccatact ccaacagatc gctgccgttc 3000

ggggcgcggc taatgggctg atggcagaag tgcttgaaag ccatatccgg gaaacgtttg 3060

accgaaatga ctgctacagc cgcgaagtca gccaatccgt tgacgacact attgaactgg 3120

ttcgagccta tcttaaatag ctgaatctat taccatattg aggaagagcg agagatgaaa 3180

tcacgtgctg ccgttgcatt tgctcccggt aaaccgctgg aaatcgttga aattgacgtt 3240

gcaccaccga aaaaaggtga agtgctgatt aaagtcaccc ataccggcgt ttgccatacc 3300

gacgcattta ccctctccgg ggatgacccg gaaggtgtat tcccggtggt tctcggtcac 3360

gaaggggccg gcgttgtggt tgaagtcggt gaaggcgtaa ccagcgtcaa acctggcgac 3420

catgtgatcc cgctttacac cgcggagtgc ggcgagtgtg agttctgtcg ttctggcaaa 3480

actaacctct gtgttgcggt tcgcgaaacc cagggtaaag gcttgatgcc agacggcacc 3540

acccgttttt cttacaacgg gcagccgctt tatcactaca tgggatgctc aacattcagt 3600

gaatacaccg tggtcgcgga agtgtctctg gccaaaatta atccagaagc aaaccatgaa 3660

cacgtctgcc tgctgggctg tggcgtgacc accggtattg gcgcggtgca caacacagct 3720

aaagtccagc caggtgattc tgttgccgtg tttggtcttg gcgcgattgg tctggcagtg 3780

gttcagggcg cgcgtcaggc gaaagcggga cggattatcg ctatcgatac caacccgaag 3840

aaattcgatc tggctcgtcg cttcggtgct accgactgca ttaacccgaa tgactacgac 3900

aaaccgatta aagatgtcct gctggatatc aacaaatggg gtatcgacca tacctttgaa 3960

tgcatcggta acgtcaacgt gatgcgtgcg gcgctggaaa gtgcgcaccg cggctggggt 4020

cagtcggtga tcatcggggt agcaggtgcc ggtcaggaaa tctccacccg accattccag 4080

ttggtcaccg gtcgcgtatg gaaaggttcc gcgtttggcg gcgtgaaagg tcgttcccag 4140

ttaccgggta tggttgaaga tgcgatgaaa ggtgatatcg atctggaacc gtttgtcacg 4200

cataccatga gccttgatga aattaatgac gccttcgacc tgatgcatga aggcaaatcc 4260

attcgaaccg taattcgtta ctgatttccc gcaggtatac cccgtccact tcagacgggg 4320

ttcttaatac tctccctggg cagccgtccg ggggattaac cgtgagataa tgactgatgg 4380

aactcattga aaaacatgcc agctttggcg gctggcaaaa tgtgtatcgg cattattccc 4440

aatcactgaa atgtgaaatg aatgtcggcg tctatctccc accaaaagcc gcgaatgaaa 4500

aattgccggt gttgtactgg ctttcaggcc tgacttgcaa cgagcagaat ttcattacta 4560

aatcggggat gcagcgttac gcggctgagc acaacattat tgttgttgcg ccggacacca 4620

gtccgcgagg cagtcatgtc gcagatgctg accgttacga tctcgggcaa ggtgccgggt 4680

tttacctgaa cgcgacgcaa gcgccgtgga atgaacatta caaaatgtat gactatatcc 4740

gcaacgagct gccggattta gtgatgcatc attttccggc aacggccaaa aagtctatct 4800

ctggtcattc tatgggcggg ctgggcgcgc tggtgctggc gttacgtaac ccagatgaat 4860

atgtcagcgt ctcggcgttt tcgcccattg tctccccatc gcaagtgccg tggggacagc 4920

aagcctttgc tgcatatctt gctgaaaata aagatgcctg gttggattac gacccggtga 4980

gtcttatttc acaaggtcaa cgcgttgcgg aaatcatggt tgatcagggg ttgagtgatg 5040

atttttacgc agaacagctg cggactccaa atcttgaaaa gatctgccag gagatgaata 5100

tcaagacgtt aatccgttat cacgagggtt atgatcacag ctattatttt gtctccagtt 5160

ttattggcga gcatattgcc taccacgcca ataaactgaa tatgcgttga taatagtgca 5220

cgactgccgg atgcggcgtg aacgccttat ccggcctaca cttcgcccgt aaaccgtagg 5280

cctgataaga cgcgcaaagc gtcgcatcag gcatggcgca cgactgccgg atgcggcgtg 5340

aacgccttat ccggtctaca cttcgcccat aaaccgtagg cctgataaga cgcgcatagc 5400

gtcgcatcag gcatctgcgc acgacttatc tatgtttacc acatcaaatc atcaggcact 5460

ttgaagtcgg catacgggtc gtcttcatcc tgctcttcgg cgctgagcgc gctgtgcaac 5520

actatactgc tggcatcgcg ctgagcaatt ttatcggcaa cgctggcggg aataatggcg 5580

tattcacctt cgctattgtt atcgaccaac aagcgggcaa tcgccagacg accattaatc 5640

aactgcgcct gtgtgagctt atcgacaaaa atcttcttaa tcagattgcc gtcagtgaag 5700

ttaaaaccaa tatcgccatt ggcaatggtg attcggttca tttcaataag ctgcttcacc 5760

tgagctttat attctttcgc caacgccgct tgtttttgct gttcgctaag ctgtttatca 5820

cgctcaagct gtgccttttt attttcttct accgccgccc gagcttcacg cgcctgaacg 5880

cgcgattttt tcgccgttct ctccaccttc gccgcttttt tgctggtgac taatcctgct 5940

ttgagcaact gctcttgtaa ggtaagtttt gccatctttg tttccaaacc cgctgaataa 6000

tttttagcga gtatacctgt aaacgccgta ggtgtattgg ggtgaagtcc ctttcgcccc 6060

tgcctaataa ggcacgtcag gcatcggcgc acggctgtat tcgtgatctc cggctcatca 6120

aaataaacac cgccaaccca gcaacaagaa tacccggtgc agaagcggcc attacgccga 6180

ccgtgccagt gcctaatgcc agcattttcc cggccagtaa cggaccgctc atagccccca 6240

gacgccctac cgccacggct gttcccacac ctgttgcgcg gatctgcgaa ctgtaaaaca 6300

acggtgccag ggcatacaaa acgctttgcc cacctgtcgc aaacaacccc gcgacaaatc 6360

ccgccagcaa cataccgtta aatgacgaca ccgttccaag cgccagcagc gaagctaaca 6420

tgccgctata aatcagtagc gacatggtta ctggacgcag cttatccatc aatgcgccca 6480

acattaacgt cccgcttgcc gcccccattt gcagggcaaa catcacccct gccgcctgcg 6540

atggctggaa tccttgctcc accaaaagta gcggtagcca gttgatcaac atgtagacca 6600

ccagcagagt gaagaaataa cacaaccaca gcagcagcgt cgcggttgcc gtttctggcg 6660

caaataaggc acgcagtggt ggcgcagact gtttttcgcc agcgaaaacc gccgactccg 6720

gcagccagcg cattaatagc ggcaccagaa tcaacggcac cacaccacct acccaaaaca 6780

ccgtttgcca tgctaagttt gcccccgcga aacccagtgt cgccgccagc gccgcgccaa 6840

tgggaacacc gcaatacatc aggctcactg ccgtcccacg aaaacgtgga cccgcggctt 6900

cagacgtcag ggcgataaga ttcggcaacg ccgcccccag cccgacaccg gtcatcagcc 6960

gcgcaaagac cagtgagggg aaatcccagg caatcgccgt tgccagtgag aacaaaccaa 7020

acagcgcaac tgagccaatc aaaatacgct tacgaccata acggtccgcc agcattccgc 7080

caaccaacgc gccgggtagc aaaccgagta ttccggcgct aaatatccag cccatttgca 7140

ttttatcgag tgcgaaagcc tgggcgatgc cacccgccgc aatgccagcc gcctgaagat 7200

ccagcccttc catcagagcg accaaaaaac aaagcccgat ggtcagcatc aggcgggatg 7260

aagatgatga aggggtacga gtcgacataa gatgaacctc attgcgagtg caggtgaatc 7320

gcgactgata cattgccagc cgcgtaatca gaactattga atgactgcct acgggcgaaa 7380

tgtaggccgg ataaggcgtt cacgccgcat ccggcagtcg tgtgcagatg cctgatgcga 7440

cgcttgcgcg tcttatcagg cctacaaatt cccgcgccat ccgtaggccg gataaggcgt 7500

ttacgccgca tccggcagtc gtgcgcagat gcctgatgcg acgctaacgc gtcttatcag 7560

gcctacaaat tctcgcgcca tccgtaggcc ggacaagacg ttcacgccgc atccggcagt 7620

cgtgctggga tgggcataca aaatgcacat tctcggcagt caatattatt tgttgttgcg 7680

cagatccagc gccacgtcga cgatcatatc ctcctggccg ccaaccatcc ggcgtttgcc 7740

cagctcaacg agaatatcca ccgcgcttaa gccataacgc gccgccgccg tttcacagtg 7800

acgcaggaag ctggagtaaa caccagcgta tcccagcgcc agcgtttcgc gatcgactcg 7860

taccggtcga tcctgcaacg gacgcaccag gtcgtcagcg gcatccatta acgcatagag 7920

atcggtccca tgctgccagc ccagtttatc cgcggcggca ataaatactt ccagcggcgc 7980

gttacctgcg cccgcgccca ttcccgcgag gctggcgtcg attcggtcgc agccctcttc 8040

caccgcctcg atagagttcg ccacgccaag actcaggtta tggtgagcgt gcatgccggt 8100

ttgcgtttct ggtttcaaca ctgctttcag ggcgcggaaa cggtcacgga tatcgctcat 8160

gttcatcgca ccgccagaat ccaccacata aatacaggtc gcaccgtagc cttccatcag 8220

ctttgcctgc tttgcgagat tctctggcgt ggtcatatgg ctcatcatca gaaaaccaac 8280

ggtgtccatt ccgagctcgc gggcatactg aatatgctgg gcggaaacat cagcttcggt 8340

acagtgcgta gccacacgaa ccacccgcgc gccagcttgc caggcatttt tcagatcgtg 8400

aatagtgccg attcctggca gcaacaacgt cgcgattttg gcgtgcttca ccacatccgc 8460

cgctgcttca atccattcaa ggtcgctatg tgcgccgaaa ccatagttaa agctggaacc 8520

ctgcaaaccg tcgccgtggg ccacttcaat cgaatccacg tgggcatcgt ccagtgcttt 8580

ggcaatctgg cgaacgtttt ccagcgaata ctgatgacga atggcgtgca taccgtcacg 8640

caacgtgacg tccgagatat aaagtttttt accgttcatg ccgcttctcc tgccttgcgc 8700

gccagtgact gggccatttt ttccgctgtc gccagcgcac tggaagtcat aatgtcgagg 8760

ttgcccgcat aggcaggcag ataatgcgct gcgccttcga cttccagcca gaccgctgtt 8820

ttcagtccgg agaattgccc cacgcccggt aaattgaccg gtttatcctg cgggataact 8880

tcaaactgca cgcgctgttt caggcgataa cccggtacgt aagcctgcac cgcctcagcc 8940

atttcattga ttgaggcttc gatatcatct tgtgaagctt cgtcgctcaa tacatacacc 9000

gtgtcacgca tcatcaacgg tggctctgct gggttaagca caataatcgc cttccctttt 9060

gccgcgccgc ccaccacttc aatggctcgg gaagtggttt ccgtaaattc atcgatattg 9120

gcacgcgtgc caggtccggc agatttactg gcgatagaag cgataatttc ggcgtaatga 9180

acacgcgcca cgcgtgaaac tgccgccacc attggaatgg tggcctggcc gccgcaggtg 9240

accatgttga cgttcagttg atcgacgttc gcctcgaggt taaccaccgg cacgcagtaa 9300

gggccgatgg cagcaggcgt caggtcaatt aagcgaatat ccggtttcgc ttcgcgtaaa 9360

gcggcatcgt ttttcacatg agcaccggcg ctggtcgcat caaatacaat gtcgatatca 9420

gcaaattcag gcatgttcat cagtccgatc accccttcat gggtggtggc gacgcccata 9480

cgtctggcgc gcgccagacc gtcggactga ggatcaatgc caaccatcac cgccatctcc 9540

agatgctgac cgtgacgcaa aattttaatc atcagatcgg tgccaatgtt gccagaaccg 9600

ataatggcga ctttacgctt actcatgaca gacttccttt tggggctgcg cttgaaaatg 9660

tcgcagcaac tgaacctatg ccttcaatat gggcttcaaa acgatcgccc gcattcaccg 9720

ccaccatcgg acctaatgcc ccggtaagaa tgatatctcc ggtgcgcagc ggttcaccca 9780

gactggccat tttgcgtgcc agccagacgg ccgcattaag cggatgtccc aggcattcgc 9840

tgccgcgccc gctagaaacc tcttcgttat tacgcgtcat cttcatggcg cagtttttca 9900

ggtctaaccc cgccggacgt tgcgccggac cgccgatgac atacacccca caggaggcgt 9960

tatctgccac ggtatcgaca aactgaatcg accagtcgcg aatgcggctc cccaccactt 10020

ccagcgccgg aagtacccat tcaatggcgt tatacaattc gtcgaaggtg atatcggttg 10080

cgggcaaatc gcggttcaac accagtgcga tctccgcttc aatgcggggt tgcagaacac 10140

gggaaaaagg aatgatttcg ttatcgccat aacacatgtc ggcaaataat gtcccgaaat 10200

ccggttgatc aacgcccagt tgttgctgca ctttcggatg cgtcaggccc actttacgcc 10260

ctaccacgcg acgcccctgc gcaacgtcat attgcacatt tatgtgctga atggcgtagg 10320

ccgcttcagc gttatcgata ccaatcagat cgcgcagcgg cgcaatcgct tcgccctgct 10380

ctgcggcgcg gcgtaaatcc gccgccagtt gctcaagagt atgcttcgtc atgaccattc 10440

cttaagggcg tgcgaggaaa ttcagcacca attgattgaa agcgtcggca tgttcccact 10500

gcgcccagtg accacagtcg cggaagatat gcagttcaga accggcaatg ccggacagca 10560

gacgcagacc cgcatccatc ggcacaaagc ggtcgttgcg cccccagaca atcagggttt 10620

gcgctttgat ttccgccaga cgtgggccaa aatccgggaa ctgtttcgga ttagcttcca 10680

ggctcttaac gaagttttcc aggtgatcgc ggcgcgacag catattattc aggcgcgctt 10740

caaacagggc gtcggtcaaa tcgctggtat cgaaaacgaa gatatccatc atcagcttca 10800

ggttttcgat agtcggctga cgataaagct gattcagtcg cttaatacct tcggttggca 10860

tcggcgtaaa caaactcatg ccgcccgtac cgccgcccat cagcaccagt ttgccgacgc 10920

gctccggcca gttaagggtg aacgccacag aactatggcc gcccatcgag ttgcccagca 10980

ggtggatttt ggcgatatcc agttgatcca ccacgctttt caggattcgt gcattaagat 11040

ccgatcgtga accactatta acgatcgaat cgcttttgcc ccaacccgga caatccagca 11100

ggatcacccg atagcccgcc tctaccagcg gatcgatatt gcggctgaag ttcgcccagc 11160

cagtagcacc cgggccggaa ccatgcagca ggacaacggt ttcgtcgcct tgtccgcagt 11220

cattaaaatg gatgcgcagc gttttacccg cttcttctac attcagaaaa cggctggtgg 11280

cggcttcggt ttgtggctga taactcatca tcttctcctg catattcagt tctctgttct 11340

ggcgcttaac gagccaaatc cggcaatcca ctccgggatt gggcggtaat aacgcccttc 11400

gctacgccag ttgccaaatg cagaaatagc ggcaaaagcg gcgacccagg ttttgatttc 11460

atgtgtcgac tttccggcaa tggcggaaag ctcttcgtta ctgacggcat ccagttcctg 11520

tatgcgtccc tgctccagca aagtcatgaa ctggttatcc caaatcgggt tgagcggatg 11580

cagagttctc tgatcctcaa caaacttctc agcggcgcta atcacccgtt gctgacgcaa 11640

ttcgcgctca ctggcgggta aatctttccc gctccccaac agacggtcgc gcatatgggc 11700

atcggctttc gccagttcgg gcaccggcgg ctgatgggaa agcccaccgg aacccaggaa 11760

cagcacgcgt ttattgagag tgctggtgaa acgtccaatg gcttcaccca acatgcgggt 11820

acgctggaaa ccgggcagcg gcgtggcgac accgttgatg aacacaggca gaactggcac 11880

cttatccagc ccgccgagca ggaactccag tggctgggcg aacccgtggt ccacctgcat 11940

acagtaagaa acggcaagat cgatcccgct cttcatgacg gcatgcgcac aggcctccgc 12000

cagctccaca ggcacgggca gctctcctgc cgcactgccg aaatcaccaa ttgccgtcgc 12060

cccaacgcct aaacagaacg gtggcatcac gtcatagaaa aagccgttgt agtgatctgg 12120

cgcaaacagc accaccagtt caggggagaa agccgcaata cgctcgcggg cgctggcaat 12180

cacgccattg acctcatcga gtacctcttg cgccgggtcg acatatccca ccagcggcga 12240

gtgggaaaga cagtgaagat aagcgtgcat atcaggctac cttttcgaca gaaacgtcgg 12300

catcagggcg ggtcagcgtc atcaccgacg ccagtttatt cagcgtatta cccagggttt 12360

gcggaatggc ggtggcggca acaaagcgat ccgggcgcat caccaccagc gaagcattat 12420

gttgtgcgaa ccagctacgc aggcgacctt gcgtatcccc cacgcgtagt acgccgtcgt 12480

ggttatcctg tgcggtatga atttgcactt ccggcaccac ctgaatgaag cgggtgccca 12540

acgcgcgcca ctgctggatt tgctcgtcgc tcatccccca cagtggattg catccccagc 12600

caattaccgc gaagttcgcg ccgatcgcgt tatcgagcag cgtcacgtcg ccgttttcca 12660

gcgtgacttt cggctgaata aacatcttgc cgaccggaga gtgcttcgct tcgccctctc 12720

gcaccagcgc accgccgtaa tattgcggca tcggcttgaa gcgcatttcg aggaagtagc 12780

gttttactgg cggcagataa ttcaacagcc aggaaacgcc gtcacgtaac gtaccctgcc 12840

agcgtttcgg cggagccagc acgttgcccg ccgtcacgga caggtcaatc atcgctttgg 12900

cgtgatcgcg tcgttcttgt tgataggtat cgagcagcgc atcacgggct ttcccctgga 12960

taaccaacgc cagtttccag gcgaggttaa aggcgtcgcg cataccgctg ttatagccct 13020

gcccctgcca taccggcatg atgtgcgcgg catcgcccgc cagcagtacg cgatcaatac 13080

ggaaacgttg cgccagtcgc gcgttgtggg tgtagacacg ctggcgaatc aattcaacat 13140

tgtccggatt aggcagcact ttgcttaaca gcttgcgcat attttgcggc tcacgcagct 13200

gttcttcggt ttctcctggc atcaccataa attcaaagcg acgtaccgca tgaggtagcg 13260

cggcagaaac atacgggcgc accggatcgc aacacaaata gatatgcggc gtacttaacg 13320

gatcgttggc gatatctacc acaatccact gatttggcgc agttttacct tcaaacggca 13380

cattcagggt gcgacggaca aaacttgccc caccatcaca ggccaccagc cactgggctt 13440

tgactatttc ccgctgccct tctgccgttt tcaggtgcaa ggtcacttcg tcatcttgct 13500

gactgaaggc ctccagctcg cgggaaaaca agcagcgcac attcggaaaa cgcgacaccc 13560

cttccagcat caccgcatcg acctgcggct gaataaaggc gttacggcgc ggccagccaa 13620

attcatcggt cattggctga atatcagcaa aacagcggcc tttcggggtg agaaaacgca 13680

tcgcgtgcca cggcgtagtg tgcggcagaa catcatcgac caggccgacc gactgcatgg 13740

tgcgcagcgc ctcgtcatca ataccaatcg cacgcgggta gtcgatcaac ttatcgagtt 13800

tctccaccac cagcacgtca atgcccatct ggccgagata gttcgccatc atcagcccaa 13860

ccgggccggc accagcgatc gccacctgaa cgctatggtt aacagcaggc tggatgtcag 13920

ggtgttgtat tgccatttca gtacctcacg actcggacaa aatgtcgttg cgcgcacagt 13980

acagcgcaac ttattttgtt aaaaacatgt aaatgatttt ttattgtgcg ctcagtatag 14040

gaagggtgtt ttcggctaca atcaaaacat gcccgaatgt gcaccaggtg caccacgttg 14100

ttttaactat agaaatgtca attaatatgc agaacaatga gcagacggaa tacaaaaccg 14160

tgcgcggctt aacccgcggt ctaatgttat taaatatgtt aaataaactt gatggcggtg 14220

ccagcgtcgg gctgctggcg gaactcagcg gcctgcatcg caccactgtg cggcgactgc 14280

tggagacgct gcaggaagag ggatatgtcc gccgtagccc ctccgatgat agttttcgac 14340

tgaccatcaa agtgcggcaa ttaagcgaag gatttcgtga cgaacagtgg atttctgcac 14400

tggcggcccc actgctgggc gatctgttgc gcgaagtggt atggccgaca gatgtgtcca 14460

cgctggatgt tgatgcaatg gtggtacgcg aaaccactca ccgtttcagc cgcttatcct 14520

ttcaccgggc aatggtcggg cgacgtttgc cgcttctgaa aaccgcctcg ggcctgacct 14580

ggctggcctt ttgcccggaa caagaccgca aggaattaat cgaaatgtta gcctcccgcc 14640

ccggtgatga ctatcaactg gcacgggaac cgttaaagct ggaagccatt ctggcgcgcg 14700

cgcgcaaaga gggttacgga cagaactacc gcggctggga tcaggaggag aagatcgcct 14760

ctatcgccgt accgctgcgc agtgaacaac gggtgattgg ctgtctgaat ctggtgtata 14820

tggcgagcgc aatgaccatt gaacaggcag cggaaaagca tcttccggcg ctacaacggg 14880

tagcaaaaca gatcgaagaa ggggttgaat cgcaggctat tctggtggcc ggaaggcgaa 14940

gcggcatgca tttacgttga caccatcgaa tggcgcaaaa cctttcgcgg tatggcatga 15000

tagcgcccgg aagagagtca attcagggtg gtgaatgtga aaccagtaac gttatacgat 15060

gtcgcagagt atgccggtgt ctcttatcag accgtttccc gcgtggtgaa ccaggccagc 15120

cacgtttctg cgaaaacgcg ggaaaaagtg gaagcggcga tggcggagct gaattacatt 15180

cccaaccgcg tggcacaaca actggcgggc aaacagtcgt tgctgattgg cgttgccacc 15240

tccagtctgg ccctgcacgc gccgtcgcaa attgtcgcgg cgattaaatc tcgcgccgat 15300

caactgggtg ccagcgtggt ggtgtcgatg gtagaacgaa gcggcgtcga agcctgtaaa 15360

gcggcggtgc acaatcttct cgcgcaacgc gtcagtgggc tgatcattaa ctatccgctg 15420

gatgaccagg atgccattgc tgtggaagct gcctgcacta atgttccggc gttatttctt 15480

gatgtctctg accagacacc catcaacagt attattttct cccatgaaga cggtacgcga 15540

ctgggcgtgg agcatctggt cgcattgggt caccagcaaa tcgcgctgtt agcgggccca 15600

ttaagttctg tctcggcgcg tctgcgtctg gctggctggc ataaatatct cactcgcaat 15660

caaattcagc cgatagcgga acgggaaggc gactggagtg ccatgtccgg ttttcaacaa 15720

accatgcaaa tgctgaatga gggcatcgtt cccactgcga tgctggttgc caacgatcag 15780

atggcgctgg gcgcaatgcg cgccattacc gagtccgggc tgcgcgttgg tgcggatatc 15840

tcggtagtgg gatacgacga taccgaagac agctcatgtt atatcccgcc gttaaccacc 15900

atcaaacagg attttcgcct gctggggcaa accagcgtgg accgcttgct gcaactctct 15960

cagggccagg cggtgaaggg caatcagctg ttgcccgtct cactggtgaa aagaaaaacc 16020

accctggcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag 16080

ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtaac 16140

taggcacccc aggctttaca ctttatgctt ccggctggta taatgtgtgg acctgtagaa 16200

ataattttgt ttaactttaa taaggagata taccatggga ggcagtactg ttgcaccaac 16260

tacaccgttg gcaaccggcg gtgcgctccg caaagtgcga caagccgtct ttcccatcta 16320

cggaaaccaa gaagtcacca aatttctgct catcggatcc attaaattct ttataatctt 16380

ggcactcacg ctcacgcgtg ataccaagga cacgttgatt gtcacgcaat gtggtgccga 16440

agcgattgcc tttctcaaaa tatacggggt gctacccgca gcgaccgcat ttatcgcgct 16500

ctattccaaa atgtccaacg ccatgggcaa aaaaatgcta ttttattcca cttgcattcc 16560

tttctttacc tttttcgggc tgtttgatgt tttcatttac ccgaacgcgg agcgactgca 16620

ccctagtttg gaagccgtgc aggcaattct cccgggcggt gccgcatctg gcggcatggc 16680

ggttctggcc aagattgcga cacactggac atcggcctta ttttacgtca tggcggaaat 16740

atattcttcc gtatcggtgg ggctattgtt ttggcagttt gcgaacgacg tcgtcaacgt 16800

ggatcaggcc aagcgctttt atccattatt tgctcaaatg agtggcctcg ctccagtttt 16860

agcgggccag tatgtggtac ggtttgccag caaagcggtc aactttgagg catccatgca 16920

tcgactcacg gcggccgtaa catttgctgg tattatgatt tgcatctttt accaactcag 16980

ttcgtcatat gtggagcgaa cggaatcagc aaagccagcg gcagataacg agcagtctat 17040

caaaccgaaa aagaagaaac ccaaaatgtc catggttgaa tcggggaaat ttctcgcgtc 17100

aagtcagtac ctgcgtctaa ttgccatgct ggtgctggga tacggcctca gtattaactt 17160

taccgaaatc atgtggaaaa gcttggtgaa gaaacaatat ccagacccgc tagattatca 17220

acgatttatg ggtaacttct cgtcagcggt tggtttgagc acatgcattg ttattttctt 17280

cggtgtgcac gtgatccgtt tgttggggtg gaaagtcgga gcgttggcta cacctgggat 17340

catggccatt ctagcgttac ccttttttgc ttgcattttg ttgggtttgg atagtccagc 17400

acgattggag atcgccgtaa tctttggaac aattcagagt ttgctgagca aaacctccaa 17460

gtatgccctt ttcgacccta ccacacaaat ggcttatatt cctctggacg acgaatcaaa 17520

ggtcaaagga aaagcggcaa ttgatgtttt gggatcgcgg attggcaaga gtggaggctc 17580

actgatccag cagggcttgg tctttgtttt tggaaatatc attaatgccg cacctgtagt 17640

aggggttgtc tactacagtg tccttgttgc gtggatgagc gcagctggcc gactaagtgg 17700

gctttttcaa gcacaaacag aaatggataa ggccgacaaa atggaggcaa agaccaacaa 17760

agaaaagtag ttaacctagg ctgctgccac cgctgagcaa taagactcct gttgatagat 17820

ccagtaatga cctcagaact ccatctggat ttgttcagaa cgctcggttg ccgccgggcg 17880

ttttttattg gtgagaat 17898

<210> 6

<211> 125

<212> ДНК

<213> Escherichia coli

<400> 6

aggagtaaaa atgattccgg ggatccgtcg acctgcagtt cgaagttcct attctctaga 60

aagtatagga acttcgaagc agctccagcc tacagaaact aacgaagatt tttaatcgtc 120

ttgtt 125

<210> 7

<211> 1082

<212> ДНК

<213> Escherichia coli

<400> 7

aggagtaaaa atggctatcg acgaaaacaa acagaaagcg ttggcggcag cactgggcca 60

gattgagaaa caatttggta aaggctccat catgcgcctg ggtgaagacc gttccatgga 120

tgtggaaacc atctctaccg gttcgctttc actggatatc gcgcttgggg caggtggtct 180

gccgatgggc cgtatcgtcg aaatctacgg accggaatct tccggtaaaa ccacgctgac 240

gctgcaggtg atcgccgcag cgcagcgtga aggtaaaacc tgtgcgttta tcgatgctga 300

acacgcgctg gacccaatct acgcacgtaa actgggcgtc gatatcgata acctgctgtg 360

ctcccagccg gacaccggcg agcaggcact ggaaatctgt gacgccctgg cgcgttctgg 420

cgcagtagac gttatcgtcg ttgactccgt ggcggcactg acgccgaaag cggaaatcga 480

aggcgaaatc ggcgactctc acatgggcct tgcggcacgt atgatgagcc aggcgatgcg 540

taagctggcg ggtaacctga agcagtccaa cacgctgctg atcttcatca accagatccg 600

tatgaaaatt ggtgtgatgt tcggtaaccc ggaaaccact accggtggta acgcgctgaa 660

attctacgcc tctgttcgtc tcgacatccg tcgtatcggc gcggtgaaag agggcgaaaa 720

cgtggtgggt agcgaaaccc gcgtgaaagt ggtgaagaac aaaatcgctg cgccgtttaa 780

acaggctgaa ttccagatcc tctacggcga aggtatcaac ttctacggcg aactggttga 840

cctgggcgta aaagagaagc tgatcgagaa agcaggcgcg tggtacagct acaaaggtga 900

gaagatcggt cagggtaaag cgaatgcgac tgcctggctg aaagataacc cggaaaccgc 960

gaaagagatc gagaagaaag tacgtgagtt gctgctgagc aacccgaact caacgccgga 1020

tttctctgta gatgatagcg aaggcgtagc agaaactaac gaagattttt aatcgtcttg 1080

tt 1082

<210> 8

<211> 783

<212> БЕЛОК

<213> Escherichia coli

<400> 8

Met Ala Gln Ala Gly Phe Ile Leu Thr Arg His Trp Arg Asp Thr Pro

1 5 10 15

Gln Gly Thr Glu Val Ser Phe Trp Leu Ala Thr Asp Asn Gly Pro Leu

20 25 30

Gln Val Thr Leu Ala Pro Gln Glu Ser Val Ala Phe Ile Pro Ala Asp

35 40 45

Gln Val Pro Arg Ala Gln His Ile Leu Gln Gly Glu Gln Gly Val Arg

50 55 60

Leu Thr Pro Leu Ala Leu Lys Asp Phe His Arg Gln Pro Val Tyr Gly

65 70 75 80

Leu Tyr Cys Arg Ala His Arg Gln Leu Met Asn Tyr Glu Lys Arg Leu

85 90 95

Arg Glu Gly Gly Val Thr Val Tyr Glu Ala Asp Val Arg Pro Pro Glu

100 105 110

Arg Tyr Leu Met Glu Arg Phe Ile Thr Ser Pro Val Trp Val Glu Gly

115 120 125

Asp Met His Asn Gly Ala Ile Val Asn Ala Arg Leu Lys Pro His Pro

130 135 140

Asp Tyr Arg Pro Pro Leu Lys Trp Val Ser Ile Asp Ile Glu Thr Thr

145 150 155 160

Arg His Gly Glu Leu Tyr Cys Ile Gly Leu Glu Gly Cys Gly Gln Arg

165 170 175

Ile Val Tyr Met Leu Gly Pro Glu Asn Gly Asp Ala Ser Ala Leu Asp

180 185 190

Phe Glu Leu Glu Tyr Val Ala Ser Arg Pro Gln Leu Leu Glu Lys Leu

195 200 205

Asn Ala Trp Phe Ala Asn Tyr Asp Pro Asp Val Ile Ile Gly Trp Asn

210 215 220

Val Val Gln Phe Asp Leu Arg Met Leu Gln Lys His Ala Glu Arg Tyr

225 230 235 240

Arg Ile Pro Leu Arg Leu Gly Arg Asp Asn Ser Glu Leu Glu Trp Arg

245 250 255

Glu His Gly Phe Lys Asn Gly Val Phe Phe Ala Gln Ala Lys Gly Arg

260 265 270

Leu Ile Ile Asp Gly Ile Glu Ala Leu Lys Ser Ala Phe Trp Asn Phe

275 280 285

Ser Ser Phe Ser Leu Glu Thr Val Ala Gln Glu Leu Leu Gly Glu Gly

290 295 300

Lys Ser Ile Asp Asn Pro Trp Asp Arg Met Asp Glu Ile Asp Arg Arg

305 310 315 320

Phe Ala Glu Asp Lys Pro Ala Leu Ala Thr Tyr Asn Leu Lys Asp Cys

325 330 335

Glu Leu Val Thr Gln Ile Phe His Lys Thr Glu Ile Met Pro Phe Leu

340 345 350

Leu Glu Arg Ala Thr Val Asn Gly Leu Pro Val Asp Arg His Gly Gly

355 360 365

Ser Val Ala Ala Phe Gly His Leu Tyr Phe Pro Arg Met His Arg Ala

370 375 380

Gly Tyr Val Ala Pro Asn Leu Gly Glu Val Pro Pro His Ala Ser Pro

385 390 395 400

Gly Gly Tyr Val Met Asp Ser Arg Pro Gly Leu Tyr Asp Ser Val Leu

405 410 415

Val Leu Asp Tyr Lys Ser Leu Tyr Pro Ser Ile Ile Arg Thr Phe Leu

420 425 430

Ile Asp Pro Val Gly Leu Val Glu Gly Met Ala Gln Pro Asp Pro Glu

435 440 445

His Ser Thr Glu Gly Phe Leu Asp Ala Trp Phe Ser Arg Glu Lys His

450 455 460

Cys Leu Pro Glu Ile Val Thr Asn Ile Trp His Gly Arg Asp Glu Ala

465 470 475 480

Lys Arg Gln Gly Asn Lys Pro Leu Ser Gln Ala Leu Lys Ile Ile Met

485 490 495

Asn Ala Phe Tyr Gly Val Leu Gly Thr Thr Ala Cys Arg Phe Phe Asp

500 505 510

Pro Arg Leu Ala Ser Ser Ile Thr Met Arg Gly His Gln Ile Met Arg

515 520 525

Gln Thr Lys Ala Leu Ile Glu Ala Gln Gly Tyr Asp Val Ile Tyr Gly

530 535 540

Asp Thr Asp Ser Thr Phe Val Trp Leu Lys Gly Ala His Ser Glu Glu

545 550 555 560

Glu Ala Ala Lys Ile Gly Arg Ala Leu Val Gln His Val Asn Ala Trp

565 570 575

Trp Ala Glu Thr Leu Gln Lys Gln Arg Leu Thr Ser Ala Leu Glu Leu

580 585 590

Glu Tyr Glu Thr His Phe Cys Arg Phe Leu Met Pro Thr Ile Arg Gly

595 600 605

Ala Asp Thr Gly Ser Lys Lys Arg Tyr Ala Gly Leu Ile Gln Glu Gly

610 615 620

Asp Lys Gln Arg Met Val Phe Lys Gly Leu Glu Thr Val Arg Thr Asp

625 630 635 640

Trp Thr Pro Leu Ala Gln Gln Phe Gln Gln Glu Leu Tyr Leu Arg Ile

645 650 655

Phe Arg Asn Glu Pro Tyr Gln Glu Tyr Val Arg Glu Thr Ile Asp Lys

660 665 670

Leu Met Ala Gly Glu Leu Asp Ala Arg Leu Val Tyr Arg Lys Arg Leu

675 680 685

Arg Arg Pro Leu Ser Glu Tyr Gln Arg Asn Val Pro Pro His Val Arg

690 695 700

Ala Ala Arg Leu Ala Asp Glu Glu Asn Gln Lys Arg Gly Arg Pro Leu

705 710 715 720

Gln Tyr Gln Asn Arg Gly Thr Ile Lys Tyr Val Trp Thr Thr Asn Gly

725 730 735

Pro Glu Pro Leu Asp Tyr Gln Arg Ser Pro Leu Asp Tyr Glu His Tyr

740 745 750

Leu Thr Arg Gln Leu Gln Pro Val Ala Glu Gly Ile Leu Pro Phe Ile

755 760 765

Glu Asp Asn Phe Ala Thr Leu Met Thr Gly Gln Leu Gly Leu Phe

770 775 780

<210> 9

<211> 320

<212> БЕЛОК

<213> Escherichia coli

<400> 9

Met Ala Ile Ser Ser Arg Asn Thr Leu Leu Ala Ala Leu Ala Phe Ile

1 5 10 15

Ala Phe Gln Ala Gln Ala Val Asn Val Thr Val Ala Tyr Gln Thr Ser

20 25 30

Ala Glu Pro Ala Lys Val Ala Gln Ala Asp Asn Thr Phe Ala Lys Glu

35 40 45

Ser Gly Ala Thr Val Asp Trp Arg Lys Phe Asp Ser Gly Ala Ser Ile

50 55 60

Val Arg Ala Leu Ala Ser Gly Asp Val Gln Ile Gly Asn Leu Gly Ser

65 70 75 80

Ser Pro Leu Ala Val Ala Ala Ser Gln Gln Val Pro Ile Glu Val Phe

85 90 95

Leu Leu Ala Ser Lys Leu Gly Asn Ser Glu Ala Leu Val Val Lys Lys

100 105 110

Thr Ile Ser Lys Pro Glu Asp Leu Ile Gly Lys Arg Ile Ala Val Pro

115 120 125

Phe Ile Ser Thr Thr His Tyr Ser Leu Leu Ala Ala Leu Lys His Trp

130 135 140

Gly Ile Lys Pro Gly Gln Val Glu Ile Val Asn Leu Gln Pro Pro Ala

145 150 155 160

Ile Ile Ala Ala Trp Gln Arg Gly Asp Ile Asp Gly Ala Tyr Val Trp

165 170 175

Ala Pro Ala Val Asn Ala Leu Glu Lys Asp Gly Lys Val Leu Thr Asp

180 185 190

Ser Glu Gln Val Gly Gln Trp Gly Ala Pro Thr Leu Asp Val Trp Val

195 200 205

Val Arg Lys Asp Phe Ala Glu Lys His Pro Glu Val Val Lys Ala Phe

210 215 220

Ala Lys Ser Ala Ile Asp Ala Gln Gln Pro Tyr Ile Ala Asn Pro Asp

225 230 235 240

Ala Trp Leu Lys Gln Pro Glu Asn Ile Ser Lys Leu Ala Arg Leu Ser

245 250 255

Gly Val Pro Glu Gly Asp Val Pro Gly Leu Val Lys Gly Asn Thr Tyr

260 265 270

Leu Thr Pro Gln Gln Gln Thr Ala Glu Leu Thr Gly Pro Val Asn Lys

275 280 285

Ala Ile Ile Asp Thr Ala Gln Phe Leu Lys Glu Gln Gly Lys Val Pro

290 295 300

Ala Val Ala Asn Asp Tyr Ser Gln Tyr Val Thr Ser Arg Phe Val Gln

305 310 315 320

<210> 10

<211> 91

<212> БЕЛОК

<213> Escherichia coli

<400> 10

Met Ala Ser Val Ser Ile Ser Cys Pro Ser Cys Ser Ala Thr Asp Gly

1 5 10 15

Val Val Arg Asn Gly Lys Ser Thr Ala Gly His Gln Arg Tyr Leu Cys

20 25 30

Ser His Cys Arg Lys Thr Trp Gln Leu Gln Phe Thr Tyr Thr Ala Ser

35 40 45

Gln Pro Gly Thr His Gln Lys Ile Ile Asp Met Ala Met Asn Gly Val

50 55 60

Gly Cys Arg Ala Thr Ala Arg Ile Met Gly Val Gly Leu Asn Thr Ile

65 70 75 80

Leu Arg His Leu Lys Asn Ser Gly Arg Ser Arg

85 90

<210> 11

<211> 167

<212> БЕЛОК

<213> Escherichia coli

<400> 11

Met Pro Gly Asn Cys Pro His Tyr Gly Arg Trp Pro Gln His Asp Phe

1 5 10 15

Thr Ser Leu Lys Lys Leu Arg Pro Gln Ser Val Thr Ser Arg Ile Gln

20 25 30

Pro Gly Ser Asp Val Ile Val Cys Ala Glu Met Asp Glu Gln Trp Gly

35 40 45

Tyr Val Gly Ala Lys Ser Arg Gln Arg Trp Leu Phe Tyr Ala Tyr Asp

50 55 60

Arg Leu Arg Lys Thr Val Val Ala His Val Phe Gly Glu Arg Thr Met

65 70 75 80

Ala Thr Leu Gly Arg Leu Met Ser Leu Met Ser Pro Phe Asp Val Val

85 90 95

Ile Trp Met Thr Asp Gly Trp Pro Leu Tyr Glu Ser Arg Leu Lys Gly

100 105 110

Lys Leu His Val Ile Ser Lys Arg Tyr Thr Gln Arg Ile Glu Arg His

115 120 125

Asn Leu Asn Leu Arg Gln His Leu Ala Arg Leu Gly Arg Lys Ser Leu

130 135 140

Ser Phe Ser Lys Ser Val Glu Leu His Asp Lys Val Ile Gly His Tyr

145 150 155 160

Leu Asn Ile Lys His Tyr Gln

165

<210> 12

<211> 511

<212> БЕЛОК

<213> Escherichia coli

<400> 12

Met Gly Gly Ser Thr Val Ala Pro Thr Thr Pro Leu Ala Thr Gly Gly

1 5 10 15

Ala Leu Arg Lys Val Arg Gln Ala Val Phe Pro Ile Tyr Gly Asn Gln

20 25 30

Glu Val Thr Lys Phe Leu Leu Ile Gly Ser Ile Lys Phe Phe Ile Ile

35 40 45

Leu Ala Leu Thr Leu Thr Arg Asp Thr Lys Asp Thr Leu Ile Val Thr

50 55 60

Gln Cys Gly Ala Glu Ala Ile Ala Phe Leu Lys Ile Tyr Gly Val Leu

65 70 75 80

Pro Ala Ala Thr Ala Phe Ile Ala Leu Tyr Ser Lys Met Ser Asn Ala

85 90 95

Met Gly Lys Lys Met Leu Phe Tyr Ser Thr Cys Ile Pro Phe Phe Thr

100 105 110

Phe Phe Gly Leu Phe Asp Val Phe Ile Tyr Pro Asn Ala Glu Arg Leu

115 120 125

His Pro Ser Leu Glu Ala Val Gln Ala Ile Leu Pro Gly Gly Ala Ala

130 135 140

Ser Gly Gly Met Ala Val Leu Ala Lys Ile Ala Thr His Trp Thr Ser

145 150 155 160

Ala Leu Phe Tyr Val Met Ala Glu Ile Tyr Ser Ser Val Ser Val Gly

165 170 175

Leu Leu Phe Trp Gln Phe Ala Asn Asp Val Val Asn Val Asp Gln Ala

180 185 190

Lys Arg Phe Tyr Pro Leu Phe Ala Gln Met Ser Gly Leu Ala Pro Val

195 200 205

Leu Ala Gly Gln Tyr Val Val Arg Phe Ala Ser Lys Ala Val Asn Phe

210 215 220

Glu Ala Ser Met His Arg Leu Thr Ala Ala Val Thr Phe Ala Gly Ile

225 230 235 240

Met Ile Cys Ile Phe Tyr Gln Leu Ser Ser Ser Tyr Val Glu Arg Thr

245 250 255

Glu Ser Ala Lys Pro Ala Ala Asp Asn Glu Gln Ser Ile Lys Pro Lys

260 265 270

Lys Lys Lys Pro Lys Met Ser Met Val Glu Ser Gly Lys Phe Leu Ala

275 280 285

Ser Ser Gln Tyr Leu Arg Leu Ile Ala Met Leu Val Leu Gly Tyr Gly

290 295 300

Leu Ser Ile Asn Phe Thr Glu Ile Met Trp Lys Ser Leu Val Lys Lys

305 310 315 320

Gln Tyr Pro Asp Pro Leu Asp Tyr Gln Arg Phe Met Gly Asn Phe Ser

325 330 335

Ser Ala Val Gly Leu Ser Thr Cys Ile Val Ile Phe Phe Gly Val His

340 345 350

Val Ile Arg Leu Leu Gly Trp Lys Val Gly Ala Leu Ala Thr Pro Gly

355 360 365

Ile Met Ala Ile Leu Ala Leu Pro Phe Phe Ala Cys Ile Leu Leu Gly

370 375 380

Leu Asp Ser Pro Ala Arg Leu Glu Ile Ala Val Ile Phe Gly Thr Ile

385 390 395 400

Gln Ser Leu Leu Ser Lys Thr Ser Lys Tyr Ala Leu Phe Asp Pro Thr

405 410 415

Thr Gln Met Ala Tyr Ile Pro Leu Asp Asp Glu Ser Lys Val Lys Gly

420 425 430

Lys Ala Ala Ile Asp Val Leu Gly Ser Arg Ile Gly Lys Ser Gly Gly

435 440 445

Ser Leu Ile Gln Gln Gly Leu Val Phe Val Phe Gly Asn Ile Ile Asn

450 455 460

Ala Ala Pro Val Val Gly Val Val Tyr Tyr Ser Val Leu Val Ala Trp

465 470 475 480

Met Ser Ala Ala Gly Arg Leu Ser Gly Leu Phe Gln Ala Gln Thr Glu

485 490 495

Met Asp Lys Ala Asp Lys Met Glu Ala Lys Thr Asn Lys Glu Lys

500 505 510

<210> 13

<211> 257

<212> БЕЛОК

<213> Escherichia coli

<400> 13

Met Ile Lys Arg Thr Leu Leu Ala Ala Ala Ile Phe Ser Ala Leu Pro

1 5 10 15

Ala Tyr Ala Gly Leu Thr Ser Ile Thr Ala Gly Tyr Asp Phe Thr Asp

20 25 30

Tyr Ser Gly Asp His Gly Asn Arg Asn Leu Ala Tyr Ala Glu Leu Val

35 40 45

Ala Lys Val Glu Asn Ala Thr Leu Leu Phe Asn Leu Ser Gln Gly Arg

50 55 60

Arg Asp Tyr Glu Thr Glu His Phe Asn Ala Thr Arg Gly Gln Gly Ala

65 70 75 80

Val Trp Tyr Lys Trp Asn Asn Trp Leu Thr Thr Arg Thr Gly Ile Ala

85 90 95

Phe Ala Asp Asn Thr Pro Val Phe Ala Arg Gln Asp Phe Arg Gln Asp

100 105 110

Ile Asn Leu Ala Leu Leu Pro Lys Thr Leu Phe Thr Thr Gly Tyr Arg

115 120 125

Tyr Thr Lys Tyr Tyr Asp Asp Val Glu Val Asp Ala Trp Gln Gly Gly

130 135 140

Val Ser Leu Tyr Thr Gly Pro Val Ile Thr Ser Tyr Arg Tyr Thr His

145 150 155 160

Tyr Asp Ser Ser Asp Ala Gly Gly Ser Tyr Ser Asn Met Ile Ser Val

165 170 175

Arg Leu Asn Asp Pro Arg Gly Thr Gly Tyr Thr Gln Leu Trp Leu Ser

180 185 190

Arg Gly Thr Gly Ala Tyr Thr Tyr Asp Trp Thr Pro Glu Thr Arg Tyr

195 200 205

Gly Ser Met Lys Ser Val Ser Leu Gln Arg Ile Gln Pro Leu Thr Glu

210 215 220

Gln Leu Asn Leu Gly Leu Thr Ala Gly Lys Val Trp Tyr Asp Thr Pro

225 230 235 240

Thr Asp Asp Tyr Asn Gly Leu Gln Leu Ala Ala His Leu Thr Trp Lys

245 250 255

Phe

<210> 14

<211> 91

<212> БЕЛОК

<213> Escherichia coli

<400> 14

Met Pro Ser Thr Pro Glu Glu Lys Lys Lys Val Leu Thr Arg Val Arg

1 5 10 15

Arg Ile Arg Gly Gln Ile Asp Ala Leu Glu Arg Ser Leu Glu Gly Asp

20 25 30

Ala Glu Cys Arg Ala Ile Leu Gln Gln Ile Ala Ala Val Arg Gly Ala

35 40 45

Ala Asn Gly Leu Met Ala Glu Val Leu Glu Ser His Ile Arg Glu Thr

50 55 60

Phe Asp Arg Asn Asp Cys Tyr Ser Arg Glu Val Ser Gln Ser Val Asp

65 70 75 80

Asp Thr Ile Glu Leu Val Arg Ala Tyr Leu Lys

85 90

<210> 15

<211> 369

<212> БЕЛОК

<213> Escherichia coli

<400> 15

Met Lys Ser Arg Ala Ala Val Ala Phe Ala Pro Gly Lys Pro Leu Glu

1 5 10 15

Ile Val Glu Ile Asp Val Ala Pro Pro Lys Lys Gly Glu Val Leu Ile

20 25 30

Lys Val Thr His Thr Gly Val Cys His Thr Asp Ala Phe Thr Leu Ser

35 40 45

Gly Asp Asp Pro Glu Gly Val Phe Pro Val Val Leu Gly His Glu Gly

50 55 60

Ala Gly Val Val Val Glu Val Gly Glu Gly Val Thr Ser Val Lys Pro

65 70 75 80

Gly Asp His Val Ile Pro Leu Tyr Thr Ala Glu Cys Gly Glu Cys Glu

85 90 95

Phe Cys Arg Ser Gly Lys Thr Asn Leu Cys Val Ala Val Arg Glu Thr

100 105 110

Gln Gly Lys Gly Leu Met Pro Asp Gly Thr Thr Arg Phe Ser Tyr Asn

115 120 125

Gly Gln Pro Leu Tyr His Tyr Met Gly Cys Ser Thr Phe Ser Glu Tyr

130 135 140

Thr Val Val Ala Glu Val Ser Leu Ala Lys Ile Asn Pro Glu Ala Asn

145 150 155 160

His Glu His Val Cys Leu Leu Gly Cys Gly Val Thr Thr Gly Ile Gly

165 170 175

Ala Val His Asn Thr Ala Lys Val Gln Pro Gly Asp Ser Val Ala Val

180 185 190

Phe Gly Leu Gly Ala Ile Gly Leu Ala Val Val Gln Gly Ala Arg Gln

195 200 205

Ala Lys Ala Gly Arg Ile Ile Ala Ile Asp Thr Asn Pro Lys Lys Phe

210 215 220

Asp Leu Ala Arg Arg Phe Gly Ala Thr Asp Cys Ile Asn Pro Asn Asp

225 230 235 240

Tyr Asp Lys Pro Ile Lys Asp Val Leu Leu Asp Ile Asn Lys Trp Gly

245 250 255

Ile Asp His Thr Phe Glu Cys Ile Gly Asn Val Asn Val Met Arg Ala

260 265 270

Ala Leu Glu Ser Ala His Arg Gly Trp Gly Gln Ser Val Ile Ile Gly

275 280 285

Val Ala Gly Ala Gly Gln Glu Ile Ser Thr Arg Pro Phe Gln Leu Val

290 295 300

Thr Gly Arg Val Trp Lys Gly Ser Ala Phe Gly Gly Val Lys Gly Arg

305 310 315 320

Ser Gln Leu Pro Gly Met Val Glu Asp Ala Met Lys Gly Asp Ile Asp

325 330 335

Leu Glu Pro Phe Val Thr His Thr Met Ser Leu Asp Glu Ile Asn Asp

340 345 350

Ala Phe Asp Leu Met His Glu Gly Lys Ser Ile Arg Thr Val Ile Arg

355 360 365

Tyr

<210> 16

<211> 277

<212> БЕЛОК

<213> Escherichia coli

<400> 16

Met Glu Leu Ile Glu Lys His Ala Ser Phe Gly Gly Trp Gln Asn Val

1 5 10 15

Tyr Arg His Tyr Ser Gln Ser Leu Lys Cys Glu Met Asn Val Gly Val

20 25 30

Tyr Leu Pro Pro Lys Ala Ala Asn Glu Lys Leu Pro Val Leu Tyr Trp

35 40 45

Leu Ser Gly Leu Thr Cys Asn Glu Gln Asn Phe Ile Thr Lys Ser Gly

50 55 60

Met Gln Arg Tyr Ala Ala Glu His Asn Ile Ile Val Val Ala Pro Asp

65 70 75 80

Thr Ser Pro Arg Gly Ser His Val Ala Asp Ala Asp Arg Tyr Asp Leu

85 90 95

Gly Gln Gly Ala Gly Phe Tyr Leu Asn Ala Thr Gln Ala Pro Trp Asn

100 105 110

Glu His Tyr Lys Met Tyr Asp Tyr Ile Arg Asn Glu Leu Pro Asp Leu

115 120 125

Val Met His His Phe Pro Ala Thr Ala Lys Lys Ser Ile Ser Gly His

130 135 140

Ser Met Gly Gly Leu Gly Ala Leu Val Leu Ala Leu Arg Asn Pro Asp

145 150 155 160

Glu Tyr Val Ser Val Ser Ala Phe Ser Pro Ile Val Ser Pro Ser Gln

165 170 175

Val Pro Trp Gly Gln Gln Ala Phe Ala Ala Tyr Leu Ala Glu Asn Lys

180 185 190

Asp Ala Trp Leu Asp Tyr Asp Pro Val Ser Leu Ile Ser Gln Gly Gln

195 200 205

Arg Val Ala Glu Ile Met Val Asp Gln Gly Leu Ser Asp Asp Phe Tyr

210 215 220

Ala Glu Gln Leu Arg Thr Pro Asn Leu Glu Lys Ile Cys Gln Glu Met

225 230 235 240

Asn Ile Lys Thr Leu Ile Arg Tyr His Glu Gly Tyr Asp His Ser Tyr

245 250 255

Tyr Phe Val Ser Ser Phe Ile Gly Glu His Ile Ala Tyr His Ala Asn

260 265 270

Lys Leu Asn Met Arg

275

<210> 17

<211> 179

<212> БЕЛОК

<213> Escherichia coli

<400> 17

Met Ala Lys Leu Thr Leu Gln Glu Gln Leu Leu Lys Ala Gly Leu Val

1 5 10 15

Thr Ser Lys Lys Ala Ala Lys Val Glu Arg Thr Ala Lys Lys Ser Arg

20 25 30

Val Gln Ala Arg Glu Ala Arg Ala Ala Val Glu Glu Asn Lys Lys Ala

35 40 45

Gln Leu Glu Arg Asp Lys Gln Leu Ser Glu Gln Gln Lys Gln Ala Ala

50 55 60

Leu Ala Lys Glu Tyr Lys Ala Gln Val Lys Gln Leu Ile Glu Met Asn

65 70 75 80

Arg Ile Thr Ile Ala Asn Gly Asp Ile Gly Phe Asn Phe Thr Asp Gly

85 90 95

Asn Leu Ile Lys Lys Ile Phe Val Asp Lys Leu Thr Gln Ala Gln Leu

100 105 110

Ile Asn Gly Arg Leu Ala Ile Ala Arg Leu Leu Val Asp Asn Asn Ser

115 120 125

Glu Gly Glu Tyr Ala Ile Ile Pro Ala Ser Val Ala Asp Lys Ile Ala

130 135 140

Gln Arg Asp Ala Ser Ser Ile Val Leu His Ser Ala Leu Ser Ala Glu

145 150 155 160

Glu Gln Asp Glu Asp Asp Pro Tyr Ala Asp Phe Lys Val Pro Asp Asp

165 170 175

Leu Met Trp

<210> 18

<211> 403

<212> БЕЛОК

<213> Escherichia coli

<400> 18

Met Ser Thr Arg Thr Pro Ser Ser Ser Ser Ser Arg Leu Met Leu Thr

1 5 10 15

Ile Gly Leu Cys Phe Leu Val Ala Leu Met Glu Gly Leu Asp Leu Gln

20 25 30

Ala Ala Gly Ile Ala Ala Gly Gly Ile Ala Gln Ala Phe Ala Leu Asp

35 40 45

Lys Met Gln Met Gly Trp Ile Phe Ser Ala Gly Ile Leu Gly Leu Leu

50 55 60

Pro Gly Ala Leu Val Gly Gly Met Leu Ala Asp Arg Tyr Gly Arg Lys

65 70 75 80

Arg Ile Leu Ile Gly Ser Val Ala Leu Phe Gly Leu Phe Ser Leu Ala

85 90 95

Thr Ala Ile Ala Trp Asp Phe Pro Ser Leu Val Phe Ala Arg Leu Met

100 105 110

Thr Gly Val Gly Leu Gly Ala Ala Leu Pro Asn Leu Ile Ala Leu Thr

115 120 125

Ser Glu Ala Ala Gly Pro Arg Phe Arg Gly Thr Ala Val Ser Leu Met

130 135 140

Tyr Cys Gly Val Pro Ile Gly Ala Ala Leu Ala Ala Thr Leu Gly Phe

145 150 155 160

Ala Gly Ala Asn Leu Ala Trp Gln Thr Val Phe Trp Val Gly Gly Val

165 170 175

Val Pro Leu Ile Leu Val Pro Leu Leu Met Arg Trp Leu Pro Glu Ser

180 185 190

Ala Val Phe Ala Gly Glu Lys Gln Ser Ala Pro Pro Leu Arg Ala Leu

195 200 205

Phe Ala Pro Glu Thr Ala Thr Ala Thr Leu Leu Leu Trp Leu Cys Tyr

210 215 220

Phe Phe Thr Leu Leu Val Val Tyr Met Leu Ile Asn Trp Leu Pro Leu

225 230 235 240

Leu Leu Val Glu Gln Gly Phe Gln Pro Ser Gln Ala Ala Gly Val Met

245 250 255

Phe Ala Leu Gln Met Gly Ala Ala Ser Gly Thr Leu Met Leu Gly Ala

260 265 270

Leu Met Asp Lys Leu Arg Pro Val Thr Met Ser Leu Leu Ile Tyr Ser

275 280 285

Gly Met Leu Ala Ser Leu Leu Ala Leu Gly Thr Val Ser Ser Phe Asn

290 295 300

Gly Met Leu Leu Ala Gly Phe Val Ala Gly Leu Phe Ala Thr Gly Gly

305 310 315 320

Gln Ser Val Leu Tyr Ala Leu Ala Pro Leu Phe Tyr Ser Ser Gln Ile

325 330 335

Arg Ala Thr Gly Val Gly Thr Ala Val Ala Val Gly Arg Leu Gly Ala

340 345 350

Met Ser Gly Pro Leu Leu Ala Gly Lys Met Leu Ala Leu Gly Thr Gly

355 360 365

Thr Val Gly Val Met Ala Ala Ser Ala Pro Gly Ile Leu Val Ala Gly

370 375 380

Leu Ala Val Phe Ile Leu Met Ser Arg Arg Ser Arg Ile Gln Pro Cys

385 390 395 400

Ala Asp Ala

<210> 19

<211> 337

<212> БЕЛОК

<213> Escherichia coli

<400> 19

Met Asn Gly Lys Lys Leu Tyr Ile Ser Asp Val Thr Leu Arg Asp Gly

1 5 10 15

Met His Ala Ile Arg His Gln Tyr Ser Leu Glu Asn Val Arg Gln Ile

20 25 30

Ala Lys Ala Leu Asp Asp Ala His Val Asp Ser Ile Glu Val Ala His

35 40 45

Gly Asp Gly Leu Gln Gly Ser Ser Phe Asn Tyr Gly Phe Gly Ala His

50 55 60

Ser Asp Leu Glu Trp Ile Glu Ala Ala Ala Asp Val Val Lys His Ala

65 70 75 80

Lys Ile Ala Thr Leu Leu Leu Pro Gly Ile Gly Thr Ile His Asp Leu

85 90 95

Lys Asn Ala Trp Gln Ala Gly Ala Arg Val Val Arg Val Ala Thr His

100 105 110

Cys Thr Glu Ala Asp Val Ser Ala Gln His Ile Gln Tyr Ala Arg Glu

115 120 125

Leu Gly Met Asp Thr Val Gly Phe Leu Met Met Ser His Met Thr Thr

130 135 140

Pro Glu Asn Leu Ala Lys Gln Ala Lys Leu Met Glu Gly Tyr Gly Ala

145 150 155 160

Thr Cys Ile Tyr Val Val Asp Ser Gly Gly Ala Met Asn Met Ser Asp

165 170 175

Ile Arg Asp Arg Phe Arg Ala Leu Lys Ala Val Leu Lys Pro Glu Thr

180 185 190

Gln Thr Gly Met His Ala His His Asn Leu Ser Leu Gly Val Ala Asn

195 200 205

Ser Ile Glu Ala Val Glu Glu Gly Cys Asp Arg Ile Asp Ala Ser Leu

210 215 220

Ala Gly Met Gly Ala Gly Ala Gly Asn Ala Pro Leu Glu Val Phe Ile

225 230 235 240

Ala Ala Ala Asp Lys Leu Gly Trp Gln His Gly Thr Asp Leu Tyr Ala

245 250 255

Leu Met Asp Ala Ala Asp Asp Leu Val Arg Pro Leu Gln Asp Arg Pro

260 265 270

Val Arg Val Asp Arg Glu Thr Leu Ala Leu Gly Tyr Ala Gly Val Tyr

275 280 285

Ser Ser Phe Leu Arg His Cys Glu Thr Ala Ala Ala Arg Tyr Gly Leu

290 295 300

Ser Ala Val Asp Ile Leu Val Glu Leu Gly Lys Arg Arg Met Val Gly

305 310 315 320

Gly Gln Glu Asp Met Ile Val Asp Val Ala Leu Asp Leu Arg Asn Asn

325 330 335

Lys

<210> 20

<211> 316

<212> БЕЛОК

<213> Escherichia coli

<400> 20

Met Ser Lys Arg Lys Val Ala Ile Ile Gly Ser Gly Asn Ile Gly Thr

1 5 10 15

Asp Leu Met Ile Lys Ile Leu Arg His Gly Gln His Leu Glu Met Ala

20 25 30

Val Met Val Gly Ile Asp Pro Gln Ser Asp Gly Leu Ala Arg Ala Arg

35 40 45

Arg Met Gly Val Ala Thr Thr His Glu Gly Val Ile Gly Leu Met Asn

50 55 60

Met Pro Glu Phe Ala Asp Ile Asp Ile Val Phe Asp Ala Thr Ser Ala

65 70 75 80

Gly Ala His Val Lys Asn Asp Ala Ala Leu Arg Glu Ala Lys Pro Asp

85 90 95

Ile Arg Leu Ile Asp Leu Thr Pro Ala Ala Ile Gly Pro Tyr Cys Val

100 105 110

Pro Val Val Asn Leu Glu Ala Asn Val Asp Gln Leu Asn Val Asn Met

115 120 125

Val Thr Cys Gly Gly Gln Ala Thr Ile Pro Met Val Ala Ala Val Ser

130 135 140

Arg Val Ala Arg Val His Tyr Ala Glu Ile Ile Ala Ser Ile Ala Ser

145 150 155 160

Lys Ser Ala Gly Pro Gly Thr Arg Ala Asn Ile Asp Glu Phe Thr Glu

165 170 175

Thr Thr Ser Arg Ala Ile Glu Val Val Gly Gly Ala Ala Lys Gly Lys

180 185 190

Ala Ile Ile Val Leu Asn Pro Ala Glu Pro Pro Leu Met Met Arg Asp

195 200 205

Thr Val Tyr Val Leu Ser Asp Glu Ala Ser Gln Asp Asp Ile Glu Ala

210 215 220

Ser Ile Asn Glu Met Ala Glu Ala Val Gln Ala Tyr Val Pro Gly Tyr

225 230 235 240

Arg Leu Lys Gln Arg Val Gln Phe Glu Val Ile Pro Gln Asp Lys Pro

245 250 255

Val Asn Leu Pro Gly Val Gly Gln Phe Ser Gly Leu Lys Thr Ala Val

260 265 270

Trp Leu Glu Val Glu Gly Ala Ala His Tyr Leu Pro Ala Tyr Ala Gly

275 280 285

Asn Leu Asp Ile Met Thr Ser Ser Ala Leu Ala Thr Ala Glu Lys Met

290 295 300

Ala Gln Ser Leu Ala Arg Lys Ala Gly Glu Ala Ala

305 310 315

<210> 21

<211> 269

<212> БЕЛОК

<213> Escherichia coli

<400> 21

Met Thr Lys His Thr Leu Glu Gln Leu Ala Ala Asp Leu Arg Arg Ala

1 5 10 15

Ala Glu Gln Gly Glu Ala Ile Ala Pro Leu Arg Asp Leu Ile Gly Ile

20 25 30

Asp Asn Ala Glu Ala Ala Tyr Ala Ile Gln His Ile Asn Val Gln Tyr

35 40 45

Asp Val Ala Gln Gly Arg Arg Val Val Gly Arg Lys Val Gly Leu Thr

50 55 60

His Pro Lys Val Gln Gln Gln Leu Gly Val Asp Gln Pro Asp Phe Gly

65 70 75 80

Thr Leu Phe Ala Asp Met Cys Tyr Gly Asp Asn Glu Ile Ile Pro Phe

85 90 95

Ser Arg Val Leu Gln Pro Arg Ile Glu Ala Glu Ile Ala Leu Val Leu

100 105 110

Asn Arg Asp Leu Pro Ala Thr Asp Ile Thr Phe Asp Glu Leu Tyr Asn

115 120 125

Ala Ile Glu Trp Val Leu Pro Ala Leu Glu Val Val Gly Ser Arg Ile

130 135 140

Arg Asp Trp Ser Ile Gln Phe Val Asp Thr Val Ala Asp Asn Ala Ser

145 150 155 160

Cys Gly Val Tyr Val Ile Gly Gly Pro Ala Gln Arg Pro Ala Gly Leu

165 170 175

Asp Leu Lys Asn Cys Ala Met Lys Met Thr Arg Asn Asn Glu Glu Val

180 185 190

Ser Ser Gly Arg Gly Ser Glu Cys Leu Gly His Pro Leu Asn Ala Ala

195 200 205

Val Trp Leu Ala Arg Lys Met Ala Ser Leu Gly Glu Pro Leu Arg Thr

210 215 220

Gly Asp Ile Ile Leu Thr Gly Ala Leu Gly Pro Met Val Ala Val Asn

225 230 235 240

Ala Gly Asp Arg Phe Glu Ala His Ile Glu Gly Ile Gly Ser Val Ala

245 250 255

Ala Thr Phe Ser Ser Ala Ala Pro Lys Gly Ser Leu Ser

260 265

<210> 22

<211> 293

<212> БЕЛОК

<213> Escherichia coli

<400> 22

Met Gln Glu Lys Met Met Ser Tyr Gln Pro Gln Thr Glu Ala Ala Thr

1 5 10 15

Ser Arg Phe Leu Asn Val Glu Glu Ala Gly Lys Thr Leu Arg Ile His

20 25 30

Phe Asn Asp Cys Gly Gln Gly Asp Glu Thr Val Val Leu Leu His Gly

35 40 45

Ser Gly Pro Gly Ala Thr Gly Trp Ala Asn Phe Ser Arg Asn Ile Asp

50 55 60

Pro Leu Val Glu Ala Gly Tyr Arg Val Ile Leu Leu Asp Cys Pro Gly

65 70 75 80

Trp Gly Lys Ser Asp Ser Ile Val Asn Ser Gly Ser Arg Ser Asp Leu

85 90 95

Asn Ala Arg Ile Leu Lys Ser Val Val Asp Gln Leu Asp Ile Ala Lys

100 105 110

Ile His Leu Leu Gly Asn Ser Met Gly Gly His Ser Ser Val Ala Phe

115 120 125

Thr Leu Asn Trp Pro Glu Arg Val Gly Lys Leu Val Leu Met Gly Gly

130 135 140

Gly Thr Gly Gly Met Ser Leu Phe Thr Pro Met Pro Thr Glu Gly Ile

145 150 155 160

Lys Arg Leu Asn Gln Leu Tyr Arg Gln Pro Thr Ile Glu Asn Leu Lys

165 170 175

Leu Met Met Asp Ile Phe Val Phe Asp Thr Ser Asp Leu Thr Asp Ala

180 185 190

Leu Phe Glu Ala Arg Leu Asn Asn Met Leu Ser Arg Arg Asp His Leu

195 200 205

Glu Asn Phe Val Lys Ser Leu Glu Ala Asn Pro Lys Gln Phe Pro Asp

210 215 220

Phe Gly Pro Arg Leu Ala Glu Ile Lys Ala Gln Thr Leu Ile Val Trp

225 230 235 240

Gly Arg Asn Asp Arg Phe Val Pro Met Asp Ala Gly Leu Arg Leu Leu

245 250 255

Ser Gly Ile Ala Gly Ser Glu Leu His Ile Phe Arg Asp Cys Gly His

260 265 270

Trp Ala Gln Trp Glu His Ala Asp Ala Phe Asn Gln Leu Val Leu Asn

275 280 285

Phe Leu Ala Arg Pro

290

<210> 23

<211> 314

<212> БЕЛОК

<213> Escherichia coli

<400> 23

Met His Ala Tyr Leu His Cys Leu Ser His Ser Pro Leu Val Gly Tyr

1 5 10 15

Val Asp Pro Ala Gln Glu Val Leu Asp Glu Val Asn Gly Val Ile Ala

20 25 30

Ser Ala Arg Glu Arg Ile Ala Ala Phe Ser Pro Glu Leu Val Val Leu

35 40 45

Phe Ala Pro Asp His Tyr Asn Gly Phe Phe Tyr Asp Val Met Pro Pro

50 55 60

Phe Cys Leu Gly Val Gly Ala Thr Ala Ile Gly Asp Phe Gly Ser Ala

65 70 75 80

Ala Gly Glu Leu Pro Val Pro Val Glu Leu Ala Glu Ala Cys Ala His

85 90 95

Ala Val Met Lys Ser Gly Ile Asp Leu Ala Val Ser Tyr Cys Met Gln

100 105 110

Val Asp His Gly Phe Ala Gln Pro Leu Glu Phe Leu Leu Gly Gly Leu

115 120 125

Asp Lys Val Pro Val Leu Pro Val Phe Ile Asn Gly Val Ala Thr Pro

130 135 140

Leu Pro Gly Phe Gln Arg Thr Arg Met Leu Gly Glu Ala Ile Gly Arg

145 150 155 160

Phe Thr Ser Thr Leu Asn Lys Arg Val Leu Phe Leu Gly Ser Gly Gly

165 170 175

Leu Ser His Gln Pro Pro Val Pro Glu Leu Ala Lys Ala Asp Ala His

180 185 190

Met Arg Asp Arg Leu Leu Gly Ser Gly Lys Asp Leu Pro Ala Ser Glu

195 200 205

Arg Glu Leu Arg Gln Gln Arg Val Ile Ser Ala Ala Glu Lys Phe Val

210 215 220

Glu Asp Gln Arg Thr Leu His Pro Leu Asn Pro Ile Trp Asp Asn Gln

225 230 235 240

Phe Met Thr Leu Leu Glu Gln Gly Arg Ile Gln Glu Leu Asp Ala Val

245 250 255

Ser Asn Glu Glu Leu Ser Ala Ile Ala Gly Lys Ser Thr His Glu Ile

260 265 270

Lys Thr Trp Val Ala Ala Phe Ala Ala Ile Ser Ala Phe Gly Asn Trp

275 280 285

Arg Ser Glu Gly Arg Tyr Tyr Arg Pro Ile Pro Glu Trp Ile Ala Gly

290 295 300

Phe Gly Ser Leu Ser Ala Arg Thr Glu Asn

305 310

<210> 24

<211> 554

<212> БЕЛОК

<213> Escherichia coli

<400> 24

Met Ala Ile Gln His Pro Asp Ile Gln Pro Ala Val Asn His Ser Val

1 5 10 15

Gln Val Ala Ile Ala Gly Ala Gly Pro Val Gly Leu Met Met Ala Asn

20 25 30

Tyr Leu Gly Gln Met Gly Ile Asp Val Leu Val Val Glu Lys Leu Asp

35 40 45

Lys Leu Ile Asp Tyr Pro Arg Ala Ile Gly Ile Asp Asp Glu Ala Leu

50 55 60

Arg Thr Met Gln Ser Val Gly Leu Val Asp Asp Val Leu Pro His Thr

65 70 75 80

Thr Pro Trp His Ala Met Arg Phe Leu Thr Pro Lys Gly Arg Cys Phe

85 90 95

Ala Asp Ile Gln Pro Met Thr Asp Glu Phe Gly Trp Pro Arg Arg Asn

100 105 110

Ala Phe Ile Gln Pro Gln Val Asp Ala Val Met Leu Glu Gly Val Ser

115 120 125

Arg Phe Pro Asn Val Arg Cys Leu Phe Ser Arg Glu Leu Glu Ala Phe

130 135 140

Ser Gln Gln Asp Asp Glu Val Thr Leu His Leu Lys Thr Ala Glu Gly

145 150 155 160

Gln Arg Glu Ile Val Lys Ala Gln Trp Leu Val Ala Cys Asp Gly Gly

165 170 175

Ala Ser Phe Val Arg Arg Thr Leu Asn Val Pro Phe Glu Gly Lys Thr

180 185 190

Ala Pro Asn Gln Trp Ile Val Val Asp Ile Ala Asn Asp Pro Leu Ser

195 200 205

Thr Pro His Ile Tyr Leu Cys Cys Asp Pro Val Arg Pro Tyr Val Ser

210 215 220

Ala Ala Leu Pro His Ala Val Arg Arg Phe Glu Phe Met Val Met Pro

225 230 235 240

Gly Glu Thr Glu Glu Gln Leu Arg Glu Pro Gln Asn Met Arg Lys Leu

245 250 255

Leu Ser Lys Val Leu Pro Asn Pro Asp Asn Val Glu Leu Ile Arg Gln

260 265 270

Arg Val Tyr Thr His Asn Ala Arg Leu Ala Gln Arg Phe Arg Ile Asp

275 280 285

Arg Val Leu Leu Ala Gly Asp Ala Ala His Ile Met Pro Val Trp Gln

290 295 300

Gly Gln Gly Tyr Asn Ser Gly Met Arg Asp Ala Phe Asn Leu Ala Trp

305 310 315 320

Lys Leu Ala Leu Val Ile Gln Gly Lys Ala Arg Asp Ala Leu Leu Asp

325 330 335

Thr Tyr Gln Gln Glu Arg Arg Asp His Ala Lys Ala Met Ile Asp Leu

340 345 350

Ser Val Thr Ala Gly Asn Val Leu Ala Pro Pro Lys Arg Trp Gln Gly

355 360 365

Thr Leu Arg Asp Gly Val Ser Trp Leu Leu Asn Tyr Leu Pro Pro Val

370 375 380

Lys Arg Tyr Phe Leu Glu Met Arg Phe Lys Pro Met Pro Gln Tyr Tyr

385 390 395 400

Gly Gly Ala Leu Val Arg Glu Gly Glu Ala Lys His Ser Pro Val Gly

405 410 415

Lys Met Phe Ile Gln Pro Lys Val Thr Leu Glu Asn Gly Asp Val Thr

420 425 430

Leu Leu Asp Asn Ala Ile Gly Ala Asn Phe Ala Val Ile Gly Trp Gly

435 440 445

Cys Asn Pro Leu Trp Gly Met Ser Asp Glu Gln Ile Gln Gln Trp Arg

450 455 460

Ala Leu Gly Thr Arg Phe Ile Gln Val Val Pro Glu Val Gln Ile His

465 470 475 480

Thr Ala Gln Asp Asn His Asp Gly Val Leu Arg Val Gly Asp Thr Gln

485 490 495

Gly Arg Leu Arg Ser Trp Phe Ala Gln His Asn Ala Ser Leu Val Val

500 505 510

Met Arg Pro Asp Arg Phe Val Ala Ala Thr Ala Ile Pro Gln Thr Leu

515 520 525

Gly Asn Thr Leu Asn Lys Leu Ala Ser Val Met Thr Leu Thr Arg Pro

530 535 540

Asp Ala Asp Val Ser Val Glu Lys Val Ala

545 550

<210> 25

<211> 315

<212> БЕЛОК

<213> Escherichia coli

<400> 25

Met Ile Phe Tyr Cys Ala Leu Ser Ile Gly Arg Val Phe Ser Ala Thr

1 5 10 15

Ile Lys Thr Cys Pro Asn Val His Gln Val His His Val Val Leu Thr

20 25 30

Ile Glu Met Ser Ile Asn Met Gln Asn Asn Glu Gln Thr Glu Tyr Lys

35 40 45

Thr Val Arg Gly Leu Thr Arg Gly Leu Met Leu Leu Asn Met Leu Asn

50 55 60

Lys Leu Asp Gly Gly Ala Ser Val Gly Leu Leu Ala Glu Leu Ser Gly

65 70 75 80

Leu His Arg Thr Thr Val Arg Arg Leu Leu Glu Thr Leu Gln Glu Glu

85 90 95

Gly Tyr Val Arg Arg Ser Pro Ser Asp Asp Ser Phe Arg Leu Thr Ile

100 105 110

Lys Val Arg Gln Leu Ser Glu Gly Phe Arg Asp Glu Gln Trp Ile Ser

115 120 125

Ala Leu Ala Ala Pro Leu Leu Gly Asp Leu Leu Arg Glu Val Val Trp

130 135 140

Pro Thr Asp Val Ser Thr Leu Asp Val Asp Ala Met Val Val Arg Glu

145 150 155 160

Thr Thr His Arg Phe Ser Arg Leu Ser Phe His Arg Ala Met Val Gly

165 170 175

Arg Arg Leu Pro Leu Leu Lys Thr Ala Ser Gly Leu Thr Trp Leu Ala

180 185 190

Phe Cys Pro Glu Gln Asp Arg Lys Glu Leu Ile Glu Met Leu Ala Ser

195 200 205

Arg Pro Gly Asp Asp Tyr Gln Leu Ala Arg Glu Pro Leu Lys Leu Glu

210 215 220

Ala Ile Leu Ala Arg Ala Arg Lys Glu Gly Tyr Gly Gln Asn Tyr Arg

225 230 235 240

Gly Trp Asp Gln Glu Glu Lys Ile Ala Ser Ile Ala Val Pro Leu Arg

245 250 255

Ser Glu Gln Arg Val Ile Gly Cys Leu Asn Leu Val Tyr Met Ala Ser

260 265 270

Ala Met Thr Ile Glu Gln Ala Ala Glu Lys His Leu Pro Ala Leu Gln

275 280 285

Arg Val Ala Lys Gln Ile Glu Glu Gly Val Glu Ser Gln Ala Ile Leu

290 295 300

Val Ala Gly Arg Arg Ser Gly Met His Leu Arg

305 310 315

<210> 26

<211> 360

<212> БЕЛОК

<213> Escherichia coli

<400> 26

Met Lys Pro Val Thr Leu Tyr Asp Val Ala Glu Tyr Ala Gly Val Ser

1 5 10 15

Tyr Gln Thr Val Ser Arg Val Val Asn Gln Ala Ser His Val Ser Ala

20 25 30

Lys Thr Arg Glu Lys Val Glu Ala Ala Met Ala Glu Leu Asn Tyr Ile

35 40 45

Pro Asn Arg Val Ala Gln Gln Leu Ala Gly Lys Gln Ser Leu Leu Ile

50 55 60

Gly Val Ala Thr Ser Ser Leu Ala Leu His Ala Pro Ser Gln Ile Val

65 70 75 80

Ala Ala Ile Lys Ser Arg Ala Asp Gln Leu Gly Ala Ser Val Val Val

85 90 95

Ser Met Val Glu Arg Ser Gly Val Glu Ala Cys Lys Ala Ala Val His

100 105 110

Asn Leu Leu Ala Gln Arg Val Ser Gly Leu Ile Ile Asn Tyr Pro Leu

115 120 125

Asp Asp Gln Asp Ala Ile Ala Val Glu Ala Ala Cys Thr Asn Val Pro

130 135 140

Ala Leu Phe Leu Asp Val Ser Asp Gln Thr Pro Ile Asn Ser Ile Ile

145 150 155 160

Phe Ser His Glu Asp Gly Thr Arg Leu Gly Val Glu His Leu Val Ala

165 170 175

Leu Gly His Gln Gln Ile Ala Leu Leu Ala Gly Pro Leu Ser Ser Val

180 185 190

Ser Ala Arg Leu Arg Leu Ala Gly Trp His Lys Tyr Leu Thr Arg Asn

195 200 205

Gln Ile Gln Pro Ile Ala Glu Arg Glu Gly Asp Trp Ser Ala Met Ser

210 215 220

Gly Phe Gln Gln Thr Met Gln Met Leu Asn Glu Gly Ile Val Pro Thr

225 230 235 240

Ala Met Leu Val Ala Asn Asp Gln Met Ala Leu Gly Ala Met Arg Ala

245 250 255

Ile Thr Glu Ser Gly Leu Arg Val Gly Ala Asp Ile Ser Val Val Gly

260 265 270

Tyr Asp Asp Thr Glu Asp Ser Ser Cys Tyr Ile Pro Pro Leu Thr Thr

275 280 285

Ile Lys Gln Asp Phe Arg Leu Leu Gly Gln Thr Ser Val Asp Arg Leu

290 295 300

Leu Gln Leu Ser Gln Gly Gln Ala Val Lys Gly Asn Gln Leu Leu Pro

305 310 315 320

Val Ser Leu Val Lys Arg Lys Thr Thr Leu Ala Pro Asn Thr Gln Thr

325 330 335

Ala Ser Pro Arg Ala Leu Ala Asp Ser Leu Met Gln Leu Ala Arg Gln

340 345 350

Val Ser Arg Leu Glu Ser Gly Gln

355 360

<210> 27

<211> 353

<212> БЕЛОК

<213> Escherichia coli

<400> 27

Met Ala Ile Asp Glu Asn Lys Gln Lys Ala Leu Ala Ala Ala Leu Gly

1 5 10 15

Gln Ile Glu Lys Gln Phe Gly Lys Gly Ser Ile Met Arg Leu Gly Glu

20 25 30

Asp Arg Ser Met Asp Val Glu Thr Ile Ser Thr Gly Ser Leu Ser Leu

35 40 45

Asp Ile Ala Leu Gly Ala Gly Gly Leu Pro Met Gly Arg Ile Val Glu

50 55 60

Ile Tyr Gly Pro Glu Ser Ser Gly Lys Thr Thr Leu Thr Leu Gln Val

65 70 75 80

Ile Ala Ala Ala Gln Arg Glu Gly Lys Thr Cys Ala Phe Ile Asp Ala

85 90 95

Glu His Ala Leu Asp Pro Ile Tyr Ala Arg Lys Leu Gly Val Asp Ile

100 105 110

Asp Asn Leu Leu Cys Ser Gln Pro Asp Thr Gly Glu Gln Ala Leu Glu

115 120 125

Ile Cys Asp Ala Leu Ala Arg Ser Gly Ala Val Asp Val Ile Val Val

130 135 140

Asp Ser Val Ala Ala Leu Thr Pro Lys Ala Glu Ile Glu Gly Glu Ile

145 150 155 160

Gly Asp Ser His Met Gly Leu Ala Ala Arg Met Met Ser Gln Ala Met

165 170 175

Arg Lys Leu Ala Gly Asn Leu Lys Gln Ser Asn Thr Leu Leu Ile Phe

180 185 190

Ile Asn Gln Ile Arg Met Lys Ile Gly Val Met Phe Gly Asn Pro Glu

195 200 205

Thr Thr Thr Gly Gly Asn Ala Leu Lys Phe Tyr Ala Ser Val Arg Leu

210 215 220

Asp Ile Arg Arg Ile Gly Ala Val Lys Glu Gly Glu Asn Val Val Gly

225 230 235 240

Ser Glu Thr Arg Val Lys Val Val Lys Asn Lys Ile Ala Ala Pro Phe

245 250 255

Lys Gln Ala Glu Phe Gln Ile Leu Tyr Gly Glu Gly Ile Asn Phe Tyr

260 265 270

Gly Glu Leu Val Asp Leu Gly Val Lys Glu Lys Leu Ile Glu Lys Ala

275 280 285

Gly Ala Trp Tyr Ser Tyr Lys Gly Glu Lys Ile Gly Gln Gly Lys Ala

290 295 300

Asn Ala Thr Ala Trp Leu Lys Asp Asn Pro Glu Thr Ala Lys Glu Ile

305 310 315 320

Glu Lys Lys Val Arg Glu Leu Leu Leu Ser Asn Pro Asn Ser Thr Pro

325 330 335

Asp Phe Ser Val Asp Asp Ser Glu Gly Val Ala Glu Thr Asn Glu Asp

340 345 350

Phe

<210> 28

<211> 49

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: Синтетический олигонуклеотид

<400> 28

ctgtataaaa ccacagccaa tcaaacgaaa ccaggctata ctcaagcct 49

<210> 29

<211> 49

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: Синтетический олигонуклеотид

<400> 29

ttttataaat acacagccaa tcaaacgaaa ccaggctata ctcaagcct 49

<210> 30

<211> 133

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид

<400> 30

ctcagcggtg gcagcagcct aggttaacta cttttctttg ttggtctttg cctccatttt 60

gtcggcctgg taatgactcc aacttattga tagtgtttta tgttcagata atgcccgatg 120

actttgtcat gca 133

<210> 31

<211> 133

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид

<220>

<221> модифицированное_основание

<222> (22)..(22)

<223> a, c, t, g, неизвестное или другое

<400> 31

ctcagcggtg gcagcagcct angttaatca tttttctttg ttggttttgg cttccatttt 60

atctgcttgg taatgactcc aacttattga tagtgtttta tgttcagata atgcccgatg 120

actttgtcat gca 133

<210> 32

<211> 133

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: Синтетический полинуклеотид

<400> 32

ctcagcggtg gcagcagcct aggttaatca tttttctttg ttggttttgg cttccatttt 60

atctgcttgg taatgactcc aacttattga tagtgtttta tgttcagata atgcccgatg 120

actttgtcat gca 133

<---

Похожие патенты RU2799441C2

название год авторы номер документа
КОМПОЗИЦИИ, СОДЕРЖАЩИЕ КУРОНЫ, И ПУТИ ИХ ПРИМЕНЕНИЯ 2018
  • Кахведжан, Авак
  • Вайнштейн, Эрика Габриэль
  • Плуджис, Николас Маккартни
  • Лебо, Кевин Джеймс
  • Диас, Фернандо Мартин
  • Навандар, Дхананджай Маниклал
RU2822800C2
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 2020
  • Прокофьев Александр Владимирович
  • Гершович Павел Михайлович
  • Стрелкова Анна Николаевна
  • Спирина Наталья Александровна
  • Кондинская Диана Александровна
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2783313C1
НОВЫЙ КОРОНАВИРУС РЫБ 2020
  • Нюлунн, Стиан
  • Саннлунн, Лив
  • Экланн, Арнфинн Л.
RU2813731C2
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 2021
  • Прокофьев Александр Владимирович
  • Гершович Павел Михайлович
  • Стрелкова Анна Николаевна
  • Спирина Наталья Александровна
  • Кондинская Диана Александровна
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2761879C1
Выделенный модифицированный белок VP1 капсида аденоассоциированного вируса 5 серотипа (AAV5), капсид и вектор на его основе 2019
  • Стрелкова Анна Николаевна
  • Карабельский Александр Владимирович
  • Мадера Дмитрий Александрович
  • Перепелкина Мария Павловна
  • Юрлова Елена Викторовна
  • Гершович Павел Михайлович
  • Прокофьев Александр Владимирович
  • Морозов Дмитрий Валентинович
RU2751592C2
Выделенный модифицированный белок VPI капсида аденоассоциированного вируса 9 серотипа (AAV9), капсид и вектор на его основе 2021
  • Стрелкова Анна Николаевна
  • Шугаева Татьяна Евгеньевна
  • Гершович Павел Михайлович
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2825667C2
АМИНОАЦИЛ-тРНК-СИНТЕТАЗА ДЛЯ ЭФФЕКТИВНОГО ВВЕДЕНИЯ ПРОИЗВОДНОГО ЛИЗИНА В БЕЛОК 2020
  • У, Сун
  • Чзан, Чжэньшань
  • Лю, Хуэйлин
  • Чэнь, Вэй
RU2799794C2
Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок SMN1, и ее применение 2020
  • Мадера Дмитрий Александрович
  • Гершович Павел Михайлович
  • Веселова Анна Сергеевна
  • Шугаева Татьяна Евгеньевна
  • Ломунова Мария Андреевна
  • Шкляева Маргарита Александровна
  • Морозов Дмитрий Валентинович
RU2742837C1
НОВЫЕ ФЕРМЕНТЫ И СИСТЕМЫ CRISPR 2016
  • Кунин Юджин
  • Чжан Фэн
  • Вольф Юрий И.
  • Шмаков Сергей
  • Северинов Константин
  • Семенова Екатерина
  • Минахин Леонид
  • Макарова Кира С.
  • Конерманн Сильвана
  • Джунг Джулия
  • Гутенберг Джонатан С.
  • Абудайех Омар О.
RU2777988C2
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 2020
  • Гершович Павел Михайлович
  • Прокофьев Александр Владимирович
  • Стрелкова Анна Николаевна
  • Спирина Наталья Александровна
  • Шугаева Татьяна Евгеньевна
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2760301C1

Иллюстрации к изобретению RU 2 799 441 C2

Реферат патента 2023 года КОМПОЗИЦИИ НА ОСНОВЕ НЕПРИРОДНЫХ ПАР ОСНОВАНИЙ И СПОСОБЫ ИХ ПРИМЕНЕНИЯ

Группа изобретений относится к биотехнологии. Представлены: сконструированная клетка-хозяин для получения модифицированного полипептида, содержащего неприродную аминокислоту, способ повышения продуцирования первой молекулы нуклеиновой кислоты и способ получения модифицированного полипептида, содержащего неприродную аминокислоту. Изобретение используется для повышения показателя сохранения неприродных нуклеиновых кислот, кодирующих неприродные аминокислоты, в сконструированной клетке или полусинтетическом организме. 3 н. и 36 з.п. ф-лы, 1 табл., 10 ил., 3 пр.

Формула изобретения RU 2 799 441 C2

1. Сконструированная клетка-хозяин для получения модифицированного полипептида, содержащего неприродную аминокислоту, и/или сохранения неприродного нуклеотида, где сконструированная клетка-хозяин представляет собой клетку Escherichia coli и содержит:

a. первую молекулу нуклеиновой кислоты, содержащую неприродный нуклеотид;

b. вторую молекулу нуклеиновой кислоты, содержащую:

(i) делецию гена, кодирующего белок, ассоциированный с транспозицией, или транспонируемый элемент, необязательно где делеция представляет собой N-концевую делецию, C-концевую делецию, усечение на обоих концах, внутреннюю делецию и/или делецию целого гена, или

(ii) ген, кодирующий мутированный белок, ассоциированный с транспозицией, или транспонируемый элемент, где мутированный белок, ассоциированный с транспозицией, или транспонируемый элемент не экспрессируется или экспрессируется на сниженных уровнях, и/или

(iii) (A) молекулу нуклеиновой кислоты, кодирующую модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, где ответ, представляющий собой репарацию ДНК, включает рекомбинационную репарацию, SOS-ответ, эксцизионную репарацию нуклеотидов или метил-направленную репарацию ошибочно спаренных оснований или их комбинацию; или (B) делецию белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и

с. третью молекулу нуклеиновой кислоты, кодирующую транспортер нуклеозидтрифосфата, который доставляет неприродные нуклеиновые кислоты в клетку, где третья молекула нуклеиновой кислоты встроена в геномную последовательность сконструированной клетки-хозяина, или содержит плазмиду, кодирующую транспортер нуклеозидтрифосфата,

где сконструированная клетка-хозяин конститутивно экспрессирует или сверхэкспрессирует ДНК-полимеразу II.

2. Сконструированная клетка-хозяин по п. 1, где транспортер нуклеозидтрифосфата характеризуется повышенной стабильностью экспрессии в сконструированной клетке-хозяине по сравнению с экспрессией в эквивалентной сконструированной клетке-хозяине, которая не содержит вторую молекулу нуклеиновой кислоты.

3. Сконструированная клетка-хозяин по п. 1 или 2, где транспортер нуклеозидтрифосфата предусматривает N-концевое усечение, С-концевое усечение или усечение обоих концов.

4. Сконструированная клетка-хозяин по любому из пп. 1-3, где транспортер нуклеозидтрифосфата предусматривает транспортер нуклеозидтрифосфата из Phaeodactylum tricornutum.

5. Сконструированная клетка-хозяин по любому из пп. 1-4, где транспортер нуклеозидтрифосфата включает PtNTT2.

6. Сконструированная клетка-хозяин по п. 4 или 5, где транспортер нуклеозидтрифосфата из Phaeodactylum tricornutum или PtNTT2 находится под контролем промотора, выбранного из плазмиды pSC или промотора из lac-оперона.

7. Сконструированная клетка-хозяин по любому из пп. 1-6, дополнительно содержащая:

a. полипептид Cas9 или его вариант и

b. одиночную направляющую РНК (sgRNA), содержащую остов crRNA-tracrRNA, где комбинация полипептида Cas9 или его варианта и sgRNA обеспечивает модуляцию репликации первой молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид.

8. Сконструированная клетка-хозяин по любому из пп. 1-7, где ген, кодирующий белок, ассоциированный с транспозицией, содержит insB-4 и/или insA-4 или ген, кодирующий мутированный белок, ассоциированный с транспозицией, содержит мутированный ген insB-4 и/или мутированный ген insA-4.

9. Сконструированная клетка-хозяин по любому из пп. 1-7, где вторая молекула нуклеиновой кислоты содержит делецию гена, кодирующего транспонируемый элемент, где транспонируемый элемент предусматривает IS1.

10. Сконструированная клетка-хозяин по п. 1, где вторая молекула нуклеиновой кислоты содержит делецию гена, кодирующего белок, ассоциированный с транспозицией, и дополнительно где делеция предусматривает N-концевую делецию, C-концевую делецию, усечение на обоих концах, внутреннюю делецию и/или делецию всего гена.

11. Сконструированная клетка-хозяин по любому из пп. 1-10, содержащая (А) молекулу нуклеиновой кислоты, кодирующую модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, где ответ, представляющий собой репарацию ДНК, предусматривает рекомбинационную репарацию, SOS-ответ, эксцизионную репарацию нуклеотидов или метил-направленную репарацию ошибочно спаренных оснований или их комбинацию, или (B) делецию белка, ассоциированного с ответом, представляющим собой репарацию ДНК.

12. Сконструированная клетка-хозяин по п. 11, где модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, предусматривает RecA, RadA или LexA или их комбинацию.

13. Сконструированная клетка-хозяин по любому из пп. 1-12, где сконструированная клетка-хозяин представляет собой клетку Escherichia coli BL21 (DE3).

14. Сконструированная клетка-хозяин по любому из пп. 1-13, где неприродный нуклеотид содержит неприродное основание, выбранное из группы, состоящей из 2-аминоаденин-9-ила, 2-аминоаденина, 2-F-аденина, 2-тиоурацила, 2-тиотимина, 2-тиоцитозина, 2-пропильных и алкильных производных аденина и гуанина, 2-аминоаденина, 2-аминопропиладенина, 2-аминопиридина, 2-пиридона, 2'-дезоксиуридина, 2-амино-2'-дезоксиаденозина, 3-дезазагуанина, 3-дезазааденина, 4-тиоурацила, 4-тиотимина, урацил-5-ила, гипоксантин-9-ила (I), 5-метилцитозина, 5-гидроксиметилцитозина, ксантина, гипоксантина, 5-бром- и 5-трифторметилурацилов и цитозинов; 5-галогенурацила, 5-галогенцитозина, 5-пропинилурацила, 5-пропинилцитозина, 5-урацила, 5-замещенного, 5-галоген-, 5-замещенных пиримидинов, 5-гидроксицитозина, 5-бромцитозина, 5-бромурацила, 5-хлорцитозина, хлорированного цитозина, циклоцитозина, цитозинарабинозида, 5-фторцитозина, фторпиримидина, фторурацила, 5,6-дигидроцитозина, 5-йодцитозина, гидроксимочевины, йодурацила, 5-нитроцитозина, 5-бромурацила, 5-хлорурацила, 5-фторурацила и 5-йодурацила, 6-алкильных производных аденина и гуанина, 6-азапиримидинов, 6-азоурацила, 6-азоцитозина, азацитозина, 6-азотимина, 6-тиогуанина, 7-метилгуанина, 7-метиладенина, 7-дезазагуанина, 7-дезазагуанозина, 7-дезазааденина, 7-дезаза-8-азагуанина, 8-азагуанина, 8-азааденина, 8-галоген-, 8-амино-, 8-тиол-, 8-тиоалкил- и 8-гидроксил-замещенных аденинов и гуанинов; N4-этилцитозина, N-2-замещенных пуринов, N-6-замещенных пуринов, O-6-замещенных пуринов, тех, которые повышают стабильность образования дуплекса, универсальных нуклеиновых кислот, гидрофобных нуклеиновых кислот, промискуитентных нуклеиновых кислот, нуклеиновых кислот, увеличенных в размере, фторированных нуклеиновых кислот, трициклических пиримидинов, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3H)-он), фенотиазинцитидин(1H-пиримидо[5,4-b][1,4]бензотиазин-2(3Н)-он), гуанин-фиксирующих оснований (G-clamps), феноксазинцитидин(9-(2-аминоэтокси)-Н-пиримидо[5,4-b] [1,4-бензоксазин-2(3Н)-он), карбазолцитидин(2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин(H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), 5-фторурацила, 5-бромурацила, 5-хлорурацила, 5-йодурацила, гипоксантина, ксантина, 4-ацетилцитозина, 5-(карбоксигидроксиметил)урацила, 5-карбоксиметиламинометил-2-тиоуридина, 5-карбоксиметиламинометилурацила, дигидроурацила, бета-D-галактозилквеуозина, инозина, N6-изопентениладенина, 1-метилгуанина, 1-метилинозина, 2,2-диметилгуанина, 2-метиладенина, 2-метилгуанина, 3-метилцитозина, 5-метилцитозина, N6-аденина, 7-метилгуанина, 5-метиламинометилурацила, 5-метоксиаминометил-2-тиоурацила, бета-D-маннозилквеуозина, 5'-метоксикарбоксиметилурацила, 5-метоксиурацила, 2-метилтио-N6-изопентениладенина, урацил-5-оксиуксусной кислоты, вибутоксозина, псевдоурацила, квеуозина, 2-тиоцитозина, 5-метил-2-тиоурацила, 2-тиоурацила, 4-тиоурацила, 5-метилурацила, сложного метилового эфира урацил-5-оксиуксусной кислоты, урацил-5-оксиуксусной кислоты, 5-метил-2-тиоурацила, 3-(3-амино-3-N-2-карбоксипропил)урацила, (acp3)w и 2,6-диаминопурина и тех, в которых пуриновое или пиримидиновое основание заменено гетероциклом.

15. Сконструированная клетка-хозяин по любому из пп. 1-13, где неприродный нуклеотид включает неприродное основание, выбранное из группы, состоящей из:

.

16. Сконструированная клетка-хозяин по любому из пп. 1-15, где неприродный нуклеотид дополнительно содержит модифицированный сахарный фрагмент.

17. Сконструированная клетка-хозяин по п. 16, где модифицированный сахарный фрагмент выбран из группы, состоящей из:

(а) модификации в 2'-положении, включающей:

(i)OH;

(ii) замещенный низший алкил, алкарил, аралкил, O-алкарил O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3 или NH2F;

(iii) O-алкил, S-алкил или N-алкил;

(iv) О-алкенил, S-алкенил или N-алкенил;

(v) O-алкинил, S-алкинил или N-алкинил; или

(vi) O-алкил-O-алкил, 2'-F, 2'-OCH3 или 2'-O(CH2)2OCH3,

где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C1-C10алкил, C2-C10алкенил, C2-C10алкинил, -O[(CH2)n O]mCH3, -O(CH2)nOCH3, -O(CH2)n NH2, -O(CH2)n CH3, -O(CH2)n -ONH2 и -O(CH2)nON[(CH2)n CH3)]2 и где n и m составляют от 1 до приблизительно 10;

(b) модификации в 5'-положении, включающей: 5'-винил, 5'-метил (R или S);

(с) модификации в 4'-положении, включающей 4'-S, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, группу, расщепляющую РНК, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида, и

(d) любой комбинации (a)-(c).

18. Сконструированная клетка-хозяин по любому из пп. 1-17, дополнительно включающая дерепрессированный ген polB.

19. Способ повышения продуцирования первой молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, предусматривающий:

a) инкубирование сконструированной клетки-хозяина со множеством неприродных нуклеотидов, где сконструированная клетка-хозяин представляет собой клетку Escherichia coli, где сконструированная клетка-хозяин конститутивно экспрессирует или сверхэкспрессирует ДНК-полимеразу II, и дополнительно где сконструированная клетка-хозяин содержит транспортер нуклеозидтрифосфата, который доставляет неприродные нуклеиновые кислоты в клетку, и вторую молекулу нуклеиновой кислоты, содержащую (i) делецию гена, кодирующего белок, ассоциированный с транспозицией, или транспонируемый элемент, необязательно где делеция представляет собой N-концевую делецию, С-концевую делецию, усечение на обоих концах, внутреннюю делецию и/или делецию целого гена, или (ii) ген, кодирующий мутированный белок, ассоциированный с транспозицией, или транспонируемый элемент, где мутированный белок, ассоциированный с транспозицией, или транспонируемый элемент не экспрессируется или экспрессируется на сниженных уровнях, и/или (iii) (A) молекулу нуклеиновой кислоты, кодирующую модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, где ответ, представляющий собой репарацию ДНК, включает рекомбинационную репарацию, SOS-ответ, эксцизионную репарацию нуклеотидов или метил-направленную репарацию ошибочно спаренных оснований или их комбинацию; или (B) делецию белка, ассоциированного с ответом, представляющим собой репарацию ДНК; и

b) встраивание множества неприродных нуклеотидов в новую синтезированную первую молекулу нуклеиновой кислоты;

где (i) (А) вторая молекула нуклеиновой кислоты или (В) молекула нуклеиновой кислоты, кодирующая модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, или делеция белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и (ii) транспортер нуклеозидтрифосфата обеспечивают повышение показателя сохранения неприродных пар оснований, предусматривающих неприродные нуклеотиды, в новой синтезированной первой молекуле нуклеиновой кислоты.

20. Способ по п. 19, где ген, кодирующий белок, ассоциированный с транспозицией, предусматривает InsB4 и/или InsA4.

21. Способ по п. 19, где вторая молекула нуклеиновой кислоты содержит делецию гена, кодирующего транспонируемый элемент, где транспонируемый элемент предусматривает IS1.

22. Способ по любому из пп. 19-21, где транспортер нуклеозидтрифосфата предусматривает кодон-оптимизированный транспортер нуклеозидтрифосфата из Phaeodactylum tricornutum (PtNTT2).

23. Способ по любому из пп. 19-22, где неприродный нуклеотид содержит неприродное основание, выбранное из группы, состоящей из 2-аминоаденин-9-ила, 2-аминоаденина, 2-F-аденина, 2-тиоурацила, 2-тиотимина, 2-тиоцитозина, 2-пропильных и алкильных производных аденина и гуанина, 2-аминоаденина, 2-аминопропиладенина, 2-аминопиридина, 2-пиридона, 2'-дезоксиуридина, 2-амино-2'-дезоксиаденозина, 3-дезазагуанина, 3-дезазааденина, 4-тиоурацила, 4-тиотимина, урацил-5-ила, гипоксантин-9-ила (I), 5-метилцитозина, 5-гидроксиметилцитозина, ксантина, гипоксантина, 5-бром- и 5-трифторметилурацилов и цитозинов; 5-галогенурацила, 5-галогенцитозина, 5-пропинилурацила, 5-пропинилцитозина, 5-урацила, 5-замещенного, 5-галоген-, 5-замещенных пиримидинов, 5-гидроксицитозина, 5-бромцитозина, 5-бромурацила, 5-хлорцитозина, хлорированного цитозина, циклоцитозина, цитозинарабинозида, 5-фторцитозина, фторпиримидина, фторурацила, 5,6-дигидроцитозина, 5-йодцитозина, гидроксимочевины, йодурацила, 5-нитроцитозина, 5-бромурацила, 5-хлорурацила, 5-фторурацила и 5-йодурацила, 6-алкильных производных аденина и гуанина, 6-азапиримидинов, 6-азоурацила, 6-азоцитозина, азацитозина, 6-азотимина, 6-тиогуанина, 7-метилгуанина, 7-метиладенина, 7-дезазагуанина, 7-дезазагуанозина, 7-дезазааденина, 7-дезаза-8-азагуанина, 8-азагуанина, 8-азааденина, 8-галоген-, 8-амино-, 8-тиол-, 8-тиоалкил- и 8-гидроксил-замещенных аденинов и гуанинов; N4-этилцитозина, N-2-замещенных пуринов, N-6-замещенных пуринов, O-6-замещенных пуринов, тех, которые повышают стабильность образования дуплекса, универсальных нуклеиновых кислот, гидрофобных нуклеиновых кислот, промискуитентных нуклеиновых кислот, нуклеиновых кислот, увеличенных в размере, фторированных нуклеиновых кислот, трициклических пиримидинов, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3H)-он), фенотиазинцитидин(1H-пиримидо[5,4-b][1,4]бензотиазин-2(3Н)-он), гуанин-фиксирующих оснований (G-clamps), феноксазинцитидин(9-(2-аминоэтокси)-Н-пиримидо[5,4-b] [1,4-бензоксазин-2(3Н)-он), карбазолцитидин(2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин(H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), 5-фторурацила, 5-бромурацила, 5-хлорурацила, 5-йодурацила, гипоксантина, ксантина, 4-ацетилцитозина, 5-(карбоксигидроксиметил)урацила, 5-карбоксиметиламинометил-2-тиоуридина, 5-карбоксиметиламинометилурацила, дигидроурацила, бета-D-галактозилквеуозина, инозина, N6-изопентениладенина, 1-метилгуанина, 1-метилинозина, 2,2-диметилгуанина, 2-метиладенина, 2-метилгуанина, 3-метилцитозина, 5-метилцитозина, N6-аденина, 7-метилгуанина, 5-метиламинометилурацила, 5-метоксиаминометил-2-тиоурацила, бета-D-маннозилквеуозина, 5'-метоксикарбоксиметилурацила, 5-метоксиурацила, 2-метилтио-N6-изопентениладенина, урацил-5-оксиуксусной кислоты, вибутоксозина, псевдоурацила, квеуозина, 2-тиоцитозина, 5-метил-2-тиоурацила, 2-тиоурацила, 4-тиоурацила, 5-метилурацила, сложного метилового эфира урацил-5-оксиуксусной кислоты, урацил-5-оксиуксусной кислоты, 5-метил-2-тиоурацила, 3-(3-амино-3-N-2-карбоксипропил)урацила, (acp3)w и 2,6-диаминопурина и тех, в которых пуриновое или пиримидиновое основание заменено гетероциклом.

24. Способ по любому из пп. 19-23, где неприродный нуклеотид включает неприродное основание, выбранное из группы, состоящей из:

.

25. Способ по любому из пп. 19-24, где неприродный нуклеотид дополнительно содержит модифицированный сахарный фрагмент.

26. Способ по п. 25, где модифицированный сахарный фрагмент выбран из группы, состоящей из:

(а) модификации в 2'-положении, включающей:

(i) OH;

(ii) замещенный низший алкил, алкарил, аралкил, O-алкарил, O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3 или NH2F;

(iii) O-алкил, S-алкил или N-алкил;

(iv) О-алкенил, S-алкенил или N-алкенил;

(v) O-алкинил, S-алкинил или N-алкинил; или

(vi) O-алкил-O-алкил, 2'-F, 2'-OCH3 или 2'-O(CH2)2OCH3,

где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C1-C10алкил, C2-C10алкенил, C2-C10алкинил, -O[(CH2)n O]mCH3, -O(CH2)nOCH3, -O(CH2)n NH2, -O(CH2)n CH3, -O(CH2)n -ONH2 и -O(CH2)nON[(CH2)n CH3)]2 и где n и m составляют от 1 до приблизительно 10;

(b) модификации в 5'-положении, включающей 5'-винил или 5'-метил (R или S);

(с) модификации в 4'-положении, включающей 4'-S, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, группу, расщепляющую РНК, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида; и

(d) любой комбинации (а)-(с).

27. Способ получения модифицированного полипептида, содержащего неприродную аминокислоту, предусматривающий:

а) инкубирование сконструированной клетки-хозяина со множеством неприродных нуклеотидов, где сконструированная клетка-хозяин представляет собой клетку Escherichia coli, где сконструированная клетка-хозяин конститутивно экспрессирует или сверхэкспрессирует ДНК-полимеразу II и дополнительно где сконструированная клетка-хозяин содержит первую молекулу нуклеиновой кислоты, содержащую неприродный нуклеотид, вторую молекулу нуклеиновой кислоты, содержащую (i) делецию гена, кодирующего белок, ассоциированный с транспозицией, или транспонируемый элемент, необязательно где делеция представляет собой N-концевую делецию, С-концевую делецию, усечение на обоих концах, внутреннюю делецию и/или делецию целого гена, или (ii) ген, кодирующий мутированный белок, ассоциированный с транспозицией, или транспонируемый элемент, где мутированный белок, ассоциированный с транспозицией, или транспонируемый элемент не экспрессируется или экспрессируется на сниженных уровнях, и/или (iii) (A) молекулу нуклеиновой кислоты, кодирующую модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, где ответ, представляющий собой репарацию ДНК, включает рекомбинационную репарацию, SOS-ответ, эксцизионную репарацию нуклеотидов или метил-направленную репарацию ошибочно спаренных оснований или их комбинацию; или (B) делецию белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и третью молекулу нуклеиновой кислоты, кодирующую транспортер нуклеозидтрифосфата, который доставляет неприродные нуклеиновые кислоты в клетку; и

b) встраивание множества неприродных нуклеотидов в одну или несколько новых синтезированных нитей ДНК, за счет чего образуется молекула неприродной нуклеиновой кислоты;

где (i) (A) белок, ассоциированный с транспозицией, или транспонируемый элемент или (В) молекула нуклеиновой кислоты, кодирующая модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, или делеция белка, ассоциированного с ответом, представляющим собой репарацию ДНК, и (ii) транспортер нуклеозидтрифосфата обеспечивают повышение показателя сохранения неприродных пар оснований, что способствует встраиванию неприродных аминокислот в новый синтезированный полипептид с получением модифицированного полипептида.

28. Способ по п. 27, где ген, кодирующий белок, ассоциированный с транспозицией, предусматривает InsB4 и/или InsA4, или ген, кодирующий мутированный белок, ассоциированный с транспозицией, предусматривает мутированный ген insB-4 и/или мутированный ген insA-4.

29. Способ по п. 27, где вторая молекула нуклеиновой кислоты содержит делецию гена, кодирующего транспонируемый элемент, где транспонируемый элемент предусматривает IS1.

30. Способ по любому из пп. 27-29, где транспортер нуклеозидтрифосфата предусматривает кодон-оптимизированный транспортер нуклеозидтрифосфата из Phaeodactylum tricornutum (PtNTT2).

31. Способ по любому из пп. 27-30, где неприродный нуклеотид содержит неприродное основание, выбранное из группы, состоящей из 2-аминоаденин-9-ила, 2-аминоаденина, 2-F-аденина, 2-тиоурацила, 2-тиотимина, 2-тиоцитозина, 2-пропильных и алкильных производных аденина и гуанина, 2-аминоаденина, 2-аминопропиладенина, 2-аминопиридина, 2-пиридона, 2'-дезоксиуридина, 2-амино-2'-дезоксиаденозина, 3-дезазагуанина, 3-дезазааденина, 4-тиоурацила, 4-тиотимина, урацил-5-ила, гипоксантин-9-ила (I), 5-метилцитозина, 5-гидроксиметилцитозина, ксантина, гипоксантина, 5-бром- и 5-трифторметилурацилов и цитозинов; 5-галогенурацила, 5-галогенцитозина, 5-пропинилурацила, 5-пропинилцитозина, 5-урацила, 5-замещенного, 5-галоген-, 5-замещенных пиримидинов, 5-гидроксицитозина, 5-бромцитозина, 5-бромурацила, 5-хлорцитозина, хлорированного цитозина, циклоцитозина, цитозинарабинозида, 5-фторцитозина, фторпиримидина, фторурацила, 5,6-дигидроцитозина, 5-йодцитозина, гидроксимочевины, йодурацила, 5-нитроцитозина, 5-бромурацила, 5-хлорурацила, 5-фторурацила и 5-йодурацила, 6-алкильных производных аденина и гуанина, 6-азапиримидинов, 6-азоурацила, 6-азоцитозина, азацитозина, 6-азотимина, 6-тиогуанина, 7-метилгуанина, 7-метиладенина, 7-дезазагуанина, 7-дезазагуанозина, 7-дезазааденина, 7-дезаза-8-азагуанина, 8-азагуанина, 8-азааденина, 8-галоген-, 8-амино-, 8-тиол-, 8-тиоалкил- и 8-гидроксил-замещенных аденинов и гуанинов; N4-этилцитозина, N-2-замещенных пуринов, N-6-замещенных пуринов, O-6-замещенных пуринов, тех, которые повышают стабильность образования дуплекса, универсальных нуклеиновых кислот, гидрофобных нуклеиновых кислот, промискуитентных нуклеиновых кислот, нуклеиновых кислот, увеличенных в размере, фторированных нуклеиновых кислот, трициклических пиримидинов, феноксазинцитидин([5,4-b][1,4]бензоксазин-2(3H)-он), фенотиазинцитидин(1H-пиримидо[5,4-b][1,4]бензотиазин-2(3Н)-он), гуанин-фиксирующих оснований (G-clamps), феноксазинцитидин(9-(2-аминоэтокси)-Н-пиримидо[5,4-b] [1,4-бензоксазин-2(3Н)-он), карбазолцитидин(2H-пиримидо[4,5-b]индол-2-он), пиридоиндолцитидин(H-пиридо[3',2':4,5]пирроло[2,3-d]пиримидин-2-он), 5-фторурацила, 5-бромурацила, 5-хлорурацила, 5-йодурацила, гипоксантина, ксантина, 4-ацетилцитозина, 5-(карбоксигидроксиметил)урацила, 5-карбоксиметиламинометил-2-тиоуридина, 5-карбоксиметиламинометилурацила, дигидроурацила, бета-D-галактозилквеуозина, инозина, N6-изопентениладенина, 1-метилгуанина, 1-метилинозина, 2,2-диметилгуанина, 2-метиладенина, 2-метилгуанина, 3-метилцитозина, 5-метилцитозина, N6-аденина, 7-метилгуанина, 5-метиламинометилурацила, 5-метоксиаминометил-2-тиоурацила, бета-D-маннозилквеуозина, 5'-метоксикарбоксиметилурацила, 5-метоксиурацила, 2-метилтио-N6-изопентениладенина, урацил-5-оксиуксусной кислоты, вибутоксозина, псевдоурацила, квеуозина, 2-тиоцитозина, 5-метил-2-тиоурацила, 2-тиоурацила, 4-тиоурацила, 5-метилурацила, сложного метилового эфира урацил-5-оксиуксусной кислоты, урацил-5-оксиуксусной кислоты, 5-метил-2-тиоурацила, 3-(3-амино-3-N-2-карбоксипропил)урацила, (acp3)w и 2,6-диаминопурина и тех, в которых пуриновое или пиримидиновое основание заменено гетероциклом.

32. Способ по любому из пп. 27-30, где неприродный нуклеотид включает неприродное основание, выбранное из группы, состоящей из:

.

33. Способ по любому из пп. 27-32, где неприродный нуклеотид дополнительно содержит модифицированный сахарный фрагмент, выбранный из группы, состоящей из:

(а) модификации в 2'-положении, включающей:

(i) OH;

(ii) замещенный низший алкил, алкарил, аралкил, O-алкарил, O-аралкил, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2 CH3, ONO2, NO2, N3 или NH2F;

(iii) O-алкил, S-алкил или N-алкил;

(iv) О-алкенил, S-алкенил или N-алкенил;

(v) O-алкинил, S-алкинил или N-алкинил; или

(vi) O-алкил-O-алкил, 2'-F, 2'-OCH3 или 2'-O(CH2)2OCH3,

где алкил, алкенил и алкинил могут представлять собой замещенный или незамещенный C1-C10алкил, C2-C10алкенил, C2-C10алкинил, -O[(CH2)n O]mCH3, -O(CH2)nOCH3, -O(CH2)n NH2, -O(CH2)n CH3, -O(CH2)n -ONH2 и -O(CH2)nON[(CH2)n CH3)]2 и где n и m составляют от 1 до приблизительно 10;

(b) модификации в 5'-положении, включающей 5'-винил или 5'-метил (R или S);

(с) модификации в 4'-положении, включающей 4'-S, гетероциклоалкил, гетероциклоалкарил, аминоалкиламино, полиалкиламино, замещенный силил, группу, расщепляющую РНК, репортерную группу, интеркалятор, группу для улучшения фармакокинетических свойств олигонуклеотида или группу для улучшения фармакодинамических свойств олигонуклеотида; и

(d) любой комбинации (а)-(с).

34 Способ по любому из пп. 19-33, где сконструированная клетка-хозяин дополнительно включает дерепрессированный ген polB.

35. Способ по любому из пп. 19-34, где сконструированная клетка-хозяин содержит (А) молекулу нуклеиновой кислоты, кодирующую модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, где ответ, представляющий собой репарацию ДНК, предусматривает рекомбинационную репарацию, SOS-ответ, эксцизионную репарацию нуклеотидов или метил-направленную репарацию ошибочно спаренных оснований или их комбинацию, или (В) сконструированная клетка-хозяин содержит делецию белка, ассоциированного с ответом, представляющим собой репарацию ДНК.

36. Способ по п. 35, где белок, ассоциированный с ответом, представляющим собой репарацию ДНК, предусматривает RecA, RadA или LexA или их комбинацию.

37. Сконструированная клетка-хозяин по любому из пп. 11-18, где молекула нуклеиновой кислоты, кодирующая модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК, предусматривает N-концевую делецию, C-концевую делецию, усечение на обоих концах, внутреннюю делецию и/или делецию всего гена.

38. Сконструированная клетка-хозяин по любому из пп. 11-18, где сконструированная клетка-хозяин проявляет улучшенное удержание молекулы нуклеиновой кислоты, содержащей неприродный нуклеотид, во время репликации ДНК по сравнению с молекулой нуклеиновой кислоты, содержащей неприродный нуклеотид, в эквивалентной сконструированной клетке-хозяине, которая не содержит молекулу нуклеиновой кислоты, кодирующую модифицированный белок, ассоциированный с ответом, представляющим собой репарацию ДНК.

39. Способ по любому из пп. 19-26, где транспортер нуклеозидтрифосфата проявляет повышенную стабильность экспрессии в сконструированной клетке-хозяине относительно экспрессии в эквивалентной сконструированной клетке-хозяине, которая не содержит вторую молекулу нуклеиновой кислоты.

Документы, цитированные в отчете о поиске Патент 2023 года RU2799441C2

WO 2017223528 A1, 28.12.2017
YING et al
"Molecular Variation and Horizontal Gene Transfer of the Homocysteine Methyltransferase Gene mmuM and its Distribution in Clinical Pathogens," International Journal of Biological Sciences, 01.01.2015, Vol
Походная разборная печь для варки пищи и печения хлеба 1920
  • Богач Б.И.
SU11A1
Печь для непрерывного получения сернистого натрия 1921
  • Настюков А.М.
  • Настюков К.И.
SU1A1
Походная разборная печь для варки пищи и печения хлеба 1920
  • Богач Б.И.
SU11A1
US 20070054381 A1, 08.03.2007
FELDMAN et al
"A Tool for the Import of

RU 2 799 441 C2

Авторы

Ромесберг, Флойд И.

Ледбеттер, Майкл П.

Карадима, Ребека Дж.

Даты

2023-07-05Публикация

2018-12-28Подача