КОНСТРУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ ДЛЯ ПОЛУЧЕНИЯ БЕЛКОВ Российский патент 2025 года по МПК C12N15/63 C12N15/85 C12N15/90 

Описание патента на изобретение RU2840923C1

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ

Настоящая заявка испрашивает приоритет на основании предварительной заявки на патент США №63/033,514, поданной 2 июня 2020 года, содержание которой полностью включено в настоящую заявку посредством ссылки.

Настоящая заявка также испрашивает приоритет на основании предварительной заявки на патент США №63/033,516, поданной 2 июня 2020 года, содержание которой полностью включено в настоящую заявку посредством ссылки.

ОБЛАСТЬ ТЕХНИКИ

Настоящее изобретение относится к конструкциям нуклеиновых кислот и их применению для разработки линий клеток-хозяев для получения целевого белка и, в частности, к конструкциям нуклеиновых кислот, которые обеспечивают улучшенную селекцию для разработки высокопродуктивных линий клеток.

УРОВЕНЬ ТЕХНИКИ

Белковые терапевтические средства являются важным классом лекарственных средств, которые обеспечивают помощь пациентам, наиболее нуждающимся в новых видах терапии. Недавно одобренные рекомбинантные белковые терапевтические средства были разработаны для лечения широкого спектра клинических показаний, включая раковые заболевания, аутоиммунные нарушения/воспаление, воздействие инфекционных агентов и генетические нарушения. Последние достижения в области технологий конструирования белков позволили разработчикам и производителям лекарственных средств точно подбирать и использовать желаемые функциональные характеристики целевых белков при сохранении (и в некоторых случаях улучшении) безопасности или эффективности продукта или и того, и другого.

Производство и продуцирование терапевтических белков представляют собой очень сложные процессы. Например, процесс получения типичного белкового лекарственного средства может включать более 5000 критических стадий, что во много раз превышает число стадий, необходимых для получения низкомолекулярного лекарственного средства.

Аналогичным образом, белковые терапевтические средства, которые включают моноклональные антитела, а также большие или слитые белки, имеющие молекулярную массу свыше 100 кДа, могут быть на порядки больше по размеру, чем низкомолекулярные лекарственные средства. Кроме того, белковые терапевтические средства характеризуются сложными вторичными и третичными структурами, которые должны быть сохранены. Белковые терапевтические средства не могут быть синтезированы полностью с помощью химических способов, и требуется их получение в живых клетках или организмах; соответственно, выбор клеточной линии, природы вида и условий культивирования влияет на характеристики конечного продукта. Более того, большинство биологически активных белков нуждаются в посттрансляционных модификациях, которые могут нарушаться при использовании гетерологичных систем экспрессии. Кроме того, поскольку продукты синтезируются клетками или организмами, то задействованы сложные способы очистки. Кроме того, для предотвращения серьезной проблемы безопасности белковых лекарственных веществ, связанной с вирусной контаминацией, вводят процессы очистки от вирусов, такие как удаление вирусных частиц с помощью фильтров или смол, а также стадии инактивации путем использования низких значений рН или детергентов. С учетом сложности терапевтических белков, касающихся большого размера их молекул, посттрансляционных модификаций и разнообразия биологических материалов, включаемых в процесс их получения, весьма желательной является возможность улучшения конкретных функциональных характеристик продукта при сохранении его безопасности и эффективности, что обеспечивается с помощью стратегий конструирования белков.

В то время как внедрение новых стратегий и подходов к модификации белковых лекарственных продуктов не является рядовой задачей, потенциальные терапевтические преимущества обусловили более широкое применение таких стратегий в процессе разработки лекарственных средств. В настоящее время используют ряд платформенных технологий конструирования белков для увеличения периода полувыведения из циркуляции, усиления нацеливания и повышения функциональности новых белковых терапевтических средств, а также для повышения выхода и чистоты продукта. Например, для продления периода полувыведения лекарственного средства из циркуляции в настоящее время применяют подходы с конъюгированием и дериватизацией белков, включая слияние с Fc, слияние с альбумином и ПЭГилирование.

Получение белковых фармацевтических (биологических) препаратов является дорогостоящим и трудоемким. В данной области техники существует потребность в более эффективных инструментах и способах для получения этого важного класса лекарственных средств.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Настоящее изобретение относится к конструкциям нуклеиновых кислот и их применению для разработки линий клеток-хозяев для получения целевого белка и, в частности, к конструкциям нуклеиновых кислот, которые обеспечивают улучшенную селекцию для разработки высокопродуктивных линий клеток.

В некоторых предпочтительных вариантах реализации настоящего изобретения предложены конструкции нуклеиновых кислот для экспрессии целевого белка, содержащие следующие функционально связанные элементы по порядку от 5'- до 3'-конца: необязательно, первую промоторную последовательность; последовательность селектируемого маркера; вторую промоторную последовательность; последовательность нуклеиновой кислоты, кодирующую первый целевой белок, которая функционально связана со второй промоторной последовательностью; и сигнальную последовательность поли(А); при этом указанная конструкция нуклеиновой кислоты дополнительно содержит по меньшей мере один инсерционный элемент в положении или положениях, выбранных из группы, состоящей из 3'-конца относительно необязательной первой промоторной последовательности или последовательности селектируемого маркера, 3'-конца относительно сигнальной последовательности поли(А), положения между необязательной первой промоторной последовательностью и сигнальной последовательностью поли(А), положения между последовательностью селектируемого маркера и второй промоторной последовательностью, и одновременно 5'-конца относительно необязательной первой промоторной последовательности или последовательности селектируемого маркера и 3'-конца относительно сигнальной последовательности поли(А). В некоторых вариантах реализации конструкции нуклеиновых кислот содержат первую промоторную последовательность. В некоторых предпочтительных вариантах реализации конструкция не содержит сигнальной последовательности поли(А) между селектируемым маркером и вторым промотором. В некоторых предпочтительных вариантах реализации селектируемый маркер примыкает ко второму промотору. В некоторых предпочтительных вариантах реализации второй промотор примыкает к последовательности нуклеиновой кислоты, кодирующей первый целевой белок.

В некоторых предпочтительных вариантах реализации конструкция нуклеиновой кислоты содержит некодирующую область между первым промотором и селектируемым маркером. В некоторых предпочтительных вариантах реализации некодирующая область содержит несколько потенциальных последовательностей Козак и/или сайтов начала трансляции ATG. В некоторых предпочтительных вариантах реализации конструкция нуклеиновой кислоты содержит расширенную область упаковки (EPR) между первым промотором и селектируемым маркером. В некоторых предпочтительных вариантах реализации EPR содержит несколько потенциальных последовательностей Козак и/или сайтов начала трансляции ATG.

В некоторых предпочтительных вариантах реализации первая промоторная последовательность выбрана из группы, состоящей из промоторных последовательностей SIN-LTR, SV40, lac Е. coli, trp Е. coli, PL фага лямбда, PR фага лямбда, Т3, Т7, немедленно-раннего промотора цитомегаловируса (CMV), тимидинкиназы вируса простого герпеса (HSV), альфа-лактальбумина, фактора элонгации 1 альфа человека (hEF1 альфа) и металлотионеина-I мыши. В некоторых предпочтительных вариантах реализации первая промоторная последовательность не является ретровирусным промотором LTR.

В некоторых предпочтительных вариантах реализации последовательность селектируемого маркера представляет собой амплифицируемую последовательность селектируемого маркера, выбранную из группы, состоящей из последовательности глутаминсинтетазы (GS) и последовательности дигидрофолатредуктазы (DHFR). В некоторых предпочтительных вариантах реализации последовательность селектируемого маркера представляет собой последовательность маркера устойчивости к антибиотику, выбранную из группы, состоящей из последовательностей гена устойчивости к неомицину (neo), гена гигромицин В-фосфотрансферазы и гена пуромицин-М-ацетилтрансферазы.

В некоторых предпочтительных вариантах реализации вторая промоторная последовательность выбрана из группы, состоящей из промоторных последовательностей SV40, lac Е. coli, trp Е. coli, PL фага лямбда, PR фага лямбда, Т3, Т7, немедленно-раннего промотора цитомегаловируса (CMV), тимидинкиназы вируса простого герпеса (HSV), альфа-лактальбумина, фактора элонгации 1 альфа человека (hEF1 альфа) и металлотионеина-I мыши.

В некоторых предпочтительных вариантах реализации последовательность нуклеиновой кислоты, кодирующая целевой белок, кодирует белок, выбранный из группы, состоящей из последовательностей тяжелой и легкой цепей иммуноглобулина.

В некоторых предпочтительных вариантах реализации инсерционный элемент выбран из группы, состоящей из управляемого транспозоном инсерционного элемента, управляемого рекомбиназой инсерционного элемента и управляемого HDR инсерционного элемента. В некоторых предпочтительных вариантах реализации управляемый транспозоном инсерционный элемент представляет собой инвертированный концевой повтор. В некоторых предпочтительных вариантах реализации конструкция содержит два инвертированных концевых повтора, расположенных на 5'-конце относительно первого промотора и на 3'-конце относительно сигнальной последовательности поли(А). В некоторых предпочтительных вариантах реализации управляемый рекомбиназой инсерционный элемент представляет собой сайт интеграции (att). В некоторых предпочтительных вариантах реализации сайт интеграции (att) представляет собой attB. В некоторых предпочтительных вариантах реализации управляемый HDR инсерционный элемент содержит последовательность генетически нейтрального ("safe harbor") локуса AAVS1. В некоторых предпочтительных вариантах реализации управляемый HDR инсерционный элемент представляет собой последовательность нуклеиновой кислоты, гомологичную сайту-мишени в хромосоме. В некоторых предпочтительных вариантах реализации последовательность нуклеиновой кислоты, гомологичная сайту-мишени в хромосоме, имеет длину от приблизительно 30 до 1000 оснований. В некоторых предпочтительных вариантах реализации конструкция содержит две последовательности нуклеиновой кислоты, гомологичные сайту-мишени в хромосоме, расположенные на 5'-конце относительно первого промотора и на 3'-конце относительно сигнальной последовательности поли(А). В некоторых предпочтительных вариантах реализации управляемый рекомбиназой инсерционный элемент представляет собой сайт-мишень для распознавания Flp (FRT). В некоторых предпочтительных вариантах реализации управляемый рекомбиназой инсерционный элемент представляет собой последовательность LoxP.

В некоторых предпочтительных вариантах реализации конструкции дополнительно содержат элемент экспорта РНК. В некоторых предпочтительных вариантах реализации элемент экспорта РНК расположен на 3'- или 5'-конце относительно последовательности нуклеиновой кислоты, кодирующей целевой белок. В некоторых предпочтительных вариантах реализации элемент экспорта РНК представляет собой энхансер процессинга пре-мРНК (РРЕ). В некоторых предпочтительных вариантах реализации элемент экспорта РНК представляет собой посттранскрипционный регуляторный элемент (PRE). В некоторых предпочтительных вариантах реализации элемент экспорта РНК PRE представляет собой посттранскрипционный регуляторный элемент вируса гепатита сурков (WPRE).

В некоторых предпочтительных вариантах реализации конструкции дополнительно содержат последовательность сигнального пептида, функционально связанную с первым целевым белком. В некоторых предпочтительных вариантах реализации последовательность сигнального пептида выбрана из группы, состоящей из последовательностей сигнальных пептидов тканевого активатора плазминогена, гормона роста человека, лактоферрина, альфа-казеина и альфа-лактальбумина.

В некоторых предпочтительных вариантах реализации конструкции дополнительно содержат маркерную последовательность для очистки белка. В некоторых предпочтительных вариантах реализации маркерная последовательность для очистки белка представляет собой гексагистидиновую метку или гемагглютининовую (НА) метку.

В некоторых предпочтительных вариантах реализации конструкции дополнительно содержат последовательность участка внутренней посадки рибосомы (IRES) и вторую последовательность нуклеиновой кислоты, кодирующую по меньшей мере второй целевой белок (например, в том числе третий, четвертый, пятый и т.д. целевой белок), расположенные на 3'-конце относительно последовательности нуклеиновой кислоты, кодирующей первый целевой белок. В некоторых предпочтительных вариантах реализации последовательность IRES выбрана из группы, состоящей из последовательностей IRES вируса ящура (FDV), вируса энцефаломиокардита и полиовируса.

В некоторых предпочтительных вариантах реализации конструкция нуклеиновой кислоты дополнительно содержит третий промотор, функционально связанный со второй последовательностью нуклеиновой кислоты, кодирующей второй целевой белок, расположенный на 3'-конце относительно последовательности нуклеиновой кислоты, кодирующей первый целевой белок. В некоторых предпочтительных вариантах реализации третья промоторная последовательность выбрана из группы, состоящей из промоторных последовательностей SV40, lac Е. coli, trp Е. coli, PL фага лямбда, PR фага лямбда, Т3, Т7, немедленно-раннего промотора цитомегаловируса (CMV), тимидинкиназы вируса простого герпеса (HSV), альфа-лактальбумина, фактора элонгации 1 альфа человека (hEF1 альфа) и металлотионеина-I мыши. В некоторых предпочтительных вариантах реализации конструкции дополнительно содержат элемент экспорта РНК, функционально связанный со второй последовательностью нуклеиновой кислоты, кодирующей второй целевой белок. В некоторых предпочтительных вариантах реализации конструкции дополнительно содержат сигнальную последовательность поли(А), функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей второй целевой белок.

В некоторых предпочтительных вариантах реализации первый целевой белок представляет собой одну из тяжелой и легкой цепей антитела, и второй целевой белок представляет собой другую из тяжелой и легкой цепей антитела.

В некоторых предпочтительных вариантах реализации конструкция нуклеиновой кислоты дополнительно содержит интрон, функционально связанный со второй последовательностью нуклеиновой кислоты, кодирующей второй целевой белок, расположенный на 3'-конце относительно последовательности нуклеиновой кислоты, кодирующей первый целевой белок. В некоторых предпочтительных вариантах реализации конструкции дополнительно содержат элемент экспорта РНК, функционально связанный со второй последовательностью нуклеиновой кислоты, кодирующей второй целевой белок. В некоторых предпочтительных вариантах реализации конструкции дополнительно содержат сигнальную последовательность поли(А), функционально связанную со второй последовательностью нуклеиновой кислоты, кодирующей второй целевой белок. В некоторых предпочтительных вариантах реализации первый целевой белок представляет собой одну из тяжелой и легкой цепей антитела, и второй целевой белок представляет собой другую из тяжелой и легкой цепей антитела.

В некоторых предпочтительных вариантах реализации настоящего изобретения предложен вектор, содержащий конструкцию нуклеиновой кислоты, описанную выше. В некоторых предпочтительных вариантах реализации вектор представляет собой плазмиду.

В некоторых предпочтительных вариантах реализации настоящего изобретения предложена клетка-хозяин, содержащая конструкцию нуклеиновой кислоты, описанную выше, или вектор, описанный выше. В некоторых предпочтительных вариантах реализации клетка-хозяин выбрана из группы, состоящей из клеток яичника китайского хомячка (СНО), клеток HEK 293, клеток САР, эпителиальных клеток молочной железы крупного рогатого скота, линии клеток почки обезьяны CV1, трансформированной SV40, клеток почки детеныша хомяка, клеток Сертоли мыши, клеток почки обезьяны, клеток почки африканской зеленой мартышки, клеток карциномы шейки матки человека, клеток почки собаки, клеток печени крысы Buffalo, клеток легкого человека, клеток печени человека, клеток опухоли молочной железы мыши, клеток TRI, клеток MRC 5, клеток FS4, фибробластов крысы, клеток MDBK и линии клеток гепатомы человека. В некоторых предпочтительных вариантах реализации клетка-хозяин выбрана из группы, состоящей из клеток яичника китайского хомячка (СНО), клеток HEK 293 и клеток САР. В некоторых предпочтительных вариантах реализации линия клеток-хозяев представляет собой линию клеток с нокаутом GS. В некоторых предпочтительных вариантах реализации линия клеток-хозяев представляет собой линию клеток с нокаутом DHFR. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от приблизительно 1 до 1000 копий конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от приблизительно 10 до 200 копий конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от приблизительно 10 до 100 копий конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от приблизительно 20 до 100 копий конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от 50 до 500 копий конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от 50 до 250 копий конструкции нуклеиновой кислоты.

В некоторых предпочтительных вариантах реализации клетка-хозяин дополнительно содержит по меньшей мере вторую конструкцию нуклеиновой кислоты, которая кодирует второй целевой белок и обеспечивает его экспрессию. В некоторых предпочтительных вариантах реализации вторая конструкция нуклеиновой кислоты не содержит селектируемого маркера. В некоторых предпочтительных вариантах реализации вторая конструкция нуклеиновой кислоты содержит селектируемый маркер, отличный от селектируемого маркера в первой конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации первый целевой белок в первой конструкции нуклеиновой кислоты представляет собой одну из тяжелой или легкой цепей иммуноглобулина, и второй белок во второй конструкции нуклеиновой кислоты представляет собой другую из тяжелой или легкой цепей иммуноглобулина. В некоторых предпочтительных вариантах реализации первый целевой белок представляет собой тяжелую цепь иммуноглобулина, и второй целевой белок представляет собой легкую цепь иммуноглобулина. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от приблизительно 1 до 1000 копий второй конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от приблизительно 10 до 200 копий второй конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от приблизительно 10 до 100 копий второй конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от приблизительно 20 до 100 копий второй конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от 50 до 500 копий второй конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации клетка-хозяин содержит от 50 до 250 копий второй конструкции нуклеиновой кислоты.

В некоторых предпочтительных вариантах реализации настоящего изобретения предложена культура клеток-хозяев, содержащая популяцию клеток-хозяев, описанную выше.

В некоторых предпочтительных вариантах реализации настоящего изобретения предложены способы получения целевого белка, включающие культивирование клеток-хозяев, описанных выше, в условиях, при которых осуществляется экспрессия целевого(ых) белка(ов), и очистку целевого(ых) белка(ов) от культуры клеток-хозяев. В некоторых предпочтительных вариантах реализации клетки-хозяева выращивают в среде, содержащей ингибитор селектируемого маркера. В некоторых предпочтительных вариантах реализации селектируемый маркер представляет собой GS, и ингибитор представляет собой фосфинотрицин или метионинсульфоксимин (Msx). В некоторых предпочтительных вариантах реализации селектируемый маркер представляет собой DHFR, и ингибитор представляет собой метотрексат.

В некоторых предпочтительных вариантах реализации настоящего изобретения предложен вектор, содержащий конструкцию нуклеиновой кислоты, описанную выше. В некоторых предпочтительных вариантах реализации вектор выбран из группы, состоящей из плазмидного вектора, ретровирусного вектора, лентивирусного вектора, вектора на основе AAV и транспозонного вектора.

В некоторых предпочтительных вариантах реализации настоящего изобретения предложена система, содержащая: первую конструкцию нуклеиновой кислоты, описанную выше; и вторую конструкцию нуклеиновой кислоты, кодирующую фермент. В некоторых предпочтительных вариантах реализации конструкции обеспечены на различных векторах. В некоторых предпочтительных вариантах реализации конструкции обеспечены на одних и тех же векторах. В некоторых предпочтительных вариантах реализации фермент выбран из группы, состоящей из транспозазы, интегразы, рекомбиназы, нуклеазы и никазы. В некоторых предпочтительных вариантах реализации нуклеаза представляет собой нуклеазу Cas. В некоторых предпочтительных вариантах реализации никаза представляет собой никазу Cas. В некоторых предпочтительных вариантах реализации системы дополнительно содержат одну или более направляющих последовательностей РНК. В некоторых предпочтительных вариантах реализации фермент облегчает встраивание конструкции нуклеиновой кислоты или ее части в геном клетки-хозяина.

В некоторых предпочтительных вариантах реализации системы дополнительно содержат по меньшей мере третью конструкцию нуклеиновой кислоты, описанную выше, при этом указанная третья конструкция нуклеиновой кислоты кодирует целевой белок, который отличен от целевого белка в первой конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации третья конструкция нуклеиновой кислоты обеспечена в отдельном векторе. В некоторых предпочтительных вариантах реализации третья конструкция нуклеиновой кислоты обеспечена в том же векторе, что и первая и вторая конструкции нуклеиновых кислот.

В некоторых предпочтительных вариантах реализации настоящего изобретения предложена система, содержащая по меньшей мере первую и вторую конструкции нуклеиновых кислот, описанные выше; при этом каждая из указанных первой и второй конструкций нуклеиновых кислот кодирует свой целевой белок. В некоторых предпочтительных вариантах реализации первая и вторая конструкции нуклеиновых кислот обеспечены в отдельных векторах. В некоторых предпочтительных вариантах реализации первая и вторая конструкции нуклеиновых кислот обеспечены в одном и том же векторе. В некоторых предпочтительных вариантах реализации системы дополнительно содержат третью конструкцию нуклеиновой кислоты, кодирующую фермент. В некоторых предпочтительных вариантах реализации фермент выбран из группы, состоящей из транспозазы, интегразы, рекомбиназы, нуклеазы и никазы. В некоторых предпочтительных вариантах реализации нуклеаза представляет собой нуклеазу Cas. В некоторых предпочтительных вариантах реализации никаза представляет собой никазу Cas. В некоторых предпочтительных вариантах реализации системы дополнительно содержат одну или более направляющих последовательностей РНК. В некоторых предпочтительных вариантах реализации фермент облегчает встраивание конструкции нуклеиновой кислоты или ее части в геном клетки-хозяина. В некоторых предпочтительных вариантах реализации третья конструкция нуклеиновой кислоты обеспечена в отдельном векторе. В некоторых предпочтительных вариантах реализации третья конструкция нуклеиновой кислоты обеспечена в том же векторе, что и первая и вторая конструкции нуклеиновых кислот.

В некоторых предпочтительных вариантах реализации настоящего изобретения предложены способы получения целевого белка, включающие: введение конструкции нуклеиновой кислоты, вектора или системы, описанных выше, в клетку-хозяина в условиях, при которых конструкция нуклеиновой кислоты встраивается в геном клетки-хозяина; разработку линии клеток-хозяев, экспрессирующей целевой белок; культивирование клеток-хозяев из линии клеток-хозяев в условиях, при которых целевой белок продуцируется клетками-хозяевами; и очистку целевого белка от культуры клеток-хозяев.

В некоторых предпочтительных вариантах реализации клетка-хозяин выбрана из группы, состоящей из клеток яичника китайского хомячка (СНО), клеток HEK 293, клеток САР, эпителиальных клеток молочной железы крупного рогатого скота, линии клеток почки обезьяны CV1, трансформированной SV40, клеток почки детеныша хомяка, клеток Сертоли мыши, клеток почки обезьяны, клеток почки африканской зеленой мартышки, клеток карциномы шейки матки человека, клеток почки собаки, клеток печени крысы Buffalo, клеток легкого человека, клеток печени человека, клеток опухоли молочной железы мыши, клеток TRI, клеток MRC 5, клеток FS4, фибробластов крысы, клеток MDBK и линии клеток гепатомы человека. В некоторых предпочтительных вариантах реализации клетка-хозяин выбрана из группы, состоящей из клеток яичника китайского хомячка (СНО), клеток HEK 293 и клеток САР. В некоторых предпочтительных вариантах реализации линия клеток-хозяев представляет собой линию клеток с нокаутом GS. В некоторых предпочтительных вариантах реализации линия клеток-хозяев представляет собой линию клеток с нокаутом DHFR. В некоторых предпочтительных вариантах реализации клетки-хозяева выращивают в среде, содержащей ингибитор селектируемого маркера. В некоторых предпочтительных вариантах реализации селектируемый маркер представляет собой GS, и ингибитор представляет собой фосфинотрицин или метионинсульфоксимин (Msx). В некоторых предпочтительных вариантах реализации селектируемый маркер представляет собой DHFR, и ингибитор представляет собой метотрексат. В некоторых предпочтительных вариантах реализации культивирование клеток-хозяев из линии клеток-хозяев в условиях, при которых целевой белок продуцируется клетками-хозяевами, дополнительно включает культивирование в системе, выбранной из группы, состоящей из чашек Петри, луночных планшетов, роллерных флаконов, биореакторов, перфузионных систем и культур с периодическим добавлением питательной среды.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

Сокращения, используемые на чертежах:

AmpR = Бактериальный ген устойчивости к ампициллину

attB = Бактериальный сайт интеграции

attP = Фаговый сайт интеграции

attR = Рекомбинированный вышележащий сайт интеграции

Остов = Остов плазмиды

CDS = Кодирующая последовательность

EPR = Расширенная область упаковки вируса лейкоза мышей Молони (MMLV)

GCI = Индекс копийности гена

GS = Глутаминсинтетаза

Н или НС = Тяжелая цепь

hCMV = Немедленно-ранний промотор цитомегаловируса человека

I = Интрон

L или LC = Легкая цепь

MoMuSV 5'LTR=5' - длинный концевой повтор вируса саркомы мышей Молони

Neo = Ген устойчивости к неомицину

РА или PolyA = Сигнал полиаденилирования

ProV SLNT-LTR = Провирусный самоинактивирующийся длинный концевой повтор

sCMV = Немедленно-ранний промотор цитомегаловируса обезьян

ДСН-ПААГ = Электрофорез в полиакриламидном геле в присутствии додецилсульфата натрия

SLN-3'LTR = Самоинактивирующийся 3'-длинный концевой повтор

SV40 = Вирус обезьян 40

TK = Тимидинкиназа

UTR = Нетранслируемая область

W или WPRE = Посттранскрипционный регуляторный элемент вируса гепатита сурков.

ФИГ. 1. Схема конструкции нуклеиновой кислоты для некоторых вариантов реализации настоящего изобретения.

ФИГ. 2. График кривых выживаемости клеток после трансфекции и селекции в отсутствие глутамина. Показаны средние значения для двух дублированных трансфекций.

ФИГ. 3. Таблица, представляющая анализ продуктивности и числа копий для объединенных клеточных линий, полученных с применением различных плазмид. Показаны средние значения для двух дублированных трансфекций.

ФИГ. 4. График кривых выживаемости клеток после трансфекции и селекции в отсутствие глутамина. Показаны средние значения для двух дублированных трансфекций.

ФИГ. 5. Карта плазмиды для экспрессии интегразы PhiC31.

ФИГ. 6. Последовательность плазмиды для экспрессии интегразы PhiC31.

ФИГ. 7. Карта плазмиды для экспрессии акцепторного сайта (Dock).

ФИГ. 8. Последовательность плазмиды для экспрессии акцепторного сайта (Dock).

ФИГ. 9. Карта плазмиды Dock-WPRE.

ФИГ. 10. Последовательность плазмиды Dock-WPRE.

ФИГ. 11. Карта плазмиды Transgene-Promoter-Any way. В этой плазмиде экспрессией GS управляет слабый провирусный самоинактивирующийся 5'-длинный концевой повтор вируса саркомы мышей Молони.

ФИГ. 12. Последовательность плазмиды Transgene-Promoter- Any way. В этой плазмиде и всех последующих плазмидах Transgene отсутствует промотор, который управлял бы экспрессией GS в плазмиде Transgene.

ФИГ. 13. Карта плазмиды Transgene-Any way.

ФИГ. 14. Последовательность плазмиды Transgene-Any way.

ФИГ. 15. Карта плазмиды Transgene-MCS.

ФИГ. 16. Последовательность плазмиды Transgene-MCS.

ФИГ. 17. Карта плазмиды Transgene-MCS-WPRE-hvtron-MCS.

ФИГ. 18. Последовательность плазмиды Transgene- MCS-WPRE-Intron-MCS.

ФИГ. 19. Карта плазмиды Transgene-MCS-WPRE-MCS-WPRE.

ФИГ. 20. Последовательность плазмиды Transgene-MCS-WPRE-MCS-WPRE.

ФИГ. 21. Карта плазмиды Transgene-Yourway-HWIL.

ФИГ. 22. Последовательность плазмиды Transgene-Yourway-HWIL.

ФИГ. 23. Карта плазмиды Transgene-Yourway-LWIH.

ФИГ. 24. Последовательность плазмиды Transgene-Yourway-LWIH.

ФИГ. 25. Карта плазмиды Transgene-Yourway-HWLW.

ФИГ. 26. Последовательность плазмиды Transgene-Yourway-HWLW.

ФИГ. 27. Карта плазмиды Transgene-Yourway-LWHW.

ФИГ. 28. Последовательность плазмиды Transgene-Yourway- LWHW.

ФИГ. 29. Диаграмма индекса копийности гена attR для не подвергнутых селекции пулов клеток с акцепторными сайтами, содержащих в среднем приблизительно 36 акцепторных сайтов на клетку, трансфицированных плазмидой Transgene-Promoter-Any way в указанных соотношениях.

ФИГ. 30. График процентного содержания жизнеспособных клеток с течением времени селекции в выбранных пулах согласно Фигуре 29.

ФИГ. 31. Таблица значений индекса копийности и числа копий гена attR для всех пулов согласно Фигуре 30.

ФИГ. 32. График процентного содержания жизнеспособных клеток с течением времени селекции в пулах клеток с акцепторными сайтами, содержащих в среднем приблизительно 135 акцепторных сайтов на клетку, трансфицированных не содержащей промотора плазмидой Transgene-Anyway и плазмидой Integrase в указанных соотношениях. Показано среднее значение для двух дублированных пулов.

ФИГ. 33. Таблица значений индекса копийности гена attR для пулов согласно Фигуре 32 после селекции. Показано среднее значение для двух дублированных пулов.

ФИГ. 34. График процентного содержания жизнеспособных клеток с течением времени селекции в клонах клеток с акцепторными сайтами, содержащих приблизительно 181 копию акцепторного сайта на клетку, трансфицированных плазмидой Transgene-Yourway-LWHW и плазмидой Integrase в указанных соотношениях. Показано среднее значение для двух дублированных пулов.

ФИГ. 35. Таблица значений индекса копийности гена attR для пулов согласно Фигуре 34 после селекции. Показано среднее значение для двух дублированных пулов.

ФИГ. 36. Таблица значений индексов копийности генов attR (заполненный акцепторный сайт) и attP (пустой акцепторный сайт), % заполненных акцепторных сайтов и конечного титра согласно анализу продуктивности при периодическом добавлении питательной среды для клонов, полученных из пулов с акцепторными сайтами, содержащих приблизительно 135 копий акцепторного сайта на клетку, трансфицированных плазмидой Transgene-Anyway и плазмидой Integrase.

ФИГ. 37. График зависимости титра согласно анализу продуктивности при периодическом добавлении среды Excell от индексов копийности гена attR для всех 25 клонов согласно Фигуре 36.

ФИГ. 38. График процентного содержания жизнеспособных клеток с течением времени селекции в клонах клеток с акцепторными сайтами, содержащих приблизительно 181 копию акцепторного сайта на клетку, трансфицированных плазмидами Transgene-Yourway-LWHW, Yourway-HWLW, Yourway-HWTL, Yourway-LWTH или Anyway (в отдельности) и плазмидой Integrase. Показано среднее значение для двух дублированных пулов.

ФИГ. 39. Таблица значений индекса копийности гена attR и конечного титра согласно анализу продуктивности при периодическом добавлении питательной среды для клонов, полученных из пулов с акцепторными сайтами, согласно Фигуре 38. Показано среднее значение для двух дублированных пулов.

ФИГ. 40. Анализ продуктов Transgene- Yourway и Transgene-Anyway посредством ДСН-ПААГ-электрофореза проводили как в невосстанавливающих (слева), так и в восстанавливающих (справа) условиях.

ФИГ. 41. График конечного титра через более чем 40 поколений согласно анализу продуктивности при периодическом добавлении питательной среды с применением двух различных сред/стратегий добавления питательной среды для 3 пулов, экспрессирующих Anyway.

ОПРЕДЕЛЕНИЯ

Для облегчения понимания настоящего изобретения ниже приведены определения ряда терминов.

В настоящей заявке термин «клетка-хозяин» относится к любой эукариотической клетке (например, клеткам млекопитающих, клеткам птиц, клеткам земноводных, клеткам растений, клеткам рыб и клеткам насекомых) независимо от того, находится ли клетка в условиях in vitro или in vivo.

В настоящей заявке термин «клеточная культура» относится к любой культуре клеток in vitro. Этот термин включает стабильные клеточные линии (например, имеющие иммортализованный фенотип), первичные клеточные культуры, перевиваемые клеточные линии (например, нетрансформированные клетки) и любую другую популяцию клеток, поддерживаемую in vitro, включая ооциты и эмбрионы.

В настоящей заявке термин «вектор» относится к любому генетическому элементу, такому как плазмида, фаг, транспозон, космида, хромосома, вирус, вирион и т.д., который способен к репликации, когда он связан с подходящими регуляторными элементами, и который может переносить последовательности генов между клетками. Таким образом, указанный термин включает переносчики для клонирования и экспрессии, а также вирусные векторы.

В настоящей заявке термин «геном» относится к генетическому материалу (например, хромосомам) организма.

Термин «целевая (представляющая интерес) нуклеотидная последовательность» относится к любой нуклеотидной последовательности (например, РНК или ДНК), манипуляции с которой могут считаться желательными по любой причине (например, для лечения заболевания, обеспечения улучшенных качеств, экспрессии целевого белка в клетке-хозяине, экспрессии рибозима и т.д.) специалистом в данной области техники. Такие нуклеотидные последовательности включают, не ограничиваясь указанными, кодирующие последовательности структурных генов (например, репортерных генов, генов селектируемых маркеров, онкогенов, генов устойчивости к лекарственным средствам, факторов роста и т.д.) и некодирующие регуляторные последовательности, которые не кодируют мРНК или белковый продукт (например, промоторную последовательность, последовательность полиаденилирования, последовательность терминации, энхансерную последовательность и т.д.).

В настоящей заявке термин «целевой белок» относится к белку, кодируемому целевой нуклеиновой кислотой.

В настоящей заявке термины «кодирующая молекула нуклеиновой кислоты», «кодирующая последовательность ДНК», «кодирующая ДНК», «кодирующая последовательность РНК» и «кодирующая РНК» относятся к расположению в определенном порядке или последовательности дезоксирибонуклеотидов или рибонуклеотидов вдоль цепи дезоксирибонуклеиновой кислоты или рибонуклеиновой кислоты. Порядок этих дезоксирибонуклеотидов или рибонуклеотидов определяет порядок аминокислот вдоль полипептидной (белковой) цепи. Таким образом, последовательность ДНК или РНК кодирует аминокислотную последовательность.

В настоящей заявке термин «промотор», «промоторный элемент» или «промоторная последовательность» относится к последовательности ДНК, которая, при лигировании с целевой нуклеотидной последовательностью, способна регулировать транскрипцию целевой нуклеотидной последовательности в мРНК. Промотор, как правило, хотя и не обязательно, расположен на 5'-конце относительно целевой нуклеотидной последовательности (то есть выше нее), транскрипцию которой в мРНК он регулирует, и обеспечивает сайт для специфичного связывания РНК-полимеразы и других факторов транскрипции для инициации транскрипции.

Сигналы контроля транскрипции у эукариот включают «промоторные» и «энхансерные» элементы. Промоторы и энхансеры состоят из коротких наборов последовательностей ДНК, которые специфично взаимодействуют с клеточными белками, участвующими в транскрипции (Maniatis el al, Science 236: 1237 [1987]). Промоторные и энхансерные элементы были выделены из различных эукариотических источников, включая гены в клетках дрожжей, насекомых и млекопитающих, а также вирусов (аналогичные регуляторные элементы, то есть промоторы, также обнаружены в прокариотах). Выбор конкретного промотора и энхансера зависит от типа клеток, который предполагается использовать для экспрессии целевого белка. Некоторые эукариотические промоторы и энхансеры имеют широкий спектр хозяев, тогда как другие являются функциональными в ограниченной субпопуляции типов клеток (см. обзор в источниках Voss et al., Trends Biochem. Sci., 11:287 [1986]; и Maniatis et al., см. выше). Например, энхансер раннего гена SV40 очень активен в широком спектре типов клеток из многих видов млекопитающих и широко используется для экспрессии белков в клетках млекопитающих (Dijkema et al., EMBO J. 4:761 [1985]). Два других примера промоторных/энхансерных элементов, которые активны в широком спектре типов клеток млекопитающих, представляют собой элементы из гена фактора элонгации человека la (Uetsuki et al., J. Biol. Chem., 264:5791 [1989]; Kim et al, Gene 91:217 [1990]; и Mizushima andNagata, Nuc. Acids. Res., 18:5322 [1990]) и длинные концевые повторы вируса саркомы Рауса (Gorman et al, Proc. Natl. Acad. Sci. USA 79:6777 [1982]) и цитомегаловируса человека (Boshart et al, Cell 41:521 [1985]).

В настоящей заявке термин «промотор/энхансер» обозначает сегмент ДНК, который содержит последовательности, способные обеспечивать как промоторные, так и энхансерные функции (то есть функции, обеспечиваемые промоторным элементом и энхансерным элементом; обсуждение этих функций см. выше). Например, длинные концевые повторы ретровирусов обладают как промоторными, так и энхансерными функциями. Энхансер/промотор может быть «эндогенным» или «экзогенным» или «гетерологичным». «Эндогенный» энхансер/промотор представляет собой энхансер/промотор, который природно связан с данным геном в геноме. «Экзогенный» или «гетерологичный» энхансер/промотор представляет собой энхансер/промотор, который помещают в смежное с геном положение посредством генетической манипуляции (то есть молекулярно-биологических методик, таких как клонирование и рекомбинация) таким образом, что транскрипцией этого гена управляет связанный с ним энхансер/промотор.

В настоящей заявке термин «длинный концевой повтор» или «LTR» относится к элементам контроля транскрипции, расположенным в 5'- и 3'-концевых участках области U3 ретро вирусного генома или выделенным из них.

Как известно в данной области техники, длинные концевые повторы могут применяться в качестве регуляторных элементов в ретровирусных векторах, либо они могут быть выделены из ретровирусного генома и применяться для регулирования экспрессии из векторов других типов.

В настоящей заявке термины «комплементарный» или «комплементарность» используются в отношении полинуклеотидов (то есть последовательности нуклеотидов), связанных в соответствии с правилами спаривания оснований. Например, последовательность «5'-A-G-T-3'» комплементарна последовательности «3'-T-C-A-5'». Комплементарность может быть «частичной», при которой только некоторые из оснований нуклеиновых кислот соответствуют правилам спаривания оснований. Либо, комплементарность между нуклеиновыми кислотами может быть «полной» или «абсолютной». Степень комплементарное™ между цепями нуклеиновых кислот оказывает значительное влияние на эффективность и силу гибридизации между цепями нуклеиновых кислот. Это особенно важно в реакциях амплификации, а также в способах детектирования, зависящих от связывания нуклеиновых кислот.

Термины «гомология» и «процент идентичности», используемые в отношении нуклеиновых кислот, относятся к степени комплементарности. Гомология может быть частичной (то есть частичная идентичность) или полной (то есть полная идентичность). Частично комплементарная последовательность представляет собой последовательность, которая по меньшей мере частично ингибирует гибридизацию полностью комплементарной последовательности с последовательностью нуклеиновой кислоты-мишени, и ее обозначают с помощью функционального термина «по существу гомологичная». Ингибирование гибридизации полностью комплементарной последовательности с последовательностью-мишенью может быть исследовано с применением анализа гибридизации (Саузерн-блоттинг или Нозерн-блоттинг, гибридизация в растворе и тому подобное) в условиях низкой жесткости. По существу гомологичные последовательность или зонд (то есть олигонуклеотид, который способен гибридизоваться с другим целевым олигонуклеотидом) будут конкурировать за последовательность-мишень и ингибировать ее связывание (то есть гибридизацию) с полностью гомологичной последовательностью в условиях низкой жесткости. Это не означает, что условия низкой жесткости допускают неспецифичное связывание; условия низкой жесткости требуют, чтобы связывание двух последовательностей друг с другом являлось специфичным (то есть селектируемым) взаимодействием. Отсутствие неспецифичного связывания может быть проверено путем использования второй мишени, у которой отсутствует даже частичная степень комплементарности (например, имеющей идентичность менее чем приблизительно 30%); в отсутствие неспецифичного связывания зонд не будет гибридизоваться со второй некомплементарной мишенью.

Термины «в функциональной комбинации», «в функциональном порядке» и «функционально связанный» в настоящей заявке относятся к такой связи между последовательностями нуклеиновых кислот, при которой молекула нуклеиновой кислоты способна управлять транскрипцией данного гена и/или обеспечивает синтез желаемой белковой молекулы. Указанный термин также относится к такой связи между аминокислотными последовательностями, при которой образуется функциональный белок.

В настоящей заявке термин «селектируемый маркер» относится к гену, который кодирует белок с ферментативной активностью или другой белок, обеспечивающий способность расти в среде, не содержащей элемента, который в противном случае являлся бы незаменимым питательным веществом; кроме того, селектируемый маркер может обеспечивать клетке, в которой он экспрессируется, устойчивость к антибиотику или лекарственному средству.

В настоящей заявке термин «ретровирус» относится к ретровирусной частице, способной проникать в клетку (то есть указанная частица содержит мембрано-ассоциированный белок, такой как белок оболочки или вирусный гликопротеин G, который может связываться с поверхностью клетки-хозяина и облегчать проникновение вирусной частицы в цитоплазму клетки-хозяина) и интегрировать ретровирусный геном (в виде двухцепочечного провируса) в геном клетки-хозяина. Термин "ретровирус" охватывает подсемейства Oncovirinae (например, вирус лейкоза мышей Молони (MoMLV), вирус саркомы мышей Молони (MoMSV) и вирус опухоли молочной железы мышей (MMTV)), Spumavirinae и Lentivirinae (например, вирус иммунодефицита человека, вирус иммунодефицита обезьян, вирус инфекционной анемии лошадей и вирус козьего артрита-энцефалита; см., например, патенты США №№5,994,136 и 6,013,516, оба из которых включены в настоящую заявку посредством ссылки).

В настоящей заявке термин «ретровирусный вектор» относится к ретровирусу, который был модифицирован для экспрессии целевого гена. Ретровирусные векторы могут применяться для эффективного переноса генов в клетки-хозяева путем использования вирусного инфекционного процесса. Чужеродные или гетерологичные гены, клонированные (то есть встроенные с использованием молекулярно-биологических методик) в ретровирусный геном, могут быть эффективно доставлены в клетки-хозяева, которые восприимчивы к инфицированию ретровирусом. С помощью хорошо известных генетических манипуляций может быть устранена способность ретровирусного генома к репликации. Полученные дефектные по репликации векторы могут применяться для введения нового генетического материала в клетку, но они не способны реплицироваться. Вирус-помощник или линия упаковывающих клеток могут применяться для обеспечения сборки векторных частиц и выхода их из клетки. Такие ретровирусные векторы содержат дефектный по репликации ретровирусный геном, содержащий последовательность нуклеиновой кислоты, кодирующую по меньшей мере один целевой ген (то есть полицистронная последовательность нуклеиновой кислоты может кодировать более одного целевого гена), 5'-ретровирусный длинный концевой повтор (5'-LTR) и 3'-ретровирусный длинный концевой повтор (3'-LTR).

В настоящей заявке термин «лентивирусный вектор» относится к ретровирусным векторам, полученным из семейства Lentiviridae (например, вируса иммунодефицита человека, вируса иммунодефицита обезьян, вируса инфекционной анемии лошадей и вируса козьего артрита-энцефалита), которые способны интегрироваться в неделящиеся клетки (см., например, патенты США №№5,994,136 и 6,013,516, оба из которых включены в настоящую заявку посредством ссылки).

В настоящей заявке термин «транспозон» относится к мобильным элементам (например, Tn5, Tn7 и TnlO), которые могут перемещаться или переставляться из одного положения в геноме в другое. Как правило, транспозиция находится под контролем транспозазы. В настоящей заявке термин «транспозонный вектор» относится к вектору, кодирующему целевую нуклеиновую кислоту, фланкированную концевыми участками транспозона. Примеры транспозонных векторов включают, не ограничиваясь указанными, векторы, описанные в патентах США №№6,027,722; 5,958,775; 5,968,785; 5,965,443 и 5,719,055, все из которых включены в настоящую заявку посредством ссылки.

В настоящей заявке термин «вектор на основе аденоассоциированного вируса (AAV)» относится к вектору, полученному из серотипа аденоассоциированного вируса, включая, но не ограничиваясь указанными, AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAVX7 и т.д. Векторы на основе AAV могут иметь полную или частичную делецию одного или более генов AAV дикого типа, предпочтительно генов rep и/или cap, но сохраняют функциональные фланкирующие последовательности ITR.

Векторы на основе AAV могут быть сконструированы с использованием рекомбинантных методик, известных в данной области техники, таким образом, чтобы содержать одну или более гетерологичных нуклеотидных последовательностей, фланкированных на обоих концах (5' и 3') функциональными ITR AAV. При практическом применении настоящего изобретения вектор на основе AAV может содержать по меньшей мере одну ITR AAV и подходящую промоторную последовательность, расположенные выше гетерологичной нуклеотидной последовательности, и по меньшей мере одну ITR AAV, расположенную ниже гетерологичной последовательности. «Рекомбинантная векторная плазмида на основе AAV» относится к одному из типов рекомбинантных векторов на основе AAV, где указанный вектор содержит плазмиду. Как правило, как и в случае векторов на основе AAV, 5'- и 3'-ITR фланкируют выбранную гетерологичную нуклеотидную последовательность.

В настоящей заявке термин «аденовирусный вектор» относится к не имеющему оболочки двухцепочечному ДНК-вектору, содержащему аденовирусный остов.

В настоящей заявке термин «очищенный» относится к молекулам, последовательностям нуклеиновых кислот или аминокислот, которые извлечены из их природной среды, выделены или разделены. Таким образом, «последовательность выделенной нуклеиновой кислоты» представляет собой последовательность очищенной нуклеиновой кислоты. «По существу очищенные» молекулы по меньшей мере на 60%, предпочтительно по меньшей мере на 75% и более предпочтительно по меньшей мере на 90% не содержат других компонентов, с которыми они обычно связаны.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Настоящее изобретение относится к конструкциям нуклеиновых кислот и их применению для разработки линий клеток-хозяев для получения целевого белка и, в частности, к конструкциям нуклеиновых кислот, которые обеспечивают улучшенную селекцию для разработки высокопродуктивных линий клеток.

В некоторых предпочтительных вариантах реализации настоящего изобретения предложены конструкции нуклеиновых кислот для применения при осуществлении экспрессии целевого белка или целевых белков в клетке-хозяине. В некоторых предпочтительных вариантах реализации конструкции нуклеиновых кислот содержат следующие функционально связанные элементы, наиболее предпочтительно по порядку от 5'- до 3'-конца:

первая промоторная последовательность - последовательность селектируемого маркера -вторая промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая первый целевой белок - сигнальная последовательность поли(А).

В некоторых предпочтительных вариантах реализации конструкции согласно настоящему изобретению не содержат сигнальной последовательности поли(А) между последовательностью селектируемого маркера и второй промоторной последовательностью. Настоящее изобретение не ограничивается каким-либо конкретным механизмом действия.

Действительно, понимание механизма действия не является необходимым для практического применения настоящего изобретения. Тем не менее было обнаружено, что конструкции, не содержащие сигнальной последовательности поли(А) после селектируемого маркера, обеспечивали лучшие селекцию и продуцирование целевого белка в культурах клеток-хозяев. В других предпочтительных вариантах реализации селектируемый маркер примыкает ко второму промотору. В других предпочтительных вариантах реализации второй промотор примыкает к последовательности нуклеиновой кислоты, кодирующей первый целевой белок. В этом контексте термин «примыкает» означает, что между перечисленными компонентами нет промежуточного функционального элемента или интрона.

Конструкции нуклеиновых кислот могут применяться со многими различными векторами и векторными системами. Подходящие векторы и векторные системы включают, не ограничиваясь указанными, технологии встраивания генов с использованием вирусов, такие как ретровирусные, лентивирусные системы и системы на основе AAV, а также технологии встраивания генов без использования вирусов, такие как встраивание генов с помощью транспозазы, рекомбиназы, интегразы или CRISPR. Конкретные примеры технологий/ферментов, которые могут применяться с конструкциями нуклеиновых кислот согласно настоящему изобретению, включают системы транспозазы PiggyBac, системы транспозазы «Спящая красавица», системы транспозазы Mos1, системы транспозазы Tol2, системы транспозазы Leapin, системы рекомбиназы фага лямбда, системы FLP/FRT, системы Cre/Lox, системы интегразы MMLV, системы интегразы Rep 78 и системы CRISPR, которые могут содержать нуклеазы или никазы, а также направляющие последовательности. В некоторых предпочтительных вариантах реализации система представляет собой систему интеграции нуклеиновых кислот при условии, что эта система не является ретровирусной или лентивирусной системой, использующей ретровирусный или лентивирусный LTR.

В некоторых вариантах реализации конструкции являются подходящими для применения в клетках-хозяевах, содержащих интегрированные акцепторные сайты, описанных в предварительной заявке на патент США №63/033,516, содержание которой полностью включено в настоящую заявку посредством ссылки. Интегрированные акцепторные сайты предпочтительно содержат один или более инсерционных элементов (которые могут быть названы «инсерционный элемент акцепторного сайта»). Инсерционные элементы акцепторного сайта предпочтительно представляют собой последовательности нуклеиновых кислот, которые облегчают встраивание последовательности нуклеиновой кислоты, кодирующей целевой белок, в акцепторный сайт. Конструкции нуклеиновых кислот, которые могут быть встроены в акцепторные сайты в клетках-хозяевах согласно настоящему изобретению, подробно описаны ниже.

Например, в некоторых предпочтительных вариантах реализации управляемый рекомбиназой инсерционный элемент акцепторного сайта содержит сайт интеграции (att). В некоторых особенно предпочтительных вариантах реализации сайт интеграции представляет собой attP. Эти сайты интеграции используются интегразой PhiC31, которая представляет собой фермент рекомбиназу и которая в предпочтительных вариантах реализации может быть обеспечена в клетке-хозяине с помощью вектора. Эти акцепторные сайты служат в качестве акцепторов для интеграции конструкций нуклеиновых кислот, содержащих сайт интеграции attB. В других предпочтительных вариантах реализации могут быть использованы сайты интеграции attR и attL.

В других предпочтительных вариантах реализации управляемый рекомбиназой инсерционный элемент акцепторного сайта содержит сайт-мишень для распознавания Flp (FRT). Эти сайты используются ферментом флиппазой, которая представляет собой фермент рекомбиназу и которая в предпочтительных вариантах реализации может быть обеспечена в клетке-хозяине с помощью вектора. Эти акцепторные сайты служат в качестве акцепторов для интеграции конструкций нуклеиновых кислот, содержащих сайт FRT.

В других предпочтительных вариантах реализации управляемый рекомбиназой инсерционный элемент акцепторного сайта содержит сайт LoxP. Эти сайты используются рекомбиназой Cre, которая в предпочтительных вариантах реализации может быть обеспечена в клетке-хозяине с помощью вектора. Эти акцепторные сайты служат в качестве акцепторов для интеграции конструкций нуклеиновых кислот, содержащих сайт LoxP.

В других предпочтительных вариантах реализации инсерционный элемент представляет собой управляемый HDR инсерционный элемент (направляемой гомологией репарации) акцепторного сайта. Управляемые HDR инсерционные элементы акцепторного сайта представляют собой последовательности нуклеиновых кислот, обеспечивающие область гомологии («плечо гомологии»), которая взаимодействует за счет спаривания оснований с соответствующими плечами гомологии на конструкции нуклеиновой кислоты, встраиваемой в этот сайт. Эти системы предпочтительно применяются с эндонуклеазами, которые вводят двухцепочечные разрывы в целевой сайт или целевые сайты, предпочтительно фланкированные плечами гомологии. В некоторых вариантах реализации управляемый HDR инсерционный элемент акцепторного сайта представляет собой генетически нейтральный локус AAVS1. В этих вариантах реализации применяют акцепторный сайт, используемый эндонуклеазой (никазой) Rep 78, которая может быть введена в клетку-хозяина с помощью вектора. Белок никаза Rep 78 способствует сайт-специфической интеграции последовательностей нуклеиновых кислот, несущих плечи гомологии, соответствующие генетически нейтральному локусу AAVS1.

В других предпочтительных вариантах реализации управляемый HDR инсерционный элемент акцепторного сайта содержит одно или более плеч гомологии, которые представляют собой экзогенные последовательности, имеющие длину от 30 до 1000 пар оснований. Эти акцепторные сайты предпочтительно применяются в сочетании с системами редактирования генов CRISPR. В некоторых вариантах реализации акцепторный сайт дополнительно содержит одну или более последовательностей, которые гомологичны последовательностям направляющей РНК. В этих вариантах реализации конструкция нуклеиновой кислоты, встраиваемая в акцепторный сайт, предпочтительно содержит плечи гомологии, которые гомологичны плечам гомологии в акцепторном сайте и взаимодействуют с ними за счет спаривания оснований. Для применения с системами редактирования генов CRISPR в клетку-хозяина вводят совместимую с системами редактирования генов CRISPR нуклеазу. Совместимая с системой редактирования генов CRISPR нуклеаза может представлять собой эндонуклеазу дикого типа, которая создает двухцепочечный разрыв в положении, определяемом направляющей РНК (и в пределах акцепторного сайта), или мутированную нуклеазу (то есть никазу), которая создает ступенчатые одноцепочечные разрывы в пределах акцепторного сайта в положениях, определяемых двумя направляющими РНК. Подходящие нуклеазы подробно описаны ниже при обсуждении конструкций для экспрессии нуклеиновых кислот.

В некоторых предпочтительных вариантах реализации акцепторный сайт предпочтительно может содержать подходящий промотор таким образом, что используется схема промоторной ловушки, когда в акцепторный сайт вводят подходящие конструкции нуклеиновых кислот. Подходящие промоторы включают, не ограничиваясь указанными, промоторные последовательности SIN-LTR, SV40, EF1a, lac Е. coli, trp Е. coli, PL фага лямбда, PR фага лямбда, Т3, Т7, немедленно-раннего промотора цитомегаловируса (CMV), тимидинкиназы вируса простого герпеса (HSV), альфа-лактальбумина и металлотионеина-I мыши. В некоторых предпочтительных вариантах реализации промоторная последовательность ориентирована в акцепторном сайте таким образом, что промотор будет обеспечивать экспрессию из встроенной конструкции нуклеиновой кислоты. В некоторых предпочтительных вариантах реализации промотор имеет 5'-ориентацию относительно акцепторного сайта. В некоторых особенно предпочтительных вариантах реализации промотор представляет собой SIN LTR. В этих вариантах реализации SIN-LTR и EPR расположены на 5'-конце относительно акцепторного сайта, и SIN LTR расположен на 3'-конце относительно акцепторного сайта.

Соответственно, в некоторых предпочтительных вариантах реализации конструкции нуклеиновых кислот содержат инсерционный элемент. Предпочтительно инсерционный элемент может быть расположен на 5'-конце относительно первого промотора, на 3'-конце относительно сигнальной последовательности поли(А), между первой промоторной последовательностью и сигнальной последовательностью поли(А), между последовательностью селектируемого маркера и второй промоторной последовательностью, и одновременно на 5'-конце относительно первого промотора и на 3'-конце относительно сигнальной последовательности поли(А). Подходящие конструкции представлены в следующих неограничивающих примерах:

инсерционный элемент экспрессионной конструкции - первая промоторная последовательность (необязательно в зависимости от того, содержит ли уже акцепторный сайт экзогенную промоторную последовательность) - последовательность селектируемого маркера - вторая (то есть внутренняя) промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая первый целевой белок - сигнальная последовательность поли(А).

первая промоторная последовательность (необязательно в зависимости от того, содержит ли уже акцепторный сайт экзогенную промоторную последовательность) - последовательность селектируемого маркера - вторая промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая первый целевой белок - сигнальная последовательность поли(А) - инсерционный элемент экспрессионной конструкции.

инсерционный элемент экспрессионной конструкции - первая промоторная последовательность (необязательно в зависимости от того, содержит ли уже акцепторный сайт экзогенную промоторную последовательность) - последовательность селектируемого маркера - вторая промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая первый целевой белок - сигнальная последовательность поли(А) - инсерционный элемент экспрессионной конструкции.

первая промоторная последовательность (необязательно в зависимости от того, содержит ли уже акцепторный сайт экзогенную промоторную последовательность) - последовательность селектируемого маркера - инсерционный элемент экспрессионной конструкции - вторая промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая первый целевой белок - сигнальная последовательность поли(А).

В некоторых предпочтительных вариантах реализации конструкции могут содержать последовательности нуклеиновых кислот, кодирующие несколько целевых белков, например, 2, 3, 4 или 5 целевых белков. Подходящие конструкции для экспрессии двух целевых белков представлены в следующих неограничивающих примерах:

инсерционный элемент экспрессионной конструкции - первая промоторная последовательность (необязательно в зависимости от того, содержит ли уже акцепторный сайт экзогенную промоторную последовательность) - последовательность селектируемого маркера - вторая (то есть внутренняя) промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая первый целевой белок - WPRE (необязательно) - сигнальная последовательность поли(А) - третья промоторная последовательность или IRES - последовательность нуклеиновой кислоты, кодирующая второй целевой белок - WPRE (необязательно) - сигнальная последовательность поли(А);

первая промоторная последовательность (необязательно в зависимости от того, содержит ли уже акцепторный сайт экзогенную промоторную последовательность) - последовательность селектируемого маркера - вторая промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая первый целевой белок - WPRE (необязательно) - сигнальная последовательность поли(А) - третья промоторная последовательность - интрон (необязательно) - последовательность нуклеиновой кислоты, кодирующая второй целевой белок - WPRE (необязательно) - сигнальная последовательность поли(А) - инсерционный элемент экспрессионной конструкции;

инсерционный элемент экспрессионной конструкции - первая промоторная последовательность (необязательно в зависимости от того, содержит ли уже акцепторный сайт экзогенную промоторную последовательность) - последовательность селектируемого маркера - вторая промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая первый целевой белок - WPRE (необязательно) - сигнальная последовательность поли(А) - третья промоторная последовательность - интрон (необязательно) последовательность нуклеиновой кислоты, кодирующая второй целевой белок - WPRE (необязательно) - сигнальная последовательность поли(А) - инсерционный элемент экспрессионной конструкции;

первая промоторная последовательность (необязательно в зависимости от того, содержит ли уже акцепторный сайт экзогенную промоторную последовательность) - последовательность селектируемого маркера - инсерционный элемент экспрессионной конструкции - вторая промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая первый целевой белок - WPRE - сигнальная последовательность поли(А) - третья промоторная последовательность или IRES - последовательность нуклеиновой кислоты, кодирующая второй целевой белок - WPRE - сигнальная последовательность поли(А);

инсерционный элемент экспрессионной конструкции - первая промоторная последовательность (необязательно в зависимости от того, содержит ли уже акцепторный сайт экзогенную промоторную последовательность) - последовательность селектируемого маркера - вторая промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая первый целевой белок - WPRE (необязательно) - сигнальная последовательность поли(А) - третья промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая второй целевой белок - WPRE (необязательно) - сигнальная последовательность поли(А) - инсерционный элемент экспрессионной конструкции;

инсерционный элемент экспрессионной конструкции - первая промоторная последовательность (необязательно в зависимости от того, содержит ли уже акцепторный сайт экзогенную промоторную последовательность) - последовательность селектируемого маркера - вторая промоторная последовательность - последовательность нуклеиновой кислоты, кодирующая первый целевой белок - WPRE (необязательно) - сигнальная последовательность поли(А) - третья промоторная последовательность - интрон - последовательность нуклеиновой кислоты, кодирующая второй целевой белок - WPRE (необязательно) - сигнальная последовательность поли(А) - инсерционный элемент экспрессионной конструкции.

В некоторых предпочтительных вариантах реализации первый целевой белок представляет собой одну из тяжелой и легкой цепей антитела, и второй целевой белок представляет собой другую из тяжелой и легкой цепей антитела.

Однако любые подходящие целевые белки могут быть экспрессированы с применением клеток-хозяев, конструкций и систем согласно настоящему изобретению. Примеры целевых белков включают иммуноглобулины, одноцепочечные антитела, антикоагулянтные белки, белки-факторы крови, костные морфогенетические белки, конструированные белковые каркасы, ферменты, содержащие Fc слитые белки, факторы роста, гормоны, интерфероны, интерлейкины, антигены и тромболитические белки. В других предпочтительных вариантах реализации конструкции согласно настоящему изобретению могут применяться для экспрессии вирусных векторов. В этих вариантах реализации последовательность целевого белка, описанная в приведенных выше типичных векторах, заменена на последовательность нуклеиновой кислоты, кодирующую остов вирусного вектора. Вирусные векторы, которые могут быть включены в конструкции согласно настоящему изобретению, включают, не ограничиваясь указанными, ретровирусные векторы, лентивирусные векторы, аденовирусные векторы и векторы на основе AAV. В некоторых предпочтительных вариантах реализации ретровирусные векторы сами по себе включают последовательность нуклеиновой кислоты, кодирующую целевой белок, описанный выше, которая экспрессируется вектором. В некоторых особенно предпочтительных вариантах реализации целевой белок, который экспрессируется вектором, представляет собой последовательность антигена для применения в вакцине.

В некоторых предпочтительных вариантах реализации инсерционные элементы представляют собой элементы, которые находят применение в сочетании с системами транспозонов, интеграз, рекомбиназ или CRISPR или распознаются указанными системами. Подходящие инсерционные элементы включают, не ограничиваясь указанными, инвертированные концевые повторы, сайты интеграции для интегразы (att) и плечи гомологичной рекомбинации, которые в контексте конструкций, описанных в настоящей заявке, могут быть описаны как инсерционные элементы гомологичной рекомбинации.

В некоторых предпочтительных вариантах реализации конструкции нуклеиновых кислот согласно настоящему изобретению содержат управляемые транспозоном инсерционные элементы, предпочтительно инвертированные концевые повторы, которые распознаются транспозонами. В некоторых предпочтительных вариантах реализации инвертированные концевые повторы расположены как на 5'-, так и на 3'-концах конструкции. Транспозоны представляют собой мобильные генетические элементы, которые могут перемещаться или переставляться из одного положения в геноме в другое. Транспозиция внутри генома находится под контролем фермента транспозазы, кодируемого транспозоном. В данной области техники известны многие примеры транспозонов, включая, но не ограничиваясь указанными, системы транспозаз Tn5 (см., например, de la Cruz et al., J. Bact. 175: 6932-38 [1993], Tn7 (см., например, Craig, Curr. Topics Microbiol. Immunol. 204: 27-48 [1996]) и TnlO (см., например, Morisato and Kleckner, Cell 51:101-111 [1987), а также системы транспозазы PiggyBac, системы транспозазы «Спящая красавица», системы транспозазы Mosl, системы транспозазы Tol2 и системы транспозазы Leapin. Способность транспозонов интегрироваться в геномы была использована для создания транспозонных векторов (описанных, например, в патентах США №№5,719,055; 5,968,785; 5,958,775 и 6,027,722; все из которых включены в настоящую заявку посредством ссылки, а также векторов, поставляемых компаниями System Biosciences (Пало-Альто, Калифорния; система PiggyBac), Creative Biolabs (Ширли, Нью-Йорк; система «Спящая красавица») и ATUM (Ньюарк, Калифорния; система Leapin)).

Транспозиция включает упорядоченную последовательность событий: (1) специфичное в отношении последовательности связывание транспозазы с концевыми инвертированными повторами (IR), присутствующими на концах транспозона, (2) расщепление обеих цепей ДНК на каждом конце транспозона, (3) синапсис концов за счет взаимодействий транспозаза-транспозаза, (4) захват ДНК-мишени и (5) перенос цепи со встраиванием элемента в мишень.

Транспозазы являются представителями суперсемейства белков интеграз ретровирусов. Несмотря на структурное сходство в своих каталитических доменах, эти белки осуществляют реакции переноса фосфорила с различной специфичностью. Некоторые из них расщепляют только одну цепь ДНК, в то время как РНКаза Н расщепляет одну цепь РНК в гибридном дуплексе РНК: ДНК. Другие создают двухцепочечные разрывы ДНК, задействуя различные механизмы. Транспозазы бактериальных транспозонов Tn5 и TnlO осуществляют расщепление первой цепи путем гидролиза с образованием 3'-гидроксила (3'-ОН) на каждом конце элемента, в то время как вторая цепь расщепляется путем трансэтерификации с использованием этого 3'-ОН в качестве атакующего нуклеофила. В результате этого на каждом конце элемента образуется шпилька ДНК, которая гидролизуется транспозазой с регенерацией 3'-ОН, необходимого для переноса цепи. V(В)J-рекомбинация и транспозиция эукариотического элемента Hermes, представителя семейства hAT, протекают по сходному механизму за исключением того, что порядок расщепления цепей является обратным, и шпилька образуется на фланкирующей, а не на вырезаемой ДНК. Другой бактериальный транспозон, Tn7, использует TnsB для осуществления расщепления первой цепи и рекрутирует второй белок, TnsA, для расщепления не перенесенной цепи.

Поскольку транспозоны не являются инфекционными, то транспозонные векторы вводят в клетки-хозяева с помощью способов, известных в данной области техники (например, электропорации, липофекции или микроинъекции). Таким образом, можно подбирать соотношение транспозонных векторов и клеток-хозяев для обеспечения желаемой множественности заражения для получения клеток-хозяев с большим числом копий. Транспозонные векторы, подходящие для применения в настоящем изобретении, обычно содержат нуклеиновую кислоту, кодирующую целевой белок, помещенную между двумя инсерционными последовательностями транспозонов. Некоторые векторы также содержат последовательность нуклеиновой кислоты, кодирующую фермент транспозазу. В этих векторах одна из инсерционных последовательностей расположена между ферментом транспозазой и нуклеиновой кислотой, кодирующей целевой белок, таким образом, что она не встраивается в геном клетки-хозяина в процессе рекомбинации. В качестве альтернативы, фермент транспозаза может быть обеспечен подходящим способом (например, липофекцией или микроинъекцией).

В некоторых предпочтительных вариантах реализации конструкции нуклеиновых кислот согласно настоящему изобретению содержат управляемый рекомбиназой инсерционный элемент, который распознается рекомбиназой. Подходящие управляемые рекомбиназой инсерционные элементы включают, не ограничиваясь указанными, сайты интеграции (att), сайты LoxP и последовательности LTR MMLV.

В некоторых предпочтительных вариантах реализации управляемый рекомбиназой инсерционный элемент представляет собой attB и применяется в сочетании с интегразой phiC31 (BioCat GmbH, Гейдельберг, Германия или System Biosciences, Пало-Альто, Калифорния)). Интеграза phiC31 представляет собой специфичную в отношении последовательности рекомбиназу, кодируемую в геноме бактериофага phiC31. Интеграза phiC31 опосредует рекомбинацию между двумя последовательностями длиной 34 пары оснований, называемыми сайтами интеграции (att), одна из которых находится в фаге, а другая - в хозяине. Было показано, что эта сериновая интеграза эффективно функционирует во многих различных типах клеток, включая клетки млекопитающих. В присутствии интегразы phiC31 донорная плазмида, содержащая attB, может быть однонаправленно интегрирована в геном-мишень посредством рекомбинации в сайтах, имеющих сходство последовательностей с природным сайтом attP (называемых сайтами псевдо-attP). Интеграза phiC31 может интегрировать плазмиду любого размера в виде одной копии и не требует участия кофакторов. Интегрированные трансгены стабильно экспрессируются и наследуются.

В других предпочтительных вариантах реализации инсерционный элемент представляет собой последовательность нуклеиновой кислоты, гомологичную сайту-мишени в хромосоме, такой как хромосома в клетке-хозяине, и используемую в сочетании с рекомбиназой или такими системами как CRISPR. Подходящие системы на основе рекомбиназы включают системы CRE-Lox, FLP-FRT и рекомбиназы фага лямбда. Как правило, последовательность нуклеиновой кислоты, которая гомологична сайту-мишени в хромосоме, будет иметь длину от 30 до 1000 оснований.

В некоторых предпочтительных вариантах реализации управляемый рекомбиназой инсерционный элемент представляет собой последовательность lox. Рекомбинация с участием Cre-Lox представляет собой сайт-специфическую технологию с применением рекомбиназы, используемую для введения делеций, инсерций, транслокаций и инверсий в специфические сайты в ДНК клеток. Это позволяет нацеливать модификацию ДНК на конкретный тип клеток или запускать ее с помощью специфического внешнего стимула. Указанную технологию реализуют как в эукариотической, так и в прокариотической системах. Система рекомбинации Cre-lox нашла применение, в частности, у нейробиологов при изучении головного мозга, в котором сложные типы клеток и нейронные сети вместе формируют когнитивные функции и поведение. Система состоит из одного фермента, Cre-рекомбиназы, который осуществляет рекомбинацию пары коротких последовательностей-мишеней, называемых последовательностями Lox. Эта система может быть применена на практике без встраивания каких-либо дополнительных вспомогательных белков или последовательностей. Фермент Cre и исходный сайт Lox, называемый последовательностью LoxP, получены из бактериофага PI. См., например, Targeted integration of DNA using mutant lox sites in embryonic stem cells. Araki, et al. Nucleic Acids Res, Feb 1997, vol. 25, Issue 4, pp. 868-872; High-Resolution Labeling and Functional Manipulation of Specific Neuron Types in Mouse Brain by Cre-Activated Viral Gene Expression. Kuhlman, et al. PLos One, Apr 2008, Vol.3, e2005; When reverse genetics meets physiology: the use of site-specific recombinases in mice. Tranche, et al. FEBS Letters, Aug 2002, Vol.529, Issue 1, pp. 116-121.

В некоторых предпочтительных вариантах реализации управляемый рекомбиназой инсерционный элемент представляет собой последовательность FRT. Система рекомбинации FLP-FRT представляет собой другую технологию сайт-направленной рекомбинации, принципиально очень похожую на Cre-lox, использующую флиппазу (Flp) и короткий сайт-мишень для распознавания флиппазой (FRT), которые являются аналогами Cre и loxP, соответственно. См., например, Candice et al., Cre/loxP, Flp/FRT Systems and Pluripotent Stem Cell Lines (2012) Topics in Current Genetics, vol 23. Технология FLP-FRT может являться эффективной альтернативой Cre-lox, и она также была использована в сочетании с Cre-lox, что обеспечило одновременный контроль двух отдельных событий рекомбинации.

В других предпочтительных вариантах реализации конструкции нуклеиновых кислот согласно настоящему изобретению могут применяться в сочетании с системами гомологичной рекомбинации (FFDR) CRISPR. В этих системах инсерционные элементы HDR содержат плечи гомологии, которые гомологичны последовательностям-мишеням в геноме или взаимодействуют с ними за счет спаривания оснований. FTDR инициируется присутствием двухцепочечных разрывов (DSB) в ДНК. Система CRISPR/Cas9 предпочтительно применяется для создания целевых двухцепочечных разрывов с помощью последовательности направляющей РНК таким образом, что может быть встроена конструкция нуклеиновой кислоты согласно настоящему изобретению. См., например, Zhang et al., Efficient precise knockin with a double cut HDR donor after CRISPR/Cas9-mediated double-stranded DNA cleavage (2017) Genome Biol. 18:35; Mali et al., Cas9 as a versatile tool for engineering biology. Nature MethodslO, 957-963 (2013); Mali et al., RNA-Guided Human Genome Engineering via Cas9. Science339(6121), 823-826 (2013); Ran et al., Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity. Cell, 155(2), 479-480(2013). Подходящие последовательности направляющих РНК (gPHK) могут быть сконструированы, как известно в данной области техники. В некоторых предпочтительных вариантах реализации в системах CRISPR для HDR применяются либо одна, либо две направляющие последовательности. В случае применения одной последовательности направляющей РНК предпочтительно использовать нуклеазу, такую как нуклеаза Cas9, которая создает один двухцепочечный разрыв под контролем последовательности направляющей РНК. В случае применения двух направляющих последовательностей предпочтительно использовать никазу, которая может представлять собой мутированную нуклеазу Cas9, которая создает только одноцепочечные разрывы в последовательности ДНК-мишени под контролем каждой из последовательностей направляющей РНК. Одноцепочечные разрывы предпочтительно расположены в ступенчатом порядке на разных цепях (то есть смысловой и антисмысловой цепях) последовательности ДНК-мишени. Такое расположение, как правило, улучшает эффективность HDR.

В целом, «система CRISPR» относится в совокупности к транскриптам и другим элементам, участвующим в экспрессии или управлении активностью CRISPR-ассоциированных («Cas») генов, включая последовательности, кодирующие ген Cas, последовательность tracr (трансактивирующую CRISPR) (например, tracrPHK или частично активную tracrPHK), последовательность tracr-mate (охватывающую «прямой повтор» и процессируемый tracrPHK частичный прямой повтор в контексте эндогенной системы CRISPR), направляющую последовательность (также называемую «спейсер» в контексте эндогенной системы CRISPR) или другие последовательности и транскрипты из локуса CRISPR. В некоторых вариантах реализации один или более элементов системы CRISPR получены из системы CRISPR I типа, II типа или III типа. В некоторых вариантах реализации один или более элементов системы CRISPR получены из конкретного организма, содержащего эндогенную систему CRISPR, такого как Streptococcus pyogenes. В целом, система CRISPR характеризуется элементами, которые способствуют образованию комплекса CRISPR в сайте последовательности-мишени (также называемой протоспейсером в контексте эндогенной системы CRISPR). В контексте образования комплекса CRISPR «последовательность-мишень» относится к последовательности, направляющую последовательность для которой создают таким образом, чтобы она была комплементарной данной последовательность-мишени, при этом гибридизация между последовательностью-мишенью и направляющей последовательностью способствует образованию комплекса CRISPR. Не обязательно требуется полная комплементарность, если имеющаяся комплементарность достаточна для того, чтобы вызывать гибридизацию и способствовать образованию комплекса CRISPR. Последовательность-мишень может содержать любой полинуклеотид, такой как полинуклеотиды ДНК или РНК. В некоторых вариантах реализации последовательность-мишень расположена в ядре или цитоплазме клетки. В некоторых вариантах реализации последовательность-мишень может находиться внутри органеллы эукариотической клетки, например, митохондрии или хлоропласта. Последовательность или матрицу, которая может применяться для рекомбинации в целевой локус, содержащий последовательности-мишени, называют «редактирующей матрицей» или «редактирующим полинуклеотидом» или «редактирующей последовательностью». В аспектах настоящего изобретения экзогенный матричный полинуклеотид может называться редактирующей матрицей. В одном из аспектов настоящего изобретения рекомбинация представляет собой гомологичную рекомбинацию.

Как правило, в контексте эндогенной системы CRISPR образование комплекса CRISPR (содержащего направляющую последовательность, гибридизованную с последовательностью-мишенью и находящуюся в комплексе с одним или более белками Cas) приводит к расщеплению одной или обеих цепей в последовательности-мишени или вблизи от нее (например, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований от последовательности-мишени). Без привязки к какой-либо теории, последовательность tracr, которая может содержать всю последовательность tracr дикого типа или ее часть или состоять из них (например, приблизительно или более чем приблизительно 20, 26, 32, 45, 48, 54, 63, 67, 85 или более нуклеотидов последовательности tracr дикого типа), также может составлять часть комплекса CRISPR, например, путем гибридизации по меньшей мере части последовательности tracr со всей последовательностью tracr-mate или ее частью, которая функционально связана с направляющей последовательностью. В некоторых вариантах реализации последовательность tracr обладает достаточной комплементарностью в отношении последовательности tracr-mate для гибридизации и участия в образовании комплекса CRISPR. Как и в случае последовательности-мишени, полагают, что не требуется полная комплементарность, если имеющаяся комплементарность достаточна для функционирования. В некоторых вариантах реализации последовательность tracr имеет по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательностей вдоль длины последовательности tracr-mate при оптимальном выравнивании. В некоторых вариантах реализации один или более векторов, обеспечивающих экспрессию одного или более элементов системы CRISPR, вводят в клетку-хозяина таким образом, что экспрессия элементов системы CRISPR определяет образование комплекса CRISPR в одном или более сайтах-мишенях. Например, фермент Cas, направляющая последовательность, связанная с последовательностью tracr-mate, и последовательность tracr могут быть функционально связаны с отдельными регуляторными элементами на отдельных векторах. В качестве альтернативы, два или более элементов, экспрессируемых с участием одного и того же или разных регуляторных элементов, могут быть объединены в один вектор с использованием при этом одного или более дополнительных векторов, обеспечивающих какие-либо компоненты системы CRISPR, не включенные в первый вектор. Элементы системы CRISPR, которые объединены в одном векторе, могут быть расположены в любой подходящей ориентации, например, один элемент может быть расположен на 5'-конце (то есть «выше») или на 3'-конце (то есть «ниже») относительно второго элемента. Кодирующая последовательность одного элемента может быть расположена на той же или противоположной цепи, что и кодирующая последовательность второго элемента, и ориентирована в том же или противоположном направлении. В некоторых вариантах реализации один промотор управляет экспрессией транскрипта, кодирующего фермент CRISPR, и одной или более из направляющей последовательности, последовательности tracr-mate (необязательно функционально связанной с направляющей последовательностью) и последовательности tracr, встроенных в одну или более интронных последовательностей (например, каждая в свой интрон, две или более в по меньшей мере один интрон или все в один интрон). В некоторых вариантах реализации фермент CRISPR, направляющая последовательность, последовательность tracr-mate и последовательность tracr функционально связаны и экспрессируются с одного и того же промотора.

Неограничивающие примеры белков Cas, подходящих для применения в настоящем изобретении, включают Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (также известный как Csn1 и Csxl2), CaslO, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Csx1, Csxl5, Csf1, Csf2, Csf3, Csf4, их гомологи или их модифицированные варианты. Эти ферменты являются известными; например, аминокислотную последовательность белка Cas9 S. pyogenes можно найти в базе данных SwissProt под номером доступа Q99ZW2. В некоторых вариантах реализации немодифицированный фермент CRISPR обладает активностью расщепления ДНК, такой как активность Cas9. В некоторых вариантах реализации фермент CRISPR представляет собой Cas9 и может представлять собой Cas9 из S. pyogenes или S. pneumoniae. В некоторых вариантах реализации фермент CRISPR направляет расщепление одной или обеих цепей в положении последовательности-мишени, например, в пределах последовательности-мишени и/или в пределах комплемента последовательности-мишени. В некоторых вариантах реализации фермент CRISPR направляет расщепление одной или обеих цепей в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 или более пар оснований от первого или последнего нуклеотида последовательности-мишени. В некоторых вариантах реализации вектор кодирует фермент CRISPR, который является мутированным по сравнению с соответствующим ферментом дикого типа таким образом, что мутированный фермент CRISPR не обладает способностью расщеплять одну или обе цепи целевого полинуклеотида, содержащего последовательность-мишень. Например, замена аспарагиновой кислоты на аланин (D10A) в каталитическом домене RuvC I Cas9 из S. pyogenes превращает Cas9 из нуклеазы, которая расщепляет обе цепи, до никазы (расщепляет одну цепь). Другие примеры мутаций, которые превращают Cas9 в никазу, включают, не ограничиваясь указанными, Н840А, N854A и N863A. В аспектах настоящего изобретения никазы могут применяться для редактирования генома посредством гомологичной рекомбинации.

В некоторых предпочтительных вариантах реализации управляемый HDR инсерционный элемент содержит генетически нейтральный локус AAVS1 и применяется в сочетании с интегразой Rep 78. В особенно предпочтительных вариантах реализации управляемый HDR инсерционный элемент содержит плечи гомологии, которые взаимодействуют за счет спаривания оснований с генетически нейтральным локусом AAVS1. Белок Rep 78 аденоассоциированного вируса серотипа 2 (AAV2) представляет собой специфичную в отношении цепи эндонуклеазу (никазу), которая способствует сайт-специфической интеграции трансгенных последовательностей, несущих плечи гомологии, соответствующие генетически нейтральному локусу AAVS1. См., например, Ramachandra et al., Efficient recombinase-mediated cassette exchange at the AAVS1 locus in human embryonic stem cells using baculoviral vectors (2011) Nucleic Acids Research, 39(16):e107; WO 1998027207).

Как указано выше, в некоторых предпочтительных вариантах реализации конструкции нуклеиновых кислот согласно настоящему изобретению содержат первую и вторую промоторные последовательности. Первая и вторая промоторные последовательности могут быть одинаковыми или различными. Подходящие первая и вторая промоторные последовательности включают, не ограничиваясь указанными, промотор LTR MMLV, промотор LTR MoMuSV, промотор LTR респираторно-синцитиального вируса (RSV), промотор SIN LTR, промотор SV40, немедленно-ранний промотор цитомегаловируса (CMV), промотор тимидинкиназы вируса простого герпеса (HSV), промотор альфа-лактальбумина, промотор металлотионеина-I мыши, промотор дигидрофолатредуктазы, промотор b-актина, промотор фосфоглицеринкиназы (PGK) и промоторные последовательности EF 1а и их комбинации. В некоторых предпочтительных вариантах реализации первая промоторная последовательность не является ретровирусным промотором LTR, то есть первый промотор представляет собой промоторную последовательность, отличную от ретровирусной промоторной последовательности LTR. Однако, когда промотор является ретровирусной промоторной последовательностью, он может представлять собой промоторную последовательность самоинактивирующегося (SIN) LTR. См., например, также находящуюся на рассмотрении заявку PCT/US2019/064423, которая полностью включена в настоящую заявку посредством ссылки. Подходящие промоторы Sin LTR известны в данной области техники и получены путем удаления всей области U3 LTR или ее части.

Как описано в PCT/US2019/064423, в некоторых предпочтительных вариантах реализации первый промотор, который управляет экспрессией селективного маркера, представляет собой слабый промотор. В некоторых предпочтительных вариантах реализации слабый промотор представляет собой промотор, предпочтительно конститутивный промотор, который, будучи функционально связанным с последовательностью селектируемого маркера, обладает активностью, равной активности или меньшей чем активность промотора SIN LTR, в целевом хозяине (например, клетке СНО). В других предпочтительных вариантах реализации слабый промотор представляет собой промотор, предпочтительно конститутивный промотор, который, будучи функционально связанным с последовательностью селектируемого маркера, обладает активностью, равной активности или меньшей чем активность промотора убиквитина С (UBC) человека, в целевом хозяине (например, клетке СНО). Подходящие способы оценки силы промоторов известны в данной области техники. См., например, Dandindorj et al. (2014) A Comparative Analysis of Constitutive Promoters Located in Adeno-Associated Viral Vectors, PLoS One 9(8): el06472; Zhang and Baum (2005) Evaluation of Viral and Mammalian Promoters for Use in Gene Delivery to Salivary Glands Mol. Ther. 12(3):528-536; Qin et al. (2010) Systematic Comparison of Constitutive Promoters and the Doxycycline-Inducible Promoter PLoS 5(5): el 0611; Jeyaseelan et al. (2001) Real-time detection of gene promoter activity: quantitation of toxin gene transcription, Nucleic Acids Research. 29 (12): 58e-58. В некоторых вариантах реализации слабые промоторы были изменены с целью снижения промоторной активности. Соответственно, в некоторых предпочтительных вариантах реализации настоящего изобретения предложен(ы) вектор(ы) для экспрессии целевого белка, содержащий(ие) последовательность нуклеиновой кислоты, кодирующую селектируемый маркер, функционально связанную с первой последовательностью слабого промотора или промоторной последовательностью, которая была изменена с целью снижения промоторной активности по сравнению с вариантом первой промоторной последовательности, не имеющим изменений, или дикого типа, и последовательность нуклеиновой кислоты, кодирующую целевой белок, функционально связанную со второй промоторной последовательностью. Одним из таких примеров является промоторная последовательность SIN LTR. Другие промоторные последовательности, описанные выше, также могут быть изменены с целью снижения активности и обеспечения слабого промотора, либо слабый промотор может представлять собой природный слабый промотор, такой как промотор UBC.

В некоторых предпочтительных вариантах реализации конструкции нуклеиновых кислот содержат селектируемый маркер. Подходящие селектируемые маркеры включают, не ограничиваясь указанными, глутаминсинтетазу (GS), дигидрофолатредуктазу (DHFR) и тому подобное. Эти гены описаны в патентах США №№5,770,359; 5,827,739; 4,399,216; 4,634,665; 5,149,636 и 6,455,275; все из которых включены в настоящую заявку посредством ссылки. В некоторых предпочтительных вариантах реализации используемый селектируемый маркер совместим с линией клеток-хозяев, которая является дефектной по продуцированию фермента, кодируемого последовательностью нуклеиновой кислоты селектируемого маркера. Подходящие линии клеток-хозяев более подробно описаны ниже. В других вариантах реализации селектируемый маркер представляет собой маркер устойчивости к антибиотику, то есть ген, продуцирующий белок, который обеспечивает экспрессирующие этот белок клетки устойчивостью к антибиотику. Подходящие маркеры устойчивости к антибиотикам включают гены, которые обеспечивают устойчивость кнеомицину (ген устойчивости к неомицину (neo)), гигромицину (ген фосфотрансферазы гигромицина В), пуромицину (N-ацетилтрансфераза пуромицина) и тому подобное.

В других вариантах реализации настоящего изобретения, где желательна секреция целевого белка, конструкции нуклеиновых кислот содержат последовательность сигнального пептида, функционально связанную с целевым белком. Специалистам в данной области техники известны последовательности некоторых подходящих сигнальных пептидов, включая, но не ограничиваясь указанными, последовательности, полученные из тканевого активатора плазминогена, гормона роста человека, лактоферрина, альфа-казеина и альфа-лактальбумина.

В других вариантах реализации настоящего изобретения конструкции нуклеиновых кислот содержат элемент экспорта РНК (см., например, патенты США №№5,914,267; 6,136,597 и 5,686,120; и WO 99/14310, все из которых включены в настоящую заявку посредством ссылки), расположенный либо на 3'-, либо на 5'-конце относительно последовательности нуклеиновой кислоты, кодирующей целевой белок. Предполагается, что применение элементов экспорта РНК обеспечивает высокие уровни экспрессии целевого белка без включения сигналов сплайсинга или интронов в последовательность нуклеиновой кислоты, кодирующую целевой белок.

В других вариантах реализации конструкции нуклеиновых кислот содержат по меньшей мере одну последовательность участка внутренней посадки рибосомы (IRES). Доступные последовательности некоторых подходящих IRES включают, не ограничиваясь указанными, последовательности, полученные из вируса ящура (FDV), вируса энцефаломиокардита и полиовируса. Последовательность IRES может быть помещена между двумя транскрипционными единицами (например, нуклеиновыми кислотами, кодирующими различные целевые белки или субъединицы мультисубъединичного белка, такого как антитело) с образованием полицистронной последовательности таким образом, что две транскрипционные единицы транскрибируются с одного и того же промотора.

Настоящее изобретение не ограничивается экспрессией какого-либо конкретного целевого белка. В некоторых предпочтительных вариантах реализации целевой белок выбран из группы, состоящей из содержащего Fc слитого белка, фермента, продукта слияния с альбумином, фактора роста, белкового рецептора, одноцепочечного антитела (scFv), одноцепочечного Fc (scFv-Fc), диатела и миниантитела (scFv-СН3), Fab, одноцепочечного Fab (scFab), тяжелой цепи иммуноглобулина и легкой цепи иммуноглобулина и других антигенсвязывающих белков.

В некоторых предпочтительных вариантах реализации конструкции нуклеиновых кислот встроены в вектор для экспрессии нуклеиновых кислот. Векторы включают, не ограничиваясь указанными, молекулы нуклеиновой кислоты, которые являются одноцепочечными, двухцепочечными или частично двухцепочечными; молекулы нуклеиновой кислоты, которые содержат один или более свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и то, и другое; и другие разновидности полинуклеотидов, известные в данной области техники. Один из типов векторов представляет собой «плазмиду», которая относится к кольцевой двухцепочечной ДНК в виде петли, в которую могут быть встроены дополнительные сегменты ДНК, например, с помощью стандартных методик молекулярного клонирования. Другой тип векторов представляет собой вирусный вектор, в котором присутствуют полученные из вирусов последовательности ДНК или РНК для упаковки в вирус (например, ретровирусы, дефектные по репликации ретровирусы, аденовирусы, дефектные по репликации аденовирусы и аденоассоциированные вирусы). Вирусные векторы также содержат полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Некоторые векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, содержащие бактериальную точку начала репликации, и эписомальные векторы для экспрессии в клетках млекопитающих). Другие векторы (например, неэписомальные векторы для экспрессии в клетках млекопитающих) интегрируются в геном клетки-хозяина при введении в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, некоторые векторы способны управлять экспрессией генов, с которыми они функционально связаны. В настоящей заявке такие векторы обозначены термином «векторы экспрессии». Векторы экспрессии, широко используемые в методиках рекомбинантной ДНК, часто представлены в форме плазмид.

Соответственно, подходящие векторы для экспрессии нуклеиновых кислот включают, не ограничиваясь указанными, транспозонные векторы, описанные выше, а также плазмидные векторы, ретровирусные векторы, лентивирусные векторы, векторы на основе AAV, фаговые векторы и т.д.). Предполагается, что может быть использован любой вектор, если он способен к репликации и является жизнеспособным в организме-хозяине. В предпочтительных вариантах реализации векторы представляют собой векторы для экспрессии в клетках млекопитающих, которые содержат, наряду с другими элементами, описанными в настоящей заявке, точку начала репликации, подходящие промотор и энхансер, а также любые необходимые сайты связывания рибосом, сайты полиаденилирования, донорные и акцепторные сайты сплайсинга, последовательности терминации транскрипции и 5'-фланкирующие нетранскрибируемые последовательности.

Подходящие плазмидные векторы, которые могут быть адаптированы для встраивания конструкций нуклеиновых кислот согласно настоящему изобретению, включают специфические плазмидные системы для транспозонных векторов, системы FLP-FLT, системы Cre-lox, системы CRISPR-Cas9, системы рекомбиназ и системы интеграз, а также плазмидные векторы, полученные из pCIneo, pVAX1, рАСТ, плазмид Gateway, pAdvantage, pBIND, pG51uc, pTNT, pTarget, pCat3, pSI, pCMV, pSV и тому подобное.

В некоторых вариантах реализации векторы представляют собой ретровирусные векторы. Наиболее часто применяемые рекомбинантные ретровирусные векторы получают из амфотропного вируса лейкоза мышей Молони (MoMLV) (см., например, Miller and Baltimore Mol. Cell. Biol. 6:2895 [1986]). Система MoMLV имеет несколько преимуществ: 1) этот специфический ретровирус может инфицировать многие различные типы клеток, 2) для получения рекомбинантных вирусных частиц MoMLV доступны устойчивые линии упаковывающих клеток и 3) переносимые гены стабильно интегрированы в хромосому клетки-мишени. Устойчивые векторные системы на основе MoMLV содержат ДНК-вектор, содержащий небольшую часть ретровирусной последовательности (например, вирусный длинный концевой повтор, или «LTR», и сигнал упаковки «psi»), и линию упаковывающих клеток. Переносимый ген встраивают в ДНК-вектор. Вирусные последовательности, присутствующие на ДНК-векторе, обеспечивают сигналы, необходимые для встраивания или упаковки РНК вектора в вирусную частицу и для экспрессии встроенного гена. Линия упаковывающих клеток обеспечивает белки, необходимые для сборки частиц (Markowitz et ak, J. Virol. 62: 1120 [1988]).

В некоторых предпочтительных вариантах реализации ретровирусные векторы представляют собой псевдотипированные векторы, и в них используется, например, белок G вируса везикулярного стоматита (VSV) в качестве мембрано-ассоциированного белка. В отличие от ретровирусных белков оболочки, которые связываются со специфическим белковым рецептором на поверхности клетки для проникновения в клетку, белок G VSV взаимодействует с фосфолипидным компонентом плазматической мембраны (Mastromarino et al., J. Gen. Virol. 68:2359 [1977]). Поскольку проникновение VSV в клетку не зависит от наличия специфических белковых рецепторов, то VSV имеет чрезвычайно широкий спектр хозяев. Псевдотипированные ретровирусные векторы, несущие белок G VSV, имеют измененный спектр хозяев, характерный для VSV (то есть они могут инфицировать клетки почти всех видов позвоночных, беспозвоночных и насекомых). Важно отметить, что G-псевдотипированные ретровирусные векторы на основе VSV могут быть сконцентрированы в 2000 раз или больше посредством ультрацентрифугирования без значительной потери инфекционности (Bums et al. Proc. Natl. Acad. Sci. USA 90:8033 [1993]).

В некоторых предпочтительных вариантах реализации векторы представляют собой лентивирусные векторы. Лентивирусы (например, вирус инфекционной анемии лошадей, вирус козьего артрита-энцефалита, вирус иммунодефицита человека) представляют собой подсемейство ретровирусов, которые способны интегрироваться в неделящиеся клетки. Лентивирусный геном и провирусная ДНК содержат три гена, обнаруженные во всех ретровирусах: gag, pol и env, которые фланкированы двумя последовательностями LTR. Ген gag кодирует внутренние структурные белки (например, матричные, капсидные и нуклеокапсидные белки); ген pol кодирует белки обратную транскриптазу, протеазу и интегразу; и ген env кодирует гликопротеины вирусной оболочки. 5'- и 3'-LTR регулируют транскрипцию и полиаденилирование вирусных РНК. Дополнительные гены в лентивирусном геноме включают гены vif, vpr, tat, rev, vpu, nef и vpx.

Различные лентивирусные векторы и линии упаковывающих клеток известны в данной области техники и находят применение в настоящем изобретении (см., например, патенты США №№5,994,136 и 6,013,516, оба из которых включены в настоящую заявку посредством ссылки). Кроме того, белок G VSV также был использован для псевдотипирования ретровирусных векторов на основе вируса иммунодефицита человека (ВИЧ) (Naldini et al., Science 272:263 [1996]). Таким образом, белок G VSV может применяться для получения различных псевдотипированных ретровирусных векторов, и его использование не ограничивается векторами на основе MoMLV. Лентивирусные векторы также могут быть модифицированы, как описано выше, таким образом, что они будут содержать различные регуляторные последовательности (например, последовательности сигнальных пептидов, элементы экспорта РНК и TRES). После получения лентивирусных векторов они могут применяться для трансфекции клеток-хозяев, как описано выше для ретровирусных векторов.

В некоторых предпочтительных вариантах реализации векторы представляют собой векторы на основе аденоассоциированного вируса (AAV). Геном AAV состоит из линейной одноцепочечной молекулы ДНК, которая содержит приблизительно 4680 оснований. Геном содержит инвертированные концевые повторы (ITR) на каждом конце, которые функционируют в цис-положении как точки начала репликации ДНК и как сигналы упаковки для вируса. Внутренняя неповторяющаяся часть генома содержит две большие открытые рамки считывания, известные как области rep и cap AAV, соответственно. Эти области кодируют вирусные белки, участвующие в репликации и упаковке вириона. Из области rep AAV синтезируется семейство из по меньшей мере четырех вирусных белков, названных в соответствии с их кажущейся молекулярной массой, Rep 78, Rep 68, Rep 52 и Rep 40. Область cap AAV кодирует по меньшей мере три белка, VP1, VP2 и VP3 (подробное описание генома AAV см., например, в источниках Muzyczka, Current Topics Microbiol. Immunol. 158:97-129 [1992]; Kotin, Human Gene Therapy 5:793-801 [1994]).

AAV требует совместного инфицирования неродственным вирусом-помощником, таким как аденовирус, герпесвирус или вирус осповакцины, для того чтобы произошло продуктивное заражение. В отсутствие такой совместной инфекции AAV переходит в латентное состояние путем встраивания его генома в хромосому клетки-хозяина. Последующее инфицирование вирусом-помощником приводит к высвобождению интегрированной копии, которая затем может реплицироваться с образованием инфекционного вирусного потомства. В отличие от не псевдотипированных ретровирусов, AAV имеет широкий спектр хозяев и способен реплицироваться в клетках из любого вида при условии, что существует совместная инфекция с вирусом-помощником, который также будет размножаться в этом виде. Таким образом, например, AAV человека будет реплицироваться в клетках собаки, совместно инфицированных аденовирусом собак. Кроме того, в отличие от ретровирусов, AAV не ассоциирован с каким-либо заболеванием человека или животных; по-видимому, не изменяет биологические свойства клетки-хозяина при интеграции и способен интегрироваться в неделящиеся клетки. Недавно также было обнаружено, что AAV способен к сайт-специфической интеграции в геном клетки-хозяина.

В свете описанных выше свойств был разработан ряд рекомбинантных векторов на основе AAV для доставки генов (см., например, патенты США №№5,173,414; 5,139,941; источники WO 92/01070 и WO 93/03769, оба из которых включены в настоящую заявку посредством ссылки; Lebkowski et al., Molec. Cell. Biol. 8:3988-3996 [1988]; Carter, Current Opinion in Biotechnology 3:533-539 [1992]; Muzyczka, Current Topics in Microbiol and Immunol. 158:97-129 [1992]; Kotin, (1994) Human Gene Therapy 5:793-801; Shelling and Smith, Gene Therapy 1:165-169 [1994]; и Zhou et al., J. Exp. Med. 179:1867-1875 [1994]).

Рекомбинантные вирионы AAV могут быть получены в подходящей клетке-хозяине, трансфицированной как плазмидой-помощником на основе AAV, так и вектором на основе AAV. Плазмида-помощник на основе AAV обычно содержит области, кодирующие rep и cap AAV, но не содержит ITR AAV. Соответственно, плазмида-помощник самостоятельно не способна ни к репликации, ни к упаковке. Вектор на основе AAV, как правило, содержит выбранный целевой ген, ограниченный ITR AAV, которые обеспечивают функции репликации и упаковки вируса. И плазмиду-помощника, и вектор на основе AAV, несущий выбранный ген, вводят в подходящую клетку-хозяина посредством временной трансфекции. Затем трансфицированную клетку инфицируют вирусом-помощником, таким как аденовирус, который трансактивирует присутствующие на плазмиде-помощнике промоторы AAV, которые управляют транскрипцией и трансляцией областей rep и cap AAV. Образуются рекомбинантные вирионы AAV, несущие выбранный ген, которые могут быть очищены от препарата. После получения векторов на основе AAV они могут быть использованы для трансфекции (см., например, патент США №5,843,742, включенный в настоящую заявку посредством ссылки) клеток-хозяев при желаемой множественности заражения для получения клеток-хозяев с большим числом копий. Специалистам в данной области техники будет понятно, что векторы на основе AAV также могут быть модифицированы, как описано выше, таким образом, что они будут содержать различные регуляторные последовательности (например, последовательности сигнальных пептидов, элементы экспорта РНК и IRES).

В некоторых вариантах реализации настоящего изобретения предложены клетки-хозяева и культура клеток-хозяев, где клетки-хозяева экспрессируют целевой белок из конструкций нуклеиновых кислот, описанных выше. В предпочтительном варианте реализации клетки-хозяева представляют собой клетки-хозяева млекопитающих. Ряд линий клеток-хозяев млекопитающих известен в данной области техники. В целом, эти клетки-хозяева способны к росту и выживанию при помещении либо в монослойную культуру, либо в суспензионную культуру в среде, содержащей подходящие питательные вещества и факторы роста, как более подробно описано ниже. Как правило, указанные клетки способны экспрессировать и секретировать большие количества конкретного целевого белка в культуральную среду. Примеры подходящих клеток-хозяев млекопитающих включают, не ограничиваясь указанными, клетки яичника китайского хомячка (СНО-K1, АТСС СС1-61); эпителиальные клетки молочной железы крупного рогатого скота (АТСС CRL 10274; эпителиальные клетки молочной железы крупного рогатого скота); линию клеток почки обезьяны CV1, трансформированную SV40 (COS-7, АТСС CRL 1651); линию эмбриональных клеток почки человека (293 или клетки 293, субклонированные для роста в суспензионной культуре; см., например, Graham et al., J. Gen Virol., 36:59 [1977]); клетки почки детеныша хомяка (BHK, АТСС CCL 10); клетки Сертоли мыши (ТМ4, Mather, Biol. Reprod. 23:243-251 [1980]); клетки почки обезьяны (CV1 АТСС CCL 70); клетки почки африканской зеленой мартышки (VERO-76, АТСС CRL-1587); клетки карциномы шейки матки человека (HELA, АТСС CCL 2); клетки почки собаки (MDCK, АТСС CCL 34); клетки печени крысы Buffalo (BRL 3 А, АТСС CRL 1442); клетки легкого человека (W138, АТСС CCL 75); клетки печени человека (Hep G2, НВ 8065); клетки опухоли молочной железы мыши (ММТ 060562, АТСС CCL51); клетки TRI (Mather et al., Annals N.Y. Acad. Sci., 383:44-68 [1982]); клетки MRC 5; клетки FS4; фибробласты крысы (клетки 208F); клетки MDBK (клетки почки крупного рогатого скота); клетки CAP (CEVEC's Amniocyte Production); и линию клеток гепатомы человека (Hep G2).

В некоторых особенно предпочтительных вариантах реализации клетки-хозяева модифицированы таким образом, что они становятся дефектными, либо они по своей природе являются дефектными, по ферментативной активности, которая необходима для роста или выживания клеток в присутствии селектируемого агента и которая обеспечивается селектируемым маркером. Например, клетки яичника китайского хомячка (СНО) были модифицированы таким образом, что они стали дефектными по GS. В некоторых предпочтительных вариантах реализации, где вектор содержит селектируемый маркер GS, линия клеток-хозяев является дефектной по GS. В некоторых особенно предпочтительных вариантах реализации дефектная по GS линия клеток-хозяев представляет собой линию клеток CHOZN® GS, доступную от компании Merck KGaA. В других вариантах реализации, где селектируемый маркер представляет собой, например, DHFR, клеточная линия предпочтительно может быть дефектной по активности DHFR (то есть DHFR). Подходящие линии клеток DHFR- включают, не ограничиваясь указанными, CHO-DG44 и ее производные.

Конструкции нуклеиновых кислот и векторы согласно настоящему изобретению могут быть введены в клетки-хозяева любыми подходящими способами, такими как трансфекция, трансформация или трансдукция. В некоторых вариантах реализации после трансфекции или трансдукции клетки оставляют для размножения, а затем трипсинизируют и повторно высевают. Затем отбирают отдельные колонии для получения клонально отобранных клеточных линий. В других вариантах реализации клонально отобранные клеточные линии подвергают скринингу с помощью Саузерн-блоттинга или ПЦР-анализов для проверки того, что произошло желаемое количество событий интеграции. Также предполагается, что клональная селекция позволяет идентифицировать лучшие продуцирующие белок клеточные линии. В других вариантах реализации клетки не являются клонально отобранными после трансфекции.

В некоторых вариантах реализации клетки-хозяева трансфицируют векторами, кодирующими различные целевые белки. Векторы, кодирующие различные целевые белки, могут применяться для одновременной трансфекции клеток (например, клетки-хозяева подвергают воздействию раствора, содержащего векторы, кодирующие различные целевые белки), или трансфекция может быть последовательной (например, клетки-хозяева сначала трансфицируют вектором, кодирующим первый целевой белок, выжидают некоторый промежуток времени и затем клетки-хозяева трансфицируют вектором, кодирующим второй целевой белок). В некоторых предпочтительных вариантах реализации клетки-хозяева трансфицируют интегрирующим вектором, кодирующим первый целевой белок, при этом отбирают клеточные линии с высоким уровнем экспрессии, содержащие много интегрированных копий интегрирующего вектора (например, путем клонального отбора), и отобранную клеточную линию трансфицируют интегрирующим вектором, кодирующим второй целевой белок. Этот процесс можно повторять для введения нескольких целевых белков. В некоторых вариантах реализации можно регулировать множественность заражения (например, увеличивать или уменьшать) для повышения или снижения экспрессии целевого белка. Аналогичным образом, для изменения экспрессии целевых белков можно применять различные промоторы. Предполагается, что эти способы трансфекции могут применяться для конструирования линий клеток-хозяев, обеспечивающих полный экзогенный метаболический путь, или для получения клеток-хозяев с повышенной способностью к процессингу белков (например, клетки-хозяева могут быть обеспечены ферментами, необходимыми для посттрансляционной модификации).

В некоторых вариантах реализации настоящего изобретения, после трансформации подходящего штамма-хозяина и выращивания штамма-хозяина до требуемой плотности клеток в среде, целевой белок секретируется в процессе культивирования клеток-хозяев. В некоторых предпочтительных вариантах реализации, где применяются амплифицируемые маркеры, предусмотрена культура трансдуцированных клеток-хозяев в среде, содержащей ингибитор гена. Подходящие ингибиторы включают, не ограничиваясь указанными, метотрексат для ингибирования DHFR и метионинсульфоксимин (Msx) или фосфинотрицин для ингибирования GS. Предполагается, что по мере увеличения концентраций этих ингибиторов в системе с клеточной культурой отбираются клетки с большими числами копий амплифицируемого маркера (и, таким образом, генов или целевых генов) или клетки, содержащие инсерции, обеспечивающие более высокую продуктивность.

Соответственно, клетки-хозяева, содержащие векторы, описанные выше, предпочтительно культивируют в соответствии со способами, известными в данной области техники. Подходящие условия для культивирования клеток млекопитающих хорошо известны в данной области техники (см., например, J. Immunol. Methods (1983) 56:221-234 [1983], Animal Cell Culture: A Practical Approach 2nd Ed., Rickwood, D. and Hames, B.D., eds. Oxford University Press, New York [1992]).

Культуры клеток-хозяев согласно настоящему изобретению получают в среде, подходящей для конкретной культивируемой клетки. Коммерчески доступные среды, такие как среда ActiPro (HyClone), среда ExCell Advanced Fed Batch (SAFC), среда Хэма F10 (Sigma, Сент-Луис, Миссури), минимальная питательная среда (MEM, Sigma), RPMI-1640 (Sigma) и модифицированная по способу Дульбекко среда Игла (DMEM, Sigma), являются типичными питательными растворами. Подходящие среды также описаны в патентах США №№4,767,704; 4,657,866; 4,927,762; 5,122,469; 4,560,655; и источниках WO 90/03430 и WO 87/00195; раскрытия которых включены в настоящую заявку посредством ссылки. Любая из этих сред при необходимости может содержать в качестве добавок сыворотку, гормоны и/или другие факторы роста (такие как инсулин, трансферрин или эпидермальный фактор роста), соли (такие как хлорид натрия, кальций, магний и фосфат), буферы (такие как HEPES), нуклеозиды (такие как аденозин и тимидин), антибиотики (такие как гентамицин), микроэлементы (определяемые как неорганические соединения, обычно присутствующие в конечных концентрациях в микромолярном диапазоне), липиды (такие как линолевая кислота или другие жирные кислоты) и их подходящие носители и глюкозу или эквивалентный источник энергии. В некоторых предпочтительных вариантах реализации, где применяются селектируемые маркеры, такие как, например, GS, среда не будет содержать глутамина. Любые другие необходимые добавки также могут быть включены в подходящих концентрациях, которые известны специалистам в данной области техники.

Настоящее изобретение также предусматривает применение различных систем для культивирования трансфицированных клеток-хозяев (например, чашек Петри, 96-луночных планшетов, роллерных флаконов и биореакторов). Например, трансфицированные клетки-хозяева можно культивировать в перфузионной системе. Перфузионное культивирование относится к обеспечению непрерывного потока культуральной среды через культуру, в которой поддерживается высокая плотность клеток. Клетки являются суспендированными и не требуют твердой подложки для роста.

Как правило, должны непрерывно обеспечиваться свежие питательные вещества с одновременным удалением токсичных метаболитов и, в идеале, селектируемым удалением мертвых клеток. Способы фильтрования, улавливания и микрокапсулирования подходят для обновления культуральной среды с достаточной скоростью.

В качестве другого примера, в некоторых вариантах реализации может применяться процесс культивирования с периодическим добавлением питательной среды. В предпочтительном процессе культивирования клеток-хозяев млекопитающего с периодическим добавлением питательной среды клетки и культуральную среду сначала помещают в емкость для культивирования, а дополнительные питательные вещества для культивирования добавляют, непрерывно или с дискретными приращениями, в культуру в процессе культивирования с периодическим сбором клеток и/или продукта до окончания культивирования или без этого сбора. Культивирование с периодическим добавлением питательной среды может включать, например, полунепрерывное культивирование с периодическим добавлением питательной среды, при котором всю культуру (включая клетки и среду) периодически удаляют и заменяют свежей средой. Культивирование с периодическим добавлением питательной среды отличается от простого периодического культивирования, при котором все компоненты для культивирования клеток (включая клетки и все питательные вещества для культивирования) помещают в емкость для культивирования в начале процесса культивирования. Культивирование с периодическим добавлением питательной среды также можно отличить от перфузионного культивирования, поскольку супернатант не удаляют из емкости для культивирования в ходе процесса (при перфузионном культивировании клетки удерживают в культуре, например, посредством фильтрования, капсулирования, прикрепления к микроносителям и т.д., а культуральную среду непрерывно или периодически вводят в емкость для культивирования и удаляют из нее). В некоторых особенно предпочтительных вариантах реализации процессы культивирования с периодическим добавлением питательной среды проводят в роллерных флаконах.

Кроме того, клетки культуры могут быть размножены в соответствии с любой схемой или обычной процедурой, которые могут быть подходящими для конкретной клетки-хозяина и конкретного предполагаемого плана получения продукта. Таким образом, настоящее изобретение предусматривает одностадийный или многостадийный процесс культивирования. При одностадийном культивировании клетки-хозяева инокулируют в культуральную среду, и способы согласно настоящему изобретению применяют в течение единственной фазы получения клеточной культуры. В качестве альтернативы предусмотрено многостадийное культивирование. При многостадийном культивировании клетки можно культивировать в течение нескольких стадий или фаз. Например, клетки можно выращивать на первой стадии, или в фазе роста культуры, при этом клетки, предположительно извлеченные из хранилища, инокулируют в среду, подходящую для стимулирования роста и высокой жизнеспособности. Клетки можно поддерживать в фазе роста в течение подходящего периода времени путем добавления свежей среды к культуре клеток-хозяев.

Для усиления роста клеток млекопитающих в фазе роста клеточной культуры разрабатывают условия культивирования клеток с периодическим добавлением питательной среды или непрерывного культивирования клеток. В фазе роста клетки выращивают в условиях и в течение периода времени, которые обеспечивают максимальный рост. Условия культивирования, такие как температура, рН, растворенный кислород (dO2) и тому подобное, представляют собой условия, используемые с конкретным хозяином, и они будут понятны специалисту в данной области техники. Как правило, рН доводят до уровня между приблизительно 6,5 и 7,5 с использованием либо кислоты (например, СС), либо основания (например, Na2CO3 или NaOH). Подходящий температурный диапазон для культивирования клеток млекопитающих, таких как клетки СНО, составляет от приблизительно 30°С до 38°С, а подходящий dC составляет 5-90% насыщения воздуха.

После фазы получения полипептида целевой полипептид выделяют из культуральной среды с использованием методик, хорошо отработанных в данной области техники. Целевой белок предпочтительно выделяют из культуральной среды в виде секретируемого полипептида (например, секреция целевого белка направляется последовательностью сигнального пептида), хотя он также может быть выделен из лизатов клеток-хозяев. В качестве первой стадии культуральную среду или лизат центрифугируют для удаления частиц клеточного остатка. Затем полипептид очищают от загрязняющих растворимых белков и полипептидов, при этом следующие процедуры являются примерами подходящих процедур очистки: фракционирование на иммуноаффинных или ионообменных колонках; осаждение этанолом; обращенно-фазовая ВЭЖХ; хроматография на диоксиде кремния или на катионообменной смоле, такой как ДЭАЭ; хроматофокусирование; ДСН-ПААГ-электрофорез; осаждение сульфатом аммония; гель-фильтрации с использованием, например, сефадекса G-75; и колоночная хроматография на сефарозе с белком A (protein A Sepharose) для удаления загрязняющих веществ, таких как IgG. Ингибитор протеазы, такой как фенилметилсульфонилфторид (PMSF), также может быть подходящим для ингибирования протеолитической деградации в процессе очистки. Кроме того, целевой белок может присутствовать в слитом виде в рамке считывания с маркерной последовательностью, которая позволяет очищать целевой белок. Неограничивающие примеры маркерных последовательностей включают гексагистидиновую метку, которая может быть обеспечена с помощью вектора, предпочтительно вектора pQE-9, и гемагглютининовую (НА) метку. НА-метка соответствует эпитопу, полученному из белка гемагглютинина вируса гриппа (см., например, Wilson et al., Cell, 37:767 [1984]). Специалисту в данной области техники будет понятно, что способы очистки, подходящие для целевого полипептида, могут потребовать модификации для учета изменений в свойствах полипептида при экспрессии в культуре рекомбинантных клеток.

В некоторых предпочтительных вариантах реализации в системы включены конструкции нуклеиновых кислот. В некоторых вариантах реализации системы содержат многокомпонентные конструкции нуклеиновых кислот или векторы, описанные выше, которые предназначены для введения в клетку-хозяина. В других предпочтительных вариантах реализации системы содержат одну или более или один или более многокомпонентных конструкций нуклеиновых кислот или векторов, описанных выше, которые предназначены для введения в клетку-хозяина, в дополнение к нуклеиновой кислоте или вектору, кодирующим фермент, необходимый для встраивания конструкций нуклеиновых кислот в геном клетки-хозяина. Примеры ферментов включают, не ограничиваясь указанными, транспозазы для применения с транспозоиными векторными системами, интегразы для применения в системах, в которых используются интегрирующие последовательности, таких как система PhiC31, системы MMLV и тому подобное, рекомбиназы для применения в векторных системах, таких как Cre-loc, FLP-FRT и тому подобное, и нуклеазы Cas9 для применения в системах на основе CRISPR.

ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ

В настоящем изобретении предложен уникальный способ комбинирования ретровирусной экспрессионной кассеты SIN-LTR с системой линии клеток СНО, имеющих нокаут гена глутаминсинтетазы (GS), для улучшения способов разработки клеточных линий с использованием случайной интеграции, который обеспечивает увеличение числа копий гена и повышение продуктивности на каждую копию. Указанный подход также обеспечивает улучшенный и неожиданный способ более строгой селекции пулов для дополнительного улучшения титра и обогащения пулов для клонов с более высокой продуктивностью. Он также обеспечивает быстрый и эффективный способ разработки высокопродуктивных линий клеток посредством нацеленной интеграции экспрессионных кассет (трансгенов) в заранее определенные сайты (акцепторные сайты) в пределах всего генома СНО.

Пример 1:

Три объединенные клеточные линии были получены в результате временной трансфекции пятью независимыми плазмидами (Фиг. 1), все из которых были сконструированы для экспрессии тест-белка «Anyway». Эти плазмиды названы в соответствии с промотором, используемым в них для управления экспрессией GS. Первая плазмида, SV40, представляет традиционный способ разработки клеточной линии плазмиду, содержащую ген селектируемого маркера (GS), управляемый сильным промотором SV40, а также содержащую интрон SV40 и сигнальную последовательность поли(А). Во второй плазмиде, WT-LTR, используется провирусный LTR дикого типа для обеспечения экспрессии GS, включенный в плазмиду аналогично тому, как выглядела бы его вставка в векторе GPEx. Несмотря на то, что этот промотор считается лишь относительно сильным, транскрипция с этого промотора не заканчивается после GS, а продолжается на протяжении последовательностей sCMV, Anyway и WPRE, используя последовательность поли(А) для ТК. Третья плазмида, SLN-LTR, идентична второй конструкции за исключением того, что она содержит усеченный вариант LTR, SIN-LTR (самоинактивирущийся LTR), который обладает более низкой промоторной активностью. Четвертая плазмида, pSLN, идентична первой плазмиде за исключением того, что вместо сильного промотора, управляющего экспрессией GS, в ней используется более слабый промоторный элемент из SIN-LTR. Пятая плазмида экспрессировала GFP, но не содержала гена GS и, таким образом, служила в качестве отрицательного контроля.

Пулы, полученные путем трансфекции этими плазмидами, отбирали по выживанию в отсутствие глутамина. Отобранные пулы были использованы для получения неспецифического продукта с периодическим добавлением питательной среды для определения их способности продуцировать белок Anyway.

Разработка клеточной линии CHOZN

Трансфекция клеток CHOZn: Объединенные клеточные линии, содержащие каждую из плазмид, интегрированную случайным образом, получали путем трансфекции клеток указанной плазмидой с использованием реагента для трансфекции Expifectamine СНО. К 1 мл среды OptiPro добавляли 20 мкг плазмиды. К 920 мкл OptiPro добавляли 80 мкл Expifectamine СНО. Эти два раствора перемешивали в течение 1 минуты, затем добавляли к 3 мл среды СНО-Gro, содержащей 30 миллионов клеток CHOZn. Клетки инкубировали в течение ночи при 37°С со встряхиванием при 250 об/мин. На следующее утро добавляли 15 мл среды Excell CD Fusion с добавлением 6 мМ глутамина. Клетки пересевали в этой среде до тех пор, пока они не восстанавливались после трансфекции.

Селекция клеток CHOZn: Как только жизнеспособность клеток достигала > 96%, их пересевали путем полной замены среды в среду Ex-Cell CD Fusion с добавлением 2% ClonaCell-СНО ACF, но без глутамина. Регулярно проводили мониторинг жизнеспособности клеток и плотности жизнеспособных клеток. Среду заменяли еженедельно до тех пор, пока концентрация клеток в культуре не достигала 1 миллиона клеток на мл, и клетки пересевали по стандартной методике.

Получение продукта с периодическим добавлением питательной среды: Перед получением продукта с периодическим добавлением питательной среды каждый пул адаптировали к среде ActiPro в течение по меньшей мере трех пересевов. Для получения продукта с периодическим добавлением питательной среды в центрифужные пробирки объемом 50 мл высевали клетки в концентрации 600000 клеток на мл в среде ActiPro (HyClone) и инкубировали в увлажненном (70-80%) встряхивателе-инкубаторе при 250 об/мин при 5% СО2 и температуре 37°С (34°С начиная с 5 дня). Культуры получали питание шесть раз в течение цикла получения с использованием двух различных питательных добавок. Ежедневно контролировали содержание глюкозы и добавляли ее, если уровень падал ниже 5 г/л. Культивирование прекращали, когда жизнеспособность составляла <70%.

Результаты

Как показано на Фиг. 2, пулы SV40, WT-LTR и SIN-LTR демонстрировали значительно различающиеся профили восстановления в процессе селекции. Пулы SV40 демонстрировали наиболее быстрое восстановление (>90% жизнеспособности), что указывало на то, что относительно большая доля клеток в не подвергнутом селекции пуле была устойчива к селекции. Пулы WT-LTR демонстрировали более медленное восстановление, что указывало на то, что устойчивой была меньшая доля в не подвергнутом селекции пуле. Пулы SIN-LTR демонстрировали заметно замедленное восстановление, что указывало на то, что устойчивой была очень небольшая доля в не подвергнутом селекции пуле.

Как показано на Фиг. 3, титр был значительно выше для пула STN-LTR по сравнению с пулами WT-LTR и SV40. Для сравнения, значения числа копий гена демонстрировали сходную тенденцию.

Эти данные указывают на то, что плазмида SIN-LTR обеспечивала селекцию большего числа копий и сайтов встраивания с более высокой активностью.

Неожиданно, в отдельном эксперименте, представленном на Фиг. 4, пулы pSTN имели время восстановления, сходное с таковым для пулов SV40 или WT-LTR. Следовательно, различия во времени восстановления не объясняются только промоторной активностью, поскольку pSTN содержит очень слабый промотор, но все еще демонстрировала быстрое восстановление. Другие элементы плазмиды SIN-LTR должны быть ответственными за более сильное селекционное давление. Без ограничения каким-либо конкретным механизмом действия, предполагается, что комбинация слабого промотора и длинного транскрипта, который также содержит вторую открытую рамку считывания, может влиять на эффективность транскрипции или трансляции GS. Аналогичным образом, без ограничения каким-либо конкретным механизмом, известное присутствие слабой последовательности Козак в EPR может приводить к аберрантной трансляции со снижением эффективности трансляции белка GS.

Пример 2:

Концепции GPEx Boost также могут применяться в комбинации с другими технологиями встраивания генов без использования вирусов, такими как встраивание генов с помощью транспозазы, рекомбиназы, интегразы или CRISPR. Технология GPEx может применяться для помещения множества копий последовательности распознавания для технологии встраивания без использования вирусов в высокоактивные сайты в пределах всего генома. Полученная линия клеток с акцепторными сайтами («Dock») затем может быть подвергнута временной совместной трансфекции с применением плазмиды, экспрессирующей транспозазу, рекомбиназу, интегразу или Cas9, в комбинации с плазмидой трансгена, которая содержит когнатную последовательность распознавания, селектируемый маркер GS и подлежащий экспрессии генный продукт. Транспозаза, рекомбиназа, интеграза или Cas9 будут опосредовать встраивание всей плазмиды трансгена или ее части в акцепторные сайты. Полученная клеточная линия будет содержать множество копий плазмиды трансгена, встроенных в высокоактивные акцепторные сайты в пределах всего генома. Некоторые примеры технологий/ферментов, которые можно применять, включают транспозазу PiggyBac, транспозазу «Спящая красавица», транспозазу Mos1, транспозазу Tol2, транспозазу Leapin, рекомбиназу фага лямбда, FLP/FRT, Cre/Lox, интегразу MMLV, интегразу Rep 78, интегразу Bxb1 и различные типы CRISPR. Авторы настоящего изобретения впервые проверили эту концепцию, применяя систему интегразы PhiC31 в комбинации с технологией GPEx.

Получение ретровектора и трансдукция для создания родительской линии клеток с акцепторными сайтами: Конструкцию для экспрессии акцепторного сайта, Фиг. 7 и 8, вводили в линию клеток HEK 293, которая конститутивно продуцирует белки gag, pro и pol MLV. Также были проведены совместные трансфекции оболочкой вируса, содержащей экспрессионную плазмиду, и каждой из генетических конструкций. Совместная трансфекция приводила к получению дефектного по репликации ретровектора с высоким титром, который концентрировали посредством ультрацентрифугирования и использовали для трансдукции родительской линии клеток яичника китайского хомячка CHOZN (1,2). Проводили 5 последовательных циклов трансдукции, и клетки поддерживали в среде по стандартной методике с добавлением 6 мМ глутамина. Также успешно получали вторую объединенную линию клеток с акцепторными сайтами с применением тех же способов. Это было осуществлено с использованием немного другой генетической конструкции для экспрессии акцепторного сайта, представленной на Фиг. 9 и 10.

Трансфекция и селекция объединенной линии клеток с акцепторными сайтами: 1,5 миллиона клеток инкубировали с предварительно приготовленной смесью, содержащей 1 мкг (общее количество) ДНК плазмид Transgene и Integrase (Фиг. 11, 12, 5 и 6, соответственно) и 4 микролитра ExpiFectamine СНО™ (ThermoFisher Scientific) в конечном объеме 250 микролитров. Объединенные клеточные линии оставляли для восстановления в присутствии среды с добавлением 6 мМ глутамина до тех пор, пока жизнеспособность не возвращалась до уровня более 95%. Затем клетки переносили в среду, не содержащую глутамина. Проводили мониторинг жизнеспособности клеток, и среду заменяли еженедельно до тех пор, пока жизнеспособность полученных отобранных пулов клеток не возвращалась до уровня более 95%

Количественная оценка рекомбинации: Геномную ДНК выделяли из 3 миллионов клеток с использованием набора Qiagen DNEasy. attR является результатом рекомбинации между attP и attB. Количественную полимеразную цепную реакцию (кПЦР) с использованием красителя SYBR Green проводили для количественного определения attR в клетках с использованием прямого праймера в последовательности attP в акцепторном сайте и обратного праймера в последовательности attB в плазмиде трансгена. Амплификация с использованием этой пары праймеров будет детектировать плазмиду трансгена только в том случае, когда эта плазмида является рекомбинированной в акцепторный сайт и не является свободной, интегрированной случайным образом или интегрированной в сайт псевдо-attP плазмидой трансгена. Аналогичным образом, эта пара праймеров не будет детектировать последовательность нерекомбинированного (пустого) акцепторного сайта. Число циклов ПЦР, необходимых для пересечения порога интенсивности флуоресценции (значение Ct), определяли для этого набора праймеров, а также для набора праймеров для внутреннего референсного гена СНО. Индексы копийности гена (GCI) рассчитывали путем вычитания значения Ct для референсного гена из значения Ct для набора праймеров attR. Следует отметить, что значения GCI по своей природе являются логарифмическими, а не линейными, так что изменение на 1 единицу в нижней части шкалы, например, от GCI=1 до GCI=3, соответствует разнице, составляющей лишь несколько копий, тогда как изменение на одну единицу в верхней части шкалы, например, от GCI=6 до GCI=7, может соответствовать разнице, составляющей множество копий. В некоторых случаях плазмиду, содержащую желаемые ампликоны и имеющую известную концентрацию, также подвергали кПЦР, и выполняли линейный регрессионный анализ полученных данных для более точного определения числа присутствующих копий.

Результаты

Акцепторные сайты, содержащие последовательность распознавания attP для PhiC31, Фигуры 7+8, помещали в пределах всего генома клеток CHOZN с помощью 5 последовательных циклов трансдукции с использованием технологии GPEx, и полученный пул клеток содержал в среднем приблизительно 36 копий акцепторного сайта на клетку. Этот пул клеток с акцепторными сайтами был совместно трансфицирован плазмидами Transgene-Promoter- Any way и Integrase (Фиг. 11, 12, 5 и 6, соответственно) в соотношениях в диапазоне от 1:50 до 1:1, как было предложено в опубликованной литературе (Groth, 2000: Andreas, 2002: Farruggio, 2012). Эта плазмида Transgene-Prom oter-Any way со держит последовательность распознавания attB для PhiC31, ген глутаминсинтетазы (GS), управляемый слабым провирусным промотором STN-LTR (самоинактивирующегося длинного концевого повтора), и тест-продукт в виде слитого с Fc белка Anyway под контролем сильного промотора. Через 3 дня после трансфекции, но до селекции, проводили кПЦР для количественной оценки рекомбинации, но уровни attR (вышележащего продукта рекомбинации между attP и attB) были детектируемыми на уровне не выше фонового, при этом индексы копийности гена (GCI) составляли приблизительно -10. Когда трансфицированные клетки подвергали селекции путем удаления глутамина, они не восстанавливались за более чем 25 дней, что указывало на то, что интеграция и экспрессия GS в этих клетках не достигали достаточных уровней.

В попытке улучшить частоту рекомбинации авторы настоящего изобретения пришли к выводу, что отношение плазмиды, экспрессирующей интегразу, к плазмиде трансгена может являться критическим параметром для эффективной рекомбинации. Для исследования этой возможности авторы настоящего изобретения подвергли совместной трансфекции пул клеток с акцепторными сайтами с использованием диапазона соотношений плазмид Transgene-Promoter-Anyway и Integrase. Через 3 дня после трансфекции, но до селекции, проводили кПЦР для количественной оценки рекомбинации, Фиг. 29. Диапазон соотношений, содержащий низкие соотношения Transgene:Integrase (1:20-100), часто используемые в литературе, соответствовал GCI для attR около фонового уровня, составляющего -10. Авторы настоящего изобретения неожиданно обнаружили, что высокие соотношения Transgene:Integrase (5-100:1) соответствовали GCI для attR, составляющим -3, что означало число копий, которое приблизительно в 200 раз превышало число копий для самых низких соотношений.

Затем проводили селекцию путем удаления глутамина на образцах с наибольшими GCI для attR согласно предварительной селекции, Фиг. 30. Эти пулы начинали восстанавливаться с 9 дня селекции. После полного восстановления авторы настоящего изобретения провели кПЦР, Фиг. 31, и обнаружили, что исследуемые пулы содержали вплоть до приблизительно 28 копий трансгена на клетку. Эти данные указывают на то, что путем использования более высоких соотношений Transgene:Integrase авторы настоящего изобретения смогли достичь эффективной интеграции в среднем вплоть до 28 трансгенов на клетку в пуле, который содержал в среднем приблизительно 36 акцепторных сайтов на клетку. Кроме того, уровень этой рекомбинации был приблизительно на 2 порядка выше, чем уровень рекомбинации, наблюдаемый с использованием более низких соотношений, описанных в литературе.

Пример 3:

После обнаружения заполнения приблизительно на 80% пула с акцепторными сайтами, содержащего приблизительно 36 копий на клетку, авторы настоящего изобретения далее попытались определить, могли ли они дополнительно увеличить число интегрированных плазмид Transgene путем использования пула с акцепторными сайтами, который содержал более 36 акцепторных сайтов на клетку. Авторы настоящего изобретения также попытались определить, можно ли было также применять в этой системе плазмиду Transgene, не содержащую промотора GS. Такая плазмида способна экспрессировать GS и таким образом обеспечивать устойчивость только в том случае, если она является рекомбинированной в акцепторный сайт, а не интегрированной случайным образом или интегрированной в сайты псевдо-attP.

Получение ретровектора и трансдукция для создания родительской линии клеток с акцепторными сайтами:

Конструкцию для экспрессии акцепторного сайта (Фиг. 7 и 8) вводили в линию клеток HEK 293, которая конститутивно продуцирует белки gag, pro и pol MLV. Также были проведены совместные трансфекции оболочкой вируса, содержащей экспрессионную плазмиду, и каждой из генетических конструкций. Совместная трансфекция приводила к получению дефектного по репликации ретровектора с высоким титром, который концентрировали посредством ультрацентрифугирования и использовали для трансдукции родительской линии клеток яичника китайского хомячка CHOZN (1,2). Проводили 9 последовательных циклов трансдукции, и клетки поддерживали в среде по стандартной методике с добавлением 6 мМ глутамина.

Трансфекция и селекция объединенной линии клеток с акцепторными сайтами: 3 миллиона клеток инкубировали с предварительно приготовленной смесью, содержащей 2 мкг (общее количество) плазмидной ДНК плазмид Transgene и Integrase и 8 микролитров ExpiFectamine СНО™ (ThermoFisher Scientific) в конечном объеме 500 микролитров. Объединенные клеточные линии оставляли для восстановления в присутствии среды с добавлением 6 мМ глутамина до тех пор, пока жизнеспособность не возвращалась до уровня более 95%. Затем клетки переносили в среду, не содержащую глутамина. Проводили мониторинг жизнеспособности клеток, среду заменяли еженедельно, и клетки пересевали до тех пор, пока жизнеспособность полученных отобранных пулов клеток не возвращалась до уровня более 95%

Количественная оценка рекомбинации: Геномную ДНК выделяли из 3 миллионов клеток с использованием набора Qiagen DNEasy. attR является результатом рекомбинации между attP и attB. Количественную полимеразную цепную реакцию (кПЦР) с использованием красителя SYBR Green проводили для количественного определения attR в клетках с использованием прямого праймера в последовательности attP в акцепторном сайте и обратного праймера в последовательности attB в трансгене. Амплификация с использованием этой пары праймеров будет детектировать плазмиду трансгена только в том случае, когда эта плазмида является рекомбинированной в акцепторный сайт и не является свободной, интегрированной случайным образом или интегрированной в сайт псевдо-attP плазмидой трансгена. Аналогичным образом, эта пара праймеров не будет детектировать последовательности нерекомбинированных (пустых) акцепторных сайтов. Число циклов ПНР, необходимых для пересечения порога интенсивности флуоресценции (значение Ct), определяли для этого набора праймеров, а также для набора праймеров для внутреннего референсного гена СНО. Индексы копийности гена (GCI) рассчитывали путем вычитания значения Ct для референсного гена из значения Ct для набора праймеров attR. Следует отметить, что значения GCI по своей природе являются логарифмическими, а не линейными, так что изменение на 1 единицу в нижней части шкалы, например, от GCI=1 до GCI=3, соответствует разнице, составляющей лишь несколько копий, тогда как изменение на одну единицу в верхней части шкалы, например, от GCI=6 до GCI=7, может соответствовать разнице, составляющей множество копий. В некоторых случаях плазмиду, содержащую желаемые ампликоны и имеющую известную концентрацию, также подвергали кПЦР, и выполняли линейный регрессионный анализ полученных данных для более точного определения числа присутствующих копий.

Результаты

Акцепторные сайты, содержащие последовательность распознавания attP для PhiC31, помещали в пределах всего генома клеток CHOZN с помощью 9 последовательных циклов трансдукции с использованием технологии GPEx, и полученный пул клеток имел GCI для EPR, составляющий 6,7, и содержал в среднем приблизительно 135 копий акцепторного сайта на клетку. Этот пул клеток с акцепторными сайтами был совместно трансфицирован плазмидами Transgene-Anyway и Integrase (Фиг. 13, 14, 5 и 6, соответственно) в соотношениях в диапазоне от 50:1 до 400:1 с последующей селекцией путем удаления глутамина. Наименьшая (минимальная) жизнеспособность, согласно Фиг. 32, была выше, чем в линии с акцепторными сайтами, содержащей приблизительно 36 копий на клетку. GCI для attR, Фиг. 33, также были выше, чем для линии клеток, содержащей приблизительно 36 копий акцепторного сайта, и увеличивались при более высоких соотношениях Transgene:Integrase, что позволяет предположить, что может быть возможным дальнейшее улучшение числа интегрированных трансгенов при более высоких соотношениях Transgene: Integrase и большем числе копий акцепторного сайта. Кроме того, авторы настоящего изобретения также продемонстрировали устойчивое восстановление после селекции при использовании плазмиды Transgene-Any way, Фиг. 13 и 14, которая не содержит промотора для GS и, таким образом, должна зависеть от слабого промотора SIN-LTR в конструкции для экспрессии акцепторного сайта.

Пример 4:

После улучшения числа интегрированных плазмид Transgene с использованием большего количества акцепторных сайтов и более высоких соотношений Transgene:Integrase, авторы настоящего изобретения далее попытались определить, могли ли они еще больше увеличить число интегрированных плазмид Transgene путем выделения клона с более высоким числом копий акцепторного сайта из пула, содержащего 135 копий акцепторного сайта, и путем проверки еще более высоких соотношений плазмид Transgene:Integrase. Авторы настоящего изобретения также попытались определить, можно ли с помощью этой технологии встраивать плазмиды с большими размерами.

Клонирование родительской линии клеток с акцепторными сайтами: Пул клеток с акцепторными сайтами, полученный с помощью 9 последовательных циклов трансдукции, клонировали с использованием прибора Berkeley Lights, Beacon. Клоны размножали, подвергали скринингу посредством кПЦР, и отбирали клон с наибольшим числом инсерций акцепторного сайта.

Трансфекция и селекция объединенной линии клеток с акцепторными сайтами: 3 миллиона клеток инкубировали с предварительно приготовленной смесью, содержащей 2 мкг (общее количество) ДНК плазмид Transgene и Integrase и 8 микролитров ExpiFectamine СНО™ (ThermoFisher Scientific) в конечном объеме 500 микролитров. Объединенные клеточные линии оставляли для восстановления в присутствии среды с добавлением 6 мМ глутамина до тех пор, пока жизнеспособность не возвращалась до уровня более 95%. Затем клетки переносили в среду, не содержащую глутамина. Проводили мониторинг жизнеспособности клеток, и среду заменяли еженедельно до тех пор, пока жизнеспособность полученных отобранных пулов клеток не возвращалась до уровня более 95%.

Количественная оценка рекомбинации: Геномную ДНК выделяли из 3 миллионов клеток с использованием набора Qiagen DNEasy. attR является результатом рекомбинации между attP и attB. Количественную полимеразную цепную реакцию (кПЦР) с использованием красителя SYBR Green проводили для количественного определения attR в клетках с использованием прямого праймера в последовательности attP в акцепторном сайте и обратного праймера в последовательности attB в трансгене. Амплификация с использованием этой пары праймеров будет детектировать плазмиду трансгена только в том случае, когда эта плазмида является рекомбинированной в акцепторный сайт и не является свободной, интегрированной случайным образом или интегрированной в сайт псевдо-attP плазмидой трансгена. Аналогичным образом, эта пара праймеров не будет детектировать последовательность нерекомбинированного (пустого) акцепторного сайта. Число циклов ПЦР, необходимых для пересечения порога интенсивности флуоресценции (значение Ct), определяли для этого набора праймеров, а также для набора праймеров для внутреннего референсного гена СНО. Праймеры, специфичные к части EPR акцепторного сайта (Фиг. 5 и 6), были использованы для классификации клонов на основе GCI для EPR. Значения индекса копийности гена рассчитывали путем вычитания значения Ct для референсного гена из значения Ct для набора праймеров attR. Следует отметить, что значения GCI по своей природе являются логарифмическими, а не линейными, так что изменение на 1 единицу в нижней части шкалы, например, от GCI=1 до GCI=3, соответствует разнице, составляющей лишь несколько копий, тогда как изменение на одну единицу в верхней части шкалы, например, от GCI=6 до GCI=7, может соответствовать разнице, составляющей множество копий. В некоторых случаях плазмиду, содержащую желаемые ампликоны и имеющую известную концентрацию, также подвергали кПЦР, и выполняли линейный регрессионный анализ полученных данных для более точного определения числа присутствующих копий.

Получение продукта с периодическим добавлением питательной среды: Для получения продукта с периодическим добавлением питательной среды в центрифужные пробирки объемом 50 мл высевали клетки в концентрации 600000 клеток на мл в 20 мл среды Ex-Cell Advanced СНО Fed-Batch™ (MilliporeSigma) и инкубировали в увлажненном (70-80%) встряхивателе-инкубаторе при 250 об/мин при 5% СО2 и температуре 37°С (34°С начиная с 4 дня). Культуры получали дополнительное питание через день, начиная со 2 дня с использованием 6,25% (об./об.) питательной смеси, содержащей 66% среды Ex-cell Advanced СНО Feed 1™ и 33% среды Cellvento 4Feed (MilliporeSigma). Ежедневно контролировали содержание глюкозы и добавляли ее, если уровень падал ниже 5 г/л. Культивирование прекращали, когда жизнеспособность составляла <70% или в конце 20 дня.

Результаты

Для выделения клона с высоким числом копий акцепторного сайта пул клеток с акцепторными сайтами, полученный с помощью 9 циклов трансдукции, подвергали процедуре клонирования одиночных клеток с использованием прибора Berkely Lights, Beacon®. Клоны выделяли, размножали и подвергали кПЦР с использованием праймеров, специфичных для области EPR акцепторного сайта. Клон 1F7 содержал приблизительно 181 копию плазмиды для экспрессии акцепторного сайта на клетку и был выбран для дальнейших экспериментов. Клон 1F7 с акцепторными сайтами совместно трансфицировали плазмидой Transgene-Yourway-LWHW, экспрессирующей обе легкую и тяжелую цепи антитела, и плазмидой Integrase, Фигуры 27+28 и 5+6, в соотношениях в диапазоне от 50:1 до 8000:1. Полученные пулы подвергали селекции путем удаления глутамина, Фигура 34. Пулы с соотношениями 4000:1 и 8000:1 не выжили в процессе селекции. кПЦР-анализ содержания attR в выживших пулах, Фигура 35, показал, что более крупные плазмиды с размером вплоть до по меньшей мере 9,8 т.п.н. могли быть эффективно интегрированы с помощью применяемой технологии, и оптимальное соотношение плазмид Transgen:Inetegrase этого размера составляло 500:1.

Пример 5:

После обнаружения относительно высокой эффективности интеграции в клоне 1F7 с акцепторными сайтами, авторы настоящего изобретения далее попытались определить, могли ли клоны, полученные из пулов с высокими уровнями интегрированных трансгенов, обеспечивать еще более высокие уровни интеграции трансгенов, и определить эффективность этих клонов в качестве продуцентов.

Трансфекция и селекция объединенной линии клеток с акцепторными сайтами: 3 миллиона клеток инкубировали с предварительно приготовленной смесью, содержащей 2 мкг (общее количество) ДНК плазмид Transgene и Integrase (Фиг. 13, 14, 5 и 6, соответственно) и 8 микролитров ExpiFectamine СНО™ (ThermoFisher Scientific) в конечном объеме 500 микролитров. Объединенные клеточные линии оставляли для восстановления в присутствии среды с добавлением 6 мМ глутамина до тех пор, пока жизнеспособность не возвращалась до уровня более 95%. Затем клетки переносили в среду, не содержащую глутамина. Проводили мониторинг жизнеспособности клеток, и среду заменяли еженедельно до тех пор, пока жизнеспособность полученных отобранных пулов клеток не возвращалась до уровня более 95%

Клонирование пулов с интегрированными плазмидами Transgene: Пулы с интегрированными плазмидами Transgene клонировали с использованием прибора Berkeley Lights, Beacon. Для определения относительной продуктивности этих клонов использовали анализ Spotlight®. Клоны с наибольшей продуктивностью извлекали из устройства и размножали.

Количественная оценка рекомбинации: Геномную ДНК выделяли из 3 миллионов клеток с использованием набора Qiagen DNEasy. attR является результатом рекомбинации между attP и attB. Количественную полимеразную цепную реакцию (кПЦР) с использованием красителя SYBR Green проводили для количественного определения attR в клетках с использованием прямого праймера в последовательности attP в акцепторном сайте и обратного праймера в последовательности attB в трансгене. Амплификация с использованием этой пары праймеров будет детектировать плазмиду трансгена только в том случае, когда эта плазмида является рекомбинированной в акцепторный сайт и не является свободной, интегрированной случайным образом или интегрированной в сайт псевдо-attP плазмидой трансгена. Аналогичным образом, эта пара праймеров не будет детектировать последовательность нерекомбинированного (пустого) акцепторного сайта. Число циклов ПЦР, необходимых для пересечения порога интенсивности флуоресценции (значение Ct), определяли для этого набора праймеров, а также для набора праймеров для внутреннего референсного гена СНО. Для оценки доли заполненных акцепторных сайтов были использованы праймеры, специфичные в отношении attP, который присутствовал только в не интегрировавших акцепторных сайтах. Значения индекса копийности гена рассчитывали путем вычитания значения Ct для референсного гена из значения Ct для набора праймеров attR. Следует отметить, что значения GCI по своей природе являются логарифмическими, а не линейными, так что изменение на 1 единицу в нижней части шкалы, например, от GCI=1 до GCI=3, соответствует разнице, составляющей лишь несколько копий, тогда как изменение на одну единицу в верхней части шкалы, например, от GCI=6 до GCI=7, может соответствовать разнице, составляющей множество копий. В некоторых случаях плазмиду, содержащую желаемые ампликоны и имеющую известную концентрацию, также подвергали кПЦР, и выполняли линейный регрессионный анализ полученных данных для более точного определения числа присутствующих копий.

Результаты

Клон 1F7 с акцепторными сайтами совместно трансфицировали плазмидами Transgene-Anyway и Integrase (Фиг. 13, 14, 5 и 6, соответственно), и полученные пулы подвергали селекции путем удаления глутамина. GCI для attR для выбранного пула составлял 6,9. Этот пул подвергали процедуре клонирования одиночных клеток с использованием прибора Berkely Lights, Beacon. Клоны классифицировали и извлекали на основании относительной экспрессии Anyway, определенной с использованием анализа Spotlight®. Были размножены 27 клонов, и GCI для attR в этих клонах, Фиг. 36, находились в диапазоне от 5,2 до 7,5. Для этих клонов также определяли GCI для attP, который являлся мерой числа пустых акцепторных сайтов, что позволило авторам настоящего изобретения оценить долю заполненных акцепторных сайтов в каждом клоне, Фиг. 36. В этих клонах средний процент заполнения составлял 65%. Это соответствовало приблизительно 118 копиям интегрированной плазмиды Transgene. Клон 1В7 имел GCI для attR, составляющий 7,5, что было эквивалентно GCI для attP (пустой акцепторный сайт) для родительского клона 1F7 с акцепторными сайтами. Авторы настоящего изобретения неожиданно не смогли детектировать attP в этом клоне при использовании двух разных пар праймеров. Эти данные указывают на то, что, неожиданно, после только одной трансфекции авторы настоящего изобретения смогли получить клон со всеми приблизительно 181 акцепторными сайтами, заполненными трансгеном.

Для определения эффективности всех этих клонов в качестве продуцентов белка проводили анализ их продуктивности при получении неспецифического продукта с периодическим добавлением питательной среды, конечные титры также показаны на Фиг. 36. Высокие уровни GCI для attR были связаны с высоким конечным титром, Фиг. 37, что указывало на то, что, как и ожидалось, увеличение количества событий нацеленной интеграции трансгенов в высокоактивные акцепторные сайты приводило к повышению эффективности клеточной линии в качестве продуцента белка. Эти данные также позволяют предположить, что авторами настоящего изобретения еще не было достигнуто насыщение эффективности этих клеток в качестве продуцентов даже при 181 интегрировавшей копии.

Пример 6:

После обнаружения относительно высокой эффективности интеграции и экспрессии слитого белка в клоне 1F7 с акцепторными сайтами, авторы настоящего изобретения далее попытались определить, могли ли они также применять эту систему для интеграции и экспрессии моноклональных антител с обеими тяжелой и легкой цепями на одной и той же плазмиде Transgene.

Трансфекция и селекция объединенной линии клеток с акцепторными сайтами: 3 миллиона клеток инкубировали с предварительно приготовленной смесью, содержащей 2 мкг (общее количество) ДНК плазмид Transgene и Integrase и 8 микролитров ExpiFectamine СНО™ (ThermoFisher Scientific) в конечном объеме 500 микролитров. Объединенные клеточные линии оставляли для восстановления в присутствии среды с добавлением 6 мМ глутамина до тех пор, пока жизнеспособность не возвращалась до уровня более 95%. Затем клетки переносили в среду, не содержащую глутамина. Проводили мониторинг жизнеспособности клеток, и среду заменяли еженедельно до тех пор, пока жизнеспособность полученных отобранных пулов клеток не возвращалась до уровня более 95%.

Количественная оценка рекомбинации: Геномную ДНК выделяли из 3 миллионов клеток с использованием набора Qiagen DNEasy. attR и attL представляют собой результат рекомбинации между attP и attB. Количественную полимеразную цепную реакцию (кПЦР) с использованием красителя SYBR Green проводили для количественного определения attR в клетках с использованием прямого праймера в последовательности attP в акцепторном сайте и обратного праймера в последовательности attB в трансгене. Амплификация с использованием этой пары праймеров будет детектировать плазмиду трансгена только в том случае, когда эта плазмида является рекомбинированной в акцепторный сайт и не является свободной, интегрированной случайным образом или интегрированной в сайт псевдо-attP плазмидой трансгена. Аналогичным образом, эта пара праймеров не будет детектировать последовательность нерекомбинированного (пустого) акцепторного сайта. Число циклов ПЦР, необходимых для пересечения порога интенсивности флуоресценции (значение Ct), определяли для этого набора праймеров, а также для набора праймеров для внутреннего референсного гена СНО. Для оценки доли заполненных акцепторных сайтов были использованы праймеры, специфичные в отношении attP, который присутствовал только в не интегрировавших акцепторных сайтах. Значения индекса копийности гена рассчитывали путем вычитания значения Ct для референсного гена из значения Ct для набора праймеров attR. Следует отметить, что значения GCI по своей природе являются логарифмическими, а не линейными, так что изменение на 1 единицу в нижней части шкалы, например, от GCI=1 до GCI=3, соответствует разнице, составляющей лишь несколько копий, тогда как изменение на одну единицу в верхней части шкалы, например, от GCI=6 до GCI=7, может соответствовать разнице, составляющей множество копий. В некоторых случаях плазмиду, содержащую желаемые ампликоны и имеющую известную концентрацию, также подвергали кПЦР, и выполняли линейный регрессионный анализ полученных данных для более точного определения числа присутствующих копий.

Получение продукта с периодическим добавлением питательной среды: В центрифужные пробирки объемом 50 мл высевали клетки в концентрации 600000 клеток на мл в 20 мл среды Ex-Cell Advanced СНО FED-BATCH™ (MilliporeSigma) и инкубировали в увлажненном (70-80%) встряхивателе-инкубаторе при 250 об/мин при 5% СО2 и температуре 37°С (34°С начиная с 4 дня). Культуры получали дополнительное питание через день начиная со 2 дня с использованием 6,25% (об./об.) питательной смеси, содержащей 66% среды Ex-Cell Advanced СНО Feed 1™ и 33% среды Cellvento 4Feed (MilliporeSigma). Ежедневно контролировали содержание глюкозы и добавляли ее, если уровень падал ниже 5 г/л. Культивирование прекращали, когда жизнеспособность составляла <70% или в конце 20 дня.

Электрофорез белков в геле. Супернатанты от получения продукта с периодическим добавлением питательной среды (см. выше) собирали и делали прозрачными. 3 мкг каждого антитела или содержащего Fc слитого белка смешивали с буфером для нанесения образцов LDS с добавлением или без добавления денатурирующего агента. Перед электрофорезом денатурированные образцы также нагревали до 70°С в течение 10 минут. Все образцы наносили на гель NuPAGE Novex 4-12% Bis-Tris (Invitrogen) и подвергали электрофорезу в буфере IX MES в течение 15 минут при 60 В и затем 105 минут при 100 В. Затем гель промывали деионизированной водой и окрашивали с помощью красителя SYPRO-Ruby. Окрашенные гели были визуализированы, и на Фиг. 40 представлено «негативное» изображение (с обращением цветов) окрашенного геля.

Результаты

Хорошо известно, что и экспрессия, и очистка моноклональных антител чувствительны к относительным количествам экспрессируемых легкой цепи и тяжелой цепи. Система, предложенная авторами настоящего изобретения, предназначена для интеграции легкой цепи и тяжелой цепи при соотношении генов 1:1. С целью оптимизации относительной экспрессии каждой цепи авторы настоящего изобретения разработали и проверили четыре различные экспрессионные конструкции, которые содержат гены, расположенные в различном порядке, и энхансерные элементы (см. Фиг. 21, 22, 23, 24, 25, 26, 27 и 28). Все исследованные конструкции не содержат промотора GS и содержат сильные промоторы и последовательности поли(А) для генов и тяжелой цепи, и легкой цепи. В первой конструкции, называемой HWIL (для подчеркивания различий между конструкциями), кодирующая последовательность тяжелой цепи (Н) экспрессируется с вышележащего промотора, и за ней следует посттранскрипционный регуляторный элемент вируса гепатита сурков (W или WPRE). Кодирующая последовательность легкой цепи (L) экспрессируется с нижележащего промотора, и ей предшествует интронная последовательность (I). Остальные три экспрессионные конструкции следуют той же номенклатуре. Клон 1F7 с акцепторными сайтами, содержащий приблизительно 181 копию акцепторного сайта, был совместно трансфицирован всеми четырьмя плазмидами Transgene-Yourway или плазмидой Transgene-Any way (в отдельности) и плазмидой Integrase (Фиг. 5+6, 21+22, 23+24, 25+26, 27+28, 13+14), и полученные пулы подвергали селекции путем удаления глутамина, Фиг. 38. Интересно, что пулы, трансфицированные плазмидой LWIH, после селекции восстанавливались медленнее, чем при трансфекции другими плазмидами. кПЦР-анализ полученных пулов, Фиг. 38, показал, что был достигнут высокий уровень интеграции трансгена, аналогичный таковому для предыдущих примеров, несмотря на больший размер этих плазмид. Также проводили анализ продуктивности при периодическом добавлении питательной среды для определения эффективности этих пулов в качестве продуцентов белка, Фиг. 39.

Три из четырех экспрессионных плазмид демонстрировали стабильную экспрессию, при этом HWTL и LWHW обеспечивали самые высокие титры. Полученные белки подвергали анализу посредством ДСН-ПААГ-электрофореза как в невосстанавливающих, так и в восстанавливающих условиях, Фиг. 40, для оценки относительной экспрессии тяжелой и легкой цепей и сборки зрелого антитела. Все четыре экспрессионные плазмиды демонстрировали высокую долю образовавшихся зрелых антител с молекулярной массой 150 кДа относительно свободных легких и тяжелых цепей. Все четыре плазмиды для экспрессии антител также демонстрировали незначительный избыток экспрессии легкой цепи, что является желательным для очистки с помощью белка А, чтобы свести к минимуму очистку свободной тяжелой цепи. Аналогичным образом, экспрессия одноцепочечного слитого белка, Anyway, демонстрировала как высокий титр, Фигура 39, так и высокую долю зрелого, димеризованного белка прогнозируемого размера.

Пример 7:

Далее авторы настоящего изобретения хотели определить стабильность продуцирования в пулах, полученных с применением этой технологии, поскольку это является необходимой характеристикой для производства.

Получение ретровектора и трансдукция для создания родительской линии клеток с акцепторными сайтами: Конструкцию для экспрессии акцепторного сайта, Фиг. 7 и 8, вводили в линию клеток HEK 293, которая конститутивно продуцирует белки gag, pro и pol MLV. Также были проведены совместные трансфекции оболочкой вируса, содержащей экспрессионную плазмиду, и каждой из генетических конструкций. Совместная трансфекция приводила к получению дефектного по репликации ретровектора с высоким титром, который концентрировали посредством ультрацентрифугирования и использовали для трансдукции родительской линии клеток яичника китайского хомячка CHOZN (1,2). Проводили 5 последовательных циклов трансдукции, и клетки поддерживали в среде по стандартной методике с добавлением 6 мМ глутамина.

Трансфекция и селекция объединенной линии клеток с акцепторными сайтами: 3 миллиона клеток инкубировали с предварительно приготовленной смесью, содержащей 2 мкг (общее количество) ДНК плазмид Transgene и Integrase и 8 микролитров ExpiFectamine СНО™ (ThermoFisher Scientific) в конечном объеме 500 микролитров. Объединенные клеточные линии оставляли для восстановления в присутствии среды с добавлением 6 мМ глутамина до тех пор, пока жизнеспособность не возвращалась до уровня более 95%. Затем клетки переносили в среду, не содержащую глутамина. Проводили мониторинг жизнеспособности клеток, и среду заменяли еженедельно до тех пор, пока жизнеспособность полученных отобранных пулов клеток не возвращалась до уровня более 95%.

Получение продукта с периодическим добавлением питательной среды - среда Ex-cell: В центрифужные пробирки объемом 50 мл высевали клетки в концентрации 600000 клеток на мл в 20 мл среды Ex-Cell Advanced СНО FED-BATCH™ (MilliporeSigma) и инкубировали в увлажненном (70-80%) встряхивателе-инкубаторе при 250 об/мин при 5% СО2 и температуре 37°С (34°С начиная с 4 дня). Культуры получали дополнительное питание через день начиная со 2 дня с использованием 6,25% (об./об.) питательной смеси, содержащей 66% среды Ex-Cell Advanced СНО Feed 1™ и 33% среды Cellvento 4Feed (MilliporeSigma). Ежедневно контролировали содержание глюкозы и добавляли ее, если уровень падал ниже 5 г/л. Культивирование прекращали, когда жизнеспособность составляла <70% или в конце 20 дня.

Получение продукта с периодическим добавлением питательной среды - среда ActiPro: В центрифужные пробирки объемом 50 мл высевали клетки в концентрации 600000 клеток на мл в 20 мл среды Hyclone ActiPro™ (Activa Life Sciences) и инкубировали в увлажненном (70-80%) встряхивателе-инкубаторе при 250 об/мин при 5% СО2 и температуре 37°С (34°С начиная с 4 дня). Культуры получали дополнительное питание через день начиная со 2 дня с использованием 3% (об./об.) среды Hyclone Cell Boost 7А и 0,3% среды Hyclone Cell Boost 7b (Activa Life Sciences). Ежедневно контролировали содержание глюкозы и добавляли ее, если уровень падал ниже 5 г/л. Культивирование прекращали, когда жизнеспособность составляла<70% или в конце 20 дня.

Результаты

Для определения стабильности продуцирования в пулах, экспрессирующих гибридный белок Anyway, пул клеток с акцепторными сайтами, полученный с помощью 9 циклов трансдукции, был совместно трансфицирован плазмидами Transgene-Anyway и Integrase, Фигуры 13+14 и 5+6. Полученные пулы подвергали селекции путем удаления глутамина. Три пула непрерывно пересевали, и аликвоты замораживали еженедельно для более чем 40 поколений. После получения 40 поколений для всех пулов размораживали флаконы с ранее замороженными поколениями и проводили анализ продуктивности при периодическом добавлении питательной среды с применением двух различных сред/стратегий добавления питательной среды. Конечные титры согласно анализам продуктивности при периодическом добавлении питательной среды, Фиг. 41, показывают, что даже после непрерывного культивирования в течение более 40 поколений титры белка оставались стабильными во всех трех пулах, что указывало как на устойчивую генетическую стабильность интегрированных плазмид трансгенов, так и на стабильную экспрессию из интегрированных плазмид трансгенов, и оба эти параметра являются критическими характеристиками для применения этой технологии в производстве лекарственных веществ.

Все публикации и патенты, упомянутые в приведенном выше описании, включены в настоящую заявку посредством ссылки. Специалистам в данной области техники будут понятны различные модификации и варианты описанных способа и системы согласно настоящему изобретению без отступления от объема и сущности настоящего изобретения. Несмотря на то, что настоящее изобретение было описано в связи с конкретными предпочтительными вариантами реализации, следует понимать, что заявленное изобретение не должно быть неоправданно ограничено такими конкретными вариантами реализации. Действительно, предполагается, что различные модификации описанных способов практического осуществления настоящего изобретения, понятные для специалистов в области техники, к которой относится настоящее изобретение, находятся в пределах объема приведенной ниже формулы изобретения.

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> Catalent Pharma Solutions, LLC

<120> КОНСТРУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ ДЛЯ ПОЛУЧЕНИЯ БЕЛКОВ

<130> CATA-38549.601

<150> US 63/033,514

<151> 2020-06-02

<150> US 63/033,516

<151> 2020-06-02

<160> 12

<170> PatentIn version 3.5

<210> 1

<211> 7516

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 1

tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60

ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120

aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180

gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240

gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300

agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360

ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420

cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480

gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540

caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600

caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactg 660

cgatcgcccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 720

agcagagctc gtttagtgaa ccgtcagatc actagaagct ttattgcggt agtttatcac 780

agttaaattg ctaacgcagt cagtgcttct gacacaacag tctcgaactt aagctgcagt 840

gactctctta aggtagcctt gcagaagttg gtcgtgaggc actgggcagg taagtatcaa 900

ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 960

cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct ttctctccac 1020

aggtgtccac tcccagttca attacagctc ttaaaaattg gatctccatt cgccattcag 1080

gctgcgcaac tgctgggaag gacgatcaga gcgggcctct tcgctattac gccagctggc 1140

gaaagggacg tggcaagcaa ggcgattaag ttgagttacg ccaggatttt cccagtcacg 1200

acgttgtaaa acgacggcca gagaattata atacgactca ctatagggcg aattcggatc 1260

cgccgccacc atggtgacct acgccggagc ctacgacaga cagagccggg agagagagaa 1320

cagcagcgcc gccagccccg ccacccagag aagcgccaac gaggccaagg ccgccgccct 1380

gcagagagag atcgagaggg ccggcggcag attcagattt gtgggccact tcagcgaggc 1440

ccctggcacc agcgccttcg gcaccgccga gagacccgag ttcgagagaa tcctgaacga 1500

gtgtagggcc ggcaggctga acatgatcat cgtgtacgac gtgtcccggt tcagcaggct 1560

gaaggtgatg gacgccatcc ctatcgtgtc cgagctgctg gccctgggcg tgaccatcgt 1620

gtccacccag gaaggcgtct ttagacaggg caacgtgatg gacctgatcc acctgatcat 1680

gaggctggac gccagccaca aggagagcag cctgaagagc gccaagatcc tggacaccaa 1740

gaacctgcag agggagctgg gcggctatgt gggcggcaag gccccctacg gcttcgagct 1800

ggtgtccgag accaaggaga tcacccggaa cggcaggatg gtgaacgtgg tgatcaacaa 1860

gctggcccac agcaccaccc ccctgaccgg ccccttcgag tttgagcccg acgtgatcag 1920

gtggtggtgg cgggagatca agacccacaa gcacctgcct ttcaagcccg gcagccaggc 1980

cgccatccac cccggcagca tcaccggcct gtgtaagaga atggacgccg acgccgtgcc 2040

caccagaggc gagaccatcg gcaagaaaac cgccagcagc gcctgggacc ccgccaccgt 2100

gatgagaatc ctgagggacc ctaggatcgc cggcttcgcc gccgaggtga tctacaagaa 2160

gaagcccgac ggcaccccca ccaccaagat cgagggctac agaatccaga gagaccccat 2220

caccctgaga cctgtggagc tggactgtgg ccctatcatc gagcctgccg agtggtacga 2280

gctgcaggcc tggctggacg gcagaggcag aggcaagggc ctgagcagag gccaggccat 2340

cctgagcgcc atggacaagc tgtactgtga gtgtggcgcc gtgatgacca gcaagagagg 2400

cgaggagagc atcaaggaca gctaccggtg ccggagaaga aaggtggtgg accccagcgc 2460

ccctggccag cacgagggca cctgtaatgt gagcatggcc gccctggaca agttcgtggc 2520

cgagcggatc ttcaacaaga tccggcacgc cgagggcgac gaggagaccc tggccctgct 2580

gtgggaggcc gccagaagat tcggcaagct gaccgaggcc cccgagaaga gcggcgagag 2640

ggccaacctg gtggccgaga gagccgacgc cctgaacgcc ctggaggagc tgtacgagga 2700

cagagccgcc ggagcctatg acggccctgt gggcaggaag cacttcagaa agcagcaggc 2760

cgccctgacc ctgagacagc agggcgccga ggaaagactg gccgagctgg aggccgccga 2820

ggcccctaag ctgcccctgg atcagtggtt ccccgaggat gccgacgccg accccaccgg 2880

ccccaagtcc tggtggggca gagccagcgt ggacgacaag agggtgttcg tgggcctgtt 2940

cgtggataag atcgtggtga ccaagagcac caccggcagg ggccagggca cccccatcga 3000

gaagagagcc agcatcacct gggccaagcc tcccaccgac gacgacgagg atgacgccca 3060

ggacggcacc gaggacgtgg ccgcccctaa gaaaaagcgg aaagtgtgac tcgagacgcg 3120

tgatatcttt cccgggggta ccgtcgactg cggccgcgaa ttccaagctt gagtattcta 3180

tcgtgtcacc taaataactt ggcgtaatca tggtcatatc tgtttcctgt gtgaaattgt 3240

tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt 3300

gcctaatgag tgagctaact cacattaatt gcgttgcgcg atgcttccat tttgtgaggg 3360

ttaatgcttc gagaagacat gataagatac attgatgagt ttggacaaac cacaacaaga 3420

atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 3480

attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 3540

cagggggaga tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc 3600

cgataaggat cgattccgga gcctgaatgg cgaatggacg cgccctgtag cggcgcatta 3660

agcgcggcgg gtgtggtggt tacgcgcacg tgaccgctac acttgccagc gccctagcgc 3720

ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 3780

ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 3840

aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 3900

gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 3960

cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct 4020

attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 4080

cgcttacaat ttcgcctgtg taccttctga ggcggaaaga accagctgtg gaatgtgtgt 4140

cagttagggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 4200

ctcaattagt cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg 4260

caaagcatgc atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg 4320

cccctaactc cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt 4380

tatgcagagg ccgaggccgc ctcggcctct gagctattcc agaagtagtg aggaggcttt 4440

tttggaggcc taggcttttg caaaaagctt gattcttctg acacaacagt ctcgaactta 4500

aggctagagc caccatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 4560

tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 4620

tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 4680

ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 4740

cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 4800

aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 4860

tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 4920

aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 4980

atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 5040

cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 5100

tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 5160

accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 5220

gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 5280

tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgaaa tgaccgacca 5340

agcgacgccc aacctgccat cacgatggcc gcaataaaat atctttattt tcattacatc 5400

tgtgtgttgg ttttttgtgt gcgtacgaag atccgcgtat ggtgcactct cagtacaatc 5460

tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc 5520

tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 5580

tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg 5640

atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc 5700

acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 5760

atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 5820

agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 5880

cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 5940

gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 6000

cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 6060

tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 6120

ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 6180

ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 6240

atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 6300

cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 6360

atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 6420

gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 6480

cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 6540

tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 6600

tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 6660

gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 6720

gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 6780

atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 6840

atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 6900

aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 6960

aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 7020

ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 7080

ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 7140

tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 7200

ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 7260

acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 7320

gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 7380

cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 7440

aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 7500

atggctcgac agatct 7516

<210> 2

<211> 5043

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 2

gaattaattc ataccagatc accgaaaact gtcctccaaa tgtgtccccc tcacactccc 60

aaattcgcgg gcttctgcct cttagaccac tctaccctat tccccacact caccggagcc 120

aaagccgcgg cccttccgtt tctttgctgt ccggccatta gccatattat tcattggtta 180

tatagcataa atcaatattg gctattggcc attgcatacg ttgtatccat atcataatat 240

gtacatttat attggctcat gtccaacatt accgccatgt tgacattgat tattgactag 300

ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt 360

tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac 420

gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg 480

ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag 540

tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat 600

gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat 660

ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact cacggggatt 720

tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa atcaacggga 780

ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta ggcgtgtacg 840

gtgggaggtc tatataagca gagctcaata aaagagccca caacccctca ctcggcgcgc 900

cagtcttccg atagactgcg tcgcccgggt acccgtattc ccaataaagc ctcttgctgt 960

ttgcatccga atcgtggtct cgctgttcct tgggagggtc tcctctgagt gattgactac 1020

ccacgacggg ggtctttcat ttgggggctc gtccgggatt tggagacccc tgcccaggga 1080

ccaccgaccc accaccggga ggtaagctgg ccagcaactt atctgtgtct gtccgattgt 1140

ctagtgtcta tgtttgatgt tatgcgcctg cgtctgtact agttagctaa ctagctctgt 1200

atctggcgga cccgtggtgg aactgacgag ttctgaacac ccggccgcaa ccctgggaga 1260

cgtcccaggg actttggggg ccgtttttgt ggcccgacct gaggaaggga gtcgatgtgg 1320

aatccgaccc cgtcaggata tgtggttctg gtaggagacg agaacctaaa acagttcccg 1380

cctccgtctg aatttttgct ttcggtttgg aaccgaagcc gcgcgtcttg tctgctgcag 1440

cgctgcagca tcgttctgtg ttgtctctgt ctgactgtgt ttctgtattt gtctgaaaat 1500

tagggccaga ctgttaccac tcccttaagt ttgaccttag gtcactggaa agatgtcgag 1560

cggatcgctc acaaccagtc ggtagatgtc aagaagagac gttgggttac cttctgctct 1620

gcagaatggc caacctttaa cgtcggatgg ccgcgagacg gcacctttaa ccgagacctc 1680

atcacccagg ttaagatcaa ggtcttttca cctggcccgc atggacaccc agaccaggtc 1740

ccctacatcg tgacctggga agccttggct tttgaccccc ctccctgggt caagcccttt 1800

gtacacccta agcctccgcc tcctcttcct ccatccgccc cgtctctccc ccttgaacct 1860

cctcgttcga ccccgcctcg atcctccctt tatccagccc tcactccttc tctaggcgcc 1920

ggaattgacg cgcgcgtagg cctgcggccg cagtactgac ggacacaccg aagccccggc 1980

ggcaaccctc agcggatgcc ccggggcttc acgttttccc aggtcagaag cggttttcgg 2040

gagtagtgcc ccaactgggg taacctttga gttctctcag ttgggggcgt agggtcgccg 2100

acatgacaca aggggttgtg accggggtgg acacgtacgc gggtgcttac gaccgtcagt 2160

cgcgcgagcg cgatagtctc gagttcgaca tcgataaaat aaaagatttt atttagtctc 2220

cagaaaaagg ggggaatgaa agaccccacc tgtaggtttg gcaagctagc ttaagtaacg 2280

ccattttgca aggcatggaa aaatacataa ctgagaatag aaaagttcag atcaaggtca 2340

ggaacagatg gaacagggtc gaccggtcga ccggtcgacc ctagagaacc atcagatgtt 2400

tccagggtgc cccaaggacc tgaaatgacc ctgtgcctta tttgaactaa ccaatcagtt 2460

cgcttctcgc ttctgttcgc gcgcttctgc tccccgagct caataaaaga gcccacaacc 2520

cctcactcgg ggcgccagtc ctccgattga ctgagtcgcc cgggtacccg tgtatccaat 2580

aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt tccttgggag ggtctcctct 2640

gagtgattga ctacccgtca gcgggggtct ttcatttggg ggctcgtccg ggatcgggag 2700

acccctgccc agggaccacc gacccaccac cgggaggtaa gctggctgcc tcgcgcgttt 2760

cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca cagcttgtct 2820

gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg 2880

tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg gcttaactat 2940

gcggcatcag agcagattgt actgagagtg caccatatgc ggtgtgaaat accgcacaga 3000

tgcgtaagga gaaaataccg catcaggcgc tcttccgctt cctcgctcac tgactcgctg 3060

cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 3120

tccacagaat caggggataa cgcaggaaag aacatgtatg catgagcaaa aggccagcaa 3180

aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 3240

gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 3300

agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 3360

cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 3420

cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 3480

ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 3540

gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 3600

tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 3660

acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 3720

tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 3780

attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 3840

gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 3900

ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 3960

taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 4020

ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 4080

ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 4140

gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 4200

ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 4260

gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc acgctcgtcg 4320

tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 4380

atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 4440

gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 4500

tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 4560

atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc gccacatagc 4620

agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 4680

ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 4740

tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 4800

aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 4860

tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 4920

aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 4980

accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctt 5040

caa 5043

<210> 3

<211> 5638

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 3

gaattaattc ataccagatc accgaaaact gtcctccaaa tgtgtccccc tcacactccc 60

aaattcgcgg gcttctgcct cttagaccac tctaccctat tccccacact caccggagcc 120

aaagccgcgg cccttccgtt tctttgctgt ccggccatta gccatattat tcattggtta 180

tatagcataa atcaatattg gctattggcc attgcatacg ttgtatccat atcataatat 240

gtacatttat attggctcat gtccaacatt accgccatgt tgacattgat tattgactag 300

ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt 360

tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac 420

gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg 480

ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag 540

tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat 600

gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat 660

ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact cacggggatt 720

tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa atcaacggga 780

ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta ggcgtgtacg 840

gtgggaggtc tatataagca gagctcaata aaagagccca caacccctca ctcggcgcgc 900

cagtcttccg atagactgcg tcgcccgggt acccgtattc ccaataaagc ctcttgctgt 960

ttgcatccga atcgtggtct cgctgttcct tgggagggtc tcctctgagt gattgactac 1020

ccacgacggg ggtctttcat ttgggggctc gtccgggatt tggagacccc tgcccaggga 1080

ccaccgaccc accaccggga ggtaagctgg ccagcaactt atctgtgtct gtccgattgt 1140

ctagtgtcta tgtttgatgt tatgcgcctg cgtctgtact agttagctaa ctagctctgt 1200

atctggcgga cccgtggtgg aactgacgag ttctgaacac ccggccgcaa ccctgggaga 1260

cgtcccaggg actttggggg ccgtttttgt ggcccgacct gaggaaggga gtcgatgtgg 1320

aatccgaccc cgtcaggata tgtggttctg gtaggagacg agaacctaaa acagttcccg 1380

cctccgtctg aatttttgct ttcggtttgg aaccgaagcc gcgcgtcttg tctgctgcag 1440

cgctgcagca tcgttctgtg ttgtctctgt ctgactgtgt ttctgtattt gtctgaaaat 1500

tagggccaga ctgttaccac tcccttaagt ttgaccttag gtcactggaa agatgtcgag 1560

cggatcgctc acaaccagtc ggtagatgtc aagaagagac gttgggttac cttctgctct 1620

gcagaatggc caacctttaa cgtcggatgg ccgcgagacg gcacctttaa ccgagacctc 1680

atcacccagg ttaagatcaa ggtcttttca cctggcccgc atggacaccc agaccaggtc 1740

ccctacatcg tgacctggga agccttggct tttgaccccc ctccctgggt caagcccttt 1800

gtacacccta agcctccgcc tcctcttcct ccatccgccc cgtctctccc ccttgaacct 1860

cctcgttcga ccccgcctcg atcctccctt tatccagccc tcactccttc tctaggcgcc 1920

ggaattgacg cgcgcgtagg cctgcggccg cagtactgac ggacacaccg aagccccggc 1980

ggcaaccctc agcggatgcc ccggggcttc acgttttccc aggtcagaag cggttttcgg 2040

gagtagtgcc ccaactgggg taacctttga gttctctcag ttgggggcgt agggtcgccg 2100

acatgacaca aggggttgtg accggggtgg acacgtacgc gggtgcttac gaccgtcagt 2160

cgcgcgagcg cgatagtctc gagttcgaca tcgataatca acctctggat tacaaaattt 2220

gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg 2280

ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc tcctccttgt 2340

ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg caacgtggcg 2400

tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc accacctgtc 2460

agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa ctcatcgccg 2520

cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat tccgtggtgt 2580

tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg tgttgccacc tggattctgc 2640

gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg 2700

gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag acgagtcgga 2760

tctccctttg ggccgcctcc ccgcatcgat aaaataaaag attttattta gtctccagaa 2820

aaagggggga atgaaagacc ccacctgtag gtttggcaag ctagcttaag taacgccatt 2880

ttgcaaggca tggaaaaata cataactgag aatagaaaag ttcagatcaa ggtcaggaac 2940

agatggaaca gggtcgaccg gtcgaccggt cgaccctaga gaaccatcag atgtttccag 3000

ggtgccccaa ggacctgaaa tgaccctgtg ccttatttga actaaccaat cagttcgctt 3060

ctcgcttctg ttcgcgcgct tctgctcccc gagctcaata aaagagccca caacccctca 3120

ctcggggcgc cagtcctccg attgactgag tcgcccgggt acccgtgtat ccaataaacc 3180

ctcttgcagt tgcatccgac ttgtggtctc gctgttcctt gggagggtct cctctgagtg 3240

attgactacc cgtcagcggg ggtctttcat ttgggggctc gtccgggatc gggagacccc 3300

tgcccaggga ccaccgaccc accaccggga ggtaagctgg ctgcctcgcg cgtttcggtg 3360

atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag 3420

cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg 3480

gcgcagccat gacccagtca cgtagcgata gcggagtgta tactggctta actatgcggc 3540

atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 3600

aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 3660

ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 3720

agaatcaggg gataacgcag gaaagaacat gtatgcatga gcaaaaggcc agcaaaaggc 3780

caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 3840

gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 3900

ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 3960

cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 4020

taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 4080

cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 4140

acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 4200

aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 4260

atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 4320

atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 4380

gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 4440

gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 4500

ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 4560

ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 4620

tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 4680

accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 4740

atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 4800

cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 4860

tagtttgcgc aacgttgttg ccattgctgc aggcatcgtg gtgtcacgct cgtcgtttgg 4920

tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 4980

gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 5040

agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 5100

aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 5160

gcgaccgagt tgctcttgcc cggcgtcaac acgggataat accgcgccac atagcagaac 5220

tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 5280

gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 5340

tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 5400

aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 5460

catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 5520

acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat 5580

tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtcttcaa 5638

<210> 4

<211> 8348

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 4

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt catttaaatg aaagacccca 420

cctgtaggtt tggcaagcta gcttaagtaa cgccattttg caaggcatgg aaaaatacat 480

aactgagaat agaaaagttc agatcaaggt caggaacaga tggaacaggg tcgaccggtc 540

gaccggtcga ccctagagaa ccatcagatg tttccagggt gccccaagga cctgaaatga 600

ccctgtgcct tatttgaact aaccaatcag ttcgcttctc gcttctgttc gcgcgcttct 660

gctccccgag ctcaataaaa gagcccacaa cccctcactc ggggcgccag tcttccgata 720

gactgcgtcg cccgggtacc cgtattccca ataaagcctc ttgctgtttg catccgaatc 780

gtggtctcgc tgttccttgg gagggtctcc tctgagtgat tgactaccca cgacgggggt 840

ctttcatttg ggggctcgtc cgggatttgg agacccctgc ccagggacca ccgacccacc 900

accgggaggt aagctggcca gcaacttatc tgtgtctgtc cgattgtcta gtgtctatgt 960

ttgatgttat gcgcctgcgt ctgtactagt tagctaacta gctctgtatc tggcggaccc 1020

gtggtggaac tgacgagttc tgaacacccg gccgcaaccc tgggagacgt cccagggact 1080

ttgggggccg tttttgtggc ccgacctgag gaagggagtc gatgtggaat ccgaccccgt 1140

caggatatgt ggttctggta ggagacgaga acctaaaaca gttcccgcct ccgtctgaat 1200

ttttgctttc ggtttggaac cgaagccgcg cgtcttgtct gctgcagcgc tgcagcatcg 1260

ttctgtgttg tctctgtctg actgtgtttc tgtatttgtc tgaaaattag ggccagactg 1320

ttaccactcc cttaagtttg accttaggtc actggaaaga tgtcgagcgg atcgctcaca 1380

accagtcggt agatgtcaag aagagacgtt gggttacctt ctgctctgca gaatggccaa 1440

cctttaacgt cggatggccg cgagacggca cctttaaccg agacctcatc acccaggtta 1500

agatcaaggt cttttcacct ggcccgcatg gacacccaga ccaggtcccc tacatcgtga 1560

cctgggaagc cttggctttt gacccccctc cctgggtcaa gccctttgta caccctaagc 1620

ctccgcctcc tcttcctcca tccgccccgt ctctccccct tgaacctcct cgttcgaccc 1680

cgcctcgatc ctccctttat ccagccctca ctccttctct aggcgccgga attgccttcc 1740

accatggcca cctcagcaag ttcccacttg aacaaaaaca tcaagcaaat gtacttgtgc 1800

ctgccccagg gtgagaaagt ccaagccatg tatatctggg ttgatggtac tggagaagga 1860

ctgcgctgca aaacccgcac cctggactgt gagcccaagt gtgtagaaga gttacctgag 1920

tggaattttg atggctctag tacctttcag tctgagggct ccaacagtga catgtatctc 1980

agccctgttg ccatgtttcg ggaccccttc cgcagagatc ccaacaagct ggtgttctgt 2040

gaagttttca agtacaaccg gaagcctgca gagaccaatt taaggcactc gtgtaaacgg 2100

ataatggaca tggtgagcaa ccagcacccc tggtttggaa tggaacagga gtatactctg 2160

atgggaacag atgggcaccc ttttggttgg ccttccaatg gctttcctgg gccccaaggt 2220

ccgtattact gtggtgtggg cgcagacaaa gcctatggca gggatatcgt ggaggctcac 2280

taccgcgcct gcttgtatgc tggggtcaag attacaggaa caaatgctga ggtcatgcct 2340

gcccagtggg agttccaaat aggaccctgt gaaggaatcc gcatgggaga tcatctctgg 2400

gtggcccgtt tcatcttgca tcgagtatgt gaagactttg gggtaatagc aacctttgac 2460

cccaagccca ttcctgggaa ctggaatggt gcaggctgcc ataccaactt tagcaccaag 2520

gccatgcggg aggagaatgg tctgaagcac atcgaggagg ccatcgagaa actaagcaag 2580

cggcaccggt accacattcg agcctacgat cccaaggggg gcctggacaa tgcccgtcgt 2640

ctgactgggt tccacgaaac gtccaacatc aacgactttt ctgctggtgt cgccaatcgc 2700

agtgccagca tccgcattcc ccggactgtc ggccaggaga agaaaggtta ctttgaagac 2760

cgccgcccct ctgccaactg tgaccccttt gcagtgacag aagccatcgt ccgcacatgc 2820

cttctcaatg agactggcga cgagcccttc caatacaaaa actaaagatc cctatggcta 2880

ttggccaggt tcaatactat gtattggccc tatgccatat agtattccat atatgggttt 2940

tcctattgac gtagatagcc cctcccaatg ggcggtccca tataccatat atggggcttc 3000

ctaataccgc ccatagccac tcccccattg acgtcaatgg tctctatata tggtctttcc 3060

tattgacgtc atatgggcgg tcctattgac gtatatggcg cctcccccat tgacgtcaat 3120

tacggtaaat ggcccgcctg gctcaatgcc cattgacgtc aataggacca cccaccattg 3180

acgtcaatgg gatggctcat tgcccattca tatccgttct cacgccccct attgacgtca 3240

atgacggtaa atggcccact tggcagtaca tcaatatcta ttaatagtaa cttggcaagt 3300

acattactat tggaagtacg ccagggtaca ttggcagtac tcccattgac gtcaatggcg 3360

gtaaatggcc cgcgatggct gccaagtaca tccccattga cgtcaatggg gaggggcaat 3420

gacgcaaatg ggcgttccat tgacgtaaat gggcggtagg cgtgcctaat gggaggtcta 3480

tataagcaat gctcgtttag ggaaccgcca ttctgcctgg ggacgtcgga ggagctcgaa 3540

agcttctaga caattgccgc caccatgatg tcctttgtct ctctgctcct ggttggcatc 3600

ctattccatg ccacccaggc cagtgataca ggtagacctt tcgtagagat gtacagtgaa 3660

atccccgaaa ttatacacat gactgaagga agggagctcg tcattccctg ccgggttacg 3720

tcacctaaca tcactgttac tttaaaaaag tttccacttg acactttgat ccctgatgga 3780

aaacgcataa tctgggacag tagaaagggc ttcatcatat caaatgcaac gtacaaagaa 3840

atagggcttc tgacctgtga agcaacagtc aatgggcatt tgtataagac aaactatctc 3900

acacatcgac aaaccaatac aatcatagat gtcgttctga gtccgtctca tggaattgaa 3960

ctatctgttg gagaaaagct tgtcttaaat tgtacagcaa gaactgaact aaatgtgggg 4020

attgacttca actgggaata cccttcttcg aagcatcagc ataagaaact tgtaaaccga 4080

gacctaaaaa cccagtctgg gagtgagatg aagaagtttt tgagcacctt aactatagat 4140

ggtgtaaccc ggagtgacca aggattgtac acctgtgcag catccagtgg gctgatgacc 4200

aagaaaaaca gcacatttgt cagggtccat gaaaaagaca aaactcacac atgcccaccg 4260

tgcccagcac ctgaactcct ggggggaccc tcagtcttcc tcttcccccc aaaacccaag 4320

gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 4380

gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 4440

acaaagccac gggaggagca gtacaacagc acatatcgtg tggtcagcgt cctcaccgtc 4500

ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 4560

ccagccccca tcgagaaaac catctccaaa gccaaagggc agccccgaga accacaggtg 4620

tacaccctgc ccccatcccg ggatgagctg accaagaacc aggtcagcct gacctgcctg 4680

gtcaaaggct tctatcccag cgacatcgcc gtggagtggg agagcaatgg gcagccggag 4740

aacaactaca agaccacgcc tcccgtgctg gactccgacg gctccttctt cctctacagc 4800

aagctcaccg tggacaagag caggtggcag caggggaacg tcttctcatg ctccgtgatg 4860

catgaggctc tgcacaacca ctacacgcag aagagcctct ccctgtctcc cgggaaatga 4920

tgagatctcg agttcgacat cgataatcaa cctctggatt acaaaatttg tgaaagattg 4980

actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 5040

ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 5100

ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact 5160

gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca gctcctttcc 5220

gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc ctgccttgcc 5280

cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa 5340

tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg cgggacgtcc 5400

ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg cctgctgccg 5460

gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat ctccctttgg 5520

gccgcctccc cgcatcgatg ggggaggcta actgaaacac ggaaggagac aataccggaa 5580

ggaacccgcg ctatgacggc aataaaaaga cagaataaaa cgcacgggtg ttgggtcgtt 5640

tgttcataaa cgcggggttc ggtcccaggg ctggcactct gtcgataccc caccgagacc 5700

ccattggggc caatacgccc gcgtttcttc cttttcccca ccccaccccc caagttcggg 5760

tgaaggccca gggctcgcag ccaacgtcgg ggcggcaggc cctgccatag cggtcgacga 5820

tgtaggtcac ggtctcgaag ccgcggtgcg ggtgccaggg cgtgcccttg ggctccccgg 5880

gcgcgtactc cacctcaccc atctggtcca tcatgatgaa cgggtcgagg tggcggtagt 5940

tgatcccggc gaacgcgcgg cgcaccggga agccctcgcc ctcgaaaccg ctgggcgcgg 6000

tggtcacggt gagcacggga cgtgcgacgg cgtcggcggg tgcggatacg cggggcagcg 6060

tcagcgggtt ctcgacggtc acggcgggca tgatttccac tgtacgcgta gcttggcgta 6120

atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 6180

acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 6240

aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 6300

atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 6360

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 6420

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 6480

aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 6540

ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 6600

aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 6660

gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 6720

tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 6780

tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 6840

gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 6900

cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 6960

cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 7020

agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 7080

caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 7140

ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 7200

aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 7260

tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 7320

agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 7380

gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 7440

accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 7500

tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 7560

tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 7620

acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 7680

atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 7740

aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 7800

tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 7860

agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 7920

gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 7980

ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 8040

atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 8100

tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 8160

tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 8220

tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 8280

cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 8340

ctttcgtc 8348

<210> 5

<211> 7011

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 5

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420

acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480

tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540

gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600

gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660

ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720

acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780

ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840

actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900

ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960

ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020

ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080

acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140

gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200

acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260

tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320

cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380

tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440

atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500

agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560

acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620

acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680

ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740

cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800

ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860

ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920

caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980

cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040

ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100

atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160

attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220

gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280

gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340

gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400

taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460

cgccattctg cctggggacg tcggaggagc tcgaaagctt ctagacaatt gccgccacca 2520

tgatgtcctt tgtctctctg ctcctggttg gcatcctatt ccatgccacc caggccagtg 2580

atacaggtag acctttcgta gagatgtaca gtgaaatccc cgaaattata cacatgactg 2640

aaggaaggga gctcgtcatt ccctgccggg ttacgtcacc taacatcact gttactttaa 2700

aaaagtttcc acttgacact ttgatccctg atggaaaacg cataatctgg gacagtagaa 2760

agggcttcat catatcaaat gcaacgtaca aagaaatagg gcttctgacc tgtgaagcaa 2820

cagtcaatgg gcatttgtat aagacaaact atctcacaca tcgacaaacc aatacaatca 2880

tagatgtcgt tctgagtccg tctcatggaa ttgaactatc tgttggagaa aagcttgtct 2940

taaattgtac agcaagaact gaactaaatg tggggattga cttcaactgg gaataccctt 3000

cttcgaagca tcagcataag aaacttgtaa accgagacct aaaaacccag tctgggagtg 3060

agatgaagaa gtttttgagc accttaacta tagatggtgt aacccggagt gaccaaggat 3120

tgtacacctg tgcagcatcc agtgggctga tgaccaagaa aaacagcaca tttgtcaggg 3180

tccatgaaaa agacaaaact cacacatgcc caccgtgccc agcacctgaa ctcctggggg 3240

gaccctcagt cttcctcttc cccccaaaac ccaaggacac cctcatgatc tcccggaccc 3300

ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga ccctgaggtc aagttcaact 3360

ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa gccacgggag gagcagtaca 3420

acagcacata tcgtgtggtc agcgtcctca ccgtcctgca ccaggactgg ctgaatggca 3480

aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc ccccatcgag aaaaccatct 3540

ccaaagccaa agggcagccc cgagaaccac aggtgtacac cctgccccca tcccgggatg 3600

agctgaccaa gaaccaggtc agcctgacct gcctggtcaa aggcttctat cccagcgaca 3660

tcgccgtgga gtgggagagc aatgggcagc cggagaacaa ctacaagacc acgcctcccg 3720

tgctggactc cgacggctcc ttcttcctct acagcaagct caccgtggac aagagcaggt 3780

ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga ggctctgcac aaccactaca 3840

cgcagaagag cctctccctg tctcccggga aatgatgaga tctcgagttc gacatcgata 3900

atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc 3960

cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta 4020

tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat gaggagttgt 4080

ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca acccccactg 4140

gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc cccctcccta 4200

ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt 4260

tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg 4320

cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct tcggccctca 4380

atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc 4440

gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgcat cgatggggga 4500

ggctaactga aacacggaag gagacaatac cggaaggaac ccgcgctatg acggcaataa 4560

aaagacagaa taaaacgcac gggtgttggg tcgtttgttc ataaacgcgg ggttcggtcc 4620

cagggctggc actctgtcga taccccaccg agaccccatt ggggccaata cgcccgcgtt 4680

tcttcctttt ccccacccca ccccccaagt tcgggtgaag gcccagggct cgcagccaac 4740

gtcggggcgg caggccctgc catagcccta gcagcttggc gtaatcatgg tcatagctgt 4800

ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 4860

agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 4920

tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4980

cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc 5040

gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat 5100

ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca 5160

ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 5220

atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 5280

aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 5340

gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta 5400

ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 5460

ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 5520

acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 5580

gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat 5640

ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 5700

ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 5760

gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 5820

ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct 5880

agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt 5940

ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc 6000

gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac 6060

catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat 6120

cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg 6180

cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata 6240

gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta 6300

tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt 6360

gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag 6420

tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa 6480

gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc 6540

gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt 6600

taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc 6660

tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta 6720

ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa 6780

taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca 6840

tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac 6900

aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa gaaaccatta 6960

ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt c 7011

<210> 6

<211> 5680

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 6

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420

acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480

tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540

gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600

gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660

ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720

acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780

ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840

actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900

ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960

ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020

ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080

acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140

gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200

acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260

tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320

cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380

tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440

atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500

agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560

acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620

acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680

ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740

cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800

ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860

ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920

caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980

cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040

ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100

atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160

attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220

gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280

gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340

gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400

taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460

cgccattctg cctggggacg tcggaggagc tcgaagcggc cgcaagcttc aattgaggcc 2520

tcctaggtta attaagttta aacagatctc tcgagttcga catcgataat caacctctgg 2580

attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat 2640

gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt 2700

tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca 2760

ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg 2820

ccaccacctg tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg 2880

aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca 2940

attccgtggt gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca 3000

cctggattct gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc 3060

ttccttcccg cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc 3120

agacgagtcg gatctccctt tgggccgcct ccccgcatcg atgggggagg ctaactgaaa 3180

cacggaagga gacaataccg gaaggaaccc gcgctatgac ggcaataaaa agacagaata 3240

aaacgcacgg gtgttgggtc gtttgttcat aaacgcgggg ttcggtccca gggctggcac 3300

tctgtcgata ccccaccgag accccattgg ggccaatacg cccgcgtttc ttccttttcc 3360

ccaccccacc ccccaagttc gggtgaaggc ccagggctcg cagccaacgt cggggcggca 3420

ggccctgcca tagccctagc agcttggccg taatcatggt catagctgtt tcctgtgtga 3480

aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc 3540

tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc 3600

cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc 3660

ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 3720

cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 3780

ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 3840

aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 3900

cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 3960

cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 4020

gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 4080

tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 4140

cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 4200

ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 4260

gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc 4320

gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 4380

accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 4440

ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 4500

tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 4560

aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt 4620

taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata 4680

gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc 4740

agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac 4800

cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag 4860

tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac 4920

gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc 4980

agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg 5040

gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc 5100

atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 5160

gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 5220

tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 5280

atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 5340

agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 5400

gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 5460

cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt 5520

tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt 5580

ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca 5640

ttaacctata aaaataggcg tatcacgagg ccctttcgtc 5680

<210> 7

<211> 8085

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 7

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420

acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480

tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540

gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600

gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660

ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720

acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780

ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840

actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900

ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960

ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020

ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080

acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140

gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200

acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260

tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320

cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380

tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440

atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500

agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560

acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620

acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680

ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740

cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800

ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860

ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920

caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980

cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040

ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100

atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160

attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220

gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280

gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340

gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400

taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460

cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccctaggg tttaaacaga 2520

tctatcgata atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac 2580

tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt 2640

gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat 2700

gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca 2760

acccccactg gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc 2820

cccctcccta ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg 2880

gctcggctgt tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct 2940

tggctgctcg cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct 3000

tcggccctca atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt 3060

ccgcgtcttc gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgcat 3120

cgattactaa tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca 3180

cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt 3240

gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 3300

ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg 3360

aattcggacg gtgactgcag tgaataataa aatgtgtgtt tgtccgaaat acgcgttttg 3420

agatttctgt cgccgactaa attcatgtcg cgcgatagtg gtgtttatcg ccgatagaga 3480

tggcgatatt ggaaaaatcg atatttgaaa atatggcata ttgaaaatgt cgccgatgtg 3540

agtttctgtg taactgatat cgccattttt ccaaaagtga tttttgggca tacgcgatat 3600

ctggcgatag cgcttatatc gtttacgggg gatggcgata gacgactttg gtgacttggg 3660

cgattctgtg tgtcgcaaat atcgcagttt cgatataggt gacagacgat atgaggctat 3720

atcgccgata gaggcgacat caagctggca catggccaat gcatatcgat ctatacattg 3780

aatcaatatt ggccattagc catattattc attggttata tagcataaat caatattggc 3840

tattggccat tgcatacgtt gtatccatat cataatatgt acatttatat tggctcatgt 3900

ccaacattac cgccatgttg acattgatta ttgactagtt attaatagta atcaattacg 3960

gggtcattag ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc 4020

ccgcctggct gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc 4080

atagtaacgc caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact 4140

gcccacttgg cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat 4200

gacggtaaat ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact 4260

tggcagtaca tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac 4320

atcaatgggc gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac 4380

gtcaatggga gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac 4440

tccgccccat tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga 4500

gctcgtttag tgaaccgtca gatcgcctgg agacgccatc cacgctgttt tgacctccat 4560

agaagacacc gggaccgatc cagcctccgc ggccgggaac ggtgcattgg aacgcggatt 4620

ccccgtgcca agagtgacgt aagtaccgcc tatagagtct ataggcccac ccccttggct 4680

tcttatgcat gctatactgt ttttggcttg gggtctatac acccccgctt cctcatgtta 4740

taggtgatgg tatagcttag cctataggtg tgggttattg accattattg accactcccc 4800

tattggtgac gatactttcc attactaatc cataacatgg ctctttgcca caactctctt 4860

tattggctat atgccaatac actgtccttc agagactgac acggactctg tatttttaca 4920

ggatggggtc tcatttatta tttacaaatt cacatataca acaccaccgt ccccagtgcc 4980

cgcagttttt attaaacata acgtgggatc tccacgcgaa tctcgggtac gtgttccgga 5040

catgggctct tctccggtag cggcggagct tctacatccg agccctgctc ccatgcctcc 5100

agcgactcat ggtcgctcgg cagctccttg ctcctaacag tggaggccag acttaggcac 5160

agcacgatgc ccaccaccac cagtgtgccg cacaaggccg tggcggtagg gtatgtgtct 5220

gaaaatgagc tcggggagcg ggcttgcacc gctgacgcat ttggaagact taaggcagcg 5280

gcagaagaag atgcaggcag ctgagttgtt gtgttctgat aagagtcaga ggtaactccc 5340

gttgcggtgc tgttaacggt ggagggcagt gtagtctgag cagtactcgt tgctgccgcg 5400

cgcgccacca gacataatag ctgacagact aacagactgt tcctttccat gggtcttttc 5460

tgcagtcacc gtccttgaca cgaagttcga atcaggataa gggcgaattc cgacgtaggc 5520

ctattcgaag tctacttaat taaaagcttt ctagagcctc gagcgatggg ggaggctaac 5580

tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa taaaaagaca 5640

gaataaaacg cacgggtgtt gggtcgtttg ttcataaacg cggggttcgg tcccagggct 5700

ggcactctgt cgatacccca ccgagacccc attggggcca atacgcccgc gtttcttcct 5760

tttccccacc ccacccccca agttcgggtg aaggcccagg gctcgcagcc aacgtcgggg 5820

cggcaggccc tgccatagcc ctagcagctt ggccgtaatc atggtcatag ctgtttcctg 5880

tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 5940

aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 6000

ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 6060

gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6120

tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6180

aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 6240

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6300

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6360

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6420

tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6480

tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6540

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6600

tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6660

ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6720

tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 6780

aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 6840

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 6900

aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 6960

ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 7020

acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 7080

ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 7140

gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 7200

taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7260

tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7320

gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7380

cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7440

aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7500

cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7560

tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7620

gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7680

tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7740

gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 7800

ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 7860

cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 7920

agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 7980

gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 8040

tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 8085

<210> 8

<211> 7683

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 8

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420

acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480

tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540

gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600

gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660

ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720

acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780

ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840

actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900

ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960

ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020

ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080

acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140

gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200

acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260

tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320

cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380

tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440

atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500

agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560

acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620

acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680

ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740

cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800

ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860

ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920

caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980

cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040

ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100

atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160

attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220

gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280

gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340

gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400

taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460

cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccctaggg tttaaacaga 2520

tctatcgata atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac 2580

tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt 2640

gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat 2700

gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca 2760

acccccactg gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc 2820

cccctcccta ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg 2880

gctcggctgt tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct 2940

tggctgctcg cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct 3000

tcggccctca atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt 3060

ccgcgtcttc gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgcat 3120

cgattactaa tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca 3180

cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt 3240

gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 3300

ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg 3360

aattcggacg gtgactgcag tgaataataa aatgtgtgtt tgtccgaaat acgcgttttg 3420

agatttctgt cgccgactaa attcatgtcg cgcgatagtg gtgtttatcg ccgatagaga 3480

tggcgatatt ggaaaaatcg atatttgaaa atatggcata ttgaaaatgt cgccgatgtg 3540

agtttctgtg taactgatat cgccattttt ccaaaagtga tttttgggca tacgcgatat 3600

ctggcgatag cgcttatatc gtttacgggg gatggcgata gacgactttg gtgacttggg 3660

cgattctgtg tgtcgcaaat atcgcagttt cgatataggt gacagacgat atgaggctat 3720

atcgccgata gaggcgacat caagctggca catggccaat gcatatcgat ctatacattg 3780

aatcaatatt ggccattagc catattattc attggttata tagcataaat caatattggc 3840

tattggccat tgcatacgtt gtatccatat cataatatgt acatttatat tggctcatgt 3900

ccaacattac cgccatgttg acattgatta ttgactagtt attaatagta atcaattacg 3960

gggtcattag ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc 4020

ccgcctggct gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc 4080

atagtaacgc caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact 4140

gcccacttgg cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat 4200

gacggtaaat ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact 4260

tggcagtaca tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac 4320

atcaatgggc gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac 4380

gtcaatggga gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac 4440

tccgccccat tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga 4500

gctcgtttag tgaaccggat ccttaaccgt gaaagcttag gccttctaga gcctcgagtt 4560

cgacatcgat aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa 4620

ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat 4680

tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta 4740

tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc 4800

aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt 4860

ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg 4920

ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc 4980

ttggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 5040

ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 5100

tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgca 5160

tcgatggggg aggctaactg aaacacggaa ggagacaata ccggaaggaa cccgcgctat 5220

gacggcaata aaaagacaga ataaaacgca cgggtgttgg gtcgtttgtt cataaacgcg 5280

gggttcggtc ccagggctgg cactctgtcg ataccccacc gagaccccat tggggccaat 5340

acgcccgcgt ttcttccttt tccccacccc accccccaag ttcgggtgaa ggcccagggc 5400

tcgcagccaa cgtcggggcg gcaggccctg ccatagccct agcagcttgg ccgtaatcat 5460

ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 5520

ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 5580

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 5640

tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 5700

ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 5760

taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 5820

agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5880

cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5940

tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 6000

tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 6060

gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 6120

acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 6180

acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 6240

cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 6300

gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 6360

gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 6420

agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 6480

ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 6540

ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 6600

atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 6660

tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 6720

gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 6780

ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 6840

caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6900

cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6960

cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 7020

cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 7080

agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 7140

tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 7200

agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 7260

atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 7320

ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 7380

cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 7440

caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 7500

attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 7560

agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 7620

aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 7680

gtc 7683

<210> 9

<211> 10196

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 9

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420

acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480

tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540

gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600

gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660

ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720

acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780

ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840

actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900

ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960

ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020

ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080

acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140

gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200

acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260

tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320

cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380

tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440

atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500

agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560

acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620

acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680

ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740

cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800

ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860

ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920

caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980

cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040

ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100

atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160

attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220

gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280

gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340

gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400

taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460

cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccgccacc atgatgtcct 2520

ttgtctctct gctcctggtt ggcatcctat tccatgccac ccaggcccag gtgcagctgg 2580

tggagtccgg cggcggcgtc gtgcagcccg gccggtccct gcggctgtcc tgcgccgcct 2640

ccggcttcac cttctcctcc tacaccatgc actgggtgcg gcaggccccc ggcaagggcc 2700

tggagtgggt gactttcatc tcctacgacg gcaacaacaa gtactacgcc gactccgtga 2760

agggccggtt caccatctcc cgcgacaact ccaagaacac cctgtacctg cagatgaact 2820

ccctgcgggc cgaggacacc gccatctact actgcgcccg gaccggctgg ctgggcccct 2880

tcgactactg gggccagggc accctggtga ccgtgtcctc cgcctccacc aagggcccat 2940

cggtcttccc cctggcaccc tctagcaaga gcacctctgg gggcacagcg gccctgggct 3000

gcctggtcaa ggactacttc cccgaaccgg tgacggtgtc gtggaactca ggcgccctga 3060

ccagcggcgt gcacaccttc ccggctgtcc tacagtcctc aggactctac tccctcagca 3120

gcgtggtgac cgtgccctcc agcagcttgg gcacccagac ctacatctgc aacgtgaatc 3180

acaagcccag caacaccaag gtggacaagc gggttgagcc caaatcttgt gacaaaactc 3240

acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc ttcctcttcc 3300

ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca tgcgtggtgg 3360

tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac ggcgtggagg 3420

tgcataatgc caagacaaag ccgcgggagg agcagtacaa cagcacgtac cgtgtggtca 3480

gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggagtacaag tgcaaggtct 3540

ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa gggcagcccc 3600

gagaaccaca ggtgtacacc ctgcctccat cccgcgatga gctgaccaag aaccaggtca 3660

gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag tgggagagca 3720

atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc gacggctcct 3780

tcttcctcta tagcaagctc accgtggaca agagcaggtg gcagcagggg aacgtcttct 3840

catgctccgt gatgcatgag gctctgcaca accactacac gcagaagagc ctctccctgt 3900

ctcctgggaa atgatgagat ctatcgataa tcaacctctg gattacaaaa tttgtgaaag 3960

attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 4020

gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 4080

ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 4140

cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 4200

ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 4260

tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 4320

gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 4380

gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 4440

gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 4500

ttgggccgcc tccccgcatc gattactaat cagccatacc acatttgtag aggttttact 4560

tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt 4620

tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa 4680

tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa 4740

tgtatcttat catgtctgga attcggacgg tgactgcagt gaataataaa atgtgtgttt 4800

gtccgaaata cgcgttttga gatttctgtc gccgactaaa ttcatgtcgc gcgatagtgg 4860

tgtttatcgc cgatagagat ggcgatattg gaaaaatcga tatttgaaaa tatggcatat 4920

tgaaaatgtc gccgatgtga gtttctgtgt aactgatatc gccatttttc caaaagtgat 4980

ttttgggcat acgcgatatc tggcgatagc gcttatatcg tttacggggg atggcgatag 5040

acgactttgg tgacttgggc gattctgtgt gtcgcaaata tcgcagtttc gatataggtg 5100

acagacgata tgaggctata tcgccgatag aggcgacatc aagctggcac atggccaatg 5160

catatcgatc tatacattga atcaatattg gccattagcc atattattca ttggttatat 5220

agcataaatc aatattggct attggccatt gcatacgttg tatccatatc ataatatgta 5280

catttatatt ggctcatgtc caacattacc gccatgttga cattgattat tgactagtta 5340

ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac 5400

ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 5460

aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 5520

ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 5580

gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 5640

cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt 5700

gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac ggggatttcc 5760

aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc aacgggactt 5820

tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg 5880

ggaggtctat ataagcagag ctcgtttagt gaaccgtcag atcgcctgga gacgccatcc 5940

acgctgtttt gacctccata gaagacaccg ggaccgatcc agcctccgcg gccgggaacg 6000

gtgcattgga acgcggattc cccgtgccaa gagtgacgta agtaccgcct atagagtcta 6060

taggcccacc cccttggctt cttatgcatg ctatactgtt tttggcttgg ggtctataca 6120

cccccgcttc ctcatgttat aggtgatggt atagcttagc ctataggtgt gggttattga 6180

ccattattga ccactcccct attggtgacg atactttcca ttactaatcc ataacatggc 6240

tctttgccac aactctcttt attggctata tgccaataca ctgtccttca gagactgaca 6300

cggactctgt atttttacag gatggggtct catttattat ttacaaattc acatatacaa 6360

caccaccgtc cccagtgccc gcagttttta ttaaacataa cgtgggatct ccacgcgaat 6420

ctcgggtacg tgttccggac atgggctctt ctccggtagc ggcggagctt ctacatccga 6480

gccctgctcc catgcctcca gcgactcatg gtcgctcggc agctccttgc tcctaacagt 6540

ggaggccaga cttaggcaca gcacgatgcc caccaccacc agtgtgccgc acaaggccgt 6600

ggcggtaggg tatgtgtctg aaaatgagct cggggagcgg gcttgcaccg ctgacgcatt 6660

tggaagactt aaggcagcgg cagaagaaga tgcaggcagc tgagttgttg tgttctgata 6720

agagtcagag gtaactcccg ttgcggtgct gttaacggtg gagggcagtg tagtctgagc 6780

agtactcgtt gctgccgcgc gcgccaccag acataatagc tgacagacta acagactgtt 6840

cctttccatg ggtcttttct gcagtcaccg tccttgacac gaagttcgaa tcaggataag 6900

ggcgaattcc gacgtaggcc tattcgaagt ctacttaatt aaaagcttgc cgccaccatg 6960

atgtcctttg tctctctgct cctggttggc atcctattcc atgccaccca ggccgagatc 7020

gtgctgaccc agtcccccgg caccctgtcc ctgtcccccg gcgagcgggc caccctgtcc 7080

tgccgggcct cccagtccgt gggctcctcc tacctggcct ggtaccagca gaagcccggc 7140

caggcccccc ggctgctgat ctacggcgcc ttctcccgcg ccaccggcat ccccgaccgg 7200

ttctccggct ccggctccgg caccgacttc accctgacca tctcccggct ggagcccgag 7260

gacttcgccg tgtactactg ccagcagtac ggctcctccc cctggacctt cggccagggc 7320

accaaggtgg agatcaagcg aactgtggct gcaccatctg tcttcatctt cccgccatct 7380

gatgagcagc ttaagtccgg aactgctagc gttgtgtgcc tgctgaataa cttctatccc 7440

agagaggcca aagtacagtg gaaggtggat aacgccctcc aatcgggtaa ctcccaggag 7500

agtgtcacag agcaggacag caaggacagc acctacagcc tcagcagcac cctgacgctg 7560

agcaaagcag actacgagaa acacaaagtc tacgcctgcg aagtcaccca tcagggcctg 7620

agctcgcccg tcacaaagag cttcaacagg ggagagtgtt agtgagatct cgagcgatgg 7680

gggaggctaa ctgaaacacg gaaggagaca ataccggaag gaacccgcgc tatgacggca 7740

ataaaaagac agaataaaac gcacgggtgt tgggtcgttt gttcataaac gcggggttcg 7800

gtcccagggc tggcactctg tcgatacccc accgagaccc cattggggcc aatacgcccg 7860

cgtttcttcc ttttccccac cccacccccc aagttcgggt gaaggcccag ggctcgcagc 7920

caacgtcggg gcggcaggcc ctgccatagc cctagcagct tggccgtaat catggtcata 7980

gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 8040

cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 8100

ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 8160

acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 8220

gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 8280

gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 8340

ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 8400

cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 8460

ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 8520

taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 8580

ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 8640

ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 8700

aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 8760

tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 8820

agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 8880

ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 8940

tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 9000

tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 9060

cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 9120

aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 9180

atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 9240

cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 9300

tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 9360

atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 9420

taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 9480

tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 9540

gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 9600

cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 9660

cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 9720

gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 9780

aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 9840

accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 9900

ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 9960

gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 10020

aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 10080

taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac 10140

cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtc 10196

<210> 10

<211> 10196

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 10

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420

acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480

tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540

gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600

gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660

ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720

acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780

ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840

actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900

ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960

ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020

ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080

acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140

gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200

acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260

tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320

cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380

tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440

atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500

agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560

acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620

acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680

ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740

cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800

ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860

ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920

caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980

cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040

ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100

atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160

attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220

gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280

gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340

gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400

taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460

cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccgccacc atgatgtcct 2520

ttgtctctct gctcctggtt ggcatcctat tccatgccac ccaggccgag atcgtgctga 2580

cccagtcccc cggcaccctg tccctgtccc ccggcgagcg ggccaccctg tcctgccggg 2640

cctcccagtc cgtgggctcc tcctacctgg cctggtacca gcagaagccc ggccaggccc 2700

cccggctgct gatctacggc gccttctccc gcgccaccgg catccccgac cggttctccg 2760

gctccggctc cggcaccgac ttcaccctga ccatctcccg gctggagccc gaggacttcg 2820

ccgtgtacta ctgccagcag tacggctcct ccccctggac cttcggccag ggcaccaagg 2880

tggagatcaa gcgaactgtg gctgcaccat ctgtcttcat cttcccgcca tctgatgagc 2940

agcttaagtc cggaactgct agcgttgtgt gcctgctgaa taacttctat cccagagagg 3000

ccaaagtaca gtggaaggtg gataacgccc tccaatcggg taactcccag gagagtgtca 3060

cagagcagga cagcaaggac agcacctaca gcctcagcag caccctgacg ctgagcaaag 3120

cagactacga gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc 3180

ccgtcacaaa gagcttcaac aggggagagt gttagtgaga tctatcgata atcaacctct 3240

ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct 3300

atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat 3360

tttctcctcc ttgtataaat cctggttgct gtctctttat gaggagttgt ggcccgttgt 3420

caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca acccccactg gttggggcat 3480

tgccaccacc tgtcagctcc tttccgggac tttcgctttc cccctcccta ttgccacggc 3540

ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga 3600

caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc 3660

cacctggatt ctgcgcggga cgtccttctg ctacgtccct tcggccctca atccagcgga 3720

ccttccttcc cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc gccttcgccc 3780

tcagacgagt cggatctccc tttgggccgc ctccccgcat cgattactaa tcagccatac 3840

cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc tgaacctgaa 3900

acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa 3960

ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 4020

tggtttgtcc aaactcatca atgtatctta tcatgtctgg aattcggacg gtgactgcag 4080

tgaataataa aatgtgtgtt tgtccgaaat acgcgttttg agatttctgt cgccgactaa 4140

attcatgtcg cgcgatagtg gtgtttatcg ccgatagaga tggcgatatt ggaaaaatcg 4200

atatttgaaa atatggcata ttgaaaatgt cgccgatgtg agtttctgtg taactgatat 4260

cgccattttt ccaaaagtga tttttgggca tacgcgatat ctggcgatag cgcttatatc 4320

gtttacgggg gatggcgata gacgactttg gtgacttggg cgattctgtg tgtcgcaaat 4380

atcgcagttt cgatataggt gacagacgat atgaggctat atcgccgata gaggcgacat 4440

caagctggca catggccaat gcatatcgat ctatacattg aatcaatatt ggccattagc 4500

catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt 4560

gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 4620

acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 4680

atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 4740

cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 4800

tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 4860

agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 4920

gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 4980

agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 5040

gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 5100

gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 5160

gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccgtca 5220

gatcgcctgg agacgccatc cacgctgttt tgacctccat agaagacacc gggaccgatc 5280

cagcctccgc ggccgggaac ggtgcattgg aacgcggatt ccccgtgcca agagtgacgt 5340

aagtaccgcc tatagagtct ataggcccac ccccttggct tcttatgcat gctatactgt 5400

ttttggcttg gggtctatac acccccgctt cctcatgtta taggtgatgg tatagcttag 5460

cctataggtg tgggttattg accattattg accactcccc tattggtgac gatactttcc 5520

attactaatc cataacatgg ctctttgcca caactctctt tattggctat atgccaatac 5580

actgtccttc agagactgac acggactctg tatttttaca ggatggggtc tcatttatta 5640

tttacaaatt cacatataca acaccaccgt ccccagtgcc cgcagttttt attaaacata 5700

acgtgggatc tccacgcgaa tctcgggtac gtgttccgga catgggctct tctccggtag 5760

cggcggagct tctacatccg agccctgctc ccatgcctcc agcgactcat ggtcgctcgg 5820

cagctccttg ctcctaacag tggaggccag acttaggcac agcacgatgc ccaccaccac 5880

cagtgtgccg cacaaggccg tggcggtagg gtatgtgtct gaaaatgagc tcggggagcg 5940

ggcttgcacc gctgacgcat ttggaagact taaggcagcg gcagaagaag atgcaggcag 6000

ctgagttgtt gtgttctgat aagagtcaga ggtaactccc gttgcggtgc tgttaacggt 6060

ggagggcagt gtagtctgag cagtactcgt tgctgccgcg cgcgccacca gacataatag 6120

ctgacagact aacagactgt tcctttccat gggtcttttc tgcagtcacc gtccttgaca 6180

cgaagttcga atcaggataa gggcgaattc cgacgtaggc ctattcgaag tctacttaat 6240

taaaagcttg ccgccaccat gatgtccttt gtctctctgc tcctggttgg catcctattc 6300

catgccaccc aggcccaggt gcagctggtg gagtccggcg gcggcgtcgt gcagcccggc 6360

cggtccctgc ggctgtcctg cgccgcctcc ggcttcacct tctcctccta caccatgcac 6420

tgggtgcggc aggcccccgg caagggcctg gagtgggtga ctttcatctc ctacgacggc 6480

aacaacaagt actacgccga ctccgtgaag ggccggttca ccatctcccg cgacaactcc 6540

aagaacaccc tgtacctgca gatgaactcc ctgcgggccg aggacaccgc catctactac 6600

tgcgcccgga ccggctggct gggccccttc gactactggg gccagggcac cctggtgacc 6660

gtgtcctccg cctccaccaa gggcccatcg gtcttccccc tggcaccctc tagcaagagc 6720

acctctgggg gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg 6780

acggtgtcgt ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta 6840

cagtcctcag gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc 6900

acccagacct acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagcgg 6960

gttgagccca aatcttgtga caaaactcac acatgcccac cgtgcccagc acctgaactc 7020

ctggggggac cgtcagtctt cctcttcccc ccaaaaccca aggacaccct catgatctcc 7080

cggacccctg aggtcacatg cgtggtggtg gacgtgagcc acgaagaccc tgaggtcaag 7140

ttcaactggt acgtggacgg cgtggaggtg cataatgcca agacaaagcc gcgggaggag 7200

cagtacaaca gcacgtaccg tgtggtcagc gtcctcaccg tcctgcacca ggactggctg 7260

aatggcaagg agtacaagtg caaggtctcc aacaaagccc tcccagcccc catcgagaaa 7320

accatctcca aagccaaagg gcagccccga gaaccacagg tgtacaccct gcctccatcc 7380

cgcgatgagc tgaccaagaa ccaggtcagc ctgacctgcc tggtcaaagg cttctatccc 7440

agcgacatcg ccgtggagtg ggagagcaat gggcagccgg agaacaacta caagaccacg 7500

cctcccgtgc tggactccga cggctccttc ttcctctata gcaagctcac cgtggacaag 7560

agcaggtggc agcaggggaa cgtcttctca tgctccgtga tgcatgaggc tctgcacaac 7620

cactacacgc agaagagcct ctccctgtct cctgggaaat gatgagatct cgagcgatgg 7680

gggaggctaa ctgaaacacg gaaggagaca ataccggaag gaacccgcgc tatgacggca 7740

ataaaaagac agaataaaac gcacgggtgt tgggtcgttt gttcataaac gcggggttcg 7800

gtcccagggc tggcactctg tcgatacccc accgagaccc cattggggcc aatacgcccg 7860

cgtttcttcc ttttccccac cccacccccc aagttcgggt gaaggcccag ggctcgcagc 7920

caacgtcggg gcggcaggcc ctgccatagc cctagcagct tggccgtaat catggtcata 7980

gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 8040

cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 8100

ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 8160

acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 8220

gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 8280

gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 8340

ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 8400

cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 8460

ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 8520

taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 8580

ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 8640

ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 8700

aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 8760

tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 8820

agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 8880

ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 8940

tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 9000

tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 9060

cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 9120

aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 9180

atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 9240

cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 9300

tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 9360

atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 9420

taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 9480

tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 9540

gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 9600

cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 9660

cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 9720

gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 9780

aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 9840

accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 9900

ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 9960

gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 10020

aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 10080

taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac 10140

cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtc 10196

<210> 11

<211> 9778

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 11

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420

acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480

tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540

gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600

gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660

ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720

acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780

ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840

actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900

ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960

ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020

ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080

acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140

gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200

acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260

tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320

cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380

tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440

atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500

agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560

acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620

acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680

ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740

cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800

ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860

ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920

caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980

cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040

ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100

atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160

attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220

gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280

gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340

gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400

taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460

cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccgccacc atgatgtcct 2520

ttgtctctct gctcctggtt ggcatcctat tccatgccac ccaggcccag gtgcagctgg 2580

tggagtccgg cggcggcgtc gtgcagcccg gccggtccct gcggctgtcc tgcgccgcct 2640

ccggcttcac cttctcctcc tacaccatgc actgggtgcg gcaggccccc ggcaagggcc 2700

tggagtgggt gactttcatc tcctacgacg gcaacaacaa gtactacgcc gactccgtga 2760

agggccggtt caccatctcc cgcgacaact ccaagaacac cctgtacctg cagatgaact 2820

ccctgcgggc cgaggacacc gccatctact actgcgcccg gaccggctgg ctgggcccct 2880

tcgactactg gggccagggc accctggtga ccgtgtcctc cgcctccacc aagggcccat 2940

cggtcttccc cctggcaccc tctagcaaga gcacctctgg gggcacagcg gccctgggct 3000

gcctggtcaa ggactacttc cccgaaccgg tgacggtgtc gtggaactca ggcgccctga 3060

ccagcggcgt gcacaccttc ccggctgtcc tacagtcctc aggactctac tccctcagca 3120

gcgtggtgac cgtgccctcc agcagcttgg gcacccagac ctacatctgc aacgtgaatc 3180

acaagcccag caacaccaag gtggacaagc gggttgagcc caaatcttgt gacaaaactc 3240

acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc ttcctcttcc 3300

ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca tgcgtggtgg 3360

tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac ggcgtggagg 3420

tgcataatgc caagacaaag ccgcgggagg agcagtacaa cagcacgtac cgtgtggtca 3480

gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggagtacaag tgcaaggtct 3540

ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa gggcagcccc 3600

gagaaccaca ggtgtacacc ctgcctccat cccgcgatga gctgaccaag aaccaggtca 3660

gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag tgggagagca 3720

atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc gacggctcct 3780

tcttcctcta tagcaagctc accgtggaca agagcaggtg gcagcagggg aacgtcttct 3840

catgctccgt gatgcatgag gctctgcaca accactacac gcagaagagc ctctccctgt 3900

ctcctgggaa atgatgagat ctatcgataa tcaacctctg gattacaaaa tttgtgaaag 3960

attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 4020

gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 4080

ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 4140

cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 4200

ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 4260

tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 4320

gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 4380

gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 4440

gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 4500

ttgggccgcc tccccgcatc gattactaat cagccatacc acatttgtag aggttttact 4560

tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt 4620

tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa 4680

tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa 4740

tgtatcttat catgtctgga attcggacgg tgactgcagt gaataataaa atgtgtgttt 4800

gtccgaaata cgcgttttga gatttctgtc gccgactaaa ttcatgtcgc gcgatagtgg 4860

tgtttatcgc cgatagagat ggcgatattg gaaaaatcga tatttgaaaa tatggcatat 4920

tgaaaatgtc gccgatgtga gtttctgtgt aactgatatc gccatttttc caaaagtgat 4980

ttttgggcat acgcgatatc tggcgatagc gcttatatcg tttacggggg atggcgatag 5040

acgactttgg tgacttgggc gattctgtgt gtcgcaaata tcgcagtttc gatataggtg 5100

acagacgata tgaggctata tcgccgatag aggcgacatc aagctggcac atggccaatg 5160

catatcgatc tatacattga atcaatattg gccattagcc atattattca ttggttatat 5220

agcataaatc aatattggct attggccatt gcatacgttg tatccatatc ataatatgta 5280

catttatatt ggctcatgtc caacattacc gccatgttga cattgattat tgactagtta 5340

ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac 5400

ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 5460

aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 5520

ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 5580

gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 5640

cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt 5700

gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac ggggatttcc 5760

aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc aacgggactt 5820

tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg 5880

ggaggtctat ataagcagag ctcgtttagt gaaccggatc cttaaccgtg aaagcttgcc 5940

gccaccatga tgtcctttgt ctctctgctc ctggttggca tcctattcca tgccacccag 6000

gccgagatcg tgctgaccca gtcccccggc accctgtccc tgtcccccgg cgagcgggcc 6060

accctgtcct gccgggcctc ccagtccgtg ggctcctcct acctggcctg gtaccagcag 6120

aagcccggcc aggccccccg gctgctgatc tacggcgcct tctcccgcgc caccggcatc 6180

cccgaccggt tctccggctc cggctccggc accgacttca ccctgaccat ctcccggctg 6240

gagcccgagg acttcgccgt gtactactgc cagcagtacg gctcctcccc ctggaccttc 6300

ggccagggca ccaaggtgga gatcaagcga actgtggctg caccatctgt cttcatcttc 6360

ccgccatctg atgagcagct taagtccgga actgctagcg ttgtgtgcct gctgaataac 6420

ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca atcgggtaac 6480

tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct cagcagcacc 6540

ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga agtcacccat 6600

cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta gtgagatctc 6660

gagttcgaca tcgataatca acctctggat tacaaaattt gtgaaagatt gactggtatt 6720

cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat 6780

gctattgctt cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct 6840

ctttatgagg agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct 6900

gacgcaaccc ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc 6960

gctttccccc tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg 7020

acaggggctc ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc 7080

tttccttggc tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac 7140

gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg 7200

cctcttccgc gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc 7260

ccgcatcgat gggggaggct aactgaaaca cggaaggaga caataccgga aggaacccgc 7320

gctatgacgg caataaaaag acagaataaa acgcacgggt gttgggtcgt ttgttcataa 7380

acgcggggtt cggtcccagg gctggcactc tgtcgatacc ccaccgagac cccattgggg 7440

ccaatacgcc cgcgtttctt ccttttcccc accccacccc ccaagttcgg gtgaaggccc 7500

agggctcgca gccaacgtcg gggcggcagg ccctgccata gccctagcag cttggccgta 7560

atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 7620

acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 7680

aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 7740

atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 7800

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 7860

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 7920

aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 7980

ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8040

aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 8100

gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 8160

tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 8220

tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 8280

gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 8340

cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 8400

cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 8460

agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 8520

caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 8580

ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 8640

aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga caatctaaag tatatatgag 8700

taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 8760

ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 8820

ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 8880

gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 8940

ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 9000

gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 9060

tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 9120

atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 9180

gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 9240

tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 9300

atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 9360

agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 9420

ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 9480

tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 9540

aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 9600

tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 9660

aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 9720

accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtc 9778

<210> 12

<211> 9788

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетическая

<400> 12

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgggat ccccgtcgac gatgtaggtc 420

acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac 480

tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta gttgatcccg 540

gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc ggtggtcacg 600

gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag cgtcagcggg 660

ttctcgacgg tcacggcggg catgtcgacc cttccaccat ggccacctca gcaagttccc 720

acttgaacaa aaacatcaag caaatgtact tgtgcctgcc ccagggtgag aaagtccaag 780

ccatgtatat ctgggttgat ggtactggag aaggactgcg ctgcaaaacc cgcaccctgg 840

actgtgagcc caagtgtgta gaagagttac ctgagtggaa ttttgatggc tctagtacct 900

ttcagtctga gggctccaac agtgacatgt atctcagccc tgttgccatg tttcgggacc 960

ccttccgcag agatcccaac aagctggtgt tctgtgaagt tttcaagtac aaccggaagc 1020

ctgcagagac caatttaagg cactcgtgta aacggataat ggacatggtg agcaaccagc 1080

acccctggtt tggaatggaa caggagtata ctctgatggg aacagatggg cacccttttg 1140

gttggccttc caatggcttt cctgggcccc aaggtccgta ttactgtggt gtgggcgcag 1200

acaaagccta tggcagggat atcgtggagg ctcactaccg cgcctgcttg tatgctgggg 1260

tcaagattac aggaacaaat gctgaggtca tgcctgccca gtgggagttc caaataggac 1320

cctgtgaagg aatccgcatg ggagatcatc tctgggtggc ccgtttcatc ttgcatcgag 1380

tatgtgaaga ctttggggta atagcaacct ttgaccccaa gcccattcct gggaactgga 1440

atggtgcagg ctgccatacc aactttagca ccaaggccat gcgggaggag aatggtctga 1500

agcacatcga ggaggccatc gagaaactaa gcaagcggca ccggtaccac attcgagcct 1560

acgatcccaa ggggggcctg gacaatgccc gtcgtctgac tgggttccac gaaacgtcca 1620

acatcaacga cttttctgct ggtgtcgcca atcgcagtgc cagcatccgc attccccgga 1680

ctgtcggcca ggagaagaaa ggttactttg aagaccgccg cccctctgcc aactgtgacc 1740

cctttgcagt gacagaagcc atcgtccgca catgccttct caatgagact ggcgacgagc 1800

ccttccaata caaaaactaa agatccctat ggctattggc caggttcaat actatgtatt 1860

ggccctatgc catatagtat tccatatatg ggttttccta ttgacgtaga tagcccctcc 1920

caatgggcgg tcccatatac catatatggg gcttcctaat accgcccata gccactcccc 1980

cattgacgtc aatggtctct atatatggtc tttcctattg acgtcatatg ggcggtccta 2040

ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc gcctggctca 2100

atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg ctcattgccc 2160

attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc ccacttggca 2220

gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa gtacgccagg 2280

gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga tggctgccaa 2340

gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt tccattgacg 2400

taaatgggcg gtaggcgtgc ctaatgggag gtctatataa gcaatgctcg tttagggaac 2460

cgccattctg cctggggacg tcggaggagc tcgaagcggc cgccgccacc atgatgtcct 2520

ttgtctctct gctcctggtt ggcatcctat tccatgccac ccaggccgag atcgtgctga 2580

cccagtcccc cggcaccctg tccctgtccc ccggcgagcg ggccaccctg tcctgccggg 2640

cctcccagtc cgtgggctcc tcctacctgg cctggtacca gcagaagccc ggccaggccc 2700

cccggctgct gatctacggc gccttctccc gcgccaccgg catccccgac cggttctccg 2760

gctccggctc cggcaccgac ttcaccctga ccatctcccg gctggagccc gaggacttcg 2820

ccgtgtacta ctgccagcag tacggctcct ccccctggac cttcggccag ggcaccaagg 2880

tggagatcaa gcgaactgtg gctgcaccat ctgtcttcat cttcccgcca tctgatgagc 2940

agcttaagtc cggaactgct agcgttgtgt gcctgctgaa taacttctat cccagagagg 3000

ccaaagtaca gtggaaggtg gataacgccc tccaatcggg taactcccag gagagtgtca 3060

cagagcagga cagcaaggac agcacctaca gcctcagcag caccctgacg ctgagcaaag 3120

cagactacga gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc 3180

ccgtcacaaa gagcttcaac aggggagagt gttagtgaga tctatcgata atcaacctct 3240

ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct 3300

atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat 3360

tttctcctcc ttgtataaat cctggttgct gtctctttat gaggagttgt ggcccgttgt 3420

caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca acccccactg gttggggcat 3480

tgccaccacc tgtcagctcc tttccgggac tttcgctttc cccctcccta ttgccacggc 3540

ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga 3600

caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc 3660

cacctggatt ctgcgcggga cgtccttctg ctacgtccct tcggccctca atccagcgga 3720

ccttccttcc cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc gccttcgccc 3780

tcagacgagt cggatctccc tttgggccgc ctccccgcat cgattactaa tcagccatac 3840

cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc tgaacctgaa 3900

acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa 3960

ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 4020

tggtttgtcc aaactcatca atgtatctta tcatgtctgg aattcggacg gtgactgcag 4080

tgaataataa aatgtgtgtt tgtccgaaat acgcgttttg agatttctgt cgccgactaa 4140

attcatgtcg cgcgatagtg gtgtttatcg ccgatagaga tggcgatatt ggaaaaatcg 4200

atatttgaaa atatggcata ttgaaaatgt cgccgatgtg agtttctgtg taactgatat 4260

cgccattttt ccaaaagtga tttttgggca tacgcgatat ctggcgatag cgcttatatc 4320

gtttacgggg gatggcgata gacgactttg gtgacttggg cgattctgtg tgtcgcaaat 4380

atcgcagttt cgatataggt gacagacgat atgaggctat atcgccgata gaggcgacat 4440

caagctggca catggccaat gcatatcgat ctatacattg aatcaatatt ggccattagc 4500

catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt 4560

gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 4620

acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 4680

atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 4740

cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 4800

tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 4860

agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 4920

gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 4980

agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 5040

gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 5100

gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 5160

gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccggat 5220

ccttaaccgt gaaagcttgc cgccaccatg atgtcctttg tctctctgct cctggttggc 5280

atcctattcc atgccaccca ggcccaggtg cagctggtgg agtccggcgg cggcgtcgtg 5340

cagcccggcc ggtccctgcg gctgtcctgc gccgcctccg gcttcacctt ctcctcctac 5400

accatgcact gggtgcggca ggcccccggc aagggcctgg agtgggtgac tttcatctcc 5460

tacgacggca acaacaagta ctacgccgac tccgtgaagg gccggttcac catctcccgc 5520

gacaactcca agaacaccct gtacctgcag atgaactccc tgcgggccga ggacaccgcc 5580

atctactact gcgcccggac cggctggctg ggccccttcg actactgggg ccagggcacc 5640

ctggtgaccg tgtcctccgc ctccaccaag ggcccatcgg tcttccccct ggcaccctct 5700

agcaagagca cctctggggg cacagcggcc ctgggctgcc tggtcaagga ctacttcccc 5760

gaaccggtga cggtgtcgtg gaactcaggc gccctgacca gcggcgtgca caccttcccg 5820

gctgtcctac agtcctcagg actctactcc ctcagcagcg tggtgaccgt gccctccagc 5880

agcttgggca cccagaccta catctgcaac gtgaatcaca agcccagcaa caccaaggtg 5940

gacaagcggg ttgagcccaa atcttgtgac aaaactcaca catgcccacc gtgcccagca 6000

cctgaactcc tggggggacc gtcagtcttc ctcttccccc caaaacccaa ggacaccctc 6060

atgatctccc ggacccctga ggtcacatgc gtggtggtgg acgtgagcca cgaagaccct 6120

gaggtcaagt tcaactggta cgtggacggc gtggaggtgc ataatgccaa gacaaagccg 6180

cgggaggagc agtacaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 6240

gactggctga atggcaagga gtacaagtgc aaggtctcca acaaagccct cccagccccc 6300

atcgagaaaa ccatctccaa agccaaaggg cagccccgag aaccacaggt gtacaccctg 6360

cctccatccc gcgatgagct gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 6420

ttctatccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 6480

aagaccacgc ctcccgtgct ggactccgac ggctccttct tcctctatag caagctcacc 6540

gtggacaaga gcaggtggca gcaggggaac gtcttctcat gctccgtgat gcatgaggct 6600

ctgcacaacc actacacgca gaagagcctc tccctgtctc ctgggaaatg atgagatctc 6660

gagttcgaca tcgataatca acctctggat tacaaaattt gtgaaagatt gactggtatt 6720

cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat 6780

gctattgctt cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct 6840

ctttatgagg agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct 6900

gacgcaaccc ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc 6960

gctttccccc tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg 7020

acaggggctc ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc 7080

tttccttggc tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac 7140

gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg 7200

cctcttccgc gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc 7260

ccgcatcgat gggggaggct aactgaaaca cggaaggaga caataccgga aggaacccgc 7320

gctatgacgg caataaaaag acagaataaa acgcacgggt gttgggtcgt ttgttcataa 7380

acgcggggtt cggtcccagg gctggcactc tgtcgatacc ccaccgagac cccattgggg 7440

ccaatacgcc cgcgtttctt ccttttcccc accccacccc ccaagttcgg gtgaaggccc 7500

agggctcgca gccaacgtcg gggcggcagg ccctgccata gccctagcag cttggccgta 7560

atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 7620

acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 7680

aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 7740

atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 7800

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 7860

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 7920

aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 7980

ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8040

aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 8100

gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 8160

tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 8220

tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 8280

gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 8340

cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 8400

cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 8460

agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 8520

caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 8580

ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 8640

aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 8700

tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 8760

agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 8820

gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 8880

accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 8940

tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 9000

tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 9060

acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 9120

atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 9180

aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 9240

tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 9300

agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 9360

gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 9420

ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 9480

atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 9540

tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 9600

tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 9660

tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 9720

cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 9780

ctttcgtc 9788

<---

Похожие патенты RU2840923C1

название год авторы номер документа
ВЕКТОРЫ ДЛЯ ПРОИЗВОДСТВА БЕЛКОВ 2019
  • Блек, Грегори Т.
  • Кравиц, Рейчел Х.
  • Холл, Чад А.
RU2820218C2
ВЕКТОРНАЯ СИСТЕМА НА ОСНОВЕ ASLV 2010
  • Аксель Шамбах
  • Кристофер Баум
  • Юлия Дебора Зюрт
RU2566563C2
НУКЛЕАЗА PaCas9 2018
  • Мадера Дмитрий Александрович
  • Карабельский Александр Владимирович
  • Иванов Роман Алексеевич
  • Морозов Дмитрий Валентинович
  • Северинов Константин Викторович
  • Шмаков Сергей Анатольевич
  • Сутормин Дмитрий Александрович
  • Побегалов Георгий Евгеньевич
  • Васильева Александра Андреевна
  • Селькова Полина Анатольевна
  • Арсениев Анатолий Николаевич
  • Зюбко Татьяна Игоревна
  • Федорова Яна Витальевна
RU2706298C1
ГЕННОЕ РЕДАКТИРОВАНИЕ ГЛУБОКИХ ИНТРОННЫХ МУТАЦИЙ 2016
  • Жуань, Госян
  • Скариа, Абрахам
RU2759335C2
РЕДАКТИРОВАНИЕ ГЕНОВ С ИСПОЛЬЗОВАНИЕМ МОДИФИЦИРОВАННОЙ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК) 2018
  • Котин, Роберт Майкл
  • Керр, Дуглас
  • Самайоа, Филлип
  • Алкан, Озан
  • Симмонс, Мэттью Дж.
RU2811724C2
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ЛЕЧЕНИЯ БОЛЕЗНИ ФАБРИ 2017
  • Хастон, Маршалл У.
RU2788133C2
Нуклеиновая кислота, имеющая промоторную активность, и ее применение 2022
  • Власова Елена Вениаминовна
  • Стрелкова Анна Николаевна
  • Тыщук Константин Ильич
  • Гершович Павел Михайлович
  • Перепелкина Мария Павловна
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2818112C2
КОМПОНЕНТЫ СИСТЕМЫ CRISPR-CAS, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ 2013
  • Чжан Фэн
  • Бикард Девид Оливье
  • Цун Лэ
  • Кокс Девид Бенджамин Туриц
  • Хсю Патрик
  • Цзян Вэньянь
  • Линь Шауйлян
  • Марраффини Лучано
  • Платт Рэндол Джеффри
  • Жань Фэй
  • Санджана Невилл Эспи
RU2701662C2
МУТАЦИИ ФЕРМЕНТА CRISPR, УМЕНЬШАЮЩИЕ НЕЦЕЛЕВЫЕ ЭФФЕКТЫ 2016
  • Чжан Фэн
  • Гао Лини
  • Цетче Бернд
  • Слеймейкер Йан
RU2752834C2
ДОСТАВКА И ПРИМЕНЕНИЕ СИСТЕМ CRISPR-CAS, ВЕКТОРОВ И КОМПОЗИЦИЙ ДЛЯ ЦЕЛЕНАПРАВЛЕННОГО ВОЗДЕЙСТВИЯ И ТЕРАПИИ В ПЕЧЕНИ 2014
  • Чжан Фэн
  • Цун Лэ
  • Жань Фэй
RU2716420C2

Иллюстрации к изобретению RU 2 840 923 C1

Реферат патента 2025 года КОНСТРУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ ДЛЯ ПОЛУЧЕНИЯ БЕЛКОВ

Изобретение относится к биотехнологии и молекулярной биологии, в частности к конструкциям нуклеиновых кислот, и их применению для разработки линий клеток-хозяев для получения целевого белка. Конструкции по настоящему изобретению обеспечивают улучшенную селекцию для разработки высокопродуктивных линий клеток. 4 н. и 10 з.п. ф-лы, 41 ил., 7 пр.

Формула изобретения RU 2 840 923 C1

1. Конструкция нуклеиновой кислоты для экспрессии целевого белка, содержащая следующие функционально связанные элементы по порядку от 5'- до 3'-конца:

необязательно, первую промоторную последовательность;

последовательность селектируемого маркера, которая функционально связана с указанной первой промоторной последовательностью в случае её присутствия;

вторую промоторную последовательность;

последовательность нуклеиновой кислоты, кодирующую целевой белок, которая функционально связана с указанной второй промоторной последовательностью; и

сигнальную последовательность поли(А);

при этом указанная конструкция нуклеиновой кислоты дополнительно содержит по меньшей мере один инсерционный элемент, выбранный из группы, состоящей из управляемого транспозоном инсерционного элемента и управляемого рекомбиназой инсерционного элемента, в положении или положениях, выбранных из группы, состоящей из 5'-конца относительно указанной необязательной первой промоторной последовательности или указанной последовательности селектируемого маркера, 3'-конца относительно указанной сигнальной последовательности поли(А), положения между указанной необязательной первой промоторной последовательностью и указанной сигнальной последовательностью поли(А), положения между указанной последовательностью селектируемого маркера и указанной второй промоторной последовательностью, и одновременно 5'-конца относительно указанной необязательной первой промоторной последовательности или указанной последовательности селектируемого маркера и 3'-конца относительно указанной сигнальной последовательности поли(А).

2. Конструкция нуклеиновой кислоты по п. 1, отличающаяся тем, что указанная конструкция нуклеиновой кислоты не содержит сигнальной последовательности поли(А) между указанным селектируемым маркером и указанным вторым промотором.

3. Конструкция нуклеиновой кислоты по любому из пп. 1-2, отличающаяся тем, что указанный селектируемый маркер примыкает к указанному второму промотору.

4. Конструкция нуклеиновой кислоты по любому из пп. 1-3, отличающаяся тем, что указанный второй промотор примыкает к последовательности нуклеиновой кислоты, кодирующей указанный первый целевой белок.

5. Конструкция нуклеиновой кислоты по любому из пп. 1-4, отличающаяся тем, что указанная конструкция нуклеиновой кислоты содержит расширенную область упаковки (EPR) между указанным первым промотором и указанным селектируемым маркером, при этом предпочтительно указанная EPR содержит несколько потенциальных последовательностей Козак и/или сайтов начала трансляции ATG.

6. Конструкция нуклеиновой кислоты по любому из пп. 1-5, отличающаяся тем, что указанная первая промоторная последовательность представляет собой последовательность слабого промотора, при этом предпочтительно указанная первая промоторная последовательность выбрана из группы, состоящей из промоторных последовательностей SIN-LTR, SV40, lac E. coli, trp E. coli, PL фага лямбда, PR фага лямбда, T3, T7, немедленно-раннего промотора цитомегаловируса (CMV), тимидинкиназы вируса простого герпеса (HSV), альфа-лактальбумина, фактора элонгации 1 альфа человека (hEF1 альфа) и металлотионеина-I мыши.

7. Конструкция нуклеиновой кислоты по любому из пп. 1-6, отличающаяся тем, что указанная последовательность селектируемого маркера представляет собой амплифицируемую последовательность селектируемого маркера, выбранную из группы, состоящей из последовательности глутаминсинтетазы (GS) и последовательности дигидрофолатредуктазы (DHFR), при этом предпочтительно указанная последовательность селектируемого маркера представляет собой последовательность маркера устойчивости к антибиотику, выбранную из группы, состоящей из последовательностей гена устойчивости к неомицину (neo), гена гигромицин B-фосфотрансферазы и гена пуромицин-N-ацетилтрансферазы.

8. Конструкция нуклеиновой кислоты по любому из пп. 1-7, отличающаяся тем, что указанная вторая промоторная последовательность выбрана из группы, состоящей из промоторных последовательностей SV40, lac E. coli, trp E. coli, PL фага лямбда, PR фага лямбда, T3, T7, немедленно-раннего промотора цитомегаловируса (CMV), тимидинкиназы вируса простого герпеса (HSV), альфа-лактальбумина, фактора элонгации 1 альфа человека (hEF1 альфа) и металлотионеина-I мыши.

9. Конструкция нуклеиновой кислоты по любому из пп. 1-8, отличающаяся тем, что указанная последовательность нуклеиновой кислоты, кодирующая целевой белок, кодирует белок, выбранный из группы, состоящей из последовательностей тяжелой и легкой цепей иммуноглобулина.

10. Конструкция нуклеиновой кислоты по п. 1, отличающаяся тем, что указанный управляемый транспозоном инсерционный элемент представляет собой инвертированный концевой повтор, предпочтительно при этом указанный конструкт содержит два инвертированных концевых повтора, расположенных на 5'-конце относительно указанного первого промотора и на 3'-конце относительно указанной сигнальной последовательности поли(А).

11. Конструкция нуклеиновой кислоты по п. 1, отличающаяся тем, что указанный управляемый рекомбиназой инсерционный элемент представляет собой сайт интеграции (att), при этом предпочтительно указанный сайт интеграции (att) представляет собой attB.

12. Клетка-хозяин для экспрессии целевого белка, содержащая конструкцию нуклеиновой кислоты по любому из пп. 1-11, при этом предпочтительно указанная клетка-хозяин содержит от приблизительно 1 до 1000 копий указанной конструкции нуклеиновой кислоты.

13. Способ получения целевого белка, включающий культивирование клеток-хозяев по п. 12 и очистку указанного целевого белка от указанной культуры клеток-хозяев.

14. Комбинация конструкций нуклеиновых кислот для обеспечения экспрессии целевого белка в клетке, содержащая:

первую конструкцию нуклеиновой кислоты по любому из пп. 1-11; и

вторую конструкцию нуклеиновой кислоты, кодирующую фермент, при этом предпочтительно указанный фермент выбран из группы, состоящей из транспозазы, интегразы, рекомбиназы, нуклеазы и никазы.

Документы, цитированные в отчете о поиске Патент 2025 года RU2840923C1

Автомобиль-сани, движущиеся на полозьях посредством устанавливающихся по высоте колес с шинами 1924
  • Ф.А. Клейн
SU2017A1
Пресс для выдавливания из деревянных дисков заготовок для ниточных катушек 1923
  • Григорьев П.Н.
SU2007A1
SEKTAS M
et al., Expression plasmid with a very tight two-step control: Int/att-mediated gene inversion with respect to the stationary promoter, Gene, 2001, v
Тепловой измеритель силы тока 1921
  • Гордеев П.П.
SU267A1
Кулиса для фотографических трансформаторов и увеличительных аппаратов 1921
  • Максимович С.О.
SU213A1
HICKMAN A.B., DYDA F., Mechanisms of DNA Transposition, Microbiol Spectr, 2015, v
Переносная печь для варки пищи и отопления в окопах, походных помещениях и т.п. 1921
  • Богач Б.И.
SU3A1

RU 2 840 923 C1

Авторы

Блек, Грегори Т.

Кравиц, Рейчел Х.

Холл, Чад А.

Даты

2025-05-30Публикация

2021-06-02Подача