ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ
В данной заявке заявлен приоритет предварительной заявки США №61/898966, поданной 1 ноября 2013 г., включенной в данное описание посредством ссылки во всей своей полноте.
ССЫЛКА НА ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
Эта заявка подается вместе с перечнем последовательностей в электронном формате. Перечень последовательностей приведен в виде файла в формате .txt с названием "PC72055A_FF_SEQ_LISTING_ST25.txt", созданного 6 октября 2014 года и имеющего размер 429 килобайт. Перечень последовательностей, содержащийся в этом .txt файле, является частью описания и включен в данное описание посредством ссылки во всей своей полноте.
ОБЛАСТЬ ИЗОБРЕТЕНИЯ
Настоящее изобретение в целом относится к иммунотерапии и в частности к вакцинам и способам лечения или предупреждения опухолевых заболеваний.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
Рак предстательной железы является вторым чаще всего диагностируемым раковым заболеванием и четвертой главной причиной смерти от рака у мужчин в развитых странах во всем мире. Было показано, что различные простатоассоциированные антигены (РАА), такие как простатоспецифический антиген (PSA), простатоспецифический мембранный антиген (PSMA) и антиген стволовых клеток простаты (PSCA), сверхэкспрессируются раковыми клетками предстательной железы по сравнению с нормальными аналогами. Таким образом, эти антигены представляют собой возможные мишени для вызова специфических иммунных ответов на раковые опухоли, экспрессирующие данные антигены, в результате применения иммунотерапевтического лечения вакцинами (см., например, Marrari, A., M. lero, et al. (2007). "Vaccination therapy in prostate cancer". Cancer Immunol. Immunother., 56(4): 429-45).
PSCA представляет собой состоящий из 123 аминокислот мембранный белок. Нативный полноразмерный PSCA человека состоит из аминокислоты 1 и аминокислот 4-125 в SEQ ID NO: 21 (без остатков аланина и серина во втором и третьем положении, соответственно). PSCA характеризуется высокой тканеспецифичностью и экспрессируется в более чем 85% видов рака предстательной железы, при этом уровни экспрессии повышены при более высоких индексах Глиссона и при андрогенной независимости. Он экспрессируется в 80-100% случаев костного метастаза у пациентов с раком предстательной железы.
PSA представляет собой калликреин-подобную сериновую протеазу, которая продуцируется исключительно клетками цилиндрического эпителия, выстилающими ацинусы и протоки предстательной железы. мРНК PSA транслируется в виде неактивного состоящего из 261 аминокислоты предшественника - preproPSA. PreproPSA имеет 24 дополнительных остатка, которые составляют пре-регион (сигнальный пептид) и пропептид. В результате высвобождения препропептида образуется состоящая из 237 аминокислот зрелая внеклеточная форма, которая является ферментативно активной. Полноразмерная последовательность нативного PSA человека состоит из аминокислот 4-263 с SEQ ID NO: 15. PSA является органоспецифическим антигеном и, таким образом, продуцируется эпителиальными клетками доброкачественной гиперплазированной ткани предстательной железы (ВРН), ткани первичного рака предстательной железы и ткани метастатического рака предстательной железы.
PSMA, также известный как фолатгидролаза 1 (FOLH1), состоит из 750 аминокислот. Аминокислотная последовательность полноразмерного PSMA человека приведена в SEQ ID NO: 1. PSMA включает цитоплазматический домен (аминокислоты 1-19), трансмембранный домен (аминокислоты 20-43) и внеклеточный домен (аминокислоты 44-750). Было обнаружено, что PSMA экспрессируется в раковых клетках предстательной железы с уровнями, в 1000 раз превышающими его уровни в нормальных тканях. Он в изобилии экспрессируется на новообразованных сосудах ряда других солидных опухолей, таких как рак толстой кишки, молочной железы, печени, мочевого пузыря, поджелудочной железы, легкого, почек, а также меланомы и сарком. Таким образом, PSMA рассматривается как мишень, специфичная не только для раковых клеток предстательной железы, а также как универсальная мишень раковых заболеваний (pan-carcinoma target) для других типов рака.
Несмотря на идентификацию большого числа опухолеассоциированных антигенов и то, что многие из этих антигенов исследованы в составе вакцин на основе белков или ДНК для лечения или предупреждения раковых заболеваний, большинство клинических испытаний к настоящему времени завершились неудачно с точки зрения получения терапевтического продукта. Одна из проблем при разработке вакцин против рака заключается в том, что раковые антигены обычно являются аутогенными и вследствие этого слабо иммуногенными, поскольку саморегуляция иммунной системы заключается в том, что она не распознает собственные белки. Соответственно, существует потребность в способе усиления иммуногенности или терапевтического эффекта вакцин против рака.
Изучали многочисленные подходы для усиления иммуногенности или усиления противоопухолевой эффективности вакцин против рака. Один из таких подходов включает применение различных иммуномодуляторов, таких как агонисты TLR (Toll-подобные рецепторы), агонисты TNFR (рецепторов фактора некроза опухоли), ингибиторы CTLA-4 (цитотоксический T-лимфоцитарный антиген 4) и ингибиторы протеинкиназ.
Toll-подобные рецепторы (TLR) представляют собой мембранные рецепторы типа 1, которые экспрессируются на гематопоэтических и не-гематопоэтических клетках. В семействе TLR идентифицировано по меньшей мере 11 членов. Эти рецепторы характеризуются своей способностью распознавать патогенассоциированные молекулярные паттерны (РАМР), экспрессируемые патогенными микроорганизмами. Эти рецепторы в системах врожденного иммунитета осуществляют контроль в отношении направленности последующего приобретенного иммунного ответа. Среди всех TLR интенсивно исследовали TLR9 в отношении его участия в иммунных ответах. Стимуляция рецептора TLR9 направляет антигенпрезентирующие клетки (АРС) в сторону примирования сильных T-клеточных ответов с доминированием TH1 (T-хелперов 1 типа) посредством усиления продуцирования провоспалительных цитокинов и презентирования костимулирующих молекул T-клеткам. Было обнаружено, что CpG-олигонуклеотиды, лиганды к TLR9, представляют собой класс сильнодействующих иммуностимулирующих факторов. CpG-терапия была протестирована в отношении широкого круга опухолевых моделей у мышей, и всякий раз была продемонстрирована стимуляция ингибирования или регрессии опухолей.
Цитотоксический T-лимфоцитарный антиген 4 (CTLA-4) является членом суперсемейства иммунолгобулинов и экспрессируется на поверхности T-хелперов. CTLA-4 представляет собой отрицательный регулятор зависимой от CD28 (cluster of differentiation - кластер дифференцировки) активации T-клеток и действует в качестве контрольной точки ингибирования в отношении адаптивного иммунного ответа. Аналогично костимулирующему T-клетки белку CD28, CTLA-4 связывается с CD80 и CD86 на антигенпрезентирующих клетках. CTLA-4 передает ингибирующий сигнал T-клеткам, в то время как CD28 передает стимулирующий сигнал. Человеческие антитела к CTLA-4 человека описаны в качестве иммуностимулирующих модуляторов в случае разнообразных болезненных состояний, например, для лечения или предупреждения вирусной и бактериальной инфекции и для лечения рака (WO 01/14424 и WO 00/37504). В различных доклинических исследованиях показано, что блокирование CTLA-4 моноклональными антителами усиливает иммунный ответ хозяина на иммуногенные опухоли и даже может приводить к отторжению диагностированных опухолей. Два полностью человеческих моноклональных антитела (mAb) к CTLA-4 человека, ипилимумаб (MDX-010) и тремелимумаб (также известный как СР-675206), были исследованы в клинических испытаниях в отношении лечения солидных опухолей различных типов.
Суперсемейство фактора некроза опухоли (TNF) представляет собой группу цитокинов, которые взаимодействуют со специфическими когнатными рецепторами клеточной поверхности, с суперсемейством рецепторов TNF (TNFR). Члены суперсемейства фактора некроза опухоли действуют посредством лиганд-опосредуемой тримеризации, приводящей к задействованию нескольких внутриклеточных адаптеров, с целью активации многочисленных путей передачи сигнала, таких как апоптоз, путь нуклеарного фактора-кВ (NF-kB; nuclear factor kappa В), путь c-Jun-N-концевой киназы (JNK; c-Jun N-terminal kinase), а также иммунных и воспалительных ответов. Примеры суперсемейства TNF включают лиганды CD40, лиганды ОХ40, лиганды 4-1ВВ, лиганд CD27, лиганд CD30 (CD153), TNF-альфа, TNF-бета, лиганды рецепторов-активаторов NF-kB (RANK; receptor activator of NF-kB), LT-альфа (лимфотоксин-альфа), LT-бета, GITR (лиганды индуцированных клюкокортикоидами TNFR) и LIGHT. Суперсемейство TNFR включает, например, CD40, ОХ40, 4-1ВВ, CD70 (лиганд CD27), CD30, TNFR2, RANK, LT-бета R, HVEM (медиатор проникновения вируса герпеса), GITR, TROY (член 19 суперсемейства TNFR) и RELT (рецептор, экспрессируемый в лимфоидной ткани). Среди членов семейства TNF интенсивное исследование проводили с агонистами CD40, включая различные агонистические антитела к CD40, такие как полностью человеческое агонистическое моноклональное антитело к CD40 СР870893, с точки зрения их применения в терапии.
Протеинкиназы представляют собой семейство ферментов, которые катализируют фосфорилирование специфических остатков в белках. Проводили изучение ряда ингибиторов киназ в клиническом исследовании с целью применения в противораковых терапиях, при этом использовали, например, MK0457, VX-680, ZD6474, MLN8054, AZD2171, SNS-032, PTK787/ZK222584, сорафениб (BAY43-9006), SU5416, SU6668, AMG706, зактима (ZD6474), МР-412, дазатиниб, СЕР-701 (лестауртиниб), XL647, XL999, тайкерб (лапатиниб), MLN518 (прежде известный как СТ53518), PKC412, ST1571, AMN107, АЕЕ 788, OSI-930, OSI-817, сунитиниба малат (сутент; SU11248), ваталаниб (PTK787/ZK 222584), SNS-032, SNS-314 и акситиниб (AG-013736). Гефитиниб и эрлотиниб представляют собой два вводимых перорально ингибитора тирозинкиназ (TKI; tyrosine kinase inhibitor) - рецептора эпидермального фактора роста (EGFR; epidermal growth factor receptor).
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Описание настоящего изобретения относится к векторам, сконструированным из последовательностей генома аденовируса шимпанзе ChAd68, для экспрессии двух или более иммуногенных полипептидов РАА. Вектор содержит (1) последовательность ДНК С68, (2) мультиантигенную конструкцию для экспрессии двух или более иммуногенных полипептидов РАА и (3) регуляторные последовательности, которые контролируют транскрипцию и трансляцию антигенных продуктов (т.е. иммуногенных полипептидов РАА). Последовательность ДНК С68, включенную в вектор, получают из геномной последовательности С68 посредством функциональной делеции одного или более вирусных генов, но ее достаточно для образования инфекционной вирусной частицы. В конкретном воплощении последовательность ДНК С68, используемая в векторе, представляет собой весь геном С68 с функциональными делециями только в участках Е1 и Е3.
Мультиантигенная конструкция, переносимая вектором, содержит нуклеотидные последовательности, кодирующие два или более иммуногенных полипептида РАА, выбранных из иммуногенного полипептида PSMA, иммуногенного полипептида PSA и иммуногенного полипептида PSCA. В некоторых воплощениях мультиантигенная конструкция, переносимая вектором, содержит (1) нуклеотидную последовательность, кодирующую по меньшей мере один иммуногенный полипептид PSMA, (2) нуклеотидную последовательность, кодирующую по меньшей мере один иммуногенный полипептид PSA, и (3) нуклеотидную последовательность, кодирующую по меньшей мере один иммуногенный полипептид PSCA. Мультиантигенные конструкции также могут включать в себя разделяющие последовательности, которые обеспечивают экспрессию отдельных полипептидов РАА, кодируемых данной конструкцией. Примеры разделяющих последовательностей включают последовательности 2А-пептидов и IRES (участки внутренней посадки рибосомы). В некоторых воплощениях вектор содержит мультиантигенную конструкцию, имеющую следующие структуры:
(1) PSA-F2A-PSMA-mIRES-PSCA;
(2) PSA-F2A-PSMA-T2A-PSCA;
(3) PSA-T2A-PSCA-F2A-PSMA и
(4) PSCA-F2A-PSMA-mIRES-PSA.
В некоторых воплощениях нуклеотидная последовательность, кодирующая иммуногенный полипептид PSA, содержит нуклеотиды 1115-1825 из SEQ ID NO: 58 или содержит нуклеотиды 1106-1825 из SEQ ID NO: 58, нуклеотидная последовательность, кодирующая иммуногенный полипептид PSCA, содержит нуклеотиды 1892-2257 из SEQ ID NO: 58 или содержит нуклеотиды 1886-2257 из SEQ ID NO: 58, и нуклеотидная последовательность, кодирующая иммуногенный полипептид PSMA, содержит нуклеотиды 2333-4543 из SEQ ID NO: 58 или содержит нуклеотиды 2324-4543 из SEQ ID NO: 58. В некоторых конкретных воплощениях мультиантигенная конструкция содержит нуклеотидную последовательность, выбранную из группы, состоящей из SEQ ID NO: 33, 34, 35 и 36. В конкретном воплощении мультиантигенная конструкция содержит нуклеотидную последовательность, которая кодирует полипептидную последовательность с SEQ ID NO: 60. В другом конкретном воплощении мультиантигенная конструкция содержит нуклеотидную последовательность с SEQ ID NO: 61.
Согласно описанию настоящего изобретения также предложены композиции, содержащие векторы. В некоторых воплощениях композиция представляет собой иммуногенную композицию, полезную для вызова иммунного ответа на РАА у млекопитающего, такого как мышь, собака, обезьяна или человек. В некоторых воплощениях композиция представляет собой вакцинную композицию, полезную для иммунизации млекопитающего, такого как человек, для ингибирования аномальной пролиферации клеток, для обеспечения защиты от развития ракового заболевания (для использования в качестве профилактического средства) или для лечения расстройств (для использования в качестве терапевтического средства), ассоциированных со сверхэкспрессией РАА, таких как рак, в частности, рак предстательной железы.
Настоящее изобретение также относится к способам применения векторов или композиций для вызова иммунного ответа на РАА или для лечения раковых заболеваний, таких как рак предстательной железы, у млекопитающего, в частности, человека. В некоторых воплощениях векторы или композиции, в том числе вакцинные композиции, вводят млекопитающему, в частности, человеку, в комбинации с одним или более иммунномодуляторами, которые усиливают иммуногенность или влияние векторов или композиций. В некоторых конкретных воплощениях способ включает совместное введение вакцины, предложенной согласно настоящему изобретению, в комбинации по меньшей мере с одним ингибитором супрессорных клеток иммунной системы и по меньшей мере с одним усилителем эффекторных клеток иммунной системы.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
ФИГ. 1. Схематическое представление вектора PJV7563.
ФИГ. 2. Аминокислотное выравнивание пяти вирусных 2А-кассет. «Пропущенные» связи глицин-пролин отмечены звездочками.
ФИГ. 3. Последовательность предпочтительного IRES вируса EMCV (энцефаломиокардита). Сайт инициации трансляции отмечен звездочкой. В минимальном элементе IRES (mIRES) отсутствуют подчеркнутые первые 5 кодонов для L-белка EMCV.
ФИГ. 4. График, показывающий кривые выживаемости Каплана-Мейера для групп мышей из репрезентативного исследования, в котором оценивается влияние малата сунитиниба (сутента) и моноклонального антитела к CTLA-4 мыши (клон 9D9) на противоопухолевую эффективность вакцины против рака (вакцины) у несущих подкожные TUBO-опухоли мышей BALB/neuT.
ФИГ. 5. График, показывающий результаты анализа с использованием IFNγ-ELISPOT (метод иммуноферментных пятен) из репрезентативного исследования, в котором оценивается влияние CpG7909 и антитела к CD40 (Bioxcell, № ВЕ0016-2) на антигенспецифические T-клеточные ответы, индуцированные вакциной против рака (rHER2).
ФИГ. 6. Графики, показывающие результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность CpG7909 с точки зрения качества иммунных ответов, индуцированных вакциной против рака (путем эпидермальной доставки с помощью частиц (particle mediated epidermal delivery; PMED), с использованием анализа методом внутриклеточного окрашивания цитокинов, в котором измеряли цитокин-позитивные CD8 T-клетки (* указывает на Р меньше 0,05 согласно t-критерию Стьюдента).
ФИГ. 7. Графики, показывающие результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность CpG7909 с точки зрения качества иммунных ответов, индуцированных вакциной против рака (PMED), с использованием анализа методом внутриклеточного окрашивания цитокинов, в котором измеряли цитокин-позитивные CD4 T-клетки (ФИГ. 7) (* указывает на Р меньше 0,05 согласно t-критерию Стьюдента).
ФИГ. 8. Графики, показывающие результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность агонистического моноклонального антитела к CD40 мыши с точки зрения качества иммунных ответов, индуцированных вакциной против рака (PMED), с использованием анализа методом внутриклеточного окрашивания цитокинов, в котором измеряли цитокин-позитивные CD8 T-клетки (* указывает на Р меньше 0,05 согласно t-критерию Стьюдента).
ФИГ. 9. Графики, показывающие результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность агонистического моноклонального антитела к CD40 мыши с точки зрения качества иммунных ответов, индуцированных вакциной против рака (PMED), с использованием анализа методом внутриклеточного окрашивания цитокинов, в котором измеряли цитокин-позитивные CD4 T-клетки (* указывает на Р меньше 0,05 согласно t-критерию Стьюдента).
ФИГ. 10. График, показывающий кривые выживаемости Каплана-Мейера для групп мышей из репрезентативного исследования, в котором оценивается влияние сунитиниба малата (сутента) в низких дозах на противоопухолевую эффективность вакцины против рака у мышей BALB/neuT, несущих спонтанные опухоли молочной железы.
ФИГ. 11. График, показывающий организацию генома вектора AdC68-734.
CMV enh/pro обозначает непосредственно ранний энхансер и промотор цитомегаловируса человека; tet op обозначает тетрациклиновый оператор; Т2А обозначает 2А-пептиды вируса Thosea asigna; F2A обозначает 2А-пептиды вируса ящура; SV40 рА обозначает сигнал полиаденилирования обезьяньего вируса 40; LITR обозначает левый инвертированный концевой повтор; RITR обозначает правый инвертированный концевой повтор.
ФИГ. 12. Точечные диаграммы, демонстрирующие посредством проточной цитометрии экспрессию PSMA и PSCA на поверхности клеток А549, трансфицированных векторами AdC68, экспрессирующими тройной антиген.
ФИГ. 13. Результаты вестерн-блоттинга для лизатов клеток А549, инфицированных векторами AdC68.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
А. ОПРЕДЕЛЕНИЯ
Термин «адъювант» относится к веществу, которое способно усиливать, ускорять или пролонгировать иммунный ответ, вызываемый вакцинным иммуногеном.
Термин «агонист» относится к веществу, которое стимулирует (индуцирует, вызывает, усиливает или повышает) активность другой молекулы или другого рецептора. Термин «агонист» охватывает вещества, которые связываются с рецептором (например, антитело, гомолог природного лиганда из другого вида), и вещества, которые стимулируют функцию рецептора без связывания с ним (например, посредством активации ассоциированного белка).
Термин «антагонист» или «ингибитор» относится к веществу, которое частично или полностью блокирует, ингибирует или нейтрализует биологическую активность другой молекулы или другого рецептора.
Термин «совместное введение» относится к введению двух или более агентов одному и тому же субъекту в течение периода лечения. Два или более агентов могут быть включены в единую композицию и потому быть введены одновременно. Альтернативно, два или более агентов могут находиться в физически разделенных композициях и вводиться субъекту по отдельности либо последовательно, либо одновременно. Термин «введенный одновременно» или «одновременное введение» означает, что введение первого агента и введение второго агента совпадает по времени друг с другом, в то время как термин «введенный последовательно» или «последовательное введение» означает, что введение первого агента и введение второго агента не совпадает по времени друг с другом.
Термин «цитозольный» означает, что после того, как нуклеотидная последовательность, кодирующая конкретный полипептид, экспрессируется клеткой хозяина, экспрессированный полипептид остается внутри клетки хозяина.
Термин «вырожденный вариант» относится к нуклеотидной последовательности, в которой выполнены замены оснований по сравнению с референсной нуклеотидной последовательностью, но которая, вследствие вырожденности генетического кода, кодирует ту же аминокислотную последовательность, что и референсная нуклеотидная последовательность.
Термин «эффективное количество» относится к вводимому млекопитающему количеству, которого достаточно, чтобы вызвать желаемый эффект у данного млекопитающего.
Термин «фрагмент» заданного полипептида относится к полипептиду, который является более коротким по сравнению с заданным полипептидом и имеет 100% идентичности с последовательностью заданного полипептида.
Термин «идентичный» или процент «идентичности» в контексте двух или более нуклеотидных или полипептидных последовательностей относится к двум или более последовательностям или подпоследовательностям, которые являются одинаковыми или имеют конкретное процентное содержание аминокислотных остатков или нуклеотидов, являющихся одинаковыми при сравнении и выравнивании для максимального совпадения.
Термин «усилитель эффекторных клеток иммунной системы» или «усилитель IEC» относится к веществу, способному увеличивать или повышать число, качество или усиливать функцию одного или более типов иммунных эффекторных клеток млекопитающего. Примеры иммунных эффекторных клеток включают цитолитические CD8 T-клетки, CD40 T-клетки, NK-клетки и В-клетки.
Термин «иммуномодулятор» относится к веществу, способному изменять (например, ингибировать, ослаблять, повышать, усиливать или стимулировать) действие любого компонента системы врожденного, гуморального или клеточного иммунитета млекопитающего. Таким образом, термин «иммуномодулятор» охватывает термины «усилитель эффекторных клеток иммунной системы», определенный в данном описании, и «ингибитор супрессорных клеток иммунной системы», определенный в данном описании, а также вещество, которое воздействует на другие компоненты иммунной системы млекопитающего.
Термин «иммунный ответ» относится к любому детектируемому ответу на конкретное вещество (такое как антиген или иммуноген), производимому иммунной системой позвоночного животного-хозяина, включая, но не ограничиваясь этим, врожденные иммунные ответы (например, активацию каскада передачи сигнала посредством Toll-подобных рецепторов), клеточно-опосредованные иммунные ответы (например, ответы, опосредуемые T-клетками, такими как антигенспецифические T-клетки и неспецифические клетки иммунной системы) и гуморальные иммунные ответы (например, ответы, опосредуемые В-клетками, такие как образование и секреция антител в плазму крови, лимфу и/или тканевые жидкости). Примеры иммунных ответов включают изменение (например, усиление) активации Toll-подобных рецепторов, экспрессии или секреции лимфокинов (например, цитокинов (например, цитокинов типа Th1, Th2 или Th17) или хемокинов), активацию макрофагов, активацию дендритных клеток, активацию T-клеток (например, CD4+ или CD8+ T-клеток), активацию NK-клеток, активацию В-клеток (например, образование и/или секрецию антител), связывание иммуногена (например, антигена (например, иммуногенного полипептида)) с молекулой МНС (главного комплекса гистосовместимости), индуцирование ответа цитотоксических T-лимфоцитов («CTL»), индуцирование B-клеточного ответа (например, продуцирование антител), распространение (например, рост популяции клеток) клеток иммунной системы (например, T-клеток и В-клеток) и усиление процессинга и презентации антигена антигенпрезентирующими клетками. Термин «иммунный ответ» также охватывает любой детектируемый ответ на конкретное вещество (такое как антиген или иммуноген), производимый одним или более компонентами иммунной системы позвоночного животного in vitro.
Термин «иммуногенный» относится к способности вещества приводить к иммунному ответу, вызывать, стимулировать или индуцировать иммунный ответ либо улучшать, усиливать, повышать или пролонгировать уже имеющийся иммунный ответ на конкретный антиген независимо от того, связано оно или не связано с носителем, в присутствии или в отсутствие адъюванта.
Термин «иммуногенный полипептид PSA» относится к полипептиду, который является иммуногенным в отношении белка PSA человека или в отношении клеток, экспрессирующих белок PSA человека.
Термин «иммуногенный полипептид PSCA» относится к полипептиду, который является иммуногенным в отношении белка PSCA человека или в отношении клеток, экспрессирующих белок PSCA человека.
Термин «иммуногенный полипептид PSMA» относится к полипептиду, который является иммуногенным в отношении белка PSMA человека или в отношении клеток, экспрессирующих белок PSMA человека.
Термин «иммуногенный полипептид РАА» относится к «иммуногенному полипептиду PSA», «иммуногенному полипептиду PSCA» или «иммуногенному полипептиду PSMA», которые определены в данном описании выше.
Термин «ингибитор супрессорных клеток иммунной системы» или «ингибитор ISC» относится к веществу, способному снижать или подавлять количество или функцию супрессорных клеток иммунной системы млекопитающего. Примеры супрессорных клеток иммунной системы включают регуляторные T-клетки («Tper»), миелоидные супрессорные клетки и опухолеассоциированные макрофаги.
Термин «внутрикожкое введение» или «вводимый внутрикожко» в контексте введения вещества, такого как терапевтический агент или иммуномодулятор, млекопитающему, в том числе человеку, относится к доставке вещества в дермальный слой кожи млекопитающего. Кожа млекопитающего состоит из трех слоев - эпидермиса, дермы и подкожного слоя. Эпидермис представляет собой относительно тонкий жесткий наружный слой кожи. Большинство клеток в эпидермисе являются кератиноцитами. Дерма, следующий слой кожи, представляет собой толстый слой волокнистой и эластичной ткани (состоящей в основном из коллагена, эластина и фибриллина), придающий коже упругость и прочность. В дерме находятся нервные окончания, потовые железы и секретирующие кожное сало (сальные) железы, волосяные фолликулы и кровеносные сосуды. Толщина дермы варьирует в зависимости от места расположения кожи. У людей она составляет примерно 0,3 мм на веке и примерно 3,0 мм на спине. Подкожный слой состоит из жировой и соединительной ткани, в которой располагаются более крупные кровеносные сосуды и нервы. Толщина этого слоя варьирует по всему организму и от субъекта к субъекту. Термин «внутрикожкое введение» относится к доставке вещества во внутреннюю часть дермального слоя. В противоположность этому, «подкожное введение» относится к введению вещества в подкожный слой, а «местное введение» относится к нанесению вещества на поверхность кожи.
Термин «локальное введение» или «вводимый локально» охватывает термины «местное введение», «внутрикожкое введение» и «подкожное введение», каждый из которых определен в данном описании выше. Этот термин также охватывает «внутриопухолевое введение», что относится к введению вещества внутрь опухоли. Локальное введение предназначено для обеспечения высоких локальных концентраций вокруг места введения в течение периода времени, пока не будет достигнуно системное биораспределение введенного вещества, в то время как «системное введение» предназначено для всасывания введенного вещества в кровь и быстрого достижения системного воздействия путем распределения через кровеносную систему в органы или ткани по всему организму.
Термин «млекопитающее» относится к животному любого вида из класса млекопитающих. Примеры млекопитающих включают: людей; приматов, не являющихся человеком, таких как обезьяны; лабораторных животных, таких как крысы, мыши, морские свинки; домашних животных, таких как кошки, собаки, кролики, крупный рогатый скот, овцы, козы, лошади и свиньи; и содержащихся в неволе диких животных, таких как львы, тигры, слоны и тому подобное.
Термин «мембраносвязанный» означает, что после того, как нуклеотидная последовательность, кодирующая конкретный полипептид, экспрессируется клеткой хозяина, экспрессированный полипептид связывается, соединяется или иным образом взаимодействует с мембраной клетки.
Термин «опухолевое заболевание» относится к состоянию, при котором клетки пролиферируют с аномально высокой и неконтролируемой скоростью, превышающей таковую и находящейся в несогласованности с таковой в окружающих нормальных тканях. В результате этого обычно образуется твердое разрастание или уплотнение, известное как «опухоль». Этот термин охватывает опухолевые заболевания доброкачественного и злокачественного характера. Термин «опухолевое заболевание злокачественного характера», который в описании настоящего изобретения используется взаимозаменяемо с термином «рак», относится к опухолевому заболеванию, характеризующемуся способностью опухолевых клеток распространяться в другие места в организме (известной как «метастазирование»). Термин «опухолевое заболевание доброкачественного характера» относится к опухолевому заболеванию, при котором у опухолевых клеток отсутствует способность к метастазированию.
Термин «функционально связанный» относится к совместному расположению, в котором описанные таким образом компоненты находятся во взаимосвязи, позволяющей им функционировать предназначенным им способом. Контрольная последовательность, «функционально связанная» с трансгеном, соединена таким образом, что экспрессия данного трансгена осуществляется в условиях, совместимых с экспрессией контрольных последовательностей.
Термин «фармацевтически приемлемый эксципиент» относится к веществу в иммуногенной или вакцинной композиции, не являющемуся активным ингредиентом (таким как антиген, кодирующая антиген нуклеиновая кислота, иммуномодулятор или адъювант), которое совместимо с активными ингредиентами и не вызывает значительного неблагоприятного действия на субъектов, которым его вводят.
Термины «пептид», «полипептид» и «белок» используются в данном описании взаимозаменяемо и относятся к состоящей из аминокислот полимерной форме любой длины, которая может включать кодируемые и некодируемые аминокислоты, химически или биохимически модифицированные аминокислоты либо производные аминокислот и полипептиды с модифицированными полипептидными остовами.
Термин «предупреждение» или «предупреждать» относится к (а) предотвращению возникновения расстройства или (б) задержке начала возникновения расстройства или начала возникновения симптомов расстройства.
Термин «простатоассоциированный антиген» (или РАА) относится к ТАА (определенному в данном описании), который специфически экспрессируется на опухолевых клетках предстательной железы или экспрессируется с более высокой частотой или плотностью опухолевыми клетками по сравнению с неопухолевыми клетками из ткани того же типа. Примеры РАА включают PSA, PSCA и PSMA.
Термин «секретируемый» в контексте полипептида означает, что после того, как нуклеотидная последовательность, кодирующая данный полипептид, экспрессируется клеткой хозяина, экспрессированный полипептид секретируется за пределы клетки хозяина.
Термин «субоптимальная доза», когда его используют для описания количества иммуномодулятора, такого как ингибитор протеинкиназ, относится к дозе иммуномодулятора ниже минимального количества, необходимого для получения желаемого терапевтического эффекта в отношении подвергаемого лечению заболевания, если пациенту вводят только иммуномодулятор.
Термин «лечащий», «лечение» или «лечить» относится к нейтрализации расстройства, снижению тяжести расстройства либо снижению тяжести или частоты возникновения симптома расстройства.
Термин «опухолеассоциированный антиген» или «ТАА» относится к антигену, который специфически экспрессируется опухолевыми клетками или экспрессируется опухолевыми клетками с более высокой частотой или плотностью по сравнению с неопухолевыми клетками из ткани того же типа. Опухолеассоциированными антигенами могут быть антигены, в норме не экспрессируемые хозяином; они могут представлять собой мутированные, укороченные, неправильно свернутые или иные аномальные варианты молекул, обычно экспрессируемых хозяином; они могут быть идентичны обычно экспрессируемым молекулам, но экспрессироваться с аномально высокими уровнями; или они могут экспрессироваться в окружении или среде, которые являются аномальными. Опухолеассоциированными антигенами могут быть, например, белки или фрагменты белков, сложные углеводы, ганглиозиды, гаптены, нуклеиновые кислоты или любая комбинация этих или других биологических молекул.
Термин «вакцина» относится к иммуногенной композиции для введения млекопитающему для вызова иммунного ответа на конкретный антиген.
Термин «вектор» относится к молекуле нуклеиновой кислоты, способной перемещать или переносить молекулу чужеродной нуклеиновой кислоты. Молекула чужеродной нуклеиновой кислоты называется «инсерционным сегментом» или «трансгеном». Обычно вектор состоит из инсерционного сегмента и большей по длине последовательности, которая служит в качестве остова вектора. Термин «вектор» охватывает как экспрессирующие векторы, так и транскрипционные векторы. Термин «экспрессирующий вектор» относится к вектору, способному экспрессировать инсерционный сегмент в целевой клетке. Как правило, он содержит контрольные последовательности, такие как последовательности энхансера, промотора и терминатора, которые управляют экспрессией этого инсерционного сегмента. Термин «транскрипционный вектор» относится к вектору, способному транскрибироваться, но не транслироваться. Транскрипционные векторы используют для амплификации находящегося в них инсерционного сегмента. С учетом структуры или происхождения векторов, основные типы векторов включают плазмидные векторы, космидные векторы, фаговые векторы, например на основе фага лямбда, вирусные векторы, такие как аденовирусные (Ad) векторы, и искусственные хромосомы.
Б. ВЕКТОРЫ, СОДЕРЖАЩИЕ МУЛЬТИАНТИГЕННУЮ КОНСТРУКЦИЮ
Согласно одному из аспектов в описании настоящего изобретения предложен вирусный вектор, сконструированный из генома аденовируса шимпанзе ChAd68, для экспрессии двух или более иммуногенных полипептидов РАА. Аденовирус шимпанзе ChAd68 также обозначается в литературе как обезьяний аденовирус типа 25, С68, Chad68, SAdV25, PanAd9 или Pan9. Для удобства, аденовирус шимпанзе ChAd68 может быть обозначен в этом описании как «С68», и вирусный вектор, сконструированный из генома аденовируса шимпанзе ChAd68, обозначен как «вектор С68». Полноразмерная геномная последовательность С68 имеется в Genbank (номер доступа АС_000011.1) и приведена в SEQ ID NO: 57. Кроме того, полноразмерная геномная последовательность С68 и место расположения аденовирусных генов Е1а, E1b, Е2а, E2b, Е3, Е4, I1, I2, L3, L4 и L5 также приведены в патенте США 6083716.
Вектор С68, предложенный согласно описанию настоящего изобретения, содержит (1) последовательность ДНК С68 и (2) мультиантигенную конструкцию для экспрессии двух или более иммуногенных полипептидов РАА. Вектор также может содержать ненативные регуляторные последовательности, которые контролируют транскрипцию и трансляцию антигенных продуктов. Ненативными регуляторными последовательностями называют последовательности, которые не являются частью генома С68. Последовательность ДНК С68, мультиантигенная конструкция и регуляторные последовательности функционально связаны друг с другом.
Вектор С68 может быть репликационно-компетентным, условно репликационно-компетентным или репликационно-дефектным. Репликационно-компетентный вектор С68 может реплицироваться в типичных клетках хозяина, т.е. клетках, обычно поддающихся инфицированию аденовирусом. Репликационно компетентный вирусный вектор может иметь одну или более мутаций по сравнению с аденовирусом дикого типа (например, одну или более делеций, вставок и/или замен) в аденовирусном геноме, которые не ингибируют репликацию вируса в клетках хозяина. Условно реплицирующийся вектор С68 представляет собой вирусный вектор, который сконструирован таким образом, чтобы реплицироваться в предварительно заданных условиях. Например, существенные для репликации функции генов, например функции, кодируемые ранними участками аденовирусного генома, могут быть функционально связаны с индуцибельной, репрессируемой или тканеспецифичной контролирующей транскрипцию последовательностью, например, промотором. Репликационно-дефектный вектор С68 представляет собой вирусный вектор, для которого требуется комплементарность одной или более чем одной генной функции или участка вирусного генома, которые необходимы для репликации, по причине, например, дефицита в одной или более чем одной существенной для репликации функции гена или участка, вследствие чего вектор не реплицируется в типичных клетках хозяина, в особенности, тех клетках человека, которые будут инфицированы данным вектором.
Такие векторы полезны для клонирования или экспрессии иммуногенных полипептидов РАА или для доставки мультиантигенной конструкции в составе композиции, такой как вакцина, в клетку хозяина или животному-хозяину, такому как человек. В некоторых конкретных воплощениях согласно описанию настоящего изобретения предложен вектор, выбранный из группы, состоящей из (1) вектора, содержащего нуклеотидную последовательность или состоящего из нуклеотидной последовательности SEQ ID NO: 58; (2) вектора, содержащего нуклеотиды или состоящего из нуклеотидов 9-34811 SEQ ID NO: 58; и (3) вектора, содержащего нуклеотидную последовательность или состоящего из нуклеотидной последовательности SEQ ID NO: 63.
Вектор С68, предложенный согласно описанию настоящего изобретения, также охватывает функциональные варианты векторов, конкретно описанные или приведенные в качестве примера в описании настоящего изобретения. «Функциональный вариант» означает вектор, который содержит мутации (например, добавления, делеции или замены) по сравнению с последовательностью вектора («родительского вектора»), конкретно описанного или приведенного в качестве примера в описании настоящего изобретения, но сохраняет функцию или свойство родительского вектора. Например, функциональный вариант может содержать кодон-оптимизированную последовательность, соответствующую родительскому вектору, приведенному в качестве примера в описании настоящего изобретения.
Б1. Последовательность ДНК С68
Термин «последовательность ДНК С68» относится к последовательности ДНК, которая представляет собой часть последовательности генома С68. Последовательность ДНК С68, включенная в вектор, получена из последовательности генома С68 посредством функциональной делеции одного или более генов или участков генома вируса. Термин «функциональная делеция» означает, что удалена или иным образом изменена часть участка гена вируса, например, посредством мутации или модификации, так, чтобы этот участок гена больше был не способен продуцировать при экспрессии гена функциональные продукты или иным образом осуществлять его нормальное функционирование. Зачастую для нарушения существенной для репликации генной функции нет необходимости в делеции всего участка гена. Однако, в целях обеспечения пространства в геноме С68, достаточного для введения одного или более трансгенов, может быть желательно удаление большей части одного или более чем одного участка гена. И хотя делеция генетического материала предпочтительна, мутация генетического материала последством добавления или замены также является целесообразной для нарушения генной функции.
В некоторых воплощениях последовательность ДНК С68 данного вектора получена из последовательности генома С68 посредством функциональной делеции всего или достаточной части аденовирусного предраннего гена Е1а и задержанно раннего гена E1b. В других воплощениях помимо функциональной делеции Е1а и E1b также может быть выполнена функциональная делеция одного или более других генов, таких как задержанно ранний ген Е2а, задержанно ранний ген Е3, Е4, любой из поздних генов от L1 до L5, промежуточные гены IX и IVa2. Таким образом, последовательность ДНК С68 для применения в конструкции вектора по изобретению может содержать делеции только в гене Е1. Альтернативно, делеции генов целиком или их частей, эффективные для разрушения их биологической активности, могут быть использованы в любой комбинации. Например, в одном из типичных векторов последовательность ДНК С68 получена из последовательности генома С68 посредством функциональных делеции генов Е1 и гена Е4, или генов Е1, Е2а и Е3, или генов Е1 и Е3, или генов Е1, Е2а и Е4, с делецией Е3 или без нее, и так далее. Помимо этого, для достижения желаемого результата такие делеции могут быть использованы в комбинации с другими мутациями, такими как температурно-чувствительные мутации. В конкретном воплощении последовательность ДНК С68 представляет собой весь геном С68 с функциональными делециями только в участках Е1 и Е3.
В некоторых конкретных воплощениях функциональную делецию гена Е1 осуществляют посредством делеции нуклеотидов 577-3403 из SEQ ID NO: 57 или посредством делеции нуклеотидов 456-3012 из SEQ ID NO: 57, и функциональную делецию гена Е3 осуществляют посредством делеции нуклеотидов 27125-31831 из SEQ ID NO: 57 или посредством делеции нуклеотидов 27812-31330 из SEQ ID NO: 57. В других конкретных воплощениях последовательность ДНК С68, включенная в вектор, содержит нуклеотиды 3013-27811 из SEQ ID NO: 57. В следующих конкретных воплощениях последовательность ДНК С68, включенная в вектор, содержит нуклеотиды 3013-27811 и 31331-36519 из SEQ ID NO: 57.
Мультиантигенная конструкция может быть встроена в любой делетированный участок аденовирусного генома. Мультиантигенная конструкция также может быть встроена в имеющийся участок гена для нарушения функции этого участка. В некоторых воплощениях мультиантигенная конструкция встроена вместо делетированного гена Е1.
Б2. Мультиантигенные конструкции
Термин «мультиантигенная конструкция» относится к молекуле или последовательности нуклеиновой кислоты, которая кодирует два или более полипептида РАА. В описании настоящего изобретения такие молекулы или последовательности также можно обозначить как «мультиантигенная вакцина» или «мультиантигенная плазмида». Мультиантигенная конструкция может нести две кодирующие нуклеотидные последовательности, причем каждая из кодирующих нуклеотидных последовательностей экспрессирует индивидуальный иммуногенный полипептид РАА. В этом описании такую конструкцию также называют «двойной антигенной конструкцией», «двойной антигенной вакциной» или «двойной антигенной плазмидой». Мультиантигенная конструкция также может нести три кодирующие нуклеотидные последовательности, причем каждая из кодирующих нуклеотидных последовательностей экспрессирует индивидуальный иммуногенный полипептид РАА. В этом описании такую конструкцию также называют «тройной антигенной конструкцией», «тройной антигенной вакциной» или «тройной антигенной плазмидой». Индивидуальные полипептиды РАА, кодируемые мультиантигенной конструкцией, могут быть иммуногенными в отношении одного и того же антигена, такого как PSMA, PSA или PSCA. Например, двойная антигенная конструкция может экспрессировать два разных антигена РАА, оба из которых являются иммуногенными в отношении PSMA. Индивидуальные полипептиды РАА, кодируемые мультиантигенной конструкцией, могут быть иммуногенными в отношении разных антигенов, например, двойная антигенная конструкция может экспрессировать два полипептида РАА, которые являются иммуногенными в отношении PSMA и PSA, соответственно. Предпочтительно, чтобы мультиантигенная конструкция кодировала два или более индивидуальных полипептида РАА, которые являются иммуногенными в отношении разных антигенов.
В некоторых воплощениях мультиантигенная конструкция кодирует по меньшей мере два иммуногенных полипептида РАА в любой из следующих комбинаций:
1) иммуногенный полипептид PSMA и иммуногенный полипептид PSA;
2) иммуногенный полипептид PSMA и иммуногенный полипептид PSCA; и
3) иммуногенный полипептид PSA и иммуногенный полипептид PSCA.
В некоторых конкретных воплощениях мультиантигенная конструкция кодирует по меньшей мере один иммуногенный полипептид PSMA, по меньшей мере один иммуногенный полипептид PSA и по меньшей мере один иммуногенный полипептид PSCA.
Иммуногенный полипептид PSMA, экспрессируемый мультиантигенной конструкцией, может быть цитозольным, секретируемым или мембраносвязанным, но предпочтительно мембраносвязанным. В некоторых воплощениях иммуногенный полипептид PSMA содержит аминокислотную последовательность, выбранную из группы, состоящей из:
1) аминокислотной последовательности с SEQ ID NO: 1,
2) аминокислот 15-750 из SEQ ID NO: 1;
3) аминокислотной последовательности с SEQ ID NO: 3;
4) аминокислотной последовательности с SEQ ID NO: 5;
5) аминокислотной последовательности с SEQ ID NO: 7;
6) аминокислот 4-739 из SEQ ID NO: 3;
7) аминокислот 4-739 из SEQ ID NO: 5;
8) аминокислот 4-739 из SEQ ID NO: 7;
9) аминокислотной последовательности с SEQ ID NO: 9 и
10) аминокислот 4-739 из SEQ ID NO: 9.
Иммуногенный полипептид PSA, экспрессируемый мультиантигенной конструкцией, может быть цитозольным, секретируемым или мембраносвязанным, но предпочтительно цитозольным. В некоторых воплощениях иммуногенный полипептид PSA содержит аминокислотную последовательность, выбранную из группы, состоящей из:
1) аминокислот 27-263 из SEQ ID NO: 15;
2) аминокислотной последовательности с SEQ ID NO: 17 и
3) аминокислот 4-240 из SEQ ID NO: 17.
Иммуногенный полипептид PSCA, экспрессируемый мультиантигенной конструкцией, может представлять собой полноразмерный белок PSCA человека. В некоторых воплощениях иммуногенный полипептид PSCA содержит аминокислотную последовательность, выбранную из группы, состоящей из:
1) аминокислотной последовательности с SEQ ID NO: 21;
2) аминокислот 2-125 из SEQ ID NO: 21 и
3) аминокислот 4-125 из SEQ ID NO: 21.
В некоторых других воплощениях мультиантигенная конструкция кодирует по меньшей мере один иммуногенный полипептид PSA, по меньшей мере один иммуногенный полипептид PSCA и по меньшей мере один иммуногенный полипептид PSMA, при этом иммуногенный полипептид PSA содержит аминокислотную последовательность с SEQ ID NO: 17 или аминокислоты 4-240 из SEQ ID NO: 17, при этом иммуногенный полипептид PSCA содержит аминокислотную последовательность с SEQ ID NO: 21 или аминокислоты 2-125 из SEQ ID NO: 21 и при этом иммуногенный полипептид PSMA содержит аминокислотную последовательность, выбранную из группы, состоящей из:
1) аминокислот 15-750 из SEQ ID NO: 1;
2) аминокислот 4-739 из SEQ ID NO: 9 и
3) аминокислотной последовательности с SEQ ID NO: 9.
В некоторых конкретных воплощениях мультиантигенная конструкция содержит нуклеотидную последовательность, кодирующую аминокислотную последовательность с SEQ ID NO: 60 или 64.
В некоторых конкретных воплощениях мультиантигенная конструкция содержит: (а) нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, (б) нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, и (в) нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, при этом:
(1) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности с SEQ ID NO: 18; (б) нуклеотидной последовательности с SEQ ID NO: 20; (в) нуклеотидной последовательности, содержащей нуклеотиды 10-720 из SEQ ID NO: 18; (г) нуклеотидной последовательности, содержащей нуклеотиды 1115-1825 из SEQ ID NO: 58 или SEQ ID NO: 63; (д) нуклеотидной последовательности, содержащей нуклеотиды 1106-1825 из SEQ ID NO: 58 или SEQ ID NO: 63; и (e) вырожденного варианта любой из этих нуклеотидных последовательностей, приведенных выше в (а)-(д);
(2) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSCA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности с SEQ ID NO: 22; (б) нуклеотидной последовательности, содержащей нуклеотиды 10-375 из SEQ ID NO: 22; (в) нуклеотидной последовательности, содержащей нуклеотиды 1892-2257 из SEQ ID NO: 58 или SEQ ID NO: 63; (г) нуклеотидной последовательности, содержащей нуклеотиды 1886-2257 из SEQ ID NO: 58 или SEQ ID NO: 63; и (д) вырожденного варианта любой из этих нуклеотидных последовательностей, приведенных выше в (а)-(г); и
(3) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSMA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности, содержащей нуклеотиды 43-2250 из SEQ ID NO: 2; (б) нуклеотидной последовательности с SEQ ID NO: 4; (в) нуклеотидной последовательности с SEQ ID NO: 6; (г) нуклеотидной последовательности с SEQ ID NO: 8; (д) нуклеотидной последовательности с SEQ ID NO: 10; (е) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 4; (ж) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 6; (з) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 8; (и) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 10; (к) нуклеотидной последовательности, содержащей нуклеотиды 2333-4543 из SEQ ID NO: 58 или SEQ ID NO: 63; (л) нуклеотидной последовательности, содержащей нуклеотиды 2324-4543 из SEQ ID NO: 58 или SEQ ID NO: 63; и (м) вырожденного варианта любой из этих нуклеотидных последовательностей, приведенный выше в (а)-(л).
В другом конкретном воплощении мультиантигенная конструкция содержит нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, и нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, при этом: нуклеотидная последовательность, кодирующая иммуногенный полипептид PSA, содержит нуклеотиды 1106-1825 из SEQ ID NO: 58 или SEQ ID NO: 63; нуклеотидная последовательность, кодирующая иммуногенный полипептид PSCA, содержит нуклеотиды 1886-2257 из SEQ ID NO: 58 или SEQ ID NO: 63; и нуклеотидная последовательность, кодирующая иммуногенный полипептид PSMA, содержит нуклеотиды 2324-4543 из SEQ ID NO: 58 или SEQ ID NO: 63.
Чтобы обеспечить экспрессию отдельных иммуногенных полипептидов РАА из единой мультиантигенной конструкции, переносимой вектором, между последовательностями, которые кодируют индивидуальные иммуногенные полипептиды РАА (т.е. полипептиды PSA, PSCA и PSMA), вводят промежуточные последовательности. Эти промежуточные последовательности обеспечивают отдельную трансляцию расположенного ниже иммуногенного полипептида РАА. Такая промежуточная последовательность обозначена в данном описании как «разделяющая последовательность». Любые последовательности, которые можно использовать для совместной экспрессии многих полипептидов из одного вектора, могут быть использованы в качестве разделяющих последовательностей в векторе, предложенном согласно описанию настоящего изобретения. Примеры полезных разделяющих последовательностей включают участки внутренней посадки рибосомы (IRES) и последовательности 2А-пептидов.
Последовательности 2А-пептидов и подобные 2А-пептидам, также называемые кассетами для расщепления или цис-активирующими элементами гидролаз (CHYSEL), представляют собой последовательности длиной приблизительно 20 аминокислот с высококонсервативным карбоксиконцевым мотивом D-V/I-EXNPGP (Фиг. 2). Такие последовательности редко встречаются в природе, чаще всего их обнаруживают в таких вирусах, как вирус ящура (FMDV), вирус А, вызывающий ринит у лошадей (ERAV), вирус энцефаломиокардита (EMCV), вирус болезни Тешена у свиней (PTV) и вирус Thosea asigna (TAV) (Luke, G.A., P. de Felipe, et al. (2008). "Occurrence, function and evolutionary origins of '2A-like' sequences in virus genomes". J. Gen. Virol., 89 (Pt 4): 036-1042). Используя основанную на применении 2А-пептидов стратегию мультиантигенной экспрессии, гены, кодирующие несколько целевых антигенов, соединяют друг с другом в одной открытой рамке считывания, с разделением 2А-последовательностями. Всю открытую рамку считывания клонируют в вектор с единственным промотором и терминатором. После доставки конструкций в клетку хозяина мРНК, кодирующая несколько антигенов, транскрибируется и транслируется в виде единого полипептида. В процессе трансляции 2А-последовательностей рибосомы «перепрыгивают» связь между находящимися на С-конце глицином и пролином. «Рибосомное перепрыгивание» (ribosomal skipping) действует по типу котрансляционного аутокаталитического «расщепления», в результате которого осуществляется высвобождение белков, расположенных выше, от белков, расположенных ниже. Общую информацию, касающуюся применения различных последовательностей 2А-пептидов в векторах, коэкспрессирующих несколько полипептидов, можно найти в статье Andrea L. Szymczak & Darrio АА Vignali: Development of 2A peptide-based strategies in the design of multicistronic vectors. Expert Opinion Biol. Ther. (2005), 5(5): 627-638, описание которой включено в данное описание посредством ссылки. Результом встраивания 2А-последовательности между двумя белковыми антигенами является добавление приблизительно 20 аминокислот к С-концу расположенного выше полипептида и 1 аминокислоты (пролина) к N-концу расположенного ниже по течению белка. При адаптации этой методологии, на N-конец 2А-кассеты можно встроить сайты расщепления протеазами таким образом, что присутствующие повсеместно протеазы будут расщеплять кассету, начиная от расположенного выше белка (Fang, J., S. Yi, et al. (2007). "An antibody delivery system for regulated expression of therapeutic levels of monoclonal antibodies in vivo". Mol. Ther., 15(6): 1153-1159).
Примеры конкретных последовательностей 2А-пептидов, которые могут быть использованы в настоящем изобретении, описаны в Andrea L. Szymczak & Darrio АА Vignali: Development of 2A peptide-based strategies in the design of multicistronic vectors. Expert Opinion Biol. Ther., (2005), 5(5): 627-638 и приведены в Таблице 1.
Участки внутренней посадки рибосомы (IRES) представляют собой элементы РНК (Фиг. 3), обнаруженные в 5'-нетранслируемых участках некоторых молекул РНК (Bonnal, S., С. Boutonnet, et al. (2003). "IRESdb: the Internal Ribosome Entry Site database". Nucleic Acids Res., 31(1): 427-428). Они «притягивают» рибосомы эукариот к РНК, способствуя трансляции расположенных ниже открытых рамок считывания. В отличие от обычной кэп-зависимой трансляции в клетках, где кэпом является 7-метилгуанозин, IRES-опосредуемая трансляция может инициироваться в кодонах AUG, удаленных от начала молекулы РНК. Этот высокоэффективный процесс может быть использован в полицистронных экспрессирующих векторах (Bochkov, Y.A. and А.С. Palmenberg (2006). "Translational efficiency of EMCV IRES in bicistronic vectors is dependent upon IRES sequence and gene location". Biotechniques, 41(3): 283-284, 286, 288). Последовательность предпочтительного IRES (pIRES) EMCV приведена на Фиг. 3 и в SEQ ID NO: 59. В минимальном IRES (mIRES) EMCV отсутствуют подчеркнутые первые пять кодонов L белка EMCV, которые показаны на Фиг. 3. Обычно, в вектор встраивают два трансгена между промотором и терминатором транскрипции в качестве двух отдельных открытых рамок считывания, разделенных посредством IRES. После доставки таких конструкций в клетку хозяина будет транскрибироваться единый длинный транскрипт, кодирующий оба трансгена. Первая ORF будет транслироваться традиционным кэп-зависимым образом с терминацией на стоп-кодоне, расположенном выше относительно IRES. Вторая ORF будет транслироваться кэп-независимым образом с использованием IRES. Благодаря этому могут продуцироваться два независимых белка из единой мРНК, транскрибированной с вектора с использованием единой экспрессионной кассеты. В некоторых воплощениях мультиантигенная конструкция содержит IRES из EMCV, содержащий нуклеотиды 1-553 из SEQ ID NO: 59.
Обычно в мультиантигенной конструкции необходима только одна разделяющая последовательность между двумя последовательностями, кодирующими иммуногенные полипептиды РАА. Порядок расположения разделяющих последовательностей и нуклеотидных последовательностей, кодирующих полипептиды РАА в мультиантигенной конструкции, показан в формуле (I):
,
где: (1) каждый РАА1, РАА2 и РАА3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, или нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, при условии, что РАА1, РАА2 и РАА3 кодируют разные полипептиды РАА, и (2) SS1 и SS2 представляют собой разделяющие последовательности и могут быть одинаковыми или разными.
В некоторых воплощениях вектор содержит мультиантигенную конструкцию формулы (I), где:
(1) РАА1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA;
(2) РАА2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA или PSMA (если РАА2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, то РАА3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, или наоборот);
(3) SS1 представляет собой 2А-пептидную последовательность и
(4) SS2 представляет собой 2А-пептидную последовательность или IRES.
В некоторых конкретных воплощениях мультиантигенная конструкция имеет структуру, выбранную из группы, состоящей из:
(1) PSA-F2A-PSMA-mIRES-PSCA;
(2) PSA-F2A-PSMA-T2A-PSCA;
(3) PSA-T2A-PSCA-F2A-PSMA и
(4) PSCA-F2A-PSMA-mIRES-PSA.
В конкретном воплощении вектор содержит мультиантигенную конструкцию, имеющую структуру формулы (I):
,
где:
(1) РАА1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, и содержит нуклеотиды 1115-1825 из SEQ ID NO: 58 или содержит нуклеотиды 1106-1114 из SEQ ID NO: 58 или 63;
(2) РАА2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, и содержит нуклеотиды 1892-2257 из SEQ ID NO: 58 или содержит нуклеотиды 1886-2257 из SEQ ID NO: 58 или 63;
(3) РАА3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, и содержит нуклеотиды 2333-4543 из SEQ ID NO: 58 или содержит нуклеотиды 2324-4543 из SEQ ID NO: 58 или 63;
(4) SS1 представляет собой нуклеотидную последовательность, кодирующую Т2А; и
(5) SS2 представляет собой нуклеотидную последовательность, кодирующую F2A.
Мультиантигенная конструкция также может включать в себя линкерную последовательность, расположенную между нуклеотидной последовательностью, кодирующей иммуногенный полипептид РАА (т.е. иммуногенный полипептид PSA, PSCA или PSMA), и расположенной ниже разделяющей последовательностью. Одним из примеров такой линкерной последовательности является нуклеотидная последовательность, кодирующая глицин-серин.
В некоторых конкретных воплощениях мультиантигенная конструкция содержит нуклеотидную последовательность, которая кодирует аминокислотную последовательность с SEQ ID NO: 60 или кодирует аминокислотную последовательность с SEQ ID NO: 61. В конкретном воплощении мультиантигенная конструкция содержит нуклеотидную последовательность, выбранную из группы, состоящей из нуклеотидной последовательности с SEQ ID NO: 61, нуклеотидной последовательности с SEQ ID NO: 65, нуклеотидной последовательности с SEQ ID NO: 66 и вырожденного варианта любой из этих нуклеотидных последовательностей.
Б3. Регуляторные последовательности
Помимо разделяющих последовательностей и линкерных последовательностей, описанных выше, вектор может содержать другие ненативные регуляторные последовательности для управления эффективной экспрессией кодируемых олипептидов РАА. Примеры регуляторных последовательностей включают (1) последовательности инициации транскрипции, терминации транскрипции, промотора и энхансера; (2) сигналы, управляющие процессингом РНК, такие как сигналы сплайсинга и полиаденилирования; (3) последовательности, которые стабилизируют цитоплазматическую мРНК; (4) последовательности, которые повышают эффективность трансляции (т.е. консенсусную последовательность Козака); (5) последовательности, которые повышают стабильность белков; и (6) последовательности, которые повышают секрецию белков. Примеры систем промоторов, которые можно использовать в векторах, предложенных согласно описанию настоящего изобретения, для эффективного управления экспрессией в клетках млекопитающих, включают промотор SV40, промотор бета-актина цыпленка, промотор фактора элонгации человека, промотор цитомегаловируса (CMV) человека, промотор CMV обезьян, промотор CMV мышей, промотор вируса псевдобешенства, промотор вируса саркомы Рауса, фосфоглицераткиназный промотор, промотор длинных концевых повторов (LTR; long terminal repeats) вируса мышиного лейкоза, промотор LTR вируса лейкоза птиц, промотор LTR вируса опухоли молочной железы мышей, промотор LTR вируса мышиного лейкоза Молони, промотор ингибитора активатора плазминогена, CYR61, главный поздний промотор аденовируса, мышиный металлотионеиновый промотор, промотор фосфоенолпируваткарбоксикиназы мыши, промотор гена бета-лактоглобулина быка, промотор гена пролактина быка, убиквитиновый С промотор и тимидинкиназный промотор вируса простого герпеса. Примеры сигналов терминации транскрипции включают полиаденилирование (polyA) SV40; polyA бычьего гормона роста; polyA кроличьего β-глобина; терминаторы тимидинкиназа HSV, гликопротеин В и гликопротеин D; Е и L папилломавируса человека (HPV) и синтетические терминаторы.
В некоторых воплощениях векторы С68 содержат промотор цитомегаловируса человека (CMV), возможно с энхансером CMV и SV40 polyA.
В. КОМПОЗИЦИИ, СОДЕРЖАЩИЕ ВЕКТОР, НЕСУЩИЙ МУЛЬТИАНТИГЕННУЮ КОНСТРУКЦИЮ (КОМПОЗИЦИИ НА ОСНОВЕ ВЕКТОРОВ)
Согласно описанию настоящего изобретения также предложена композиция, содержащая вектор, предложенный согласно описанию настоящего изобретения (в данном документе «композиция на основе вектора»). Композиции на основе векторов полезны для вызова иммунного ответа на белок РАА in vitro или in vivo у млекопитающего, включая человека. Композиция на основе вектора может содержать только векторы или может дополнительно содержать эксципиент.
В некоторых воплощениях композиция на основе вектора представляет собой фармацевтическую композицию, которая содержит вектор, предложенный согласно описанию настоящего изобретения, и фармацевтически приемлемый эксципиент. Подходящие эксципиенты для фармацевтических композиций известны в данных областях техники. Эксципиенты могут включать водные растворы, неводные растворы, суспензии и эмульсии. Примеры неводных эксципиентов включают пропиленгликоль, полиэтиленгликоль, растительные масла, такие как оливковое масло, и инъекционные органические сложные эфиры, такие как этилолеат. Примеры водного эксципиента включают воду, спиртовой/водный растворы, эмульсии или суспензии, в том числе физиологический раствор и забуференные среды. Подходящие эксципиенты также включают агенты, которые способствуют захвату вектора клеткой.
В некоторых воплощениях фармацевтическая композиция представляет собой вакцинную композицию для введения людям с целью ингибирования аномальной пролиферации клеток, для обеспечения защиты от развития ракового заболевания (для использования в качестве профилактического средства), или для лечения рака (для использования в качестве терапевтического средства), ассоциированного со сверхэкспрессией РАА, или для вызова иммунного ответа на конкретный РАА человека, такой как PSMA, PSA и PSCA. Вакцинная композиция может дополнительно содержать один или более адъювантов. Примеры адъювантов, которые могут быть включены в вакцинные композиции, приведены в данном описании ниже.
Г. ПРИМЕНЕНИЯ ВЕКТОРОВ И КОМПОЗИЦИЙ НА ОСНОВЕ ВЕКТОРОВ
Согласно другим аспектам описания настоящего изобретения предложены способы применения вектора или композиции, содержащей векторы, изложенные в данном описании выше.
Согласно одному из аспектов описания настоящего изобретения предложен способ вызова иммунного ответа на РАА у млекопитающего, в частности, человека, включающий введение млекопитающему эффективного количества (1) вектора, содержащего мультиантигенную конструкцию, или (2) композиции, содержащей такие векторы.
Согласно другому аспекту описания настоящего изобретения предложен способ ингибирования аномальной пролиферации клеток у человека, при этом аномальная пролиферация клеток ассоциирована со сверхэкспрессией РАА. Способ включает введение млекопитающему эффективного количества (1) вектора, содержащего мультиантигенную конструкцию, кодирующую два или более иммуногенных полипептида РАА, или (2) композиции, содержащей такие векторы. В некоторых воплощениях способ предназначен для ингибирования аномальной пролиферации клеток в предстательной железе у человека. В конкретном воплощении согласно описанию настоящего изобретения предложен способ ингибирования аномальной пролиферации клеток в предстательной железе, сверхэкспрессирующей PSMA. В некоторых воплощениях согласно изобретению предложен способ лечения рака предстательной железы у человека, включающий введение человеку эффективного количества (1) вектора, содержащего мультиантигенную конструкцию, или (2) композиции, содержащей такие векторы. В предпочтительном воплощении мультиантигенная конструкция представляет собой тройную антигенную конструкцию, кодирующую иммуногенный полипептид PSMA, иммуногенный полипептид PSA и иммуногенный полипептид PSCA.
Векторы или композиции на основе векторов можно вводить животному, в том числе человеку, рядом способов, известных в данной области техники. Примеры подходящих способов включают: (1) внутримышечное, внутрикожкое, интраэпидермальное, внутривенное, интраартериальное, подкожное или внутрибрюшинное введение, (2) пероральное введение и (3) местное применение (такое как глазное, интраназальное и интравагинальное применение). Один из конкретных способов внутрикожкого или интраэпидермального введения вакцинной композиции на основе нуклеиновой кислоты включает применение технологии доставки с использованием генной пушки, такого как приспособления для эпидермальной доставки с помощью частиц (PMED™), применяемого для доставки вакцин и поставляемого на рынок PowderMed. Другой конкретный способ внутримышечного введения вакцины на основе нуклеиновой кислоты представляет собой инъекцию с последующей электропорацией.
Эффективное количество вектора или композиции на основе вектора, подлежащих введению в данном способе, может быть легко определено специалистом в данной области техники и будет зависеть от ряда факторов. В способе лечения рака, такого как рак предстательной железы, факторы, которые можно учитывать при определении эффективного количества, включают без ограничения: (1) подлежащего лечению субъекта, в том числе иммунный статус и состояние здоровья субъекта, (2) тяжесть или стадию подлежащего лечению рака, (3) специфические экспрессируемые иммуногенные полипептиды РАА, (4) степень желаемой защиты или желаемого лечения, (5) способ и схему введения, (б) используемые композиции и (7) совместное введение других терапевтических агентов (таких как адъюванты или иммуномодуляторы). Например, эффективные количества вектора могут находиться в диапазоне от 2 мкг/доза до 10 мг/доза, если вакцинная композиция на основе нуклеиновой кислоты приготовлена в виде водного раствора и вводится подкожной инъекцией с помощью иглы или инъекцией с помощью пневматического устройства, в то время как может быть необходимо использовать диапазон только от 16 нг/доза до 16 мкг/доза, если препарат на основе нуклеиновой кислоты приготовлен в виде покрытых золотом гранул и доставляется с использованием технологии генной пушки.
Векторы или композиции на основе векторов, в том числе вакцинные композиции, предложенные согласно описанию настоящего изобретения, можно использовать вместе с одним или более адъювантами. Примеры подходящих адъювантов включают: (1) композиции эмульсии типа масло-в-воде (с другими специфическими иммуностимулирующими агентами, такими как мурамилполипептиды или компоненты клеточной стенки бактерий, или без них), такие как MF59™ (содержащая 5% сквалена, 0,5% твина 80 и 0,5% сорбитантриолеата) и SAF (адъювантная композиция Syntex) (содержащая 10% сквалена, 0,4% твина 80, 5% блокированного плуроником полимера L121 и thr-MDP (треонил-мурамилдипептид)); (2) сапониновые адъюванты, такие как QS21, STIMULON™ (Cambridge Bioscience, Worcester, MA), Abisco® (Isconova, Швеция) или Iscomatrix® (Commonwealth Serum Laboratories, Австралия); (3) полный адъювант Фрейнда (CFA) и неполный адъювант Фрейнда (IFA); (4) олигонуклеотиды, содержащие CpG-мотивы, т.е. содержащие по меньшей мере один динуклеотид CG, в котором цитозин является неметилированным (например, Krieg, Vaccine (2000), 19: 618-622; Krieg, Curr. Opin. Mol. Ther. (2001), 3: 15-24; WO 98/40100, WO 98/55495, WO 98/37919 и WO 98/52581); и (5) соли металлов, в том числе соли алюминия (как например, квасцы, фосфат алюминия, гидроксид алюминия); (6) сапонин и эмульсию типа масло-в-воде (например, WO 99/11241).
Векторы или композиции на основе векторов, предложенные согласно описанию настоящего изобретения, могут быть использованы вместе с одним или более чем одним иммунномодулятором. Согласно дополнительному аспекту описания настоящего изобретения предложен способ лечения рака предстательной железы у млекопитающего, в частности, человека, включающий введение млекопитающему: (1) эффективного количества вектора, композиции на основе вектора или вакцины, предложенных согласно настоящему изобретению; (2) эффективного количества по меньшей мере одного ингибитора супрессорных клеток иммунной системы (ингибитора ISC); и (3) эффективного количества по меньшей мере одного усилителя эффекторных клеток иммунной системы (усилителя IEC). В описании настоящего изобретения этот способ также обозначается как «схема иммунотерапевтического лечения вакциной» (или «VBIR»).
Усилители IEC и ингибиторы ISC можно вводить любыми подходящими способами и путями, включая (1) системное введение, такое как внутривенное, внутримышечное или пероральное введение, и (2) локальное введение, такое как внутрикожкое и подкожное введение. Там, где целесообразно или приемлемо, локальное введение обычно является предпочтительным по отношению к системному введению. Локальное введение любого усилителя IEC и ингибитора ISC может быть осуществлено в любом месте тела млекопитающего, которое подходит для локального введения фармацевтических средств; однако, более предпочтительно вводить эти иммуномодуляторы локально в непосредственной близости к дренируемому вакциной лимфатическому узлу.
Два или более специфических усилителей IEC из одного класса усилителей IEC (в качестве примеров, два антагониста CTLA) могут быть введены в комбинации с ингибиторами ISC. Помимо этого можно вводить совместно два или более специфических усилителей IEC из двух или более разных классов усилителей IEC (например, один антагонист CTLA-4 и один агонист TLR или один антагонист CTLA-4 и один антагонист PD-1 (белка 1 программируемой клеточной смерти). Аналогичным образом, в комбинации с усилителями IEC можно вводить два или более специфических ингибиторов ISC из одного класса ингибиторов ISC (в качестве примеров, два или более ингибиторов протеинкиназ). Помимо этого можно вводить совместно два или более специфических ингибиторов ISC из двух или более разных классов ингибиторов ISC (например, один ингибитор протеинкиназ и один ингибитор СОХ-2 (циклооксигеназы-2).
Векторы или композиции на основе векторов можно вводить совместно или последовательно с любыми из используемых иммуномодуляторов или всеми используемыми иммуномодуляторами (т.е. ингибиторами ISC и усилителями IEC). Аналогичным образом, если используют два или более иммуномодулятора, то их можно вводить совместно или последовательно по отношению друг к другу. В некоторых воплощениях вектор или композицию на основе вектора вводят совместно (например, в смеси) по отношению к одному иммуномодулятору, но последовательно по отношению к одному или более чем одному дополнительному иммуномодулятору. Совместное введение вектора или композиции на основе вектора и иммуномодуляторов может включать случаи, когда вакцину и по меньшей мере один иммуномодулятор вводят таким образом, чтобы каждый из них присутствовал в месте введения, таком как дренируемый вакциной лимфатический узел, в одно и то же время, даже если антиген и иммуномодуляторы не вводят совместно. Совместное введение вакцины и иммуномодуляторов также может включать случаи, когда вакцина или иммуномодулятор выведены из места введения, но в месте введения, таком как дренируемый вакциной лимфатический узел, сохраняется по меньшей мере один эффект выведенных вакцины или иммуномодулятора на клетки по меньшей мере до тех пор, пока один или более чем один дополнительный иммуномодулятор не будет доставлен в место введения. В тех случаях, когда вакцину на основе нуклеиновой кислоты вводят в комбинации с CpG, эта вакцина и CpG могут содержаться в одной композиции и вводиться совместно любым подходящим способом. В некоторых воплощениях вакцину на основе нуклеиновой кислоты и CpG в совместной композиции (смеси) вводят путем внутримышечной инъекции в сочетании с электропорацией.
В комбинации с векторами или композициями на основе векторов, предложенных согласно настоящему изобретению, можно использовать любые ингибиторы ISC. Примеры классов ингибиторов ISC включают антагонисты PD-1/PD-L1 (лиганд 1 PD-1), ингибиторы протеинкиназ, ингибиторы циклооксигеназы-2 (СОХ-2), ингибиторы фосфодиэстеразы типа 5 (PDE5) и ДНК-кросслинкеры. Примеры антагонистов PD-1/PD-L1 включают моноклональные антитела к PD-1 и PD-L1. Примеры ингибиторов СОХ-2 включают целекоксиб и рофекоксиб. Примеры ингибиторов PDE5 включают аванафил, лоденафил, мироденафил, силденафил, тадалафил, варденафил, уденафил и запринаст. Примером ДНК-кросслинкеров является циклофосфамид. Примеры специфических ингибиторов протеинкиназ описаны подробно ниже.
Термин «ингибитор протеинкиназ» относится к любому веществу, которое действует в качестве селективного или неселективного ингибитора протеинкиназ. Термин «протеинкиназы» относится к ферментам, которые катализируют перенос концевого фосфата аденозинтрифосфата на остатки тирозина, серина или треонина в белковых субстратах. Протеинкиназы включают рецепторные тирозинкиназы и нерецепторные тирозинкиназы. Примеры рецепторных тирозинкиназ включают EGFR (например, EGFR/HER1/ErbB1, HER2/Neu/ErbB2, HER3/ErbB3, HER4/ErbB4), INSR (инсулиновый рецептор), IGF-IR (рецептор I инсулиноподобного фактора роста), IGF-II1R, IRR (рецептор, родственный инсулиновому рецептору), PDGFR (рецептор фактора роста тромбоцитов) (например, PDGFRA, PDGFRB), с-KIT/SCFR (рецептор фактора стволовых клеток), VEGFR-1 (рецептор 1 сосудистого эндотелиального фактора роста)/FLT-1 (FMS-подобная тирозинкиназа-1), VEGFR-2/FLK-1 (киназа-1 эмбриональной печени)/KDR (рецептор, содержащий домен вставки киназы), VEGFR-3/FLT-4, FLT-3/FLK-2, CSF-1R (рецептор колониестимулирующего фактора-1), FGFR (рецептор фактора роста фибробластов) 1-4, CCK4 (киназа 4 рака толстой кишки), TRK (тирозинкиназа) А-С, MET, RON, ЕРНА 1-8, ЕРНВ 1-6, AXL, MER, TYR03, TIE (тирозинкиназа с гомологичными иммуноглобулин-подобному и эпидермальному фактору роста доменами), ТЕК, RYK, DDR 1-2, RET, c-ROS, LTK (тирозинкиназа лейкоцитов), ALK (киназа анапластической лимфомы), ROR (подобный рецепторной тирозинкиназе орфановый рецептор) 1-2, MuSK (мышечно-специфическая киназа), AATYK (апоптоз-ассоциированная тирозинкиназа) 1-3 и RTK (рецепторная тирозинкиназа) 106. Примеры нерецепторных тирозинкиназ включают BCR-ABL, Src, Frk, Btk (тирозинкиназа Брутона), Csk (киназа С-конца Src-киназы), Abl (тирозинкиназа Абельсона), Zap70, Fes/Fps, Fak (киназа фокальной адгезии), Jak (янус-киназа), Ack (ацетат-киназа) и LIMK. По схеме иммунотерапевтического лечения вакцинами, предложенной согласно описанию настоящего изобретения, ингибиторы протеинкиназ вводят млекопитающему в субоптимальной дозе. Термин «субоптимальная доза» относится к дозе в количестве ниже минимальной эффективной дозы, применяемой при введении ингибитора тирозинкиназ в качестве монотерапии (т.е., если ингибитор протеинкиназ вводят без каких-либо других терапевтических агентов) для целевого опухолевого заболевания.
Примеры конкретных ингибиторов протеинкиназ, подходящих для применения согласно схеме иммунотерапевтического лечения вакцинами, включают лапатиниб, AZD 2171, ET18OCH3, индирубин-3'-оксим, NSC-154020, PD 169316, кверцетин, росковитин, трицирибин, ZD1839, 5-йодотуберцидин, адафостин, алоизин (aloisine), альстерпаулон, аминогенистеин, API-2, апигенин, арктигенин, ARRY-334543, акситиниб, AY-22989, AZD 2171, бисиндолилмалеимид IX, CCI-779, хелеритрин, DMPQ, DRB, эдельфозин, ENMD-981693, аналог эрбстатина, эрлотиниб, фасудил, гефитиниб (ZD1839), Н-7, Н-8, Н-89, НА-100, НА-1004, НА-1077, НА-1100, гидроксифасудил, кенпаулон, KN-62, KY12420, LFM-A13, лютеолин, LY294002, LY-294002, маллотоксин, ML-9, MLN608, NSC-226080, NSC-231634, NSC-664704, NSC-680410, NU6102, оломуцин, оксиндол I, PD 153035, PD 98059, флоридзин, пикеатаннол, пикроподофиллин, PKI, РР1, РР2, PTK787/ZK222584, PTK787/ZK-222584, пурваланол А, рапамун, рапамицин, Ro 31-8220, роттлерин, SB202190, SB203580, сиролимус, SL327, SP600125, стауроспорин, STI-571, SU1498, SU4312, SU5416, семаксаниб, SU6656, SU6668, ингибитор syk (spleen tyrosine kinase; тирозинкиназа селезенки), ТВВ, TCN, тирфостин AG 1024, тирфостин AG 490, тирфостин AG 825, тирфостин AG 957, U0126, W-7, вортманнин, Y-27632, зактима, ZM 252868, гефитиниб, сунитиниба малат, эрлотиниб, лапатиниб, канертиниб, семаксиниб, ваталаниб, сорафениб, иматиниб, дазатиниб, лефлуномид, вандетаниб и нилотиниб.
В некоторых воплощениях ингибитор протеинкиназ преставляет собой мультикиназный ингибитор, который является ингибитором, действующим в отношении более чем одной конкретной киназы. Примеры мультикиназных ингибиторов включают иматиниб, сорафениб, лапатиниб, BIRB-796 и AZD-1152, AMG706, зактима, МР-412, сорафениб, дазатиниб, лестауртиниб, XL647, XL999, лапатиниб, MLN518 (также известный как СТ53518), PKC412, ST1571, АЕЕ 788, OSI-930, OSI-817, сунитиниба малат, эрлотиниб, гефитиниб, акситиниб, босутиниб, темсиролимус и нилотиниб. В некоторых конкретных воплощениях ингибитором тирозинкиназ является сунитиниб, сорафениб либо фармацевтически приемлемые соль или производное (такие как малат или тозилат) сунитиниба или сорафениба.
Сунитиниба малат, поставляемый на рынок Pfizer Inc. под торговым названием СУТЕНТ, описывается химически как (2S)-гидрокси-бутандиовая кислота в соединении с N-[2-(диэтиламино)этил]-5-[(Z)-(5-фтор-1,2-дигидро-2-оксо-3H-индол-3-илидин)метил]-2,4-диметил-1Н-пиррол-3-карбоксамидом (1:1). Соединение, его синтез и конкретные полиморфы описаны в патенте США №6573293, публикациях на патент США №№2003-0229229, 2003-0069298 и 2005-0059824 и в J.M. Manley, M.J. Kalman, B.G. Conway, C.C. Ball, J.L. Havens and R. Vaidyanathan, "Early Amidation Approach to 3-[(4-amido)pyrrol-2-yl]-2-indolinones", J. Org. Chem. 68, 6447-6450 (2003). Композиции на основе сунитиниба и его L-малатной соли описаны в публикации РСТ № WO 2004/024127. В США получено разрешение к применению сунитиниба малата для лечения гастроинтестинальной стромальной опухоли, распространенной почечноклеточной карциномы и прогрессирующих, хорошо дифференцированных нейроэндокринных опухолей поджелудочной железы у пациентов с неоперабельной локально распространенной или метастатической формой заболевания. Рекомендованная доза сунитиниба малата для человека при гастроинтестинальной стромальной опухоли (GIST) и распространенной почечноклеточной карциномы (RCC) составляет 50 мг, которую принимают перорально один раз в сутки, по схеме: прием в течение 4 недель, затем 2 недели отдыха (схема 4/2). Рекомендованная доза сунитиниба малата для нейроэндокринных опухолей поджелудочной железы (pNET) составляет 37,5 мг, которую принимают перорально один раз в сутки.
Согласно схеме иммунотерапевтического лечения вакцинами, сунитиниба малат можно вводить перорально в виде разовой дозы или многократных доз. Обычно, сунитиниба малат принимают в виде двух, трех, четырех или более следующих друг за другом еженедельных доз, затем следует период «отдыха», составляющий примерно 1 или 2 недели либо более, когда никакого сунитиниба малата не принимают. В одном из воплощений, дозы принимают в течение примерно 4 недель, с 2 неделями «отдыха». В другом воплощении сунитиниба малат принимают в течение двух недель, с «отдыхом» в течение 1 недели. Однако, его также можно принимать без периода «отдыха» в течение всего периода лечения. Эффективное количество сунитиниба малата, вводимого перорально человеку согласно схеме иммунотерапевтического лечения вакциной, обычно составляет ниже 40 мг на одного субъекта из расчета на одну дозу. Например, его можно вводить перорально в количестве 37,5; 31,25; 25; 18,75; 12,5; 6,25 мг на одного субъекта в сутки. В некоторых воплощениях сунитиниба малат вводят перорально в диапазоне 1-25 мг на одного субъекта из расчета на одну дозу. В некоторых других воплощениях сунитиниба малат вводят перорально в количестве 6,25; 12,5 или 18,75 мг на одного субъекта из расчета на одну дозу. Предусматриваются другие режимы введения и варианты, и они будут определены путем получения консультации врача.
Сорафениба тозилат, поставляемый на рынок под торговым названием НЕКСАВАР, также представляет собой мультикиназный ингибитор. Его химическое название 4-(4-{3-[4-хлор-3-(трифторметил)фенил]уреидо}фенокси)-N-метилпиридин-2-карбоксамид. В США он одобрен к применению для лечения первичного рака почки (распространенной почечноклеточной карциномы) и распространенного первичного рака печени (гепатоклеточной карциномы). Рекомендованная суточная доза составляет 400 мг, которую принимают перорально два раза в сутки. Согласно схеме иммунотерапевтического лечения вакциной, предложенной согласно описанию настоящего изобретения, эффективное количество сорафениба тозилата, вводимого перорально, обычно составляет ниже 400 мг на одного субъекта в сутки. В некоторых воплощениях эффективное количество сорафениба тозилата, вводимого перорально, находится в диапазоне 10-300 мг на одного субъекта в сутки. В некоторых других воплощениях эффективное количество сорафениба тозилата, вводимого перорально, составляет от 10 до 200 мг на одного субъекта в сутки, как например, 10, 20, 60, 80, 100, 120, 140, 160, 180 или 200 мг на одного субъекта в сутки.
Акситиниб, поставляемый на рынок под торговым названием ИНЛИТА, представляет собой селективный ингибитор рецепторов 1, 2 и 3 VEGF. Его химическое название (N-метил-2-[3-((Е)-2-пиридин-2-ил-винил)-1Н-индазол-6-илсульфанил]-бензамид. Он одобрен к применению для лечения распространенной почечноклеточной карциномы после неудачи при применении одной из предшествующих системных терапий. Начальная доза составляет 5 мг перорально два раза в сутки. Корректировки доз могут быть выполнены с учетом индивидуальной безопасности и переносимости. По схеме иммунотерапевтического лечения вакциной, предложенной согласно описанию настоящего изобретения, эффективное количество акситиниба, вводимого перорально, обычно составляет ниже 5 мг два раза в сутки. В некоторых других воплощениях эффективное количество акситиниба, вводимого перорально, составляет от 1 до 5 мг два раза в сутки. В некоторых других воплощениях эффективное количество акситиниба, вводимого перорально, составляет 1, 2, 3, 4 или 5 мг два раза в сутки.
Согласно схемам иммунотерапевтического лечения вакцинами можно использовать любые усилители IEC. Ими могут быть малые молекулы или большие молекулы (такие как белок, полипептид, ДНК, РНК и антитело). Примеры усилителей IEC, которые могут быть использованы, включают агонисты TNFR, антагонисты CTLA-4, агонисты TLR, антагонисты белка 1 программируемой клеточной смерти (PD-1) (такие как антитело к PD-1 CT-011) и антагонисты лиганда 1 белка 1 программируемой клеточной смерти (PD-L1) (такие как BMS-936559), антагонисты гена 3 активации лимфоцитов (LAG3) и антагонисты молекулы-3, содержащей T-клеточный иммуноглобулиновый и муциновый домены (TIM-3). Примеры конкретных агонистов TNFR, антагонистов CTLA-4 и агонистов TLR приведены подробно в данном описании ниже.
Агонисты TNFR
Примеры агонистов TNFR включают агонисты ОХ40, 4-1ВВ (такие как BMS-663513), GITR (такие как TRX518) и CD40. Примеры конкретных агонистов CD40 описаны подробно в данном описании ниже.
Агонистами CD40 являются вещества, которые связываются с рецептором CD40 на клетке и способны повышать одну или более активностей, ассоциируемых с CD40 или CD40L. Таким образом, термин «агонисты» CD40 охватывает термин «лиганды» CD40.
Примеры агонистов CD40 включают агонистические антитела к CD40, фрагменты агонистических антител к CD40, лиганды CD40 (CD40L) и фрагменты и производные CD40L, такие как олигомерный (например, бивалентный тримерный CD40L), содержащие их слитые белки и их варианты.
Лиганды CD40 для применения в настоящем изобретении включают любой пептид, полипептид или белок либо любую нуклеиновую кислоту, кодирующую пептид, полипептид или белок, которые могут связываться с одним или более рецепторами и активировать один или более рецепторов CD40 на клетке. Подходящие лиганды CD40 описаны, например, в патенте США №6482411, патенте США №6410711, патенте США №6391637 и патенте США №5981724, при этом все патенты и заявка и последовательности CD40L, описанные там, включены в данное описание посредством ссылки во всей своей полноте. Несмотря на то, что лиганды CD40 человека будут предпочтительны для применения при лечении людей, в данном изобретении могут быть использованы лиганды CD40 из любого вида. Для применения на животных другого вида, например, в случае воплощений для ветеринарии, предпочтительным будет лиганд CD40 из вида, соответствующего подлежащему лечению животному. В конкретных воплощениях лигандом CD40 является олигомер белка или пептида gp39, в том числе образующиеся в природе олигомеры пептида, полипептида или белка gp39, а также пептиды, полипептиды, белки (и кодирующие их нуклеиновые кислоты) gp39, которые содержат олигомеризующуюся последовательность. Несмотря на то, что согласно некоторым аспектам изобретения предпочтительными являются такие олигомеры, как димеры, тримеры и тетрамеры, согласно другим аспектам изобретения для применения предусмотрены олигомерные структуры большего размера, при условии, что олигомерная структура сохраняет способность связываться с одним рецептором или несколькими рецепторами CD40 и активировать их.
В некоторых других воплощениях агонистом CD40 является антитело к CD40 или его антигенсвязывающий фрагмент.Антитело может представлять собой человеческое, гуманизированное или частично человеческое химерное антитело к CD40. Примеры конкретных моноклональных антител к CD40 включают моноклональное антитело G28-5, mAb89, ЕА-5 или S2C6 и СР870893. В конкретном воплощении агонистическим антителом к CD40 является СР870893 или дацетузумаб (SGN-40).
СР870893 представляет собой полностью человеческое агонистическое моноклональное антитело (mAb) к CD40, которое было исследовано в клинических условиях в качестве противоопухолевой терапии. Структура и получение СР870893 раскрыты в заявке WO 2003041070 (где антитело определяют по внутреннему идентификационному номеру «21.4.1»). Аминокислотные последовательности тяжелой цепи и легкой цепи СР870893 приведены в SEQ ID NO: 40 и SEQ ID NO: 41, соответственно. В клинических испытаниях СР870893 вводили посредством внутривенной инфузии в дозах, обычно лежащих в диапазонах 0,05-0,25 мг/кг на одну инфузию. В фазе I клинического исследования оцененная максимальная переносимая доза (MTD) СР870893 составляла 0,2 мг/кг, а ограничивающие дозу токсические эффекты включали синдром высвобождения цитокинов (CRS) 3-й степени и крапивницу 3-й степени (Jens Ruter et al.: Immune modulation with weekly dosing of an agonist CD40 antibody in a phase I study of patients with advanced solid tumors. Cancer Biology & Therapy, 10: 10, 983-993; November 15, 2010). По схеме иммунотерапевтического лечения вакциной, предложенной согласно описанию настоящего изобретения, СР870893 можно вводить внутрикожковнутрикожно, подкожно или местно. Предпочтительно, его вводят внутрикожко. Эффективное количество СР870893, подлежащего введению в соответствии с данной схемой, обычно составляет менее 0,2 мг/кг, в типичном случае находится в диапазоне 0,01-0,15 мг/кг или 0,05-0,1 мг/кг.
Дацетузумаб (также известный как SGN-40 или huS2C6; номер в Химической реферативной службе (CAS) 88-486-59-9) представляет собой другое агонистическое антитело к CD40, которое было изучено в клинических испытаниях в отношении вялотекущих лимфом, диффузных крупноклеточных В-клеточных лимфом и множественной миеломы. В клинических испытаниях дацетузумаб вводили внутривенно один раз в неделю в дозах в диапазоне от 2 мг/кг до 16 мг/кг. По схеме иммунотерапевтического лечения вакциной, предложенной согласно описанию настоящего изобретения, дацетузумаб можно вводить внутрикожко, подкожно или местно. Предпочтительно, его вводят внутрикожко. Эффективное количество дацетузумаба, подлежащего введению согласно схеме иммунотерапевтического лечения вакцинами, обычно составляет ниже 16 мг/кг, в типичном случае находится в диапазоне 0,2-14 мг/кг, или 0,5-8 мг/кг, или 1-5 мг/кг.
Ингибиторы CTLA-4
Подходящие антагонистические в отношении CTLA-4 агенты для применения по схеме иммунотерапевтического лечения вакцинами, предложенной согласно описанию настоящего изобретения, включают, без ограничения, антитела к CTLA-4 (такие как человеческие антитела к CTLA-4, мышиные антитела к CTLA-4, антитела млекопитающих к CTLA-4, гуманизированные антитела к CTLA-4, моноклональные антитела к CTLA-4, поликлональные антитела к CTLA-4, химерные антитела к CTLA-4, однодоменные антитела к CTLA-4), фрагменты антител к CTLA-4 (такие как одноцепочечные фрагменты антитела к CTLA-4, фрагменты тяжелой цепи антитела к CTLA-4 и фрагменты легкой цепи антитела к CTLA-4) и ингибиторы CTLA-4, оказывающие агонистическое действие на костимуляторный путь. В некоторых воплощениях ингибитором CTLA-4 является ипилимумаб или тремелимумаб.
Ипилимумаб (также известный как МЕХ-010 или MDX-101), поставляемый на рынок как ЕРВОЙ, представляет собой человеческое антитело к CTLA-4 человека. Ипилимумаб также может быть обозначен по его регистрационному № в CAS 477202-00-9 и описан как антитело 10DI в публикации РСТ № WO 01/14424, включенной в данное описание посредством ссылки во всей своей полноте. Примеры фармацевтической композиции, содержащей ипилимумаб, приведены в публикации РСТ № WO 2007/67959. В США ипилимумаб одобрен к применению для лечения неоперабельной или метастатической меланомы. Рекомендованная доза ипилимумаба в качестве монотерапии составляет 3 мг/кг путем внутривенного введения каждые 3 недели в общей сложности из расчета на 4 дозы. В способах, предложенных согласно настоящему изобретению, ипилимумаб вводят локально, в частности, внутрикожко или подкожно. Эффективное количество ипилимумаба, вводимого локально, обычно находится в диапазоне 5-200 мг/доза на одного субъекта. В некоторых воплощениях эффективное количество ипилимумаба находится в диапазоне 10-150 мг/доза на одного субъекта. В некоторых конкретных воплощениях эффективное количество ипилимумаба составляет примерно 10, 25, 50, 75, 100, 125, 150, 175 или 200 мг/доза на одного субъекта.
Тремелимумаб (также известный как СР-675206) представляет собой полностью человеческое моноклональное антитело IgG2 и имеет номер в CAS 745013-59-6. Тремелимумаб описан как антитело 11.2.1 в патенте США №6682736, включенном в данное описание посредством ссылки во всей своей полноте и для всех назначений. Аминокислотные последовательности тяжелой цепи и легкой цепи тремелимумаба приведены в SEQ ID NO: 42 и 43, соответственно. Тремелимумаб был изучен в клинических испытаниях для лечения различных опухолей, включая меланому и рак молочной железы; при этом тремелимумаб вводили внутривенно либо в виде разовой дозы, либо в виде многократных доз каждые 4 недели или 12 недель в диапазоне доз от 0,01 до 15 мг/кг. По схемам, предложенным согласно настоящему изобретению, тремелимумаб вводят локально, в частности, внутрикожко или подкожно. Эффективное количество тремелимумаба, вводимого внутрикожко или подкожно, обычно находится в диапазоне 5-200 мг/доза на одного субъекта. В некоторых воплощениях эффективное количество тремелимумаба находится в диапазоне 10-150 мг/доза на одного субъекта. В некоторых конкретных воплощениях эффективное количество тремелимумаба составляет примерно 10, 25, 37,5, 40, 50, 75, 100, 125, 150, 175 или 200 мг/доза на одного субъекта.
Агонисты Toll-подобного рецептора (TLR)
Термин «агонист Toll-подобного рецептора» или «агонист TLR» относится к соединению, которое действует в качестве агониста Toll-подобного рецептора (TLR). Сюда включены агонисты TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10 и TLR11 или их комбинация. Если не указано иное, ссылка на соединение-агонист TLR может включать соединение в любой фармацевтически приемлемой форме, включая любой изомер (например, диастереомер или энантиомер), соль, сольват, полиморф и тому подобное. В частности, если соединение является оптически активным, то ссылка на соединение может включать каждый из энантиомеров данного соединения, а также рацемические смеси энантиомеров. Кроме того, такое соединение может быть определено как агонист одного или более конкретных TLR (например, агонист TLR7, агонист TLR8 или агонист TLR7/8).
В некоторых воплощениях агонистами TLR являются агонисты TLR9, в частности, CpG-олигонуклеотиды (или CpG.ODN (олигодезоксинуклеотид)). CpG-олигонуклеотид представляет собой короткую молекулу нуклеиновой кислоты, содержащую цитозин, за которым следует гуанин, соединенный фосфатной связью, при этом пиримидиновое кольцо цитозина является неметилированным. CpG-мотив представляет собой паттерн оснований, которые включают неметилированный центральный CpG, окруженный по меньшей мере одним основанием, фланкирующим центральный CpG (по его 3'-и 5'-концам). CpG-олигонуклеотиды включают как D-, так и K-олигонуклеотиды. CpG-олигонуклеотид может быть неметилированным целиком или может быть неметилированным частично. Примеры CpG-олигонуклеотидов, полезных в способах, предложенных согласно описанию настоящего изобретения, включают таковые, описанные в патентах США №№6194388, 6207646, 6214806, 628371, 6239116 и 6339068.
Примеры конкретных CpG-олигонуклеотидов, полезных в способах, предложенных согласно описанию настоящего изобретения, включают:
;
и
.
Было проведено интенсивное исследование CpG7909, синтетического 24-мерного одноцепочечного олигонуклеотида, в отношении лечения рака в качестве монотерапии и в комбинации с химиотерапевтическими агентами, а также в качестве адъюванта для вакцин против раковых и инфекционных заболеваний. Сообщалось, что разовая внутривенная доза CpG 7909 хорошо переносится без каких-либо клинических эффектов и какой-либо значительной токсичности вплоть до 1,05 мг/кг, в то время как для разовой дозы введенного подкожно CpG 7909 получали значение максимальной переносимой дозы (MTD), равное 0,45 мг/кг, с ограничивающим дозу токсическим эффектом в виде миалгии и системными эффектами (см. Zent, Clive S., et al.: Phase I clinical trial of CpG 7909 (PF-03512676) in patients with previously treated chronic lymphocytic leukemia. Leukemia and Lymphoma, 53(2): 211-217(7), (2012)). По схемам, предложенным согласно описанию настоящего изобретения, CpG7909 можно вводить инъекцией в мышцу или любыми другими подходящими методами. Предпочтительно, его вводят локально вблизи от дренируемого вакциной лимфатического узла, в частности, путем внутрикожкого или подкожного введения. Для применения вместе с вакциной на основе нуклеиновой кислоты, такой как ДНК-вакцина, предпочтительно можно приготовить совместную единую композицию на основе CpG и вакцины и вводить путем внутримышечной инъекцией в сочетании с электропорацией. Эффективное количество CpG7909, доставляемого путем внутримышечного, внутрикожкого или подкожного введения, обычно находится в диапазоне от 10 мкг/доза до 10 мг/доза. В некоторых воплощениях эффективное количество CpG7909 находится в диапазоне 0,05-14 мг/доза. В некоторых конкретных воплощениях эффективное количество CpG7909 составляет примерно 0,05; 0,1; 0,2; 0,3; 0,4; 0,5 или 1 мг/доза. Другие CpG-олигонуклеотиды, включая CpG 24555 и CpG 10103, можно вводить аналогичным образом и с аналогичными уровнями доз.
В некоторых конкретных воплощениях согласно описанию настоящего изобретения предложен способ усиления иммуногенности или терапевтического эффекта вакцины для лечения опухолевого заболевания у человека, включающий введение человеку (1) эффективного количества по меньшей мере одного ингибитора ISC и (2) эффективного количества по меньшей мере одного усилителя IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из сорафениба тозилата, сунитиниба малата, акситиниба, эрлотиниба, гефитиниба, босутиниба, темсиролимуса или нилотиниба, и при этом по меньшей мере один усилитель IEC выбран из ингибитора CTLA-4, агониста TLR или агониста CD40. В некоторых предпочтительных воплощениях схема включает введение человеку (1) эффективного количества по меньшей мере одного ингибитора ISC и (2) эффективного количества по меньшей мере одного усилителя IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из акситиниба, сорафениба тозилата или сунитиниба малата, и при этом по меньшей мере один усилитель IEC представляет собой ингибитор CTLA-4, выбранный из ипилимумаба или тремелимумаба. В некоторых других предпочтительных воплощениях схема включает введение человеку (1) эффективного количества по меньшей мере одного ингибитора ISC и (2) эффективного количества по меньшей мере двух усилителей IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из сунитиниба или акситиниба, и при этом по меньшей мере два усилителя IEC представляют собой тремелимумаб и агонист TLR, выбранный из CpG7909, CpG2455 или CpG10103.
В некоторых других воплощениях согласно описанию настоящего изобретения предложен способ лечения рака предстательной железы у человека, включающий введение человеку (1) эффективного количества вакцины, способной вызывать иммунный ответ на РАА человека, (2) эффективного количества по меньшей мере одного ингибитора ISC и (3) эффективного количества по меньшей мере одного усилителя IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из сорафениба тозилата, сунитиниба малата, акситиниба, эрлотиниба, гефитиниба, босутиниба, темсиролимуса или нилотиниба, и при этом по меньшей мере один усилитель IEC выбран из ингибитора CTLA-4, агониста TLR или агониста CD40. В некоторых предпочтительных воплощениях способ включает введение человеку (1) эффективного количества вакцины, способной вызывать иммунный ответ на РАА человека, (2) эффективного количества по меньшей мере одного ингибитора ISC и (3) эффективного количества по меньшей мере одного усилителя IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из сорафениба тозилата, сунитиниба малата или акситиниба, и при этом по меньшей мере один усилитель IEC представляет собой ингибитор CTLA-4, выбранный из ипилимумаба или тремелимумаба.
В некоторых других конкретных воплощениях способ включает введение человеку (1) эффективного количества по меньшей мере одного ингибитора ISC и (2) эффективного количества по меньшей мере двух усилителей IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из сунитиниба или акситиниба, и при этом по меньшей мере два усилителя IEC представляют собой тремелимумаб и агонист TLR, выбранный из CpG7909, CpG2455 или CpG10103.
Дополнительные терапевтические агенты
Схема иммунотерапевтического лечения вакцинами, предложенная согласно описанию настоящего изобретения, может дополнительно включать дополнительный терапевтический агент. Можно использовать широкий ряд противораковых терапевтических агентов, включая химиотерапевтические агенты и гормонотерапевтические агенты. Термин «химиотерапевтический агент» относится к химическому или биологическому веществу, которое может вызывать гибель раковых клеток или воздействовать на рост, деление, репарацию и/или функцию раковых клеток. Примеры конкретных химиотерапевтических агентов включают: абиратерона ацетат, кабазитаксел, дегареликс, деносумаб, доцетаксел, энзалутамид, лейпролида ацетат, преднизон, сипулейцел-T и дихлорид радия-223. Термин «гормонотерапевтический агент» относится к химическому или биологическому веществу, которое ингибирует или устраняет продуцирование гормона или ингибирует либо нейтрализует влияние гормона на рост и/или выживаемость раковых клеток. Примеры конкретных гормонотерапевтических агентов включают лейпролид, гозерелин, трипторелин, гистрелин, бикалутамид, флутамид и нилутамид. VBIR, предложенную согласно данному описанию, также можно использовать в комбинации с другими терапиями, включая (1) хирургические методы для удаления всех или части органов или желез, которые участвуют в продуцировании гормона, таких как яичники, яички, надпочечник и питуитарная железа, и (2) лучевую терапию, при которой органы или железы пациента подвергают облучению в дозе, достаточной для ингибирования или устранения продуцирования целевого гормона.
Д. ПРИМЕРЫ
Следующие далее примеры приведены для иллюстрации некоторых воплощений изобретения. Их не следует истолковывать как каким-либо образом ограничивающие объем данного изобретения. Из приведенного выше обсуждения и этих примеров специалист в данной области техники может выявить существенные признаки изобретения и без отклонения от его сущности и объема может выполнить различные изменения и модификации изобретения для адаптации его к различным применениям и условиям.
ПРИМЕР 1. АНТИГЕНЫ В ЦИТОЗОЛЬНОМ, СЕКРЕТИРУЕМОМ И МЕМБРАНОСВЯЗАННОМ ФОРМАТАХ, ПРОИСХОДЯЩИЕ ИЗ БЕЛКА PSMA ЧЕЛОВЕКА
1А. Конструирование иммуногенных полипептидов PSMA
Конструкции ДНК, кодирующие иммуногенные полипептиды PSMA в цитозольном, секретируемом и модифицированом форматах, создавали на основе последовательности нативного белка PSMA человека и тестировали в отношении их способности индуцировать обусловленные эффекторными клетками противоопухолевые иммунные ответы. Ниже представлены структура и способ получения каждого из форматов антигена PSMA человека.
1А1. Цитозольный антиген PSMA человека. Конструировали иммуногенный полипептид PSMA в цитозольной форме, чтобы после экспрессии он оставался внутри клетки. Цитоплазматический домен (аминокислоты 1-19) и трансмембранный домен (аминокислоты 20-43) PSMA человека удаляли, получая цитозольный полипептид PSMA, который состоит из аминокислот 44-750 (внеклеточный домен или ECD) PSMA человека с SEQ ID NO: 1. К N-концу данного полипептида можно добавить оптимальную последовательность Козака «MAS» для усиления экспрессии или облегчения клонирования.
1А2. Секретируемый антиген PSMA человека. Конструировали иммуногенный полипептид PSMA в секретируемой форме для осуществления секреции полипептида из клетки при его экспрессии. Этот секретируемый полипептид составлен из аминокислот 44-750 (ECD) PSMA человека с SEQ ID NO: 1, секреторного элемента Ig-каппа, имеющего аминокислотную последовательность ETDTLLLWVLLLWVPGSTGD, и линкера, состоящего из двух аминокислот (АА), на N-конце для максимизации секреции антигена PSMA после его экспрессии.
1А3. Мембраносвязанный антиген PSMA человека. Конструировали иммуногенный мембраносвязанный полипептид PSMA для стабилизирования данного полипептида на клеточной поверхности. Первые 14 аминокислот белка PSMA человека удаляли и получали иммуногенный полипептид, который состоит из аминокислот 15-750 белка PSMA человека с SEQ ID NO: 1. Этот иммуногенный полипептид, состоящий из аминокислот 15-750 нативного белка PSMA человека с SEQ ID NO: 1 и имеющий последовательность, идентичную на 100% последовательности нативного белка PSMA человека, также обозначен как «модифицированный антиген PSMA человека», «модифицированный антиген hPSMA» или «антиген hPSMAmod» в описании настоящего изобретения. Также создавали приведенные далее три иммуногенных полипептида PSMA (называемые «перетасованными модифицированными антигенами PSMA»), которые представляют собой варианты модифицированного антигена PSMA человека (SEQ ID NO: 9):
(1) перетасованный модифицированный антиген 1 PSMA, имеющий аминокислотную последовательность с SEQ ID NO: 3;
(2) перетасованный модифицированный антиген 2 PSMA, имеющий аминокислотную последовательность с SEQ ID NO: 5; и
(3) перетасованный модифицированный антиген 3 PSMA, имеющий аминокислотную последовательность с SEQ ID NO: 7.
Нуклеотидные последовательности, кодирующие перетасованные модифицированные антигены 1, 2 и 3 PSMA, приведены в SEQ ID NO: 4, 6 и 8, соответственно.
1Б. Получение ДНК-плазмид для экспрессии антигенов PSMA
Конструкции ДНК, кодирующие цитозольный, секретируемый и модифицированный антигены PSMA, клонировали по отдельности в вектор PJV7563, подходящий для тестирования in vivo на животных (Фиг. 1). Обе цепи ДНК в векторах PJV7563 секвенировали для подтверждения целостности конструкции.
Крупномасштабный препарат плазмидной ДНК (Qiagen/CsCI) получали из клона с подтвержденной последовательностью. Качество плазмидной ДНК подтверждали высоким значением соотношения 260/280, высоким значением соотношения сверхскрученной/содержащей разрыв ДНК, низкими уровнями эндотоксина (меньше 10 ед./мг ДНК) и отрицательным результатом в отношении бионагрузки.
1В. Экспрессия конструкций PSMA в клетках млекопитающих
Экспрессию цитозольного, секретируемого и модифицированного антигенов PSMA оценивали методом сортировки флуоресцентно-активированных клеток (FACS). Клетки 293 млекопитающих трансфицировали вводимыми путем PMED векторами PJV7563, кодирующими различные иммуногенные полипептиды PSMA. Спустя трое суток клетки 293 окрашивали, используя мышиное антитело к PSMA, с последующей обработкой антимышиным вторичным антителом крысы, конъюгированным с флуоресцентным флуоресцеинизотиоцианатом (FITC). Результаты представлены в Таблице 2. Данные, представленные в виде среднего значения интенсивности флуоресценции (MFI) по отношению к отрицательным контролям, подтвердили, что модифицированный антиген PSMA человека экспрессируется на клеточной поверхности.
ПРИМЕР 2. КОНСТРУИРОВАНИЕ РАЗЛИЧНЫХ ИММУНОГЕННЫХ ПОЛИПЕПТИДОВ PSA
3А. Конструирование иммуногенных полипептидов PSA
Аналогично тому, как было описано в примере 1 для трех разных форм иммуногенного полипептида PSMA (например, цитозольной, мембраносвязанной и секретируемой форм), также создавали конструкции иммуногенных полипептидов PSA в трех формах на основе последовательности PSA человека. Иммуногенный полипептид PSA в цитозольной форме, который состоит из аминокислот 25-261 нативного PSA человека, сконструирован путем делеции сигнала секреции и продомена (аминокислот 1-24). Аминокислотная последовательность этого цитозольного иммуногенного полипептида PSA представлена в SEQ ID NO: 17. Секретируемая форма полипептида PSA представляет собой нативный полноразмерный PSA человека (аминокислоты 1-261). Иммуногенный полипептид PSA в мембраносвязанной форме сконструирован путем присоединения цитозольной формы иммуногенного полипептида PSA (аминокислот 25-261 нативного PSA человека) к трансмембранному домену PSMA человека (аминокислотам 15-54 PSMA человека).
3Б. Иммунные ответы у мышей Pasteur и HLA А24
План исследования. Мышей HLA А2 Pasteur или мышей HLA А24 в возрасте от восьми до 10 недель иммунизировали ДНК, экспрессирующей различные антигены PSA, приведенные в примере 3А, с использованием PMED по схеме первичной/вторичной иммунизации с двухнедельными интервалами между каждыми вакцинациями, как описано в примере 1. Антигенспецифические T- и B-клеточные ответы измеряли через 7 суток по окончании последней иммунизации в анализе интерферон-гамма (IFNγ)-ELISPOT и сэндвич-ELISA (иммуноферментный твердофазный анализ).
Данные ELISpot (метод иммуноферментных пятен), показанные в Таблице 3, указывают на то, что иммуногенные полипептиды PSA, как в цитозольной, так и мембраносвязанной формах, способны индуцировать T-клетки, которые распознают опухолевые клетки человека, трансдуцированные аденовирусом с целью экспрессии цитозольного антигена PSA (SKmel5-Ad-PSA), но не клетки, трансдуцированные аденовирусом с целью экспрессии eGFP (улучшенный зеленый флуоресцентный белок) (SKmel5-Ad-eGFP). Эти два антигена также вызывали ответ на белок PSA. У секретируемого антигена PSA отсутствовала способность индуцировать T-клетки как к белку SKmel5-Ad-PSA, так и к PSA. Количество клеток, образующих «ореол», (SFC) больше 50 считается положительным ответом.
Приведенные в Таблице 4 данные демонстрируют, что иммуногенные полипептиды PSA как в секретируемой, так и в мембраносвязанной формах способны индуцировать антительные ответы на PSA.
ПРИМЕР 3. СОЗДАНИЕ КОНСТРУКЦИЙ МУЛЬТИАНТИГЕННЫХ ВАКЦИН
В этом примере описаны конструкции плазмид, содержащих мультиантигенную конструкцию, созданные с использованием разных стратегией. Эти плазмиды содержат один и тот же общий плазмидный остов, что и pPJV7563. Если не указано иное, гены, включенные в мультиантигенные конструкции, кодируют (1) иммуногенный полипептид PSMA с SEQ ID NO: 9, (2) иммуногенный полипептид PSCA, содержащий аминокислоты 2-125 из SEQ ID NO: 21, и (3) иммуногенный полипептид PSA с SEQ ID NO: 17.
ПРИМЕР ЗА. ПЛАЗМИДЫ, СОДЕРЖАЩИЕ ДВОЙНУЮ АНТИГЕННУЮ КОНСТРУКЦИЮ
3А1. Конструирование плазмиды с использованием нескольких промоторов
Плазмида 460 (двойной промотор PSMA/PSCA). Плазмиду 460 конструировали с использованием методов сайт-специфического мутагенеза, полимеразной цепной реакции (ПЦР) и встраивания рестрикционного фрагмента. Сначала в плазмиду 5259 вводили сайт рестрикции для KpnI выше относительно промотора CMV методом сайт-специфического мутагенеза с использованием праймеров MD5 и MD6 в соответствии с протоколом производителя (набор Quickchange, Agilent Technologies, Santa Clara, CA). Затем проводили ПЦР-амплификацию экспрессионной кассеты, состоящей из минимального промотора CMV, PSMA человека и терминатора транскрипции β-глобулина кролика, с плазмиды 5166, применяя праймеры, несущие сайты рестрикции для KpnI (MD7 и MD8). ПЦР-ампликон рестрицировали с использованием KpnI и встраивали в только что введенный сайт для KpnI плазмиды 5259, обработанной щелочной фосфатазой кишечника теленка (CIP).
3А2. Конструирование двойных антигенных конструкций с использованием 2А-пептидов
Плазмида 451 (PSMA-T2A-PSCA). Плазмиду 451 конструировали с использованием методов ПЦР с перекрывающимися праймерами и замены рестрикционного фрагмента. Сначала проводили ПЦР-амплификацию гена, кодирующего аминокислоты 15-750 PSMA человека, применяя в качестве матрицы плазмиду 5166, с использованием праймеров 119 и 117. ПЦР-амплификацию гена, кодирующего полноразмерный PSCA человека, проводили, применяя в качестве матрицы плазмиду 5259, с использованием праймеров 118 и 120. В результате ПЦР достигали добавления перекрывающихся последовательностей 2А-пептидов TAV (Т2А) на 3'-конце PSMA и 5'-конце PSCA. Эти ампликоны смешивали вместе и проводили ПЦР-амплификацию, используя праймеры 119 и 120. Ампликон PSMA-T2A-PSCA рестрицировали, используя NheI и BgIII, и встраивали в аналогичным образом рестрицированную плазмиду 5166. Чтобы повысить эффективность расщепления, между PSMA и Т2А-кассетой вводили глицин-сериновый линкер.
Плазмида 454 (PSCA-F2A-PSMA). Плазмиду 454 создавали с использованием методов ПЦР и замены рестрикционного фрагмента. Сначала проводили ПЦР-амплификацию гена, кодирующего полноразмерный PSCA человека, применяя в качестве матрицы плазмиду 5259, с использованием праймеров 42 и 132. Этот ампликон рестрицировали, используя BamHI, и встраивали в аналогичным образом рестрицированную плазмиду 5300, обработанную CIP. Чтобы повысить эффективность расщепления, между PSMA и кассетой FMDV 2А (F2A) вводили глицин-сериновый линкер.
Плазмида 5300 (PSA-F2A-PSMA). Плазмиду 5300 конструировали с использованием методов ПЦР с перекрывающимися праймерами и замены рестрикционного фрагмента. Сначала проводили ПЦР-амплификацию гена, кодирующего аминокислоты 25-261 PSA, с плазмиды 5297, используя праймеры MD1 и MD2. ПЦР-амплификацию гена, кодирующего аминокислоты 15-750 PSMA человека, проводили с плазмиды 5166, используя праймеры MD3 и MD4. В результате ПЦР достигали добавления перекрывающихся последовательностей Р2А-пептидов на 3'-конце PSA и 5'-конце PSMA. Эти ампликоны смешивали вместе и выполняли удлинение с использованием ПЦР. Ампликон PSA-F2A-PSMA рестрицировали, используя NheI и BgIII, и встраивали в аналогичным образом рестрицированную плазмиду pPJV7563.
3А3. Двойные антигенные конструкции, в которых использованы участки внутренней посадки рибосомы
Плазмида 449 (PSMA-mIRES-PSCA). Плазмиду 449 конструировали с использованием методов ПЦР с перекрывающимися праймерами и замены рестрикционного фрагмента. Сначала проводили ПЦР-амплификацию гена, кодирующего полноразмерный PSCA человека, с плазмиды 5259, используя праймеры 124 и 123. ПЦР-амплификацию минимального IRES из EMCV проводили с pShuttle-IRES, используя праймеры 101 и 125. Перекрывающиеся ампликоны смешивали вместе и проводили ПЦР-амплификацию с использованием праймеров 101 и 123. Ампликон IRES-PSCA рестрицировали, используя BgIII и BamHI, и встраивали в рестрицированную BgIII, обработанную CIP плазмиду 5166. Чтобы фиксировать спонтанную мутацию в пределах IRES, этот IRES, содержащий последовательность от сайта AvrII до сайта KpnI, заменяли на эквивалентный фрагмент из pShuttle-IRES.
Плазмида 603 (PSCA-pIRES-PSMA). Плазмиду 603 конструировали с использованием методов ПЦР и бесшовного клонирования. Ген, кодирующий полноразмерный PSCA человека, присоединенный на своем 3'-конце к предпочтительному IRES EMCV, амплифицировали с плазмиды 455, используя ПЦР с праймерами SD546 и SD547. Амплификацию гена, кодирующего аминокислоты 15-750 PSMA человека, проводили с помощью ПЦР с плазмиды 5166, используя праймеры SD548 и SD550. Эти два перекрывающихся ПЦР-ампликона встраивали в плазмиду pPJV7563, рестрицированную NheI и BgIII, используя метод бесшовного клонирования в соответствии с инструкциями производителя (Invitrogen, Carlsbad, СА).
Плазмида 455 (PSCA-mIRES-PSA). Плазмиду 455 конструировали с использованием методов ПЦР с перекрывающимися праймерами и замены рестрикционного фрагмента. Сначала проводили ПЦР-амплификацию гена, кодирующего аминокислоты 25-261 PSA человека, с плазмиды 5297, используя праймеры 115 и 114. ПЦР-амплификацию минимального IRES EMCV проводили с pShuttle-IRES, используя праймеры 101 и 116. Перекрывающиеся ампликоны смешивали вместе и проводили ПЦР-амплификацию с использованием праймеров 101 и 114. Ампликон IRES-PSA рестрицировали, используя BgIII и BamHI, и встраивали в рестрицированную BgIII, обработанную CIP плазмиду 5259. Чтобы фиксировать спонтанную мутацию в этом клоне, последовательность от сайта BgIII до сайта BstEII заменяли на эквивалентный фрагмент, полученный в результате проведения еще одной ПЦР с использованием перекрывающихся праймеров.
ПРИМЕР 3Б. ПЛАЗМИДЫ, СОДЕРЖАЩИЕ ТРОЙНУЮ АНТИГЕННУЮ КОНСТРУКЦИЮ
Общая стратегия. Для введения в различных комбинациях в тройные антигенные плазмидные векторы отбирали ряд двойных антигенных плазмид, включая PSA-F2A-PSMA, PSMA-mIRES-PSCA, PSMA-T2A-PSCA, PSA-T2A-PSCA, PSCA-F2A-PSMA, PSCA-pIRES-PSMA и PSMA-mIRES-PSA. Во всех случаях основу для плазмидных векторов составлял остов родительской плазмиды pPJV7563. Для управления экспрессией всех трех антигенов, в четырех плазмидных векторах (плазмидах 456, 457, 458 и 459) использовали один полный промотор CMV с терминатором транскрипции гена β-глобулина кролика. Применение двух других плазмидных векторов (плазмид 846 и 850) для управления экспрессией этих трех антигенов основывалось на стратегии двойного промотора в комбинации либо с IRES, либо 2А-пептидами. Плазмиды с множественными 2А-кассетами конструировали такими, чтобы они несли разные кассеты для сведения к минимуму вероятности рекомбинации между первой и второй кассетами в процессе амплификации плазмиды/вектора. Экспрессию антигенов демонстрировали с использованием проточной цитометрии (Фиг. 7А и 7Б) и вестерн-блоттинга (Фиг. 8А и 8Б).
Плазмида 456 (PSA-F2A-PSMA-mIRES-PSCA). Плазмиду 456 конструировали с использованием метода замены рестрикционного фрагмента. Плазмиду 5300 рестрицировали, используя Nhe I и Нра I, и инсерционный сегмент размером приблизительно 1,8 тысяч пар оснований (т.п.о.) лигировали в аналогичным образом рестрицированную плазмиду 449.
Плазмида 457 (PSA-F2A-PSMA-T2A-PSCA). Плазмиду 457 конструировали с использованием метода замены рестрикционного фрагмента. Плазмиду 5300 рестрицировали, используя Nhe I и Нра I, и инсерционный сегмент размером приблизительно 1,8 т.п.о. лигировали в аналогичным образом рестрицированнуюплазмиду 451.
Плазмида 458 (PSA-T2A-PSCA-F2A-PSMA). Плазмиду 458 конструировали с использованием методов ПЦР и замены рестрикционного фрагмента. Проводили ПЦР-амплификацию гена, кодирующего аминокислоты 25-261 PSA человека, с плазмиды 5297, используя праймеры 119 и 139, что приводило в результате к добавлению последовательности Т2А и сайта рестрикции для Nhe I на 3'-конце. Этот ампликон рестрицировали, используя Nhe I, и встраивали в аналогичным образом рестрицированную плазмиду 454.
Плазмида 459 (PSCA-F2A-PSMA-mIRES-PSA). Плазмиду 459 конструировали с использованием метода замены рестрикционного фрагмента. Плазмиду 454 рестрицировали, используя Nhe I и BgI II, и инсерционный сегмент, содержащий PSCA-F2A-PSMA, лигировали в аналогичным образом рестрицированную плазмиду 455.
Плазмида 846 (CBA-PSA, CMV-PSCA-pIRES-PSMA). Плазмиду 846 конструировали с использованием методов ПЦР и бесшовного клонирования. Сначала синтезировали экспрессионную кассету, которая состояла из 1) промотора и 5'-нетранслируемого участка гена бета-актина цыпленка (CBA), 2) гибрида гена бета-актина цыпленка/интрона гена бета-глобина кролика, 3) гена, кодирующего аминокислоты 25-261 PSA человека, и 4) терминатора гена бычьего гормона роста (BGH). Эту экспрессионную кассету для PSA амплифицировали с помощью ПЦР с плазмиды 796, используя праймеры 3SaIICBA и 5SaIIBGH. Этот ампликон клонировали с использованием сайта SaII плазмиды 603, применяя набор для сборки и бесшовного клонирования (Seamless Cloning and Assembly Kit) GeneArt (Invitrogen, Carlsbad, CA). После доставки этой плазмиды в клетку экспрессия PSA будет управляться промотором СВА, тогда как экспрессия PSCA и PSMA будет управляться промотором CMV.
Плазмида 850 (CBA-PSA, CMV-PSCA-F2A-PSMA). Плазмиду 850 конструировали с использованием методов ПЦР и бесшовного клонирования. Сначала управляемую промотором СВА экспрессионную кассету для PSA амплифицировали с помощью ПЦР с плазмиды 796, используя праймеры 3SaIICBA и 5SaIIBGH. Этот ампликон клонировали с использованием сайта SaII плазмиды 454, применяя набор для бесшовного клонирования GeneArt. После доставки этой плазмиды в клетку экспрессия PSA будет управляться промотором СВА, тогда как экспрессия PSCA и PSMA будет управляться промотором CMV.
Плазмида 916 (PSA-T2A-PSCA-F2A-PSMA). Плазмиду 916 конструировали с использованием методов ПЦР и клонирования по Гибсону. Гены, кодирующие три полипептида РАА, амплифицировали с помощью ПЦР и лигировали с использованием сайтов Nhe I/BgI II в плазмиду pPJV7563 методами клонирования по Гибсону. Полная нуклеотидная последовательность плазмиды 916 приведена в SEQ ID NO: 62. Плазмида 458 и плазмида 916 кодируют одну и ту же аминокислотную последовательность, содержащую эти три иммуногенных полипептида РАА, аминокислотная последовательность которых приведена в SEQ ID NO: 60. Нуклеотидная последовательность плазмиды 916, которая кодирует аминокислотную последовательность, содержащую эти три полипептида РАА, является кодон-оптимизированной и также приведена в SEQ ID NO: 61.
ПРИМЕР 3В. ТРОЙНЫЕ АНТИГЕННЫЕ АДЕНОВИРУСНЫЕ ВЕКТОРЫ
Общая стратегия. Как и в случае с ДНК-плазмидами, для доставки нескольких антигенов рака предстательной железы можно сконструировать вирусные векторы. Чтобы создать тройные антигенные аденовирусные векторы, использовали в различных сочетаниях три стратегии мультиантигенной экспрессии, описанные выше для мультиантигенных конструкций: двойные промоторы, 2А-пептиды и участки внутренней посадки рибосомы. Кратко, мультиантигенные экспрессионные кассеты клонировали с использованием плазмиды pShuttle-CMV, модифицированной так, чтобы нести две копии последовательности тетрациклинового оператора (TetO2). Используя векторную систему AdEasy в соответствии с протоколами производителя (Agilent Technologies, Inc., Santa Clara, CA), создавали рекомбинантные векторы на основе аденовируса серотипа 5. Размножение вирусов осуществляли в клетках почки человеческого эмбриона 293 (HEK293) и очищение проводили путем двукратного центрифугирования в градиенте плотности хлорида цезия в соответствии со стандартными протоколами. Перед началом исследований in vivo, исходные суспензии вирусов подробно охарактеризовывали в отношении концентрации вирусных частиц, титра инфекционности, стерильности, эндотоксина, целостности генома и целостности трансгена, идентичности и экспрессии трансгена.
Аденовирус-733 (PSA-F2A-PSMA-T2A-PSCA). Ad-733 представляет собой вирусный эквивалент плазмиды 457. Экспрессия этих трех антигенов управляется единственным промотором CMV с тетрациклиновым оператором для подавления экспрессии трансгенов в процессе крупномасштабного получения в линии клеток HEK293, экспрессирующих Tet-репрессор. Стратегии мультиантигенной экспресии включают применение двух разных 2А-последовательностей.
Аденовирус-734 (PSA-T2A-PSCA-F2A-PSMA). Ad-734 представляет собой вирусный эквивалент плазмиды 458. Экспрессия этих трех антигенов управляется единственным промотором CMV с тетрациклиновым оператором для подавления экспрессии трансгенов в процессе крупномасштабного получения в линии клеток HEK293, экспрессирующих Tet-репрессор. Стратегии мультиантигенной экспресии включают применение двух разных 2А-последовательностей.
Аденовирус-735 (PSCA-F2A-PSMA-mIRES-PSA). Ad-735 представляет собой вирусный эквивалент плазмиды 459. Экспрессия этих трех антигенов управляется единственным промотором CMV с тетрациклиновым оператором для подавления экспрессии трансгенов в процессе крупномасштабного получения в линии клеток HEK293, экспрессирующих Tet-репрессор. Стратегии мультиантигенной экспресии включают применение 2А-последовательности и IRES.
Аденовирус-796 (CBA-PSA, CMV-PSCA-pIRES-PSMA). Ad-796 представляет собой вирусный эквивалент плазмиды 846. Экспрессия PSA управляется промотором гена бета-актина цыпленка, в то время как экспрессия PSCA и PSMA управляется промотором CMV-TetO2. Стратегии мультиантигенной экспресии включают применение двух промоторов и IRES.
Аденовирус-809 (CBA-PSA, CMV-PSCA-F2A-PSMA). Ad-809 представляет собой вирусный эквивалент плазмиды 850. Экспрессия PSA управляется промотором гена бета-актина цыпленка, в то время как экспрессия PSCA и PSMA управляется промотором CMV-TetO2. Стратегии мультиантигенной экспресии включают применение двух промоторов и 2А-последовательности.
ПРИМЕР 4. ПРОТИВОРАКОВАЯ ЭФФЕКТИВНОСТЬ ВАКЦИНЫ В КОМБИНАЦИИ С СУНИТИНИБОМ И АНТИТЕЛОМ К CTLA-4
Противоопухолевую эффективность вакцины против рака в комбинации с сунитинибом и моноклональным антителом к CTLA-4 (клон 9D9) исследовали на несущих подкожные опухоли TUBO мышах BALB/neuT.
Методика исследования. Кратко, десяти мышам в каждой группе один раз в сутки перорально вводили либо разбавитель, либо малат сунитиниба в дозе 20 мг/кг, начиная с 10-х суток после имплантации опухоли, вплоть до 64-х суток. Вакцинацию конструкциями ДНК, которые либо не кодируют никакого антигена (контрольная вакцина), либо кодируют антиген Her-2 крысы с SEQ ID NO: 54 (вакцина против рака), в виде аденовирусных векторов начинали на 13-е сутки, затем последовательно проводили две иммунизации по одному разу в неделю, две иммунизации по два раза в неделю и семь иммунизации по одному разу в неделю соответствующими антигенами (антигенами HBV (hepatitis В virus; вирус гепатита В) или rHer-2) с использованием ДНК. Группам мышей (закрашенный кружок и незакрашенный треугольник), которых обрабатывали моноклональным антителом к CTLA-4 мыши, вводили внутрибрюшинной инъекцией 250 мкг антитела на 20-е, 27-е, 41-е, 55-е, 62-е, 69-е, 76-е, 83-и, 90-е и 97-е сутки сразу после PMED-инъекций.
Результаты. На Фиг. 4 показана кривая выживаемости Каплана-Мейера для групп мышей из репрезентативного исследования, по которой оценивают противоопухолевую эффективность сунитиниба и моноклонального антитела к CTLA-4 мыши (клон 9D9) в комбинации с вакциной против рака. Увеличение времени выживания наблюдали для мышей, обработанных сутентом вместе с контрольной вакциной (незакрашенный кружок), моноклональным антителом к CTLA-4 мыши (незакрашенный треугольник) или вакциной против рака (закрашенный треугольник). Дальнейшее увеличение выживаемости наблюдали для мышей, обработанных сутентом и вакциной против рака в комбинации с антителом к CTLA-4 мыши (закрашенный кружок). Значения Р рассчитывали, используя логарифмический ранговый критерий.
ПРИМЕР 5. ВЛИЯНИЕ CPG ИЛИ АГОНИСТА CD40 НА ИММУННЫЕ ОТВЕТЫ, ИНДУЦИРОВАННЫЕ ВАКЦИНОЙ ПРОТИВ РАКА
Исследования иммуногенности на мышах BALB/c
Влияние локального введения иммуномодуляторов на величину и качество антигенспецифических иммунных ответов, индуцированных раковым заболеванием, исследовали на мышах BALB/c, иммунный ответ у которых оценивали, измеряя rHER2-специфические T-клеточные ответы с использованием анализа IFNγ-ELISPOT или анализа методом внутриклеточного окрашивания цитокинов. Кратко, от 4 до 6 самок мышей BALB/c на группу (указанных выше) иммунизировали экспрессирующими конструкциями на основе ДНК-плазмид, кодирующими последовательности антигена rHER2 (SEQ ID NO: 54), используя систему доставки PMED. Иммуномодуляторы CpG7909 (PF-03512676) и моноклональное агонистическое антитело к CD40 вводили локально путем внутрикожкой инъекции вблизи от дренируемого вакциной пахового лимфатического узла соответственно после осуществления PMED. Антигенспецифические T-клеточные ответы измеряли с использованием IFNγ-ELISPOT или анализа методом внутриклеточного окрашивания цитокинов в соответствии с методикой, описанной ниже.
Анализ внутриклеточного окрашивания цитокинов (ICS)
rHer2-специфические полифункциональные (мультицитокин-позитивные) T-клеточные иммунные ответы измеряли для спленоцитов или РВМС (мононуклеарные клетки периферической крови), выделенных из отдельных животных в ICS-анализе. Обычно 1×106 спленоцитов инкубировали с брефелдином А в концентрации 1 мкг/мл и стимулирующим пептидом (p66 для rHer2-специфичных CD8, р169 для rHer2-специфичных CD4 или р87 для нерелевантного HBV) в концентрации 10 мкг/мл в течение 5 ч при 37°C в инкубаторе с 5% CO2. После стимуляции спленоциты промывали и блокировали, используя блокатор Fc (антитело к CD16/CD32 мыши) в течение 10 мин при 4°C, после чего в течение 20 мин проводили окрашивание красителем live/dead aqua, конъюгированными сРЕ-Cy7 (фикоэритрин-цианин 7) антителами к CD3e мыши, конъюгированными с красителем Pacific blue антителами к CD8a мыши и конъюгированными с PerCP-Cy5.5 (перидининхлорофилл-А-белок-цианин 5.5) антителами к CD45R/B220 мыши. Клетки промывали, фиксировали 4%-м параформальдегидом в течение ночи при 4°C, подвергали пермеабилизации, используя раствор для фиксации/пермеабилизации (fix/perm) от BD, в течение 30 мин при комнатной температуре (КТ) и инкубировали с конъюгированными с АРС (аллофикоцианин) антителами к IFNγ мыши, конъюгированными с Alexa488 антителами к TNFα мыши и конъюгированными с РЕ антителами к интерлейкину-2 (IL-2) мыши в течение 30 мин при КТ. Клетки промывали и 20000 CD4- или CD8-T-клеток отбирали на анализ посредством проточной цитометрии. Общее число антигенспецифических T-клеток, позитивных в отношение одного, двух или трех типов цитокинов, из расчета на всю массу селезенки каждого животного определяют, вычитая rHer2-специфические ответы на нерелевантный пептид HBV из числа вакциноспецифических ответов и нормируя на общее число спленоцитов, выделенных из селезенки.
Результаты анализа IFNγ-ELISPOT
На Фиг. 5 показаны результаты IFNγ-ELISPOT для групп мышей из репрезентативного исследования, в котором оценивается величина антигенспецифических T-клеточных ответов, индуцированных rHER2-вакциной, вводимой совместно с указанными иммуномодуляторами. Кратко, каждую мышь в обрабатываемой группе (n=4) иммунизировали, используя PMED, экспрессирующими конструкциями на основе ДНК-плазмид, кодирующими последовательности антигена rHER2 (SEQ ID NO: 54), после чего незамедлительно вводили, как указано, либо 100 мкг контрольного моноклонального антитела IgG крысы (Bioxcell, № ВЕ0089: контрольного mAb), либо 50 мкг CpG7909, либо 100 мкг моноклонального антитела к CD40 (Bioxcell, № ВЕ0016-2: a-CD40 mAb). Антиген-специфические иммунные ответы измеряли в анализе IFNγ-ELISPOT для 5×105 спленоцитов, смешанных с контролем или rHer2-специфическими пептидами p66 в концентрации 10 мкг/мл, через 7 суток после инициации PMED. Количество всех секретирующих IFNγ клеток из числа спленоцитов, содержащих 1×105 CD8 T-клеток, рассчитывали на основании результатов ELISPOT для отдельных животных, и на диаграмме указан % числа CD8 T-клеток в спленоцитах и среднее значение, и стандартная ошибка среднего для каждой группы. Показано, что и CpG7909, и моноклональное антитело к CD40 значительно повышали величину антигенспецифических иммунных ответов, индуцированных ДНК rHer-2, по сравнению с мышами, которые получали контрольные антитела.
Результаты анализа внутриклеточного окрашивания цитокинов (ICS). На Фиг. 6 и 7 показаны результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность CpG 7909 с точки зрения качества индуцированных вакциной иммунных ответов, с использованием анализа методом внутриклеточного окрашивания цитокинов. Кратко, каждое животное дважды иммунизировали экспрессирующими конструкциями на основе ДНК-плазмид, кодирующими последовательности антигена rHER2 (SEQ ID NO: 54), доставляемыми путем PMED с интервалом в 4 недели. Мыши в каждой группе (n=5) получали внутрикожные инъекции физиологического раствора забуференного фосфатом (PBS) (группа PMED) или 50 мкг CpG7909 (группа PMED + CpG) близко к правой стороне дренируемого вакциной пахового лимфатического узла сразу же после обеих ДНК-иммунизаций путем PMED. Через семь суток после последней иммунизации путем PMED, проводили анализ ICS на спленоцитах, выделенных из каждой отдельной мыши, с целью обнаружения антигенспецифических полифункциональных CD8 или CD4 T-клеток, которые секретируют IFNγ, TNFα и/или IL-2. Значительное увеличение rHer2-специфических мультицитокин-позитивных CD8 и CD4 T-клеточных ответов обнаруживали у мышей, обработанных путем локальной доставки CpG7909 в сравнении с PBS. Увеличение CD8-популяции, позитивной в отношении цитокинов одного типа, обнаруживали у животных, которым путем локальной доставки вводили CpG7909 в сравнении с PBS.
На Фиг. 8 и 9 показаны результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность агонистического моноклонального антитела к CD40 с точки зрения качества индуцированных вакциной иммунных ответов, с использованием анализа методом внутриклеточного окрашивания цитокинов. Кратко, каждое животное дважды иммунизировали экспрессирующими конструкциями на основе ДНК-плазмид, кодирующими последовательности антигена rHER2 (SEQ ID NO: 54), доставляемыми путем PMED с интервалом в 4 недели. Мыши в каждой группе (n=6) получали путем внутрикожных инъекций 100 мкг контрольного изотипа IgG (PMED с IgG) или моноклонального антитела к CD40 (PMED с aCD40) близко к правой стороне дренируемого вакциной пахового лимфатического узла через одни сутки после первой иммунизации с введением путем PMED. Через семь суток после последней иммунизации путем PMED, проводили анализ ICS на спленоцитах, выделенных из каждой отдельной мыши, с целью обнаружения rHer2-специфических полифункциональных CD8 или CD4 T-клеток, которые секретируют IFNγ, TNFα и/или IL-2. Значительное увеличение rHer2-специфических CD8 и CD4 T-клеточных ответов, позитивных в отношении цитокинов трех типов, обнаруживали у мышей, обработанных путем локальной доставки моноклонального антитела к CD40 в сравнении с контрольным изотипом IgG. Значительное увеличение числа rHer2-специфических CD4 T-клеток, позитивных в отношении цитокинов одного и двух типов, также обнаруживали под действием локально вводимого моноклонального антитела к CD40.
ПРИМЕР 6. ПРОТИВОРАКОВАЯ ЭФФЕКТИВНОСТЬ ВАКЦИНЫ ПРОТИВ РАКА В КОМБИНАЦИИ СУНИТИНИБОМ В НИЗКОЙ ДОЗЕ
Противоопухолевую эффективность противораковой вакцины в комбинации с сунитинибом в низкой дозе исследовали на мышах BALB/neuT со спонтанными опухолями тела молочной железы.
Обработка животных. Кратко, самки мышей в возрасте 13-14 недель получали перорально малат сунитиниба (сутент) в дозе 5 мг/кг два раза в сутки в течение 112 суток. Контрольную вакцину, с использованием которой не доставляется никакого антигена, и вакцину против рака, которая доставляет антиген Her-2 крысы с SEQ ID NO: 54 (rHer-2), вводили посредством инъекций аденовируса на 3-й сутки в качестве первичной иммунизации, после чего, используя PMED, выполняли 7 введений по два раза в неделю ДНК, доставляющей антигены HBV (контрольная вакцина) или rHer-2 (вакцина против рака), соответственно. Конечную точку выживаемости определяли, когда все десять тел молочной железы становились опухолепозитивными или когда объем любой из опухолей молочной железы достигал 2000 мм3.
Результаты. Результаты представлены на Фиг. 10. По сравнению с ранее опубликованным фармакокинетическим профилем сутента (Mendel, D., Laird, D., et al.: "In vivo antitumor activity of SU11248, a novel tyrosine kinase inhibitor targeting vascular endothelial growth factor and platelet-derived growth factor receptors: determination of a pharmacokinetic/pharmacodynamic relationship". Clinical Cancer Research, 203, 9: 327-337) ожидается, что Cmax для сутента у мышей, которым его вводили два раза в сутки в дозе 5 мг/кг, будет значительно ниже минимальных уровней в крови, необходимых для достижения эффективного противоопухолевого действия у мышей и человека. Эти данные демонстрируют быстрое и временное улучшение выживаемости мышей, обработанных сутентом в низкой дозе в качестве монотерапии. Однако при введении вместе с вакциной против рака наблюдали более долговременное и значительное улучшение выживаемости (Р меньше 0,0001 согласно логарифмическому ранговому критерию).
ПРИМЕР 7. УСИЛЕНИЕ ИНДУЦИРОВАННЫХ ВАКЦИНОЙ ИММУННЫХ ОТВЕТОВ В РЕЗУЛЬТАТЕ ЛОКАЛЬНОГО ВВЕДЕНИЯ CPG
Усиливающее влияние локального введения CpG (PF-03512676) на иммунные ответы, индуцированные нуклеиновой кислотой PSMA человека, предложенной согласно данному изобретению, исследовали на обезьянах, иммунный ответ у которых оценивали, измеряя PSMA-специфические T-клеточные ответы с использованием анализа IFNγ-ELISPOT.
Обработка животных и сбор образцов. Шесть групп китайских яванских макак, по шесть (№№ с 1 по 6) в каждой тестируемой группе, иммунизировали плазмидной ДНК, кодирующей модифицированный антиген PSMA человека (полипептид с SEQ ID NO: 9), доставляемой посредством электропорации. Кратко, все животные в 0-е сутки получали билатерально внутримышечные инъекции по 5 мг плазмидной ДНК с последующей электропорацией (DNA ЕР). Затем, сразу после проведения электропорации группа 2 получала билатерально внутримышечные инъекции по 2 мг CpG в смеси с 1 мг квасцов вблизи от сайтов инъекции ДНК. Группы 3 и 4 получали билатерально внутримышечные инъекции по 2 мг CpG, доставляемые без квасцов, вблизи от сайтов инъекции ДНК, или на 0-е сутки, или на 3-й сутки, соответственно. Группа 5 получала билатерально внутримышечные инъекции по 2 мг CpG вблизи от дренируемых вакциной паховых лимфатических узлов на 3-и сутки. Группа 6 получала билатерально внутримышечные инъекции по 200 мкг CpG в смеси с раствором ДНК, который доставляли путем совместной электропорации в мышцу в 0-е сутки.
Методика анализа IFNγ-ELISPOT. Собирали образцы периферической крови от каждого животного через пятнадцать суток после ДНК-иммунизации. Из образцов крови выделяли мононуклеарные клетки периферической крови (РВМС) и подвергали анализу IFNγ-ELISPOT для измерения PSMA-специфических T-клеточных ответов. Кратко, в планшеты для IFNγ-ELISPOT помещали по 4×105 РВМС от отдельных животных из расчета на одну лунку вместе с пулом PSMA-специфических пептидов или пулом неспецифических контрольных пептидов (пулом пептидов HER2 человека) в концентрации 2 мкг/мл каждый. Состав каждого пула PSMA-специфических пептидов приведен в Таблице 24А. Планшеты инкубировали в течение 16 ч при 37°C и 5% CO2, промывали и обрабатывали после инкубации согласно инструкции производителя. Число клеток, образующих «ореол», (SFC) в анализе с IFNγ подсчитывали посредством ридера от Cellular Technology Limited (CTL). Для каждого из условий выполняли два повтора.
Результаты. В Таблице 6 показан результат репрезентативного анализа IFNγ-ELISPOT, в котором оцениваются и сравниваются IFNγ-T-клеточные ответы, индуцированные вакциной, не содержащей (группа 1) или содержащей CpG (PF-03512676), введенной локально путем внутримышечных (группы 2, 3, 4 и 5) или внутрикожных инъекций (группа 6). Приведенный PSMA-специфический ответ рассчитывали, вычитая среднее число SFC для неспецифических контрольных пептидов (пула пептидов HER2 человека) из среднего числа SFC для пулов пептидов PSMA и нормируя на число SFC, наблюдаемое для 1×106 РВМС. ^ указывает на то, что такое число является приблизительным, поскольку количества пятен были слишком велики для выполнения подсчета. ND указывает на то, что определения не проведено.
PSMA-специфические IFNγ-T-клеточные ответы наблюдали для многих пулов PSMA-специфических пептидов в отсутствие CpG (PF-03512676) для всех шести животных (группа 1). Суммарные измеренные ответы на пептиды PSMA оказались немного выше у незначительного числа животных, которые дополнительно получали CpG (PF-03512676) либо путем внутримышечной (группа 4: 3/6), либо внутрикожкой (группа 5: 2/6) инъекций через 3 суток после введения ДНК посредством электропорации. Однако, когда затем CpG доставляли сразу после электропорации в те же сутки (группы 2 и 3), несколько животных не давали высоких ответов (группа 2: 4/6 и группа 3: 3/6) как в случае смеси с квасцами, так и в отсутствие квасцов. Тем не менее, когда путем совместной электропорации в мышцу вместе с раствором ДНК доставляли десятикратно сниженную дозу CpG (группа 6), у 4/6 животных наблюдали более высокие суммарные ответы со статистически более значимым ответом (Р меньше 0,05) на пул пептидов Н1 и R1 по сравнению с животными, не получавшими CpG (группа 1). Эти данные показывают, что CpG в низкой дозе может эффективно усиливать IFNγ-T-клеточные ответы, индуцированные ДНК-вакциной при введении в мышцу посредством совместной электропорации.
ID обозначает идентификационный номер.
ПРИМЕР 8. УСИЛЕНИЕ ИНДУЦИРОВАННЫХ ВАКЦИНОЙ ИММУННЫХ ОТВЕТОВ В РЕЗУЛЬТАТЕ ЛОКАЛЬНОГО ВВЕДЕНИЯ АНТИТЕЛА К CTLA-4
Влияние подкожного введения моноклонального антитела к CTLA-4 (СР-675206) в низкой дозе на иммунные ответы, идуцированные нуклеиновой кислотой PSMA макаки-резус, исследовали на обезьянах, иммунный ответ у которых оценивали, измеряя PSMA-специфические T-клеточные ответы с использованием анализа IFNγ-ELISPOT. Использованная в этом исследовании нуклеиновая кислота PSMA макаки-резус имеет последовательность, приведенную в SEQ ID NO: 56) и кодирует иммуногенный полипептид PSMA с SEQ ID NO: 55.
Обработка животных и сбор образцов. Пять групп самцов индийских макак-резус, по семь (№№ с 1 по 7) в каждой тестируемой группе, иммунизировали с использованием аденовируса с ДНК, кодирующей модифицированный антиген PSMA макак-резус, доставляемого билатерально путем внутримышечных инъекций (2×5×1010 вирусных частиц (V.P.)). Сразу же после инъекций аденовируса группа 1 получала разбавитель, а группы 2-4 получали билатерально подкожные инъекции антитела к CTLA-4 (СР-675206) в дозах 2×25 мг, 2×16,7 мг и 2×8,4 мг, соответственно, вблизи от дренируемого вакциной лимфатического узла.
Через девять суток после иммунизации из каждого животного выделяли мононуклеарные клетки периферической крови (РВМС) и подвергали анализу IFNγ-ELISPOT для измерения T-клеточных ответов, специфических в отношении PSMA макак-резус. Кратко, в планшеты для IFNγ-ELISPOT помещали по 4×105 РВМС от отдельных животных из расчета на одну лунку вместе с пулом PSMA-специфических пептидов макак-резус (Р1, Р2, Р3 или R1+R2, представленных в Таблице 24А) или пулом неспецифических контрольных пептидов (пулом пептидов HER2 человека) в концентрации 2 мкг/мл каждый. Планшеты инкубировали в течение 16 ч при 37°C и 5% CO2, промывали и обрабатывали после инкубации согласно инструкции производителя. Число клеток, образующих «ореол», (SFC) в анализе с IFNγ подсчитывали посредством ридера от CTL. Для каждого из условий выполняли два повтора. Среднее число SFC из двух повторов с учетом фона для пулов PSMA-специфических пептидов макак-резус нормировали на ответ, полученный для 1×106 РВМС. Индивидуальные и суммарные ответы на пулы пептидов для каждого отдельного животного представлены в Таблице 29.
Методика анализа IFNγ-ELISPOT. Захватывающим антителом, специфичным к IFNγ (BD Bioscience, №51-2525kc), в течение ночи при 4°C покрывают мембрану из поливинилиденфторида (PVDF) в микропланшете. Планшет блокируют сывороткой/белком для предотвращения неспецифического связывания с антителом. По окончании блокирования в лунки добавляют эффекторные клетки (такие как спленоциты, выделенные из иммунизированных мышей, или РВМС, выделенные из макак-резус) и мишени (такие как пептиды PSMA из библиотеки пептидов, клетки-мишени, активированные антигенспецифическими пептидами, или опухолевые клетки, экспрессирующие релевантные антигены) и инкубируют в течение ночи при 37°C в инкубаторе с 5% CO2. Цитокин, секретируемый эффекторными клетками, захватывается антителом, нанесенным на поверхность мембраны из PVDF. После удаления клеток и культуральных сред в каждую из лунок для детекции добавляют по 100 мкл биотинилированного поликлонального антитела к IFNγ человека. «Ореолы» визуализируют путем добавления стрептавидина с пероксидазой хрена и преципитирующего субстрата, 3-амино-9-этилкарбазола (АЕС), получая пятно красного цвета, согласно протоколу производителя (Mabtech). Каждое пятно соответствует одной продуцирующей цитокин T-клетке.
Результаты. В Таблице 7 показаны результаты репрезентативного анализа IFNγ-ELISPOT, в котором сравниваются T-клеточные ответы, индуцированные вакциной в отсутствие (группа 1) или в присутствии (группы 2-4) моноклонального антитела к CTLA-4 (СР-675206), вводимого локально подкожными инъекциями вблизи от дренируемого вакциной лимфатического узла. Вакцина вызывала иммунный ответ (группа 1), который значительно усиливался в результате локального введения антитела к CTLA-4 (СР-675206) в дозе 50 мг (группа 2, Р равно 0,001 согласно t-критерию Стьюдента с использованием заниженных значений). Ответ также значительно усиливался при использовании антитела к CTLA-4 в низких дозах 33,4 мг (группа 3: Р равно 0,004 согласно t-критерию Стьюдента с использованием заниженных значений) и 16,7 мг (группа 4: Р равно 0,05 согласно t-критерию Стьюдента), соответственно. Данные подтверждают, что антитело к CTLA-4 в низких дозах, доставляемое подкожной инъекцией, может значительно усиливать индуцируемые вакциной иммунные ответы.
ПРИМЕР 9. ИММУНОМОДУЛИРОВАНИЕ МИЕЛОИДНЫХ СУПРЕССОРНЫХ КЛЕТОК СУНИТИНИБОМ В НИЗКОЙ ДОЗЕ
Следующий далее пример приведен для иллюстрации иммуномодулирующих эффектов сунитиниба в низкой дозе на миелоидные супрессорные клетки (MDSC) in vivo в мышиной неопухолевой модели.
Методики исследования
Для получения спленоцитов, обогащенных MDSC, клетки TUBO (1×106) имплантировали 5 мышам BALB/neuT по бокам, и мышей оставляли в покое приблизительно в течение 20-30 суток, пока объем опухолей не достигал величины в диапазоне 1000-1500 мм3. Затем мышей умерщвляли, удаляли селезенки и извлекали спленоциты, обогащенные MDSC. Спленоциты метили в течение 10 минут 5 мкМ сукцинимидиловым эфиром карбоксифлуоресцеина (CFSE), промывали PBS и проводили подсчет. Меченые клетки далее ресуспендировали в количестве 5×107 спленоцитов/мл в растворе PBS и адоптивно переносили посредством внутривенной (в.в.) инъекции в хвостовую вену наивных реципиентных мышей BALB/c. Реципиентным мышам за трое суток до адоптивного переноса начинали вводить два раза в сутки разбавитель или малат сунитиниба (сутент) в дозе 5 мг/кг, 10 мг/кг и 20 мг/кг. После адоптивного переноса реципиентные мыши продолжали получать два раза в сутки разбавитель или сунитиниб в течение еще двух суток, после чего мышей умерщвляли, селезенки удаляли, спленоциты извлекали и обрабатывали для проведения фенотипического анализа.
Спленоциты подсчитывали и ресуспендировали в количестве 5×106 клеток/мл в буфере для окрашивания для проведения FACS (PBS, 0,2% (масс./об.) бычьего сывороточного альбумина и 0,02% (масс./об.) азида натрия). С целью окрашивания спленоцитов для проведения проточной цитометрии сначала инкубировали 2,5×106 клеток с антителами к CD16/CD32 в течение 10 минут при 4°C, чтобы блокировать Fc-рецепторы и свести к минимуму неспецифическое связывание. Затем спленоциты окрашивали в течение 20 минут при 4°C, используя конъюгированные с соответствующим флуорофором антитела (Biolegend) к маркерам клеточной поверхности мышиных клеток. Для T-клеток (антитело к CD3 (Pacific Blue), клон 17А2) и для MDSC (антитело к GR-1 (АРС), клон RB6-8C5, и антитело к CD11b (PerCp-Су5.5), клон М1/70). Также использовали окраску живых/мертвых клеток. После инкубации с антителом окрашенные спленоциты промывали 2 мл буфера для FACS, собирали центрифугированием и ресуспендировали в 0,2 мл буфера для FACS, после чего получали данные на проточном цитометре CANTO II от BD. Для мониторинга влияния сунитиниба или разбавителя на выживаемость адоптивно перенесенных MDSC авторы изобретения рассчитывали процентное содержание CFSE+, CD3-, GR1+, CD11b+ в живых клетках; единичный гейт. Затем авторы изобретения определяли число адоптивно перенесенных MDSC на одну селезенку, вычисляя, какому фактическому числу клеток соответствует указанный процент от общего числа спленоцитов. Данные анализировали, используя программное обеспечение FloJo и Graph pad.
Результаты. Данные, приведенные в Таблице 27, представляют среднее число адоптивно перенесенных CSFE+, CD3-, GR1+, CD11b+ клеток, извлеченных из одной селезенки (n=7/группа), через 2 суток после адоптивного переноса из мышей, которым два раза в сутки вводили либо разбавитель, либо сунитиниб в дозе 5 мг/кг, 10 мг/кг и 20 мг/кг. Статистическую значимость определяли посредством ANOVA (однофакторного дисперсионного анализа) с использованием критерия Даннета для множественных сравнений, сравнивая группы, которым вводили сунитиниб, с группой, получавшей 0 мг/кг (разбавитель). Эти данные демонстрируют, что сунитиниб, вводимый два раза в сутки in vivo, оказывает иммуномодулирующий эффект на MDSC даже при введении в дозе всего лишь 5 мг/кг, приводящий к статистически значимому уменьшению количеств извлеченных MDSC по сравнению с обработанной разбавителем контрольной группой.
ПРИМЕР 10. ИММУНОГЕННОСТЬ ТРОЙНЫХ АНТИГЕННЫХ АДЕНОВИРУСНЫХ КОНСТРУКЦИЙ И ДНК-КОНСТРУКЦИЙ
Следующий далее пример приведен для иллюстрации способности тройных антигенных вакцинных конструкций (в форме или аденовирусного вектора, или ДНК-плазмиды), экспрессирующих три антигена PSMA, PSCA и PSA, предложенных согласно данному изобретению, вызывать специфические T-клеточные ответы ко всем трем кодируемым антигенам у не являющихся людьми приматов.
Методики исследования in vivo. T-клеточную иммуногенность пяти аденовирусных векторов, каждый из которых экспрессирует три антигена (PSMA, PSCA и PSA; Ad-733, Ad-734, Ad-735, Ad-796 и Ad-809), предложенных согласно изобретению, сравнивали с иммуногенностью смеси трех аденовирусных векторов, каждый из которых экспрессирует только один антиген (PSMA, PSA или PSCA), через 9 суток после первичной иммунизации. Для демонстрации специфичности оценивали ответ на один аденовирус, экспрессирующий один антиген (группы 1-3). Кратко, индийским макакам-резус (n=6 для групп 1 и 3, n=7 для группы 2, и n=8 для групп 4-9) вводили внутримышечной инъекцией суммарно 1×1011 V.P., после чего в те же сутки путем внутрикожных инъекций вводили антитела к CTLA-4 в дозе 10 мг/кг. Через девять суток после инъекций из каждого животного выделяли мононуклеарные клетки периферической крови (РВМС) и подвергали анализу IFNγ-ELISPOT для измерения PSMA-, PSA- и PSCA-специфических T-клеточных ответов.
Через тринадцать недель после инъекций аденовируса и антител к CTLA-4, когда были получены T-клеточные ответы, обезьяны получали поддерживающие вакцинации ДНК (группа 1: PSMA, плазмида 5166; группа 2: PSA, плазмида 5297; группа 3: PSCA, плазмида 5259; группа 4: смесь PSMA, PSA и PSCA, плазмиды 5166, 5259 и 5297; группа 5: плазмида 457; группа 6: плазмида 458; группа 7: плазмида 459; группа 8: плазмида 796; и группа 9: плазмида 809), доставляемые посредством электропорации. Таким образом, каждое животное получало в целом 5 мг плазмидной ДНК, предложенной согласно изобретению, которая доставляет ту же экспрессионную кассету, что и кодируемая аденовирусом, использованным при первичной иммунизации. Через девять суток после поддерживающей вакцинации из каждого животного выделяли мононуклеарные клетки периферической крови (РВМС) и подвергали анализу IFNγ-ELISPOT.
Анализ IFNγ-ELISPOT. Кратко, в планшеты для IFNγ-ELISPOT помещали по 4×105 РВМС от отдельных животных из расчета на одну лунку вместе с пулами PSMA-специфических пептидов Р1, Р2, Р3 или Н1 и Н2 (Таблица 9А), пулом PSA-специфических пептидов 1 или 2 (Таблица 9В), пулом PSCA-специфических пептидов (Таблица 9В) или пулом неспецифических контрольных пептидов (пулом пептидов HER2 человека) в концентрации 2 мкг/мл каждый. Планшеты инкубировали в течение 16 ч при 37°C и 5% CO2, промывали и обрабатывали после инкубации согласно инструкции производителя. Число клеток, образующих «ореол», (SFC) в анализе с IFNγ подсчитывали посредством ридера от CTL. Для каждого из условий выполняли два повтора. Среднее число SFC из двух повторов с учетом фона для пулов антигенспецифических пептидов нормировали на ответ, полученный для 1×106 РВМС. Антигенспецифические ответы, приведенные в таблицах, представляют собой сумму ответов на соответствующие антигенспецифические пептиды или пулы пептидов.
Результаты. В Таблице 11 представлены результаты исследования на индийских макаках-резус с использованием IFNγ-ELISPOT, в котором оценивается T-клеточная иммуногенность пяти разных аденовирусов, каждый из которых экспрессирует все три антигена, по сравнению со смесью трех аденовирусов, каждый из которых экспрессирует один антиген. У большинства животных, которые получали инъекции только Ad-PSMA (группа 1), индуцировались специфические ответы на PSMA, но не на PSA или PSCA (t-критерий Стьюдента, Р меньше 0,03. Одно животное (№4), у которого индуцировались ответы преимущественно на PSCA, исключали из статистического анализа). У животных, которые получали инъекции только Ad-PSA (группа 2), индуцировались специфические ответы на PSA, но не на PSMA или PSCA (t-критерий Стьюдента, Р меньше 0,02). У животных, которые получали инъекции только Ad-PSCA (группа 3), индуцировались специфические ответы на PSCA, но не на PSMA или PSA (t-критерий Стьюдента, Р меньше 0,03). Все пять экспрессирующих тройной антиген аденовирусных векторов (группы 5-9) индуцировали IFNγ-T-клеточные ответы на все три антигена, величина которых варьировала от животного к животному. Величина ответов на PSCA, индуцированных экспрессирующими тройной антиген аденовирусами, была аналогична таковой для смеси отдельных векторов (группа 4). Однако величина ответов на PSMA, индуцированных с использованием Ad-809 (группа 9), и ответов на PSA, индуцированных с использованием Ad-796 (группа 8), в каждом из этих случаев значительно превосходила таковую для смеси (t-критерий Стьюдента, Р равно 0,04 и Р равно 0,02), соответственно. Эти результаты указывают на то, что вакцинирование аденовирусом, экспрессирующим тройные антигены, может вызывать эквивалентные или превосходящие T-клеточные иммунные ответы по сравнению с вакцинированием смесью отдельных аденовирусов у приматов, не являющихся человеком.
В Таблице 12 показаны результаты исследования, полученные с использованием IFNγ-ELISPOT, в котором оценивается иммуногенность пяти разных экспрессирующих тройной антиген кассет, предложенных согласно изобретению, доставляемых посредством первичной иммунизации аденовирусом в комбинации с антителом к CTLA-4, с последующей поддерживающей иммунизацией соответствующей плазмидной ДНК посредством электропорации. Иммунные ответы сравнимы с таковыми для смеси трех конструкций, экспрессирующих один антиген, доставляемых аналогичным образом посредством первичной иммунизации аденовирусом совместно с антителом к CTLA-4 и поддерживающих ДНК-иммунизаций посредством электропорации.
У всех животных, которые получали только Ad-PSMA вместе с антителом к CTLA-4, с последующими иммунизациями PSMA-плазмидами (группа 1), индуцировались специфические ответы на PSMA, но не на PSA или PSCA. Аналогичным образом, у всех животных, которые получали только Ad-PSA вместе с антителом к CTLA-4, с последующими иммунизациями PSA-плазмидами (группа 2), индуцировались специфические ответы на PSA, но не на PSMA или PSCA, и наконец, у всех животных, которые получали только Ad-PSCA вместе с антителом к CTLA-4, с последующими иммунизациями PSCA-плазмидами (группа 3), индуцировались специфические ответы на PSCA, но не на PSMA или PSA (t-критерий Стьюдента, Р меньше 0,01).
У всех животных, которых иммунизировали либо векторами, экспрессирующими тройной антиген (группы 5-9), либо смесью (группа 4), индуцировались IFNγ-T-клеточные ответы на все три антигена. Частота встречаемости обнаруженных PSCA- или PSA-специфических IFNγ-T-клеток была одинаковой во всех этих группах (группы 4-9), соответственно. Однако группы 7 и 9, получавшие вакцинации конструкциями с экспрессирующим тройной антиген вектором, давали значительно более высокую частоту встречаемости ответов на PSMA, чем в случае использования смеси трех конструкций, экспрессирующих один антиген (группа 4). Эти результаты указывают на то, что аденовирусные и ДНК-вакцины, экспрессирующие тройные антигены в одной кассете, могут вызывать эквивалентные IFNγ-T-клеточные ответы по сравнению со смесью аденовирусов и ДНК, экспрессирующих единичные антигены, у приматов, не являющихся человеком.
ПРИМЕР 11. КОНСТРУИРОВАНИЕ ВЕКТОРОВ С68
11А. Конструирование вектора AdC68-734
AdC68-734 представляет собой репликационно некомпетентный аденовирусный вектор на основе аденовируса С68 шимпанзе, который кодирует три иммуногенных полипептида РАА - иммуногенный полипептид PSA, иммуногенный полипептид PSCA и иммуногенный полипептид PSMA. Последовательность вектора конструировали in silico. Сначала получали исходную полноразмерную последовательность С68 из Genbank (определение: обезьяний аденовирус, тип 25, полный геном; номер доступа АС_000011.1). В эту последовательность вводили пять точечных мутаций, описанных в литературе (Roshorm, Y., М.G. Cottingham, et al. (2012). "Т cells induced by recombinant chimpanzee adenovirus alone and in prime-boost regimens decrease chimeric EcoHIV/NDK challenge virus load". Eur. J. Immunol., 42(12): 3243-3255). Далее удаляли участок 1 транскрипции ранних вирусных генов (Е1) размером 2,6 т.п.н., чтобы сделать вектор репликационно некомпетентным, и удаляли участок 3 транскрипции ранних генов (Е3) размером 3,5 т.п.н., чтобы создать в векторе пространство для трансгенной экспрессионной кассеты (Tatsis, N., L. Tesema, et al. (2006). Chimpanzee-origin adenovirus vectors as vaccine carriers. Gene Ther., 13: 421-429). Затем в участок E1 вводили высокоэффективную эукариотическую экспрессионную кассету. Эта экспрессионная кассета включала следующие компоненты: (А) немедленно ранний энхансер/промотор цитомегаловируса (CMV), (Б) Tet-оператор (сайт связывания для тетрациклинового репрессора), (В) мультиантигенную конструкцию, содержащую (1) нуклеотидную последовательность, кодирующую аминокислоты от 25 до 261 из PSA человека, (2) цис-активирующий элемент гидролазы, кодирующий глицин-сериновый линкер и 2А-пептид из вируса Thosea asigna (Т2А), (3) нуклеотидную последовательность, кодирующую аминокислоты от 2 до 123 из PSCA человека, (4) цис-активирующий элемент гидролазы, кодирующий глицин-сериновый линкер и 2А-пептид из вируса ящура (F2A), и (5) нуклеотидную последовательность, кодирующую аминокислоты от 15 до 750 из PSMA человека, и (Г) сигнал терминации транскрипции polyA SV40. Наконец, вводили сайты рестрикции для PacI на каждом из концов вирусного генома для облегчения высвобождения генома из исходной бакмиды. Нуклеотиды из сайта рестрикции для PacI удаляются в процессе размножения вируса и ввиду этого не встраиваются в геном самого векторного продукта. Нуклеотидная последовательность вектора AdC68-734 целиком, включая сайты рестрикции для PacI, приведена в SEQ ID NO: 58. Мультиантигенная конструкция (PSA-T2A-PSCA-F2A-PSMA), встроенная в вектор AdC68-734 (а также в плазмиду 458), также приведена в SEQ ID NO: 61. Аминокислотная последовательность, кодируемая этой мультиантигенной конструкцией с SEQ ID NO: 61, приведена в SEQ ID NO: 60. Компоненты вектора AdC68-734 приведены в Таблице 13.
После завершения конструирования in silico, последовательность из 34819 пар оснований синтезировали биохимическим способом в ходе многостадийного процесса, используя in vitro синтез олигонуклеотидов и последующую опосредуемую рекомбинацией промежуточную сборку в Е. coli и дрожжах. В конечном итоге вирусный геном встраивали в бактериальную искусственную хромосому (ВАС) (pCC1BAC-LCyeast-TRP Trunc) для размножения. Секвенирование нового поколения (технологию MiSeq) в ходе процесса получения осуществляли за несколько стадий, включая секвенирование конечной партии бакмиды 17.3.3.22, которую использовали для создания исходной суспензии вирусного инокулята. Исходную суспензию вирусного инокулята готовили, рестрицируя бакмиду 17.3.3.22 ферментом PacI для высвобождения генома AdC68-734 из остова ВАС. Эту линеаризованную нуклеиновую кислоту трансфицировали в Е1-комплементарную адгерентную клеточную линию HEK293 и, после появления видимых цитопатических эффектов и образования скоплений аденовируса, культуры собирали, выполняя многократные раунды замораживания/оттаивания для высвобождения вируса из клеток. Вирусы амплифицировали и очищали стандартными методами. Генетическое строение бакмиды 17.3.3.22 приведено на Фиг. 11.
11Б. Конструкции дополнительных векторов С68
Дополнительные несущие тройной антиген векторы С68 конструировали аналогично AdC68-734. Некоторые из дополнительных векторов включают в себя функциональные делеции в геноме С68, которые незначительно отличаются от таковых в векторе AdC68-734, в то время как остальные включают другие мультиантигенные конструкции. Опираясь на эти примеры и остальную часть описания настоящего изобретения, специалист в данной области техники будет способен сконструировать дополнительные векторы на основе С68 для экспрессии различных мультиантигенных конструкций, и все они включены в объем настоящего изобретения.
(1) AdC68X-734 и AdC68W-734
Вектор AdC68X-734 конструировали из С68 путем функциональной делеции участков Е1 и Е3 генома С68 посредством удаления нуклеотидов 577-3403 (участка Е1) и 27125-31831 (участка Е2) генома С68 с SEQ ID NO: 57 и путем вставки тройной антигенной конструкции (PSA-T2A-PSCA-F2A-PSMA) с SEQ ID NO: 61 вместо удаленного участка Е1. Вектор AdC68W-734 идентичен вектору AdC68-734 за исключением того, что AdC68W-734 содержит одну или более мутаций в последовательности ДНК С68.
(2) AdC68X-733 и AdC68X-735
Векторы AdC68X-733 и AdC68X-735 создавали, заменяя тройную антигенную конструкцию, встроенную в вектор AdC68X-734, на тройную антигенную конструкцию с SEQ ID NO: 65 и 66, соответственно. Мультиантигенная конструкция, встроенная в вектор AdC68X-733 (т.е. PSA-F2A-PSMA-T2A-PSCA), представляет собой ту же самую конструкцию, которая встроена в плазмиду 457, а мультиантигенная конструкция, встроенная в вектор AdC68X-735 (т.е. PSCA-F2A-PSMA-mIRES-PSA), представляет собой ту же самую конструкцию, которая встроена в плазмиду 459.
11В. Характеристика продуктивности в условиях научных разработок
Получали различные партии AdC68-734 в условиях научных разработок и тестировали в отношении продуктивности. Бакмиду рестрицировали ферментом PacI для высвобождения генома этого вектора из остова ВАС и линеаризованную нуклеиновую кислоту использовали для трансфекции Е1-комплементарных адгерентных клеточных линий HEK293. После появления обширных видимых цитопатических эффектов и скоплений аденовируса, культуры собирали, выполняя многократные раунды замораживания/оттаивания для высвобождения вируса из клеток. Вирусы из культур этого 0-го пассажа (Р0) амплифицировали, выполняя по меньшей мере один дополнительный пассаж в матрасах для культур тканей, и затем использовали в качестве исходного посевного материала для получения в производственных циклах партий вирусов в масштабе исследований (общее число вирусных частиц в одной партии составляло приблизительно (0,5-3)×1013). В общей сложности проводили 11 производственных циклов (пять с суспензией клеток HEK293 и шесть с адгерентными клетками HEK293). Средняя удельная продуктивность составляла 15000 +/-6000 очищенных вирусных частиц на одну исходную инфицированную клетку, с соотношением вирусная частица : инфекционная единица, составляющим 55. Значения продуктивности в условиях научных разработок суммированы в Таблице 14.
11Г. Экспрессия антигенов
Поверхностную экспрессию PSMA и PSCA измеряли с использованием проточной цитометрии (Фиг. 12), а полную экспрессию PSMA, PSCA и PSA в клетке измеряли в анализе с применением вестерн-блоттинга (Фиг. 13) на клетках А549, инфицированных вектором AdC68 с множественностью заражения (MOI) равным 10000. Ложноинфицированные и AdC68-инфицированные клетки окрашивали антителом к PSCA (конъюгированным с флуоресцеинизотиоцианатом моноклональным антителом 1G8 [1:200]) и антителом к PSMA (конъюгированным с аллофикоцианином моноклональным антителом J591 [1:200]) для проведения проточного цитометрического анализа через 2 суток после инфекции. Для большинства клеток, инфицированных разными экспрессирующими тройной антиген векторами AdC68, обнаруживали различные уровни поверхностной экспрессии PSCA и PSMA. Относительно более высокие уровни экспрессии PSCA и PSMA обнаруживали для AdC68X-809-инфицированных клеток, а более низкие уровни обнаруживали для AdC68X-733-инфицированных клеток. Через двое суток после инфекции суммарные клеточные лизаты приблизительно 1×105 инфицированных клеток загружали каждый на свою дорожку полиакриламидного геля с додецилсульфатом натрия. После гель переносили на мембрану для обнаружения белков PSA, PSMA и PSCA с использованием первичных антител, специфичных к PSA, PSMA и PSCA, в анализе с применением вестерн-блоттинга. В инфицированных клетках наблюдали экспрессию всех трех антигенов в разной степени. В то время как в лизатах после инфицирования посредством AdC68-734 и AdC68X-735 наблюдали относительно схожие уровни PSMA и PSCA, в лизатах после инфицирования посредством AdC68-734 наблюдали более высокие уровни PSA по сравнению с таковыми для AdC68X-735.
11Д. Иммуногенность
Проводили прямое сравнительное исследование CD8 IFNγ-ответов, индуцированных различными векторами AdC68, несущими тройной антиген. Каждую группу мышей (n=5 на одну группу) иммунизировали в четырехглавую мышцу, используя AdC68-734, AdC68X-735, AdC68X-809 или Ad5-734 в количестве 1×109 или 1×1010 вирусных частиц (VP). IFNγ CD8+ T-клеточные ответы у мышей измеряли, собирая селезенки от каждого животного на 13-е сутки после иммунизации. Спленоциты выделяли и подвергали анализу IFNγ-ELISPOT для измерения PSMA-, PSCA- и PSA-специфических T-клеточных ответов. Кратко, (2,5-5)×105 спленоцитов от иммунизированных животных культивировали в присутствии отдельных PSMA-, PSCA- или PSA-специфических пептидов человека в концентрации 10 мкг/мл. Сначала определяли у этих 15-мерных пептидов наличие CD8+ T-клеточных эпитопов к каждому антигену предстательной железы. Спленоциты, культивированные с одной только средой, служили в качестве контроля. Для каждого из условий выполняли три повтора. Планшеты инкубировали в течение 20 ч при 37°C и 5% CO2, промывали и обрабатывали после инкубации согласно инструкциям производителя. Число SFC в анализе с IFNγ подсчитывали посредством ридера от CTL. Результаты показывают среднее число PSMA-, PSCA- и PSA-специфических SFC за вычетом фоновых значений, обусловленных присутствием одной только среды, и нормированы на 1×106 спленоцитов.
Подводя итог, следует отметить, что все экспрессирующие тройной антиген векторы AdC68 индуцировали иммунные ответы на все три антигена, но разной величины. В случае с 1×109 VP, ответ на PSMA с участием векторов AdC68 был аналогичен ответу на Ad5. Ответ на PSCA с участием трех векторов AdC68 был аналогичен ответу или был ниже ответа, индуцированного с участием Ad5, в то время как ответ на PSA был ниже в случае с Ad68-735 по сравнению со всеми протестированными векторами. Однако в случае с 1×1010 VP, AdC68-809 индуцировал аналогичные или улучшенные ответы на все три антигена по сравнению с AdC68-734, AdC68-735 или Ad5. Результаты представлены в Таблице 15.
ОТДЕЛЬНЫЕ ИСХОДНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ
SEQ ID NO: 1. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПОЛНОРАЗМЕРНОГО PSMA ЧЕЛОВЕКА
SEQ ID NO: 2. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ ПОЛНОРАЗМЕРНЫЙ PSMA ЧЕЛОВЕКА С SEQ ID NO: 1
SEQ ID NO: 3. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 1 PSMA
SEQ ID NO: 4. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 1 PSMA С SEQ ID NO: 3
SEQ ID NO: 5. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 2 PSMA
SEQ ID NO: 6. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 2 PSMA С SEQ ID NO: 5
SEQ ID NO: 7. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 3 PSMA
SEQ ID NO: 8. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 3 PSMA С SEQ ID NO: 7
SEQ ID NO: 9. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ МЕМБРАНОСВЯЗАННОГО АНТИГЕНА PSMA
SEQ ID NO: 10. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ МЕМБРАНОСВЯЗАННОГО АНТИГЕНА PSMA С SEQ ID NO: 9
SEQ ID NO: 11. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ЦИТОЗОЛЬНОГО АНТИГЕНА PSMA
SEQ ID NO: 12. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ЦИТОЗОЛЬНОГО АНТИГЕНА PSMA С SEQ ID NO: 11
SEQ ID NO: 13. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ СЕКРЕТИРУЕМОГО АНТИГЕНА PSMA
SEQ ID NO: 14. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ СЕКРЕТИРУЕМОГО АНТИГЕНА PSMA С SEQ ID NO: 13
SEQ ID NO: 15. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПОЛНОРАЗМЕРНОГО PSA ЧЕЛОВЕКА
SEQ ID NO: 16. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ПОЛНОРАЗМЕРНОГО PSA ЧЕЛОВЕКА С SEQ ID NO: 15
SEQ ID NO: 17. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ЦИТОЗОЛЬНОГО АНТИГЕНА PSA
SEQ ID NO: 18. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ЦИТОЗОЛЬНОГО АНТИГЕНА PSA С SEQ ID NO: 17
SEQ ID NO: 19. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ МЕМБРАНОСВЯЗАННОГО АНТИГЕНА PSA
SEQ ID NO: 20. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ МЕМБРАНОСВЯЗАННОГО АНТИГЕНА PSA С SEQ ID NO: 19
SEQ ID NO: 21. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПОЛНОРАЗМЕРНОГО PSCA ЧЕЛОВЕКА
SEQ ID NO: 22. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ПОЛНОРАЗМЕРНОГО PSCA ЧЕЛОВЕКА С SEQ ID NO: 21
SEQ ID NO: 23. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ 5166
SEQ ID NO: 24. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ 5259
SEQ ID NO: 25. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ MID 5297
SEQ ID NO: 26. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ MID 460
SEQ ID NO: 27. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ ID 451
SEQ ID NO: 28. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ D 454
SEQ ID NO: 29. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ D 5300
SEQ ID NO: 30. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ ID 449
SEQ ID NO: 31. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ MID 603
SEQ ID NO: 32. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ 455
SEQ ID NO: 33. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ ASMID 456
SEQ ID NO: 34. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ MID 457
SEQ ID NO: 35. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ 458
SEQ ID NO: 36. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ 459
SEQ ID NO: 37. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ PSHUTTLE IRES
SEQ ID NO: 38. Аминокислотная последовательность антигена Her-2:
SEQ ID NO: 39. Нуклеотидная последовательность, кодирующая аминокислотную последовательность антигена Her-2 с SEQ ID NO: 38
SEQ ID NO: 40. Аминокислотная последовательность тяжелой цепи антитела к CD40 СР870893
SEQ ID NO: 41. Аминокислотная последовательность легкой цепи антитела к CD40 СР870893
SEQ ID NO: 42. Аминокислотная последовательность тяжелой цепи антитела к CTLA-4 тремелимумаба
SEQ ID NO: 43. Аминокислотная последовательность легкой цепи антитела к CTLA-4 тремелимумаба
SEQ ID NO: 44. Нуклеотидная последовательность CpG 7909
SEQ ID NO: 45. Нуклеотидная последовательность CpG 24555
SEQ ID NO: 46. Нуклеотидная последовательность CpG 10103
SEQ ID NO: 47. Аминокислотная последовательность eGFP SEQ ID NO: 48. Аминокислотная последовательность корового антигена HBV
SEQ ID NO: 49. Аминокислотная последовательность поверхностного антигена HBV
SEQ ID NO: 50. Аминокислотная последовательность ECD белка PSMA макаки-резус
SEQ ID NO: 51. Аминокислотная последовательность пептида p66 Her-2 крысы (H-2d T-клеточного эпитопа)
SEQ ID NO: 52. Аминокислотная последовательность пептида p169 Her-2 крысы (H-2d T-клеточного эпитопа)
SEQ ID NO: 53. Аминокислотная последовательность пептида p87 корового антигена HBV
SEQ ID NO: 54. Аминокислотная последовательность антигена Her-2 крысы (rHer-2)
SEQ ID NO: 55. Аминокислотная последовательность антигена PSMA макака-резус
SEQ ID NO: 56. Нуклеотидная последовательность, кодирующая антиген PSMA макака-резус с SEQ ID NO: 55
SEQ ID NO: 57. Полный геном обезьяньего аденовируса, типа 25 (С68)
SEQ ID NO: 58. Полная последовательность вектора AdC68-734
SEQ ID NO: 59. Нуклеотидная последовательность предпочтительного IRES (pIRES) из EMCV
(В минимальном IRES (mIRES) из EMCV отсутствуют подчеркнутые 15 нуклеотидов)
SEQ ID NO: 60. Аминокислотная последовательность, содержащая иммуногенные полипептиды PSA, PSCA и PSMA (кодируемая плазмидой 916 и векторами AdC68-734 и AdC68W-734)
SEQ ID NO: 61. Нуклеотидная последовательность, кодирующая аминокислотную последовательность с SEQ ID NO: 60
SEQ ID NO: 62. Нуклеотидная последовательность плазм иды 916
SEQ ID NO: 63. Полная последовательность вектора AdC68W-734
SEQ ID NO: 64. Аминокислотная последовательность, содержащая иммуногенные полипептиды PSA, PSMA и PSCA (кодируемая плазмидой 457 и вектором AdC68X-733)
SEQ ID NO: 65. Нуклеотидная последовательность, кодирующая аминокислотную последовательность с SEQ ID NO: 64
SEQ ID NO: 66. Нуклеотидная последовательность мультиантигенной конструкции (PSCA-F2A-PSMA-mIRES-PSA), встроенной в плазм иду 459 и вектор AdC68X-735
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> Пфайзер Инк.
<120> ВЕКТОРЫ ДЛЯ ЭКСПРЕССИИ ПРОСТАТОАССОЦИИРОВАННЫХ АНТИГЕНОВ
<130> PC72055A
<150> US 61/898,966
<151> 2013-11-01
<160> 66
<170> PatentIn version 3.5
<210> 1
<211> 750
<212> ПРТ
<213> Homo sapiens
<400> 1
Met Trp Asn Leu Leu His Glu Thr Asp Ser Ala Val Ala Thr Ala Arg
1 5 10 15
Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val Leu Ala Gly Gly Phe
20 25 30
Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile Lys Ser Ser Asn Glu
35 40 45
Ala Thr Asn Ile Thr Pro Lys His Asn Met Lys Ala Phe Leu Asp Glu
50 55 60
Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu Tyr Asn Phe Thr Gln Ile
65 70 75 80
Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln Leu Ala Lys Gln Ile
85 90 95
Gln Ser Gln Trp Lys Glu Phe Gly Leu Asp Ser Val Glu Leu Ala His
100 105 110
Tyr Asp Val Leu Leu Ser Tyr Pro Asn Lys Thr His Pro Asn Tyr Ile
115 120 125
Ser Ile Ile Asn Glu Asp Gly Asn Glu Ile Phe Asn Thr Ser Leu Phe
130 135 140
Glu Pro Pro Pro Pro Gly Tyr Glu Asn Val Ser Asp Ile Val Pro Pro
145 150 155 160
Phe Ser Ala Phe Ser Pro Gln Gly Met Pro Glu Gly Asp Leu Val Tyr
165 170 175
Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys Leu Glu Arg Asp Met
180 185 190
Lys Ile Asn Cys Ser Gly Lys Ile Val Ile Ala Arg Tyr Gly Lys Val
195 200 205
Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu Ala Gly Ala Lys Gly
210 215 220
Val Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe Ala Pro Gly Val Lys
225 230 235 240
Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly Gly Val Gln Arg Gly
245 250 255
Asn Ile Leu Asn Leu Asn Gly Ala Gly Asp Pro Leu Thr Pro Gly Tyr
260 265 270
Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile Ala Glu Ala Val Gly
275 280 285
Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr Tyr Asp Ala Gln Lys
290 295 300
Leu Leu Glu Lys Met Gly Gly Ser Ala Pro Pro Asp Ser Ser Trp Arg
305 310 315 320
Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro Gly Phe Thr Gly Asn
325 330 335
Phe Ser Thr Gln Lys Val Lys Met His Ile His Ser Thr Asn Glu Val
340 345 350
Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Arg Gly Ala Val Glu Pro
355 360 365
Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp Ser Trp Val Phe Gly
370 375 380
Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val His Glu Ile Val Arg
385 390 395 400
Ser Phe Gly Thr Leu Lys Lys Glu Gly Trp Arg Pro Arg Arg Thr Ile
405 410 415
Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly Leu Leu Gly Ser Thr
420 425 430
Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln Glu Arg Gly Val Ala
435 440 445
Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn Tyr Thr Leu Arg Val
450 455 460
Asp Cys Thr Pro Leu Met Tyr Ser Leu Val His Asn Leu Thr Lys Glu
465 470 475 480
Leu Lys Ser Pro Asp Glu Gly Phe Glu Gly Lys Ser Leu Tyr Glu Ser
485 490 495
Trp Thr Lys Lys Ser Pro Ser Pro Glu Phe Ser Gly Met Pro Arg Ile
500 505 510
Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val Phe Phe Gln Arg Leu
515 520 525
Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys Asn Trp Glu Thr Asn
530 535 540
Lys Phe Ser Gly Tyr Pro Leu Tyr His Ser Val Tyr Glu Thr Tyr Glu
545 550 555 560
Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys Tyr His Leu Thr Val
565 570 575
Ala Gln Val Arg Gly Gly Met Val Phe Glu Leu Ala Asn Ser Ile Val
580 585 590
Leu Pro Phe Asp Cys Arg Asp Tyr Ala Val Val Leu Arg Lys Tyr Ala
595 600 605
Asp Lys Ile Tyr Ser Ile Ser Met Lys His Pro Gln Glu Met Lys Thr
610 615 620
Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala Val Lys Asn Phe Thr
625 630 635 640
Glu Ile Ala Ser Lys Phe Ser Glu Arg Leu Gln Asp Phe Asp Lys Ser
645 650 655
Asn Pro Ile Val Leu Arg Met Met Asn Asp Gln Leu Met Phe Leu Glu
660 665 670
Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp Arg Pro Phe Tyr Arg
675 680 685
His Val Ile Tyr Ala Pro Ser Ser His Asn Lys Tyr Ala Gly Glu Ser
690 695 700
Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile Glu Ser Lys Val Asp
705 710 715 720
Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln Ile Tyr Val Ala Ala
725 730 735
Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser Glu Val Ala
740 745 750
<210> 2
<211> 2250
<212> ДНК
<213> Homo sapiens
<400> 2
atgtggaatc tccttcacga aaccgactcg gctgtggcca ccgcgcgccg cccgcgctgg 60
ctgtgcgctg gggcgctggt gctggcgggt ggcttctttc tcctcggctt cctcttcggg 120
tggtttataa aatcctccaa tgaagctact aacattactc caaagcataa tatgaaagca 180
tttttggatg aattgaaagc tgagaacatc aagaagttct tatataattt tacacagata 240
ccacatttag caggaacaga acaaaacttt cagcttgcaa agcaaattca atcccagtgg 300
aaagaatttg gcctggattc tgttgagcta gcacattatg atgtcctgtt gtcctaccca 360
aataagactc atcccaacta catctcaata attaatgaag atggaaatga gattttcaac 420
acatcattat ttgaaccacc tcctccagga tatgaaaatg tttcggatat tgtaccacct 480
ttcagtgctt tctctcctca aggaatgcca gagggcgatc tagtgtatgt taactatgca 540
cgaactgaag acttctttaa attggaacgg gacatgaaaa tcaattgctc tgggaaaatt 600
gtaattgcca gatatgggaa agttttcaga ggaaataagg ttaaaaatgc ccagctggca 660
ggggccaaag gagtcattct ctactccgac cctgctgact actttgctcc tggggtgaag 720
tcctatccag atggttggaa tcttcctgga ggtggtgtcc agcgtggaaa tatcctaaat 780
ctgaatggtg caggagaccc tctcacacca ggttacccag caaatgaata tgcttatagg 840
cgtggaattg cagaggctgt tggtcttcca agtattcctg ttcatccaat tggatactat 900
gatgcacaga agctcctaga aaaaatgggt ggctcagcac caccagatag cagctggaga 960
ggaagtctca aagtgcccta caatgttgga cctggcttta ctggaaactt ttctacacaa 1020
aaagtcaaga tgcacatcca ctctaccaat gaagtgacaa gaatttacaa tgtgataggt 1080
actctcagag gagcagtgga accagacaga tatgtcattc tgggaggtca ccgggactca 1140
tgggtgtttg gtggtattga ccctcagagt ggagcagctg ttgttcatga aattgtgagg 1200
agctttggaa cactgaaaaa ggaagggtgg agacctagaa gaacaatttt gtttgcaagc 1260
tgggatgcag aagaatttgg tcttcttggt tctactgagt gggcagagga gaattcaaga 1320
ctccttcaag agcgtggcgt ggcttatatt aatgctgact catctataga aggaaactac 1380
actctgagag ttgattgtac accgctgatg tacagcttgg tacacaacct aacaaaagag 1440
ctgaaaagcc ctgatgaagg ctttgaaggc aaatctcttt atgaaagttg gactaaaaaa 1500
agtccttccc cagagttcag tggcatgccc aggataagca aattgggatc tggaaatgat 1560
tttgaggtgt tcttccaacg acttggaatt gcttcaggca gagcacggta tactaaaaat 1620
tgggaaacaa acaaattcag cggctatcca ctgtatcaca gtgtctatga aacatatgag 1680
ttggtggaaa agttttatga tccaatgttt aaatatcacc tcactgtggc ccaggttcga 1740
ggagggatgg tgtttgagct agccaattcc atagtgctcc cttttgattg tcgagattat 1800
gctgtagttt taagaaagta tgctgacaaa atctacagta tttctatgaa acatccacag 1860
gaaatgaaga catacagtgt atcatttgat tcactttttt ctgcagtaaa gaattttaca 1920
gaaattgctt ccaagttcag tgagagactc caggactttg acaaaagcaa cccaatagta 1980
ttaagaatga tgaatgatca actcatgttt ctggaaagag catttattga tccattaggg 2040
ttaccagaca ggccttttta taggcatgtc atctatgctc caagcagcca caacaagtat 2100
gcaggggagt cattcccagg aatttatgat gctctgtttg atattgaaag caaagtggac 2160
ccttccaagg cctggggaga agtgaagaga cagatttatg ttgcagcctt cacagtgcag 2220
gcagctgcag agactttgag tgaagtagcc 2250
<210> 3
<211> 739
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 3
Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val
1 5 10 15
Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile
20 25 30
Lys Ser Ser Ser Glu Ala Thr Asn Ile Ser Pro Gln His Asn Val Lys
35 40 45
Ala Phe Leu Asp Glu Met Lys Ala Glu Asn Ile Lys Lys Phe Leu Tyr
50 55 60
Leu Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln
65 70 75 80
Leu Ala Lys Gln Ile Gln Ala Glu Trp Lys Glu Phe Gly Leu Asp Ser
85 90 95
Val Glu Leu Ala His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Glu Thr
100 105 110
His Pro Asn Tyr Ile Ser Ile Ile Asp Glu Asp Gly Asn Glu Ile Phe
115 120 125
Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro Gly Tyr Glu Asn Ile Ser
130 135 140
Asp Val Val Pro Pro Tyr Ser Ala Phe Ser Pro Gln Gly Met Pro Glu
145 150 155 160
Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys
165 170 175
Leu Glu Arg Glu Leu Lys Ile Asn Cys Ser Gly Lys Ile Leu Ile Ala
180 185 190
Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu
195 200 205
Ala Gly Ala Lys Gly Ile Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe
210 215 220
Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly
225 230 235 240
Gly Val Gln Arg Gly Asn Val Leu Asn Leu Asn Gly Ala Gly Asp Pro
245 250 255
Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Glu Leu
260 265 270
Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr
275 280 285
Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser Ala Pro Pro
290 295 300
Asp Ser Ser Trp Lys Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro
305 310 315 320
Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met His Ile His
325 330 335
Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Ile Arg
340 345 350
Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp
355 360 365
Ala Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val
370 375 380
His Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Lys Gly Trp Arg
385 390 395 400
Pro Arg Arg Thr Ile Ile Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly
405 410 415
Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln
420 425 430
Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn
435 440 445
Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser Leu Val Tyr
450 455 460
Asn Leu Thr Lys Glu Leu Gln Ser Pro Asp Glu Gly Phe Glu Gly Lys
465 470 475 480
Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser Pro Ser Pro Glu Phe Ser
485 490 495
Gly Val Pro Arg Ile Asn Lys Leu Gly Ser Gly Asn Asp Phe Glu Val
500 505 510
Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys
515 520 525
Asn Trp Lys Thr Asn Lys Phe Ser Gly Tyr Pro Leu Tyr His Ser Val
530 535 540
Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys
545 550 555 560
Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Leu Val Phe Glu Leu
565 570 575
Ala Asp Ser Ile Val Leu Pro Phe Asp Cys Gln Asp Tyr Ala Val Val
580 585 590
Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Asn Leu Ala Met Lys His Pro
595 600 605
Glu Glu Leu Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala
610 615 620
Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Asn Gln Arg Leu Gln
625 630 635 640
Asp Phe Asp Lys Asn Asn Pro Leu Leu Val Arg Met Leu Asn Asp Gln
645 650 655
Leu Met Phe Leu Glu Arg Ala Phe Val Asp Pro Leu Gly Leu Pro Asp
660 665 670
Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys
675 680 685
Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile
690 695 700
Glu Ser Lys Val Asp Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln
705 710 715 720
Ile Tyr Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser
725 730 735
Glu Val Ala
<210> 4
<211> 2217
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 4
atggctagcg ccagacggcc cagatggctg tgcgccggag ccctggtgct ggccggagga 60
ttcttcctgc tgggcttcct gttcggctgg ttcatcaaga gcagcagcga ggccaccaac 120
atcagccccc agcacaacgt gaaggccttt ctggacgaga tgaaggccga gaacatcaag 180
aagtttctgt acctgttcac ccagatcccc cacctggccg gcaccgagca gaacttccag 240
ctggccaagc agattcaggc tgagtggaaa gagttcggcc tggacagcgt ggagctggcc 300
cactacgacg tgctgctgtc ctaccccaac gagacacacc ccaactacat cagcatcatc 360
gacgaggacg gcaacgagat tttcaacacc agcctgttcg agccccctcc ccctggctac 420
gagaacatct ccgacgtggt gcccccctac agcgccttca gccctcaggg aatgcctgaa 480
ggcgacctgg tgtacgtgaa ctacgcccgg accgaggact tcttcaagct ggaacgggag 540
ctgaagatca actgcagcgg caagatcctg atcgccagat acggcaaggt gttccggggc 600
aacaaagtga agaacgcaca gctggctgga gccaagggca tcatcctgta cagcgacccc 660
gccgactact tcgcccctgg cgtgaagtcc taccctgacg gctggaacct gcctggcggc 720
ggagtgcagc ggggcaacgt gctgaacctg aacggagccg gcgaccctct gaccccaggc 780
taccccgcca acgagtacgc ctaccggcgg gagctggccg aagccgtggg cctgcccagc 840
atccccgtgc accccatcgg ctactacgac gcccagaaac tgctggaaaa gatgggcggc 900
agcgcccctc ccgacagcag ctggaagggc agcctgaagg tgccctacaa cgtgggccct 960
ggcttcaccg gcaacttcag cacccagaaa gtgaagatgc acatccacag caccaacgaa 1020
gtgacccgga tctacaacgt gatcggcacc atcagaggcg ccgtggagcc cgacagatac 1080
gtgatcctgg gcggccaccg ggacgcctgg gtgttcggcg gcatcgaccc ccagagcgga 1140
gccgccgtgg tgcacgagat cgtgcggagc ttcggcaccc tgaagaagaa gggctggcgg 1200
cccagacgga ccatcatctt cgccagctgg gacgccgagg aattcggact gctgggctct 1260
accgagtggg ccgaggaaaa cagcagactg ctgcaggaac ggggcgtcgc ctacatcaac 1320
gccgacagct ccatcgaggg caactacacc ctgcgggtgg actgcacccc cctgatgtac 1380
agcctggtgt acaacctgac caaagagctg cagagccccg acgagggctt cgagggcaag 1440
agcctgtacg agagctggac caagaagtcc cccagccccg agttcagcgg cgtgccccgg 1500
atcaacaagc tgggcagcgg caacgacttc gaggtgttct tccagaggct gggcattgcc 1560
agcggcagag cccggtacac caagaactgg aaaaccaaca agttctccgg ctaccccctg 1620
taccacagcg tgtacgagac atacgaactg gtggagaagt tctacgaccc catgttcaag 1680
taccacctga ccgtggccca ggtccgggga gggctggtgt tcgaactggc cgacagcatc 1740
gtgctgccct tcgactgcca ggactatgct gtggtgctgc ggaagtacgc cgacaaaatc 1800
tacaacctgg ccatgaagca ccccgaggaa ctgaaaacct acagcgtgtc cttcgacagc 1860
ctgttcagcg ccgtgaagaa cttcaccgag atcgccagca agttcaacca gcggctgcag 1920
gacttcgaca agaacaaccc cctgctggtc cggatgctga acgaccagct gatgttcctg 1980
gaacgggcct tcgtggaccc cctgggcctg cctgaccggc ccttctaccg gcacgtgatc 2040
tatgccccca gcagccacaa caagtacgct ggcgagagct tccccggcat ctacgatgcc 2100
ctgttcgaca tcgagagcaa ggtggacccc agcaaggcct ggggcgaagt gaagcggcag 2160
atatacgtgg ccgccttcac agtgcaggcc gctgccgaga cactgagcga ggtggcc 2217
<210> 5
<211> 739
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 5
Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val
1 5 10 15
Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile
20 25 30
Lys Ser Ser Ser Glu Ala Thr Asn Ile Thr Pro Gln His Asn Val Lys
35 40 45
Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu Tyr
50 55 60
Asn Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Glu
65 70 75 80
Leu Ala Lys Gln Ile Gln Ala Gln Trp Lys Glu Phe Gly Leu Asp Ser
85 90 95
Val Glu Leu Ser His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Glu Thr
100 105 110
His Pro Asn Tyr Ile Ser Ile Ile Asp Glu Asp Gly Asn Glu Ile Phe
115 120 125
Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro Gly Tyr Glu Asn Ile Ser
130 135 140
Asp Val Val Pro Pro Tyr Ser Ala Phe Ser Pro Gln Gly Met Pro Glu
145 150 155 160
Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys
165 170 175
Leu Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile Leu Ile Ala
180 185 190
Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu
195 200 205
Ala Gly Ala Lys Gly Ile Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe
210 215 220
Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly
225 230 235 240
Gly Val Gln Arg Gly Asn Val Leu Asn Leu Asn Gly Ala Gly Asp Pro
245 250 255
Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile
260 265 270
Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr
275 280 285
Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ala Ala Pro Pro
290 295 300
Asp Ser Ser Trp Lys Gly Ser Leu Gln Val Pro Tyr Asn Val Gly Pro
305 310 315 320
Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met His Ile His
325 330 335
Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Lys
340 345 350
Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp
355 360 365
Ala Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val
370 375 380
His Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Lys Gly Trp Arg
385 390 395 400
Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly
405 410 415
Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln
420 425 430
Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn
435 440 445
Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser Leu Val Tyr
450 455 460
Asn Leu Thr Lys Glu Leu Gln Ser Pro Asp Glu Gly Phe Glu Gly Lys
465 470 475 480
Ser Leu Phe Asp Ser Trp Thr Glu Lys Ser Pro Ser Pro Glu Phe Ser
485 490 495
Gly Leu Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val
500 505 510
Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys
515 520 525
Asp Trp Lys Thr Ser Lys Phe Ser Gly Tyr Pro Leu Tyr His Ser Val
530 535 540
Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys
545 550 555 560
Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Ile Val Phe Glu Leu
565 570 575
Ala Asn Ser Val Val Leu Pro Phe Asp Cys Gln Asp Tyr Ala Val Val
580 585 590
Leu Lys Lys Tyr Ala Asp Lys Ile Tyr Asn Ile Ser Met Lys His Pro
595 600 605
Gln Glu Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala
610 615 620
Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Asn Gln Arg Leu Gln
625 630 635 640
Asp Phe Asp Lys Asn Asn Pro Ile Leu Leu Arg Met Met Asn Asp Gln
645 650 655
Leu Met Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp
660 665 670
Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys
675 680 685
Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile
690 695 700
Glu Ser Lys Val Asp Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln
705 710 715 720
Ile Tyr Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser
725 730 735
Glu Val Ala
<210> 6
<211> 2217
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 6
atggctagcg ccagacggcc cagatggctg tgtgctggcg ccctggtgct ggctggcggc 60
tttttcctgc tgggcttcct gttcggctgg ttcatcaaga gcagcagcga ggccaccaac 120
atcacccccc agcacaacgt gaaggccttt ctggacgagc tgaaggccga gaatatcaag 180
aagttcctgt acaacttcac ccagatcccc cacctggccg gcaccgagca gaacttcgag 240
ctggccaagc agatccaggc ccagtggaaa gagttcggcc tggacagcgt ggaactgagc 300
cactacgacg tgctgctgag ctaccccaac gagacacacc ccaactacat cagcatcatc 360
gacgaggacg gcaacgagat tttcaacacc agcctgttcg agccccctcc acccggctac 420
gagaacatca gcgacgtggt gcccccctac agcgcattca gtccacaggg aatgcccgag 480
ggcgacctgg tgtacgtgaa ctacgcccgg accgaggact tcttcaagct ggaacgggac 540
atgaagatca actgcagcgg caagatcctg atcgccagat acggcaaggt gttccggggc 600
aacaaagtga agaacgccca gctggcaggc gccaagggca tcatcctgta cagcgacccc 660
gccgactact tcgcccctgg cgtgaagtcc taccccgacg gctggaacct gcctggcggc 720
ggagtgcaga ggggcaacgt gctgaacctg aacggcgctg gcgaccctct gacccctggc 780
taccccgcca acgagtacgc ctacagacgg ggaatcgccg aggccgtggg cctgcctagc 840
atccctgtgc accccatcgg ctactacgac gcccagaaac tgctggaaaa gatgggcgga 900
gccgcccctc ccgacagctc ttggaagggc agcctgcagg tcccctacaa cgtgggccct 960
ggcttcaccg gcaacttcag cacccagaaa gtgaagatgc acatccacag caccaacgaa 1020
gtgacccgga tctacaacgt gatcggcacc ctgaagggcg ccgtggaacc cgacagatac 1080
gtgatcctgg gcggccaccg ggacgcctgg gtgttcggag gcatcgaccc tcagagcggc 1140
gctgccgtgg tgcacgagat cgtgcggagc ttcggcacac tgaagaagaa gggctggcgg 1200
cccagacgga ccatcctgtt cgccagctgg gacgccgagg aattcggcct gctgggcagc 1260
accgagtggg ccgaggaaaa cagtcggctg ctgcaggaac ggggcgtcgc ctacatcaac 1320
gccgacagca gcatcgaggg caactacacc ctgcgggtgg actgcacccc cctgatgtac 1380
agcctggtgt acaacctgac caaagagctg cagagccccg acgagggctt cgagggcaag 1440
tccctgttcg actcctggac cgagaagtcc cccagccccg agttcagcgg cctgcccaga 1500
atcagcaagc tgggcagcgg caacgacttc gaggtgttct tccagcggct gggaatcgcc 1560
agcggcagag cccggtacac caaggactgg aaaaccagca agttctccgg ctaccccctg 1620
taccacagcg tgtacgagac atacgagctg gtggaaaagt tctacgaccc catgttcaag 1680
taccacctga ccgtggccca ggtccgaggc ggcatcgtgt tcgaactggc caacagcgtg 1740
gtgctgccat tcgattgtca ggactacgcc gtggtgctga agaagtacgc cgacaaaatc 1800
tacaacatca gcatgaagca cccccaggaa atgaaaacct acagcgtgtc cttcgacagc 1860
ctgttcagcg ccgtgaagaa tttcaccgag atcgcctcca agttcaacca gagactgcag 1920
gacttcgaca agaacaaccc catcctgctg cggatgatga acgaccagct gatgttcctg 1980
gaacgggcct tcatcgaccc cctgggcctg cccgaccggc ccttttaccg gcacgtgatc 2040
tatgccccca gcagccacaa caaatacgcc ggcgagagtt tccccggcat ctacgatgcc 2100
ctgttcgata tcgagagcaa ggtggacccc agcaaggcct ggggcgaagt gaagcggcag 2160
atttacgtgg ccgcattcac agtgcaggct gctgccgaga cactgagcga ggtggcc 2217
<210> 7
<211> 739
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 7
Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val
1 5 10 15
Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile
20 25 30
Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr Pro Lys His Asn Met Lys
35 40 45
Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu Tyr
50 55 60
Asn Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln
65 70 75 80
Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys Glu Phe Gly Leu Asp Ser
85 90 95
Val Glu Leu Ala His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Lys Thr
100 105 110
His Pro Asn Tyr Ile Ser Ile Ile Asn Glu Asp Gly Asn Glu Ile Phe
115 120 125
Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro Gly Tyr Glu Asn Val Ser
130 135 140
Asp Ile Val Pro Pro Phe Ser Ala Phe Ser Pro Gln Gly Met Pro Glu
145 150 155 160
Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys
165 170 175
Leu Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile Val Ile Ala
180 185 190
Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu
195 200 205
Ala Gly Ala Lys Gly Val Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe
210 215 220
Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly
225 230 235 240
Gly Val Gln Arg Gly Asn Ile Leu Asn Leu Asn Gly Ala Gly Asp Pro
245 250 255
Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile
260 265 270
Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr
275 280 285
Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser Ala Pro Pro
290 295 300
Asp Ser Ser Trp Arg Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro
305 310 315 320
Gly Phe Thr Gly Asn Phe Ser Ala Gln Lys Leu Lys Leu His Ile His
325 330 335
Ser Asn Thr Lys Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Arg
340 345 350
Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp
355 360 365
Ser Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val
370 375 380
His Glu Ile Val Arg Thr Phe Gly Thr Leu Lys Lys Lys Gly Trp Arg
385 390 395 400
Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly
405 410 415
Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln
420 425 430
Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn
435 440 445
Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Leu His Ser Leu Val Tyr
450 455 460
Asn Leu Thr Lys Glu Leu Lys Ser Pro Asp Glu Gly Phe Glu Gly Lys
465 470 475 480
Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser Pro Ser Pro Glu Leu Ser
485 490 495
Gly Leu Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val
500 505 510
Phe Phe Gln Arg Leu Gly Ile Ser Ser Gly Arg Ala Arg Tyr Thr Lys
515 520 525
Asp Trp Lys Thr Ser Lys Phe Ser Ser Tyr Pro Leu Tyr His Ser Ile
530 535 540
Tyr Glu Thr Tyr Glu Leu Val Val Lys Phe Tyr Asp Pro Met Phe Lys
545 550 555 560
Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Met Val Phe Glu Leu
565 570 575
Ala Asn Ser Ile Val Leu Pro Phe Asp Cys Arg Asp Tyr Ala Val Ala
580 585 590
Leu Lys Asn His Ala Glu Asn Leu Tyr Ser Ile Ser Met Lys His Pro
595 600 605
Gln Glu Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala
610 615 620
Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Ser Glu Arg Leu Gln
625 630 635 640
Asp Phe Asp Lys Ser Asn Pro Ile Val Leu Arg Met Met Asn Asp Gln
645 650 655
Leu Met Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp
660 665 670
Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys
675 680 685
Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile
690 695 700
Glu Ser Lys Val Asp Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln
705 710 715 720
Ile Tyr Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser
725 730 735
Glu Val Ala
<210> 8
<211> 2217
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 8
atggctagcg ccagacggcc cagatggctg tgtgctggcg ccctggtgct ggctggcggc 60
tttttcctgc tgggcttcct gttcggctgg ttcatcaaga gcagcaacga ggccaccaac 120
atcaccccca agcacaacat gaaggccttt ctggacgagc tgaaggccga gaatatcaag 180
aagttcctgt acaacttcac ccagatcccc cacctggccg gcaccgagca gaacttccag 240
ctggccaagc agatccagag ccagtggaaa gagttcggcc tggacagcgt ggaactggcc 300
cactacgacg tgctgctgag ctaccccaac aagacccacc ccaactacat cagcatcatc 360
aacgaggacg gcaacgagat tttcaacacc agcctgttcg agccccctcc acccggctac 420
gagaacgtgt ccgacatcgt gcccccattc agcgcattca gtccacaggg aatgcccgag 480
ggcgacctgg tgtacgtgaa ctacgcccgg accgaggact tcttcaagct ggaacgggac 540
atgaagatca actgcagcgg caagatcgtg atcgccagat acggcaaggt gttccggggc 600
aacaaagtga agaacgccca gctggcaggc gccaagggcg tgatcctgta tagcgacccc 660
gccgactact tcgcccctgg cgtgaagtcc taccccgacg gctggaacct gcctggcggc 720
ggagtgcagc ggggcaacat cctgaacctg aacggcgctg gcgaccccct gacccctggc 780
tatcccgcca acgagtacgc ctacagacgg ggaatcgccg aggccgtggg cctgcctagc 840
atccctgtgc accccatcgg ctactacgac gcccagaaac tgctggaaaa gatgggcggc 900
agcgcccctc ccgatagctc ttggagaggc agcctgaagg tgccctacaa cgtgggccct 960
ggcttcaccg gcaacttcag cgcccagaag ctgaagctgc acatccacag caacaccaaa 1020
gtgacccgga tctacaacgt gatcggcacc ctgagaggcg ccgtggaacc cgacagatac 1080
gtgatcctgg gcggccaccg ggacagctgg gtgttcggcg gcatcgaccc tcagtctggc 1140
gccgctgtgg tgcacgagat cgtgcggacc tttggcaccc tgaagaagaa gggctggcgg 1200
cccagacgga ccatcctgtt cgccagctgg gacgccgagg aattcggcct gctgggcagc 1260
accgagtggg ccgaggaaaa cagtcggctg ctgcaggaac ggggcgtcgc ctacatcaac 1320
gccgacagca gcatcgaggg caactacacc ctgcgggtgg actgcacccc cctgctgcac 1380
agcctggtgt acaacctgac caaagagctg aagtcccccg acgagggctt cgagggcaag 1440
agcctgtacg agagctggac caagaagtcc cccagccccg agctgagcgg cctgcccaga 1500
atcagcaagc tgggcagcgg caacgacttc gaggtgttct tccagcggct gggcatcagc 1560
agcggcagag cccggtacac caaggactgg aaaaccagca agttcagcag ctaccccctg 1620
taccacagca tctacgagac atacgagctg gtggtcaagt tctacgaccc catgttcaag 1680
taccacctga ccgtggccca ggtccgaggc ggcatggtgt tcgagctggc caacagcatc 1740
gtgctgccct tcgactgccg ggactacgcc gtggccctga agaaccacgc cgagaacctg 1800
tacagcatca gcatgaagca cccccaggaa atgaaaacct acagcgtgtc cttcgacagc 1860
ctgttcagcg ccgtgaagaa tttcaccgag atcgcctcca agttcagcga gcggctgcag 1920
gacttcgaca agagcaaccc catcgtgctg agaatgatga acgaccagct gatgttcctg 1980
gaacgggcct tcatcgaccc cctgggcctg cccgaccggc ccttttaccg gcacgtgatc 2040
tatgccccca gcagccacaa caaatacgcc ggcgagagtt tccccggcat ctacgatgcc 2100
ctgttcgaca tcgagagcaa ggtggacccc agcaaggcct ggggcgaagt gaagcggcag 2160
atttacgtgg ccgcattcac agtgcaggcc gctgccgaga cactgagcga ggtggcc 2217
<210> 9
<211> 739
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 9
Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val
1 5 10 15
Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile
20 25 30
Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr Pro Lys His Asn Met Lys
35 40 45
Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu Tyr
50 55 60
Asn Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln
65 70 75 80
Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys Glu Phe Gly Leu Asp Ser
85 90 95
Val Glu Leu Ala His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Lys Thr
100 105 110
His Pro Asn Tyr Ile Ser Ile Ile Asn Glu Asp Gly Asn Glu Ile Phe
115 120 125
Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro Gly Tyr Glu Asn Val Ser
130 135 140
Asp Ile Val Pro Pro Phe Ser Ala Phe Ser Pro Gln Gly Met Pro Glu
145 150 155 160
Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys
165 170 175
Leu Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile Val Ile Ala
180 185 190
Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu
195 200 205
Ala Gly Ala Lys Gly Val Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe
210 215 220
Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly
225 230 235 240
Gly Val Gln Arg Gly Asn Ile Leu Asn Leu Asn Gly Ala Gly Asp Pro
245 250 255
Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile
260 265 270
Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr
275 280 285
Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser Ala Pro Pro
290 295 300
Asp Ser Ser Trp Arg Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro
305 310 315 320
Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met His Ile His
325 330 335
Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Arg
340 345 350
Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp
355 360 365
Ser Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val
370 375 380
His Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Glu Gly Trp Arg
385 390 395 400
Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly
405 410 415
Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln
420 425 430
Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn
435 440 445
Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser Leu Val His
450 455 460
Asn Leu Thr Lys Glu Leu Lys Ser Pro Asp Glu Gly Phe Glu Gly Lys
465 470 475 480
Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser Pro Ser Pro Glu Phe Ser
485 490 495
Gly Met Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val
500 505 510
Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys
515 520 525
Asn Trp Glu Thr Asn Lys Phe Ser Gly Tyr Pro Leu Tyr His Ser Val
530 535 540
Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys
545 550 555 560
Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Met Val Phe Glu Leu
565 570 575
Ala Asn Ser Ile Val Leu Pro Phe Asp Cys Arg Asp Tyr Ala Val Val
580 585 590
Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Ser Ile Ser Met Lys His Pro
595 600 605
Gln Glu Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala
610 615 620
Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Ser Glu Arg Leu Gln
625 630 635 640
Asp Phe Asp Lys Ser Asn Pro Ile Val Leu Arg Met Met Asn Asp Gln
645 650 655
Leu Met Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp
660 665 670
Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys
675 680 685
Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile
690 695 700
Glu Ser Lys Val Asp Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln
705 710 715 720
Ile Tyr Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser
725 730 735
Glu Val Ala
<210> 10
<211> 2217
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 10
atggctagcg cgcgccgccc gcgctggctg tgcgctgggg cgctggtgct ggcgggtggc 60
ttctttctcc tcggcttcct cttcgggtgg tttataaaat cctccaatga agctactaac 120
attactccaa agcataatat gaaagcattt ttggatgaat tgaaagctga gaacatcaag 180
aagttcttat ataattttac acagatacca catttagcag gaacagaaca aaactttcag 240
cttgcaaagc aaattcaatc ccagtggaaa gaatttggcc tggattctgt tgagctggca 300
cattatgatg tcctgttgtc ctacccaaat aagactcatc ccaactacat ctcaataatt 360
aatgaagatg gaaatgagat tttcaacaca tcattatttg aaccacctcc tccaggatat 420
gaaaatgttt cggatattgt accacctttc agtgctttct ctcctcaagg aatgccagag 480
ggcgatctag tgtatgttaa ctatgcacga actgaagact tctttaaatt ggaacgggac 540
atgaaaatca attgctctgg gaaaattgta attgccagat atgggaaagt tttcagagga 600
aataaggtta aaaatgccca gctggcaggg gccaaaggag tcattctcta ctccgaccct 660
gctgactact ttgctcctgg ggtgaagtcc tatccagatg gttggaatct tcctggaggt 720
ggtgtccagc gtggaaatat cctaaatctg aatggtgcag gagaccctct cacaccaggt 780
tacccagcaa atgaatatgc ttataggcgt ggaattgcag aggctgttgg tcttccaagt 840
attcctgttc atccaattgg atactatgat gcacagaagc tcctagaaaa aatgggtggc 900
tcagcaccac cagatagcag ctggagagga agtctcaaag tgccctacaa tgttggacct 960
ggctttactg gaaacttttc tacacaaaaa gtcaagatgc acatccactc taccaatgaa 1020
gtgacaagaa tttacaatgt gataggtact ctcagaggag cagtggaacc agacagatat 1080
gtcattctgg gaggtcaccg ggactcatgg gtgtttggtg gtattgaccc tcagagtgga 1140
gcagctgttg ttcatgaaat tgtgaggagc tttggaacac tgaaaaagga agggtggaga 1200
cctagaagaa caattttgtt tgcaagctgg gatgcagaag aatttggtct tcttggttct 1260
actgagtggg cagaggagaa ttcaagactc cttcaagagc gtggcgtggc ttatattaat 1320
gctgactcat ctatagaagg aaactacact ctgagagttg attgtacacc gctgatgtac 1380
agcttggtac acaacctaac aaaagagctg aaaagccctg atgaaggctt tgaaggcaaa 1440
tctctttatg aaagttggac taaaaaaagt ccttccccag agttcagtgg catgcccagg 1500
ataagcaaat tgggatctgg aaatgatttt gaggtgttct tccaacgact tggaattgct 1560
tcaggcagag cacggtatac taaaaattgg gaaacaaaca aattcagcgg ctatccactg 1620
tatcacagtg tctatgaaac atatgagttg gtggaaaagt tttatgatcc aatgtttaaa 1680
tatcacctca ctgtggccca ggttcgagga gggatggtgt ttgagctggc caattccata 1740
gtgctccctt ttgattgtcg agattatgct gtagttttaa gaaagtatgc tgacaaaatc 1800
tacagtattt ctatgaaaca tccacaggaa atgaagacat acagtgtatc atttgattca 1860
cttttttctg cagtaaagaa ttttacagaa attgcttcca agttcagtga gagactccag 1920
gactttgaca aaagcaaccc aatagtatta agaatgatga atgatcaact catgtttctg 1980
gaaagagcat ttattgatcc attagggtta ccagacaggc ctttttatag gcatgtcatc 2040
tatgctccaa gcagccacaa caagtatgca ggggagtcat tcccaggaat ttatgatgct 2100
ctgtttgata ttgaaagcaa agtggaccct tccaaggcct ggggagaagt gaagagacag 2160
atttatgttg cagccttcac agtgcaggca gctgcagaga ctttgagtga agtagcc 2217
<210> 11
<211> 710
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 11
Met Ala Ser Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr Pro Lys His
1 5 10 15
Asn Met Lys Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys
20 25 30
Phe Leu Tyr Asn Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln
35 40 45
Asn Phe Gln Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys Glu Phe Gly
50 55 60
Leu Asp Ser Val Glu Leu Ala His Tyr Asp Val Leu Leu Ser Tyr Pro
65 70 75 80
Asn Lys Thr His Pro Asn Tyr Ile Ser Ile Ile Asn Glu Asp Gly Asn
85 90 95
Glu Ile Phe Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro Gly Tyr Glu
100 105 110
Asn Val Ser Asp Ile Val Pro Pro Phe Ser Ala Phe Ser Pro Gln Gly
115 120 125
Met Pro Glu Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp
130 135 140
Phe Phe Lys Leu Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile
145 150 155 160
Val Ile Ala Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn
165 170 175
Ala Gln Leu Ala Gly Ala Lys Gly Val Ile Leu Tyr Ser Asp Pro Ala
180 185 190
Asp Tyr Phe Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu
195 200 205
Pro Gly Gly Gly Val Gln Arg Gly Asn Ile Leu Asn Leu Asn Gly Ala
210 215 220
Gly Asp Pro Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg
225 230 235 240
Arg Gly Ile Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro
245 250 255
Ile Gly Tyr Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser
260 265 270
Ala Pro Pro Asp Ser Ser Trp Arg Gly Ser Leu Lys Val Pro Tyr Asn
275 280 285
Val Gly Pro Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met
290 295 300
His Ile His Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn Val Ile Gly
305 310 315 320
Thr Leu Arg Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly
325 330 335
His Arg Asp Ser Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala
340 345 350
Ala Val Val His Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Glu
355 360 365
Gly Trp Arg Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu
370 375 380
Glu Phe Gly Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg
385 390 395 400
Leu Leu Gln Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile
405 410 415
Glu Gly Asn Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser
420 425 430
Leu Val His Asn Leu Thr Lys Glu Leu Lys Ser Pro Asp Glu Gly Phe
435 440 445
Glu Gly Lys Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser Pro Ser Pro
450 455 460
Glu Phe Ser Gly Met Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp
465 470 475 480
Phe Glu Val Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg
485 490 495
Tyr Thr Lys Asn Trp Glu Thr Asn Lys Phe Ser Gly Tyr Pro Leu Tyr
500 505 510
His Ser Val Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro
515 520 525
Met Phe Lys Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Met Val
530 535 540
Phe Glu Leu Ala Asn Ser Ile Val Leu Pro Phe Asp Cys Arg Asp Tyr
545 550 555 560
Ala Val Val Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Ser Ile Ser Met
565 570 575
Lys His Pro Gln Glu Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu
580 585 590
Phe Ser Ala Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Ser Glu
595 600 605
Arg Leu Gln Asp Phe Asp Lys Ser Asn Pro Ile Val Leu Arg Met Met
610 615 620
Asn Asp Gln Leu Met Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly
625 630 635 640
Leu Pro Asp Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser
645 650 655
His Asn Lys Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu
660 665 670
Phe Asp Ile Glu Ser Lys Val Asp Pro Ser Lys Ala Trp Gly Glu Val
675 680 685
Lys Arg Gln Ile Tyr Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu
690 695 700
Thr Leu Ser Glu Val Ala
705 710
<210> 12
<211> 2130
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 12
atggctagca aatcctccaa tgaagctact aacattactc caaagcataa tatgaaagca 60
tttttggatg aattgaaagc tgagaacatc aagaagttct tatataattt tacacagata 120
ccacatttag caggaacaga acaaaacttt cagcttgcaa agcaaattca atcccagtgg 180
aaagaatttg gcctggattc tgttgagctg gcacattatg atgtcctgtt gtcctaccca 240
aataagactc atcccaacta catctcaata attaatgaag atggaaatga gattttcaac 300
acatcattat ttgaaccacc tcctccagga tatgaaaatg tttcggatat tgtaccacct 360
ttcagtgctt tctctcctca aggaatgcca gagggcgatc tagtgtatgt taactatgca 420
cgaactgaag acttctttaa attggaacgg gacatgaaaa tcaattgctc tgggaaaatt 480
gtaattgcca gatatgggaa agttttcaga ggaaataagg ttaaaaatgc ccagctggca 540
ggggccaaag gagtcattct ctactccgac cctgctgact actttgctcc tggggtgaag 600
tcctatccag atggttggaa tcttcctgga ggtggtgtcc agcgtggaaa tatcctaaat 660
ctgaatggtg caggagaccc tctcacacca ggttacccag caaatgaata tgcttatagg 720
cgtggaattg cagaggctgt tggtcttcca agtattcctg ttcatccaat tggatactat 780
gatgcacaga agctcctaga aaaaatgggt ggctcagcac caccagatag cagctggaga 840
ggaagtctca aagtgcccta caatgttgga cctggcttta ctggaaactt ttctacacaa 900
aaagtcaaga tgcacatcca ctctaccaat gaagtgacaa gaatttacaa tgtgataggt 960
actctcagag gagcagtgga accagacaga tatgtcattc tgggaggtca ccgggactca 1020
tgggtgtttg gtggtattga ccctcagagt ggagcagctg ttgttcatga aattgtgagg 1080
agctttggaa cactgaaaaa ggaagggtgg agacctagaa gaacaatttt gtttgcaagc 1140
tgggatgcag aagaatttgg tcttcttggt tctactgagt gggcagagga gaattcaaga 1200
ctccttcaag agcgtggcgt ggcttatatt aatgctgact catctataga aggaaactac 1260
actctgagag ttgattgtac accgctgatg tacagcttgg tacacaacct aacaaaagag 1320
ctgaaaagcc ctgatgaagg ctttgaaggc aaatctcttt atgaaagttg gactaaaaaa 1380
agtccttccc cagagttcag tggcatgccc aggataagca aattgggatc tggaaatgat 1440
tttgaggtgt tcttccaacg acttggaatt gcttcaggca gagcacggta tactaaaaat 1500
tgggaaacaa acaaattcag cggctatcca ctgtatcaca gtgtctatga aacatatgag 1560
ttggtggaaa agttttatga tccaatgttt aaatatcacc tcactgtggc ccaggttcga 1620
ggagggatgg tgtttgagct ggccaattcc atagtgctcc cttttgattg tcgagattat 1680
gctgtagttt taagaaagta tgctgacaaa atctacagta tttctatgaa acatccacag 1740
gaaatgaaga catacagtgt atcatttgat tcactttttt ctgcagtaaa gaattttaca 1800
gaaattgctt ccaagttcag tgagagactc caggactttg acaaaagcaa cccaatagta 1860
ttaagaatga tgaatgatca actcatgttt ctggaaagag catttattga tccattaggg 1920
ttaccagaca ggccttttta taggcatgtc atctatgctc caagcagcca caacaagtat 1980
gcaggggagt cattcccagg aatttatgat gctctgtttg atattgaaag caaagtggac 2040
ccttccaagg cctggggaga agtgaagaga cagatttatg ttgcagcctt cacagtgcag 2100
gcagctgcag agactttgag tgaagtagcc 2130
<210> 13
<211> 732
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 13
Met Ala Ser Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp
1 5 10 15
Val Pro Gly Ser Thr Gly Asp Ala Ala Lys Ser Ser Asn Glu Ala Thr
20 25 30
Asn Ile Thr Pro Lys His Asn Met Lys Ala Phe Leu Asp Glu Leu Lys
35 40 45
Ala Glu Asn Ile Lys Lys Phe Leu Tyr Asn Phe Thr Gln Ile Pro His
50 55 60
Leu Ala Gly Thr Glu Gln Asn Phe Gln Leu Ala Lys Gln Ile Gln Ser
65 70 75 80
Gln Trp Lys Glu Phe Gly Leu Asp Ser Val Glu Leu Ala His Tyr Asp
85 90 95
Val Leu Leu Ser Tyr Pro Asn Lys Thr His Pro Asn Tyr Ile Ser Ile
100 105 110
Ile Asn Glu Asp Gly Asn Glu Ile Phe Asn Thr Ser Leu Phe Glu Pro
115 120 125
Pro Pro Pro Gly Tyr Glu Asn Val Ser Asp Ile Val Pro Pro Phe Ser
130 135 140
Ala Phe Ser Pro Gln Gly Met Pro Glu Gly Asp Leu Val Tyr Val Asn
145 150 155 160
Tyr Ala Arg Thr Glu Asp Phe Phe Lys Leu Glu Arg Asp Met Lys Ile
165 170 175
Asn Cys Ser Gly Lys Ile Val Ile Ala Arg Tyr Gly Lys Val Phe Arg
180 185 190
Gly Asn Lys Val Lys Asn Ala Gln Leu Ala Gly Ala Lys Gly Val Ile
195 200 205
Leu Tyr Ser Asp Pro Ala Asp Tyr Phe Ala Pro Gly Val Lys Ser Tyr
210 215 220
Pro Asp Gly Trp Asn Leu Pro Gly Gly Gly Val Gln Arg Gly Asn Ile
225 230 235 240
Leu Asn Leu Asn Gly Ala Gly Asp Pro Leu Thr Pro Gly Tyr Pro Ala
245 250 255
Asn Glu Tyr Ala Tyr Arg Arg Gly Ile Ala Glu Ala Val Gly Leu Pro
260 265 270
Ser Ile Pro Val His Pro Ile Gly Tyr Tyr Asp Ala Gln Lys Leu Leu
275 280 285
Glu Lys Met Gly Gly Ser Ala Pro Pro Asp Ser Ser Trp Arg Gly Ser
290 295 300
Leu Lys Val Pro Tyr Asn Val Gly Pro Gly Phe Thr Gly Asn Phe Ser
305 310 315 320
Thr Gln Lys Val Lys Met His Ile His Ser Thr Asn Glu Val Thr Arg
325 330 335
Ile Tyr Asn Val Ile Gly Thr Leu Arg Gly Ala Val Glu Pro Asp Arg
340 345 350
Tyr Val Ile Leu Gly Gly His Arg Asp Ser Trp Val Phe Gly Gly Ile
355 360 365
Asp Pro Gln Ser Gly Ala Ala Val Val His Glu Ile Val Arg Ser Phe
370 375 380
Gly Thr Leu Lys Lys Glu Gly Trp Arg Pro Arg Arg Thr Ile Leu Phe
385 390 395 400
Ala Ser Trp Asp Ala Glu Glu Phe Gly Leu Leu Gly Ser Thr Glu Trp
405 410 415
Ala Glu Glu Asn Ser Arg Leu Leu Gln Glu Arg Gly Val Ala Tyr Ile
420 425 430
Asn Ala Asp Ser Ser Ile Glu Gly Asn Tyr Thr Leu Arg Val Asp Cys
435 440 445
Thr Pro Leu Met Tyr Ser Leu Val His Asn Leu Thr Lys Glu Leu Lys
450 455 460
Ser Pro Asp Glu Gly Phe Glu Gly Lys Ser Leu Tyr Glu Ser Trp Thr
465 470 475 480
Lys Lys Ser Pro Ser Pro Glu Phe Ser Gly Met Pro Arg Ile Ser Lys
485 490 495
Leu Gly Ser Gly Asn Asp Phe Glu Val Phe Phe Gln Arg Leu Gly Ile
500 505 510
Ala Ser Gly Arg Ala Arg Tyr Thr Lys Asn Trp Glu Thr Asn Lys Phe
515 520 525
Ser Gly Tyr Pro Leu Tyr His Ser Val Tyr Glu Thr Tyr Glu Leu Val
530 535 540
Glu Lys Phe Tyr Asp Pro Met Phe Lys Tyr His Leu Thr Val Ala Gln
545 550 555 560
Val Arg Gly Gly Met Val Phe Glu Leu Ala Asn Ser Ile Val Leu Pro
565 570 575
Phe Asp Cys Arg Asp Tyr Ala Val Val Leu Arg Lys Tyr Ala Asp Lys
580 585 590
Ile Tyr Ser Ile Ser Met Lys His Pro Gln Glu Met Lys Thr Tyr Ser
595 600 605
Val Ser Phe Asp Ser Leu Phe Ser Ala Val Lys Asn Phe Thr Glu Ile
610 615 620
Ala Ser Lys Phe Ser Glu Arg Leu Gln Asp Phe Asp Lys Ser Asn Pro
625 630 635 640
Ile Val Leu Arg Met Met Asn Asp Gln Leu Met Phe Leu Glu Arg Ala
645 650 655
Phe Ile Asp Pro Leu Gly Leu Pro Asp Arg Pro Phe Tyr Arg His Val
660 665 670
Ile Tyr Ala Pro Ser Ser His Asn Lys Tyr Ala Gly Glu Ser Phe Pro
675 680 685
Gly Ile Tyr Asp Ala Leu Phe Asp Ile Glu Ser Lys Val Asp Pro Ser
690 695 700
Lys Ala Trp Gly Glu Val Lys Arg Gln Ile Tyr Val Ala Ala Phe Thr
705 710 715 720
Val Gln Ala Ala Ala Glu Thr Leu Ser Glu Val Ala
725 730
<210> 14
<211> 2196
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 14
atggctagcg aaaccgacac tttgttgttg tgggtgcttt tgctttgggt acccggatct 60
actggtgatg ctgctaaatc ctccaatgaa gctactaaca ttactccaaa gcataatatg 120
aaagcatttt tggatgaatt gaaagctgag aacatcaaga agttcttata taattttaca 180
cagataccac atttagcagg aacagaacaa aactttcagc ttgcaaagca aattcaatcc 240
cagtggaaag aatttggcct ggattctgtt gagctagcac attatgatgt cctgttgtcc 300
tacccaaata agactcatcc caactacatc tcaataatta atgaagatgg aaatgagatt 360
ttcaacacat cattatttga accacctcct ccaggatatg aaaatgtttc ggatattgta 420
ccacctttca gtgctttctc tcctcaagga atgccagagg gcgatctagt gtatgttaac 480
tatgcacgaa ctgaagactt ctttaaattg gaacgggaca tgaaaatcaa ttgctctggg 540
aaaattgtaa ttgccagata tgggaaagtt ttcagaggaa ataaggttaa aaatgcccag 600
ctggcagggg ccaaaggagt cattctctac tccgaccctg ctgactactt tgctcctggg 660
gtgaagtcct atccagatgg ttggaatctt cctggaggtg gtgtccagcg tggaaatatc 720
ctaaatctga atggtgcagg agaccctctc acaccaggtt acccagcaaa tgaatatgct 780
tataggcgtg gaattgcaga ggctgttggt cttccaagta ttcctgttca tccaattgga 840
tactatgatg cacagaagct cctagaaaaa atgggtggct cagcaccacc agatagcagc 900
tggagaggaa gtctcaaagt gccctacaat gttggacctg gctttactgg aaacttttct 960
acacaaaaag tcaagatgca catccactct accaatgaag tgacaagaat ttacaatgtg 1020
ataggtactc tcagaggagc agtggaacca gacagatatg tcattctggg aggtcaccgg 1080
gactcatggg tgtttggtgg tattgaccct cagagtggag cagctgttgt tcatgaaatt 1140
gtgaggagct ttggaacact gaaaaaggaa gggtggagac ctagaagaac aattttgttt 1200
gcaagctggg atgcagaaga atttggtctt cttggttcta ctgagtgggc agaggagaat 1260
tcaagactcc ttcaagagcg tggcgtggct tatattaatg ctgactcatc tatagaagga 1320
aactacactc tgagagttga ttgtacaccg ctgatgtaca gcttggtaca caacctaaca 1380
aaagagctga aaagccctga tgaaggcttt gaaggcaaat ctctttatga aagttggact 1440
aaaaaaagtc cttccccaga gttcagtggc atgcccagga taagcaaatt gggatctgga 1500
aatgattttg aggtgttctt ccaacgactt ggaattgctt caggcagagc acggtatact 1560
aaaaattggg aaacaaacaa attcagcggc tatccactgt atcacagtgt ctatgaaaca 1620
tatgagttgg tggaaaagtt ttatgatcca atgtttaaat atcacctcac tgtggcccag 1680
gttcgaggag ggatggtgtt tgagctagcc aattccatag tgctcccttt tgattgtcga 1740
gattatgctg tagttttaag aaagtatgct gacaaaatct acagtatttc tatgaaacat 1800
ccacaggaaa tgaagacata cagtgtatca tttgattcac ttttttctgc agtaaagaat 1860
tttacagaaa ttgcttccaa gttcagtgag agactccagg actttgacaa aagcaaccca 1920
atagtattaa gaatgatgaa tgatcaactc atgtttctgg aaagagcatt tattgatcca 1980
ttagggttac cagacaggcc tttttatagg catgtcatct atgctccaag cagccacaac 2040
aagtatgcag gggagtcatt cccaggaatt tatgatgctc tgtttgatat tgaaagcaaa 2100
gtggaccctt ccaaggcctg gggagaagtg aagagacaga tttatgttgc agccttcaca 2160
gtgcaggcag ctgcagagac tttgagtgaa gtagcc 2196
<210> 15
<211> 263
<212> ПРТ
<213> Homo sapiens
<400> 15
Met Ala Ser Trp Val Pro Val Val Phe Leu Thr Leu Ser Val Thr Trp
1 5 10 15
Ile Gly Ala Ala Pro Leu Ile Leu Ser Arg Ile Val Gly Gly Trp Glu
20 25 30
Cys Glu Lys His Ser Gln Pro Trp Gln Val Leu Val Ala Ser Arg Gly
35 40 45
Arg Ala Val Cys Gly Gly Val Leu Val His Pro Gln Trp Val Leu Thr
50 55 60
Ala Ala His Cys Ile Arg Asn Lys Ser Val Ile Leu Leu Gly Arg His
65 70 75 80
Ser Leu Phe His Pro Glu Asp Thr Gly Gln Val Phe Gln Val Ser His
85 90 95
Ser Phe Pro His Pro Leu Tyr Asp Met Ser Leu Leu Lys Asn Arg Phe
100 105 110
Leu Arg Pro Gly Asp Asp Ser Ser His Asp Leu Met Leu Leu Arg Leu
115 120 125
Ser Glu Pro Ala Glu Leu Thr Asp Ala Val Lys Val Met Asp Leu Pro
130 135 140
Thr Gln Glu Pro Ala Leu Gly Thr Thr Cys Tyr Ala Ser Gly Trp Gly
145 150 155 160
Ser Ile Glu Pro Glu Glu Phe Leu Thr Pro Lys Lys Leu Gln Cys Val
165 170 175
Asp Leu His Val Ile Ser Asn Asp Val Cys Ala Gln Val His Pro Gln
180 185 190
Lys Val Thr Lys Phe Met Leu Cys Ala Gly Arg Trp Thr Gly Gly Lys
195 200 205
Ser Thr Cys Ser Gly Asp Ser Gly Gly Pro Leu Val Cys Asn Gly Val
210 215 220
Leu Gln Gly Ile Thr Ser Trp Gly Ser Glu Pro Cys Ala Leu Pro Glu
225 230 235 240
Arg Pro Ser Leu Tyr Thr Lys Val Val His Tyr Arg Lys Trp Ile Lys
245 250 255
Asp Thr Ile Val Ala Asn Pro
260
<210> 16
<211> 789
<212> ДНК
<213> Homo sapiens
<400> 16
atggctagct gggtcccggt tgtcttcctc accctgtccg tgacgtggat tggcgctgcg 60
cccctcatcc tgtctcggat tgtgggaggc tgggagtgcg agaagcattc ccaaccctgg 120
caggtgcttg tggcctctcg tggcagggca gtctgcggcg gtgttctggt gcacccccag 180
tgggtcctca cagctgccca ctgcatcagg aacaaaagcg tgatcttgct gggtcggcac 240
agcttgtttc atcctgaaga cacaggccag gtatttcagg tcagccacag cttcccacac 300
ccgctctacg atatgagcct cctgaagaat cgattcctca ggccaggtga tgactccagc 360
cacgacctca tgctgctccg cctgtcagag cctgccgagc tcacggatgc tgtgaaggtc 420
atggacctgc ccacccagga gccagcactg gggaccacct gctacgcctc aggctggggc 480
agcattgaac cagaggagtt cttgacccca aagaaacttc agtgtgtgga cctccatgtt 540
atttccaatg acgtgtgtgc gcaagttcac cctcagaagg tgaccaagtt catgctgtgt 600
gctggacgct ggacaggggg caaaagcacc tgctcgggtg attctggggg cccacttgtc 660
tgtaatggtg tgcttcaagg tatcacgtca tggggcagtg aaccatgtgc cctgcccgaa 720
aggccttccc tgtacaccaa ggtggtgcat taccggaagt ggatcaagga caccatcgtg 780
gccaacccc 789
<210> 17
<211> 240
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 17
Met Ala Ser Ile Val Gly Gly Trp Glu Cys Glu Lys His Ser Gln Pro
1 5 10 15
Trp Gln Val Leu Val Ala Ser Arg Gly Arg Ala Val Cys Gly Gly Val
20 25 30
Leu Val His Pro Gln Trp Val Leu Thr Ala Ala His Cys Ile Arg Asn
35 40 45
Lys Ser Val Ile Leu Leu Gly Arg His Ser Leu Phe His Pro Glu Asp
50 55 60
Thr Gly Gln Val Phe Gln Val Ser His Ser Phe Pro His Pro Leu Tyr
65 70 75 80
Asp Met Ser Leu Leu Lys Asn Arg Phe Leu Arg Pro Gly Asp Asp Ser
85 90 95
Ser His Asp Leu Met Leu Leu Arg Leu Ser Glu Pro Ala Glu Leu Thr
100 105 110
Asp Ala Val Lys Val Met Asp Leu Pro Thr Gln Glu Pro Ala Leu Gly
115 120 125
Thr Thr Cys Tyr Ala Ser Gly Trp Gly Ser Ile Glu Pro Glu Glu Phe
130 135 140
Leu Thr Pro Lys Lys Leu Gln Cys Val Asp Leu His Val Ile Ser Asn
145 150 155 160
Asp Val Cys Ala Gln Val His Pro Gln Lys Val Thr Lys Phe Met Leu
165 170 175
Cys Ala Gly Arg Trp Thr Gly Gly Lys Ser Thr Cys Ser Gly Asp Ser
180 185 190
Gly Gly Pro Leu Val Cys Asn Gly Val Leu Gln Gly Ile Thr Ser Trp
195 200 205
Gly Ser Glu Pro Cys Ala Leu Pro Glu Arg Pro Ser Leu Tyr Thr Lys
210 215 220
Val Val His Tyr Arg Lys Trp Ile Lys Asp Thr Ile Val Ala Asn Pro
225 230 235 240
<210> 18
<211> 720
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 18
atggctagca ttgtgggagg ctgggagtgc gagaagcatt cccaaccctg gcaggtgctt 60
gtggcctctc gtggcagggc agtctgcggc ggtgttctgg tgcaccccca gtgggtcctc 120
acagctgccc actgcatcag gaacaaaagc gtgatcttgc tgggtcggca cagcttgttt 180
catcctgaag acacaggcca ggtatttcag gtcagccaca gcttcccaca cccgctctac 240
gatatgagcc tcctgaagaa tcgattcctc aggccaggtg atgactccag ccacgacctc 300
atgctgctcc gcctgtcaga gcctgccgag ctcacggatg ctgtgaaggt catggacctg 360
cccacccagg agccagcact ggggaccacc tgctacgcct caggctgggg cagcattgaa 420
ccagaggagt tcttgacccc aaagaaactt cagtgtgtgg acctccatgt tatttccaat 480
gacgtgtgtg cgcaagttca ccctcagaag gtgaccaagt tcatgctgtg tgctggacgc 540
tggacagggg gcaaaagcac ctgctcgggt gattctgggg gcccacttgt ctgtaatggt 600
gtgcttcaag gtatcacgtc atggggcagt gaaccatgtg ccctgcccga aaggccttcc 660
ctgtacacca aggtggtgca ttaccggaag tggatcaagg acaccatcgt ggccaacccc 720
<210> 19
<211> 281
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 19
Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val
1 5 10 15
Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile
20 25 30
Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr Pro Gly Ile Val Gly Gly
35 40 45
Trp Glu Cys Glu Lys His Ser Gln Pro Trp Gln Val Leu Val Ala Ser
50 55 60
Arg Gly Arg Ala Val Cys Gly Gly Val Leu Val His Pro Gln Trp Val
65 70 75 80
Leu Thr Ala Ala His Cys Ile Arg Asn Lys Ser Val Ile Leu Leu Gly
85 90 95
Arg His Ser Leu Phe His Pro Glu Asp Thr Gly Gln Val Phe Gln Val
100 105 110
Ser His Ser Phe Pro His Pro Leu Tyr Asp Met Ser Leu Leu Lys Asn
115 120 125
Arg Phe Leu Arg Pro Gly Asp Asp Ser Ser His Asp Leu Met Leu Leu
130 135 140
Arg Leu Ser Glu Pro Ala Glu Leu Thr Asp Ala Val Lys Val Met Asp
145 150 155 160
Leu Pro Thr Gln Glu Pro Ala Leu Gly Thr Thr Cys Tyr Ala Ser Gly
165 170 175
Trp Gly Ser Ile Glu Pro Glu Glu Phe Leu Thr Pro Lys Lys Leu Gln
180 185 190
Cys Val Asp Leu His Val Ile Ser Asn Asp Val Cys Ala Gln Val His
195 200 205
Pro Gln Lys Val Thr Lys Phe Met Leu Cys Ala Gly Arg Trp Thr Gly
210 215 220
Gly Lys Ser Thr Cys Ser Gly Asp Ser Gly Gly Pro Leu Val Cys Asn
225 230 235 240
Gly Val Leu Gln Gly Ile Thr Ser Trp Gly Ser Glu Pro Cys Ala Leu
245 250 255
Pro Glu Arg Pro Ser Leu Tyr Thr Lys Val Val His Tyr Arg Lys Trp
260 265 270
Ile Lys Asp Thr Ile Val Ala Asn Pro
275 280
<210> 20
<211> 846
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 20
atggctagcg cgcgccgccc gcgctggctg tgcgctgggg cgctggtgct ggcgggtggc 60
ttctttctcc tcggcttcct cttcgggtgg tttataaaat cctccaatga agctactaac 120
attactccag gaattgtggg aggctgggag tgcgagaagc attcccaacc ctggcaggtg 180
cttgtggcct ctcgtggcag ggcagtctgc ggcggtgttc tggtgcaccc ccagtgggtc 240
ctcacagctg cccactgcat caggaacaaa agcgtgatct tgctgggtcg gcacagcttg 300
tttcatcctg aagacacagg ccaggtattt caggtcagcc acagcttccc acacccgctc 360
tacgatatga gcctcctgaa gaatcgattc ctcaggccag gtgatgactc cagccacgac 420
ctcatgctgc tccgcctgtc agagcctgcc gagctcacgg atgctgtgaa ggtcatggac 480
ctgcccaccc aggagccagc actggggacc acctgctacg cctcaggctg gggcagcatt 540
gaaccagagg agttcttgac cccaaagaaa cttcagtgtg tggacctcca tgttatttcc 600
aatgacgtgt gtgcgcaagt tcaccctcag aaggtgacca agttcatgct gtgtgctgga 660
cgctggacag ggggcaaaag cacctgctcg ggtgattctg ggggcccact tgtctgtaat 720
ggtgtgcttc aaggtatcac gtcatggggc agtgaaccat gtgccctgcc cgaaaggcct 780
tccctgtaca ccaaggtggt gcattaccgg aagtggatca aggacaccat cgtggccaac 840
ccctga 846
<210> 21
<211> 125
<212> ПРТ
<213> Homo sapiens
<400> 21
Met Ala Ser Lys Ala Val Leu Leu Ala Leu Leu Met Ala Gly Leu Ala
1 5 10 15
Leu Gln Pro Gly Thr Ala Leu Leu Cys Tyr Ser Cys Lys Ala Gln Val
20 25 30
Ser Asn Glu Asp Cys Leu Gln Val Glu Asn Cys Thr Gln Leu Gly Glu
35 40 45
Gln Cys Trp Thr Ala Arg Ile Arg Ala Val Gly Leu Leu Thr Val Ile
50 55 60
Ser Lys Gly Cys Ser Leu Asn Cys Val Asp Asp Ser Gln Asp Tyr Tyr
65 70 75 80
Val Gly Lys Lys Asn Ile Thr Cys Cys Asp Thr Asp Leu Cys Asn Ala
85 90 95
Ser Gly Ala His Ala Leu Gln Pro Ala Ala Ala Ile Leu Ala Leu Leu
100 105 110
Pro Ala Leu Gly Leu Leu Leu Trp Gly Pro Gly Gln Leu
115 120 125
<210> 22
<211> 375
<212> ДНК
<213> Homo sapiens
<400> 22
atggctagca aggctgtgct gcttgccctg ttgatggcag gcttggccct gcagccaggc 60
actgccctgc tgtgctactc ctgcaaagcc caggtgagca acgaggactg cctgcaggtg 120
gagaactgca cccagctggg ggagcagtgc tggaccgcgc gcatccgcgc agttggcctc 180
ctgaccgtca tcagcaaagg ctgcagcttg aactgcgtgg atgactcaca ggactactac 240
gtgggcaaga agaacatcac gtgctgtgac accgacttgt gcaacgccag cggggcccat 300
gccctgcagc cggctgccgc catccttgcg ctgctccctg cactcggcct gctgctctgg 360
ggacccggcc agcta 375
<210> 23
<211> 5964
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 23
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcgcgcgcc gcccgcgctg gctgtgcgct ggggcgctgg tgctggcggg 2040
tggcttcttt ctcctcggct tcctcttcgg gtggtttata aaatcctcca atgaagctac 2100
taacattact ccaaagcata atatgaaagc atttttggat gaattgaaag ctgagaacat 2160
caagaagttc ttatataatt ttacacagat accacattta gcaggaacag aacaaaactt 2220
tcagcttgca aagcaaattc aatcccagtg gaaagaattt ggcctggatt ctgttgagct 2280
ggcacattat gatgtcctgt tgtcctaccc aaataagact catcccaact acatctcaat 2340
aattaatgaa gatggaaatg agattttcaa cacatcatta tttgaaccac ctcctccagg 2400
atatgaaaat gtttcggata ttgtaccacc tttcagtgct ttctctcctc aaggaatgcc 2460
agagggcgat ctagtgtatg ttaactatgc acgaactgaa gacttcttta aattggaacg 2520
ggacatgaaa atcaattgct ctgggaaaat tgtaattgcc agatatggga aagttttcag 2580
aggaaataag gttaaaaatg cccagctggc aggggccaaa ggagtcattc tctactccga 2640
ccctgctgac tactttgctc ctggggtgaa gtcctatcca gatggttgga atcttcctgg 2700
aggtggtgtc cagcgtggaa atatcctaaa tctgaatggt gcaggagacc ctctcacacc 2760
aggttaccca gcaaatgaat atgcttatag gcgtggaatt gcagaggctg ttggtcttcc 2820
aagtattcct gttcatccaa ttggatacta tgatgcacag aagctcctag aaaaaatggg 2880
tggctcagca ccaccagata gcagctggag aggaagtctc aaagtgccct acaatgttgg 2940
acctggcttt actggaaact tttctacaca aaaagtcaag atgcacatcc actctaccaa 3000
tgaagtgaca agaatttaca atgtgatagg tactctcaga ggagcagtgg aaccagacag 3060
atatgtcatt ctgggaggtc accgggactc atgggtgttt ggtggtattg accctcagag 3120
tggagcagct gttgttcatg aaattgtgag gagctttgga acactgaaaa aggaagggtg 3180
gagacctaga agaacaattt tgtttgcaag ctgggatgca gaagaatttg gtcttcttgg 3240
ttctactgag tgggcagagg agaattcaag actccttcaa gagcgtggcg tggcttatat 3300
taatgctgac tcatctatag aaggaaacta cactctgaga gttgattgta caccgctgat 3360
gtacagcttg gtacacaacc taacaaaaga gctgaaaagc cctgatgaag gctttgaagg 3420
caaatctctt tatgaaagtt ggactaaaaa aagtccttcc ccagagttca gtggcatgcc 3480
caggataagc aaattgggat ctggaaatga ttttgaggtg ttcttccaac gacttggaat 3540
tgcttcaggc agagcacggt atactaaaaa ttgggaaaca aacaaattca gcggctatcc 3600
actgtatcac agtgtctatg aaacatatga gttggtggaa aagttttatg atccaatgtt 3660
taaatatcac ctcactgtgg cccaggttcg aggagggatg gtgtttgagc tggccaattc 3720
catagtgctc ccttttgatt gtcgagatta tgctgtagtt ttaagaaagt atgctgacaa 3780
aatctacagt atttctatga aacatccaca ggaaatgaag acatacagtg tatcatttga 3840
ttcacttttt tctgcagtaa agaattttac agaaattgct tccaagttca gtgagagact 3900
ccaggacttt gacaaaagca acccaatagt attaagaatg atgaatgatc aactcatgtt 3960
tctggaaaga gcatttattg atccattagg gttaccagac aggccttttt ataggcatgt 4020
catctatgct ccaagcagcc acaacaagta tgcaggggag tcattcccag gaatttatga 4080
tgctctgttt gatattgaaa gcaaagtgga cccttccaag gcctggggag aagtgaagag 4140
acagatttat gttgcagcct tcacagtgca ggcagctgca gagactttga gtgaagtagc 4200
ctaaagatct gggccctaac aaaacaaaaa gatggggtta ttccctaaac ttcatgggtt 4260
acgtaattgg aagttggggg acattgccac aagatcatat tgtacaaaag atcaaacact 4320
gttttagaaa acttcctgta aacaggccta ttgattggaa agtatgtcaa aggattgtgg 4380
gtcttttggg ctttgctgct ccatttacac aatgtggata tcctgcctta atgcctttgt 4440
atgcatgtat acaagctaaa caggctttca ctttctcgcc aacttacaag gcctttctaa 4500
gtaaacagta catgaacctt taccccgttg ctcggcaacg gcctggtctg tgccaagtgt 4560
ttgctgacgc aacccccact ggctggggct tggccatagg ccatcagcgc atgcgtggaa 4620
cctttgtggc tcctctgccg atccatactg cggaactcct agccgcttgt tttgctcgca 4680
gccggtctgg agcaaagctc ataggaactg acaattctgt cgtcctctcg cggaaatata 4740
catcgtttcg atctacgtat gatctttttc cctctgccaa aaattatggg gacatcatga 4800
agccccttga gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt 4860
gttggaattt tttgtgtctc tcactcggaa ggaattctgc attaatgaat cggccaacgc 4920
gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 4980
cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 5040
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 5100
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 5160
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 5220
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 5280
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 5340
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 5400
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 5460
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 5520
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta 5580
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 5640
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 5700
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 5760
tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 5820
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 5880
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 5940
cgttcatcca tagttgcctg actc 5964
<210> 24
<211> 4122
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 24
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 2040
aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 2100
ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 2160
cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 2220
ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 2280
ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 2340
ctggggaccc ggccagctat agagatctgg gccctaacaa aacaaaaaga tggggttatt 2400
ccctaaactt catgggttac gtaattggaa gttgggggac attgccacaa gatcatattg 2460
tacaaaagat caaacactgt tttagaaaac ttcctgtaaa caggcctatt gattggaaag 2520
tatgtcaaag gattgtgggt cttttgggct ttgctgctcc atttacacaa tgtggatatc 2580
ctgccttaat gcctttgtat gcatgtatac aagctaaaca ggctttcact ttctcgccaa 2640
cttacaaggc ctttctaagt aaacagtaca tgaaccttta ccccgttgct cggcaacggc 2700
ctggtctgtg ccaagtgttt gctgacgcaa cccccactgg ctggggcttg gccataggcc 2760
atcagcgcat gcgtggaacc tttgtggctc ctctgccgat ccatactgcg gaactcctag 2820
ccgcttgttt tgctcgcagc cggtctggag caaagctcat aggaactgac aattctgtcg 2880
tcctctcgcg gaaatataca tcgtttcgat ctacgtatga tctttttccc tctgccaaaa 2940
attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 3000
ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcggaagg aattctgcat 3060
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 3120
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 3180
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 3240
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 3300
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 3360
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 3420
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 3480
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 3540
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 3600
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 3660
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 3720
tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 3780
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 3840
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 3900
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 3960
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 4020
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 4080
tcagcgatct gtctatttcg ttcatccata gttgcctgac tc 4122
210> 25
<211> 4467
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 25
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcattgtgg gaggctggga gtgcgagaag cattcccaac cctggcaggt 2040
gcttgtggcc tctcgtggca gggcagtctg cggcggtgtt ctggtgcacc cccagtgggt 2100
cctcacagct gcccactgca tcaggaacaa aagcgtgatc ttgctgggtc ggcacagctt 2160
gtttcatcct gaagacacag gccaggtatt tcaggtcagc cacagcttcc cacacccgct 2220
ctacgatatg agcctcctga agaatcgatt cctcaggcca ggtgatgact ccagccacga 2280
cctcatgctg ctccgcctgt cagagcctgc cgagctcacg gatgctgtga aggtcatgga 2340
cctgcccacc caggagccag cactggggac cacctgctac gcctcaggct ggggcagcat 2400
tgaaccagag gagttcttga ccccaaagaa acttcagtgt gtggacctcc atgttatttc 2460
caatgacgtg tgtgcgcaag ttcaccctca gaaggtgacc aagttcatgc tgtgtgctgg 2520
acgctggaca gggggcaaaa gcacctgctc gggtgattct gggggcccac ttgtctgtaa 2580
tggtgtgctt caaggtatca cgtcatgggg cagtgaacca tgtgccctgc ccgaaaggcc 2640
ttccctgtac accaaggtgg tgcattaccg gaagtggatc aaggacacca tcgtggccaa 2700
cccctgaaga tctgggccct aacaaaacaa aaagatgggg ttattcccta aacttcatgg 2760
gttacgtaat tggaagttgg gggacattgc cacaagatca tattgtacaa aagatcaaac 2820
actgttttag aaaacttcct gtaaacaggc ctattgattg gaaagtatgt caaaggattg 2880
tgggtctttt gggctttgct gctccattta cacaatgtgg atatcctgcc ttaatgcctt 2940
tgtatgcatg tatacaagct aaacaggctt tcactttctc gccaacttac aaggcctttc 3000
taagtaaaca gtacatgaac ctttaccccg ttgctcggca acggcctggt ctgtgccaag 3060
tgtttgctga cgcaaccccc actggctggg gcttggccat aggccatcag cgcatgcgtg 3120
gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct tgttttgctc 3180
gcagccggtc tggagcaaag ctcataggaa ctgacaattc tgtcgtcctc tcgcggaaat 3240
atacatcgtt tcgatctacg tatgatcttt ttccctctgc caaaaattat ggggacatca 3300
tgaagcccct tgagcatctg acttctggct aataaaggaa atttattttc attgcaatag 3360
tgtgttggaa ttttttgtgt ctctcactcg gaaggaattc tgcattaatg aatcggccaa 3420
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 3480
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 3540
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 3600
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 3660
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 3720
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 3780
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 3840
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 3900
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 3960
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 4020
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca 4080
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 4140
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 4200
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 4260
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 4320
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 4380
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 4440
tttcgttcat ccatagttgc ctgactc 4467
<210> 26
<211> 7563
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 26
gaattctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct 60
cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat 120
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 180
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 240
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 300
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 360
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 420
gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 480
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 540
actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 600
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 660
ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 720
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 780
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 840
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 900
tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 960
aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 1020
aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga ctcggcgtaa 1080
tgctctgcca gtgttacaac caattaacca attctgatta gaaaaactca tcgagcatca 1140
aatgaaactg caatttattc atatcaggat tatcaatacc atatttttga aaaagccgtt 1200
tctgtaatga aggagaaaac tcaccgaggc agttccatag gatggcaaga tcctggtatc 1260
ggtctgcgat tccgactcgt ccaacatcaa tacaacctat taatttcccc tcgtcaaaaa 1320
taaggttatc aagtgagaaa tcaccatgag tgacgactga atccggtgag aatggcaaaa 1380
gcttatgcat ttctttccag acttgttcaa caggccagcc attacgctcg tcatcaaaat 1440
cactcgcatc aaccaaaccg ttattcattc gtgattgcgc ctgagcgaga cgaaatacgc 1500
gatcgctgtt aaaaggacaa ttacaaacag gaatcaaatg caaccggcgc aggaacactg 1560
ccagcgcatc aacaatattt tcacctgaat caggatattc ttctaatacc tggaatgctg 1620
ttttcccggg gatcgcagtg gtgagtaacc atgcatcatc aggagtacgg ataaaatgct 1680
tgatggtcgg aagaggcata aattccgtca gccagtttag tctgaccatc tcatctgtaa 1740
catcattggc aacgctacct ttgccatgtt tcagaaacaa ctctggcgca tcgggcttcc 1800
catacaatcg atagattgtc gcacctgatt gcccgacatt atcgcgagcc catttatacc 1860
catataaatc agcatccatg ttggaattta atcgcggcct cgagcaagac gtttcccgtt 1920
gaatatggct cataacaccc cttgtattac tgtttatgta agcagacagg gtaccaatct 1980
tccgagtgag agacacaaaa aattccaaca cactattgca atgaaaataa atttccttta 2040
ttagccagaa gtcagatgct caaggggctt catgatgtcc ccataatttt tggcagaggg 2100
aaaaagatca tacgtagatc gaaacgatgt atatttccgc gagaggacga cagaattgtc 2160
agttcctatg agctttgctc cagaccggct gcgagcaaaa caagcggcta ggagttccgc 2220
agtatggatc ggcagaggag ccacaaaggt tccacgcatg cgctgatggc ctatggccaa 2280
gccccagcca gtgggggttg cgtcagcaaa cacttggcac agaccaggcc gttgccgagc 2340
aacggggtaa aggttcatgt actgtttact tagaaaggcc ttgtaagttg gcgagaaagt 2400
gaaagcctgt ttagcttgta tacatgcata caaaggcatt aaggcaggat atccacattg 2460
tgtaaatgga gcagcaaagc ccaaaagacc cacaatcctt tgacatactt tccaatcaat 2520
aggcctgttt acaggaagtt ttctaaaaca gtgtttgatc ttttgtacaa tatgatcttg 2580
tggcaatgtc ccccaacttc caattacgta acccatgaag tttagggaat aaccccatct 2640
ttttgttttg ttagggccca gatctttagg ctacttcact caaagtctct gcagctgcct 2700
gcactgtgaa ggctgcaaca taaatctgtc tcttcacttc tccccaggcc ttggaagggt 2760
ccactttgct ttcaatatca aacagagcat cataaattcc tgggaatgac tcccctgcat 2820
acttgttgtg gctgcttgga gcatagatga catgcctata aaaaggcctg tctggtaacc 2880
ctaatggatc aataaatgct ctttccagaa acatgagttg atcattcatc attcttaata 2940
ctattgggtt gcttttgtca aagtcctgga gtctctcact gaacttggaa gcaatttctg 3000
taaaattctt tactgcagaa aaaagtgaat caaatgatac actgtatgtc ttcatttcct 3060
gtggatgttt catagaaata ctgtagattt tgtcagcata ctttcttaaa actacagcat 3120
aatctcgaca atcaaaaggg agcactatgg aattggccag ctcaaacacc atccctcctc 3180
gaacctgggc cacagtgagg tgatatttaa acattggatc ataaaacttt tccaccaact 3240
catatgtttc atagacactg tgatacagtg gatagccgct gaatttgttt gtttcccaat 3300
ttttagtata ccgtgctctg cctgaagcaa ttccaagtcg ttggaagaac acctcaaaat 3360
catttccaga tcccaatttg cttatcctgg gcatgccact gaactctggg gaaggacttt 3420
ttttagtcca actttcataa agagatttgc cttcaaagcc ttcatcaggg cttttcagct 3480
cttttgttag gttgtgtacc aagctgtaca tcagcggtgt acaatcaact ctcagagtgt 3540
agtttccttc tatagatgag tcagcattaa tataagccac gccacgctct tgaaggagtc 3600
ttgaattctc ctctgcccac tcagtagaac caagaagacc aaattcttct gcatcccagc 3660
ttgcaaacaa aattgttctt ctaggtctcc acccttcctt tttcagtgtt ccaaagctcc 3720
tcacaatttc atgaacaaca gctgctccac tctgagggtc aataccacca aacacccatg 3780
agtcccggtg acctcccaga atgacatatc tgtctggttc cactgctcct ctgagagtac 3840
ctatcacatt gtaaattctt gtcacttcat tggtagagtg gatgtgcatc ttgacttttt 3900
gtgtagaaaa gtttccagta aagccaggtc caacattgta gggcactttg agacttcctc 3960
tccagctgct atctggtggt gctgagccac ccattttttc taggagcttc tgtgcatcat 4020
agtatccaat tggatgaaca ggaatacttg gaagaccaac agcctctgca attccacgcc 4080
tataagcata ttcatttgct gggtaacctg gtgtgagagg gtctcctgca ccattcagat 4140
ttaggatatt tccacgctgg acaccacctc caggaagatt ccaaccatct ggataggact 4200
tcaccccagg agcaaagtag tcagcagggt cggagtagag aatgactcct ttggcccctg 4260
ccagctgggc atttttaacc ttatttcctc tgaaaacttt cccatatctg gcaattacaa 4320
ttttcccaga gcaattgatt ttcatgtccc gttccaattt aaagaagtct tcagttcgtg 4380
catagttaac atacactaga tcgccctctg gcattccttg aggagagaaa gcactgaaag 4440
gtggtacaat atccgaaaca ttttcatatc ctggaggagg tggttcaaat aatgatgtgt 4500
tgaaaatctc atttccatct tcattaatta ttgagatgta gttgggatga gtcttatttg 4560
ggtaggacaa caggacatca taatgtgcca gctcaacaga atccaggcca aattctttcc 4620
actgggattg aatttgcttt gcaagctgaa agttttgttc tgttcctgct aaatgtggta 4680
tctgtgtaaa attatataag aacttcttga tgttctcagc tttcaattca tccaaaaatg 4740
ctttcatatt atgctttgga gtaatgttag tagcttcatt ggaggatttt ataaaccacc 4800
cgaagaggaa gccgaggaga aagaagccac ccgccagcac cagcgcccca gcgcacagcc 4860
agcgcgggcg gcgcgcgcta gccatgttcg tcacagggtc cccagtcctc gcggagattg 4920
acgagatgtg agaggcaata ttcggagcag ggtttactgt tcctgaactg gagccaccag 4980
caggaaaata cagacccctg actctgggat cctgacctgg aagatagtca gggttgaggc 5040
aagcaaaagg tacatgtaag agaagagccc acagcgtccc tcaaatccct ggagtcttga 5100
ctggggaagc caggcccacc ctggagagta catacctgct tgctgagatc cggacggtga 5160
gtcactcttg gcacggggaa tccgcgttcc aatgcaccgt tcccggccgc ggaggctgga 5220
tcggtcccgg tgtcttctat ggaggtcaaa acagcgtgga tggcgtctcc aggcgatctg 5280
acggttcact aaacgagctc tgcttatata gacctcccac cgtacacgcc taccgcccat 5340
ttgcgtcaac ggggcggggt tattacgaca ttttggaaag tcccgttgat tttggtgctc 5400
gacctgcagg gtaccaatat tggctattgg ccattgcata cgttgtatct atatcataat 5460
atgtacattt atattggctc atgtccaata tgaccgccat gttgacattg attattgact 5520
agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc 5580
gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg 5640
acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa 5700
tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca 5760
agtccgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac 5820
atgaccttac gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc 5880
atggtgatgc ggttttggca gtacaccaat gggcgtggat agcggtttga ctcacgggga 5940
tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg 6000
gactttccaa aatgtcgtaa taaccccgcc ccgttgacgc aaatgggcgg taggcgtgta 6060
cggtgggagg tctatataag cagagctcgt ttagtgaacc gtcagatcgc ctggagacgc 6120
catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct ccgcggccgg 6180
gaacggtgca ttggaacgcg gattccccgt gccaagagtg actcaccgtc cggatctcag 6240
caagcaggta tgtactctcc agggtgggcc tggcttcccc agtcaagact ccagggattt 6300
gagggacgct gtgggctctt ctcttacatg taccttttgc ttgcctcaac cctgactatc 6360
ttccaggtca ggatcccaga gtcaggggtc tgtattttcc tgctggtggc tccagttcag 6420
gaacagtaaa ccctgctccg aatattgcct ctcacatctc gtcaatctcc gcgaggactg 6480
gggaccctgt gacgaacatg gctagcaagg ctgtgctgct tgccctgttg atggcaggct 6540
tggccctgca gccaggcact gccctgctgt gctactcctg caaagcccag gtgagcaacg 6600
aggactgcct gcaggtggag aactgcaccc agctggggga gcagtgctgg accgcgcgca 6660
tccgcgcagt tggcctcctg accgtcatca gcaaaggctg cagcttgaac tgcgtggatg 6720
actcacagga ctactacgtg ggcaagaaga acatcacgtg ctgtgacacc gacttgtgca 6780
acgccagcgg ggcccatgcc ctgcagccgg ctgccgccat ccttgcgctg ctccctgcac 6840
tcggcctgct gctctgggga cccggccagc tatagagatc tgggccctaa caaaacaaaa 6900
agatggggtt attccctaaa cttcatgggt tacgtaattg gaagttgggg gacattgcca 6960
caagatcata ttgtacaaaa gatcaaacac tgttttagaa aacttcctgt aaacaggcct 7020
attgattgga aagtatgtca aaggattgtg ggtcttttgg gctttgctgc tccatttaca 7080
caatgtggat atcctgcctt aatgcctttg tatgcatgta tacaagctaa acaggctttc 7140
actttctcgc caacttacaa ggcctttcta agtaaacagt acatgaacct ttaccccgtt 7200
gctcggcaac ggcctggtct gtgccaagtg tttgctgacg caacccccac tggctggggc 7260
ttggccatag gccatcagcg catgcgtgga acctttgtgg ctcctctgcc gatccatact 7320
gcggaactcc tagccgcttg ttttgctcgc agccggtctg gagcaaagct cataggaact 7380
gacaattctg tcgtcctctc gcggaaatat acatcgtttc gatctacgta tgatcttttt 7440
ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac ttctggctaa 7500
taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct ctcactcgga 7560
agc 7563
<210> 27
<211> 6396
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 27
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcgcgcgcc gcccgcgctg gctgtgcgct ggggcgctgg tgctggcggg 2040
tggcttcttt ctcctcggct tcctcttcgg gtggtttata aaatcctcca atgaagctac 2100
taacattact ccaaagcata atatgaaagc atttttggat gaattgaaag ctgagaacat 2160
caagaagttc ttatataatt ttacacagat accacattta gcaggaacag aacaaaactt 2220
tcagcttgca aagcaaattc aatcccagtg gaaagaattt ggcctggatt ctgttgagct 2280
ggcacattat gatgtcctgt tgtcctaccc aaataagact catcccaact acatctcaat 2340
aattaatgaa gatggaaatg agattttcaa cacatcatta tttgaaccac ctcctccagg 2400
atatgaaaat gtttcggata ttgtaccacc tttcagtgct ttctctcctc aaggaatgcc 2460
agagggcgat ctagtgtatg ttaactatgc acgaactgaa gacttcttta aattggaacg 2520
ggacatgaaa atcaattgct ctgggaaaat tgtaattgcc agatatggga aagttttcag 2580
aggaaataag gttaaaaatg cccagctggc aggggccaaa ggagtcattc tctactccga 2640
ccctgctgac tactttgctc ctggggtgaa gtcctatcca gatggttgga atcttcctgg 2700
aggtggtgtc cagcgtggaa atatcctaaa tctgaatggt gcaggagacc ctctcacacc 2760
aggttaccca gcaaatgaat atgcttatag gcgtggaatt gcagaggctg ttggtcttcc 2820
aagtattcct gttcatccaa ttggatacta tgatgcacag aagctcctag aaaaaatggg 2880
tggctcagca ccaccagata gcagctggag aggaagtctc aaagtgccct acaatgttgg 2940
acctggcttt actggaaact tttctacaca aaaagtcaag atgcacatcc actctaccaa 3000
tgaagtgaca agaatttaca atgtgatagg tactctcaga ggagcagtgg aaccagacag 3060
atatgtcatt ctgggaggtc accgggactc atgggtgttt ggtggtattg accctcagag 3120
tggagcagct gttgttcatg aaattgtgag gagctttgga acactgaaaa aggaagggtg 3180
gagacctaga agaacaattt tgtttgcaag ctgggatgca gaagaatttg gtcttcttgg 3240
ttctactgag tgggcagagg agaattcaag actccttcaa gagcgtggcg tggcttatat 3300
taatgctgac tcatctatag aaggaaacta cactctgaga gttgattgta caccgctgat 3360
gtacagcttg gtacacaacc taacaaaaga gctgaaaagc cctgatgaag gctttgaagg 3420
caaatctctt tatgaaagtt ggactaaaaa aagtccttcc ccagagttca gtggcatgcc 3480
caggataagc aaattgggat ctggaaatga ttttgaggtg ttcttccaac gacttggaat 3540
tgcttcaggc agagcacggt atactaaaaa ttgggaaaca aacaaattca gcggctatcc 3600
actgtatcac agtgtctatg aaacatatga gttggtggaa aagttttatg atccaatgtt 3660
taaatatcac ctcactgtgg cccaggttcg aggagggatg gtgtttgagc tggccaattc 3720
catagtgctc ccttttgatt gtcgagatta tgctgtagtt ttaagaaagt atgctgacaa 3780
aatctacagt atttctatga aacatccaca ggaaatgaag acatacagtg tatcatttga 3840
ttcacttttt tctgcagtaa agaattttac agaaattgct tccaagttca gtgagagact 3900
ccaggacttt gacaaaagca acccaatagt attaagaatg atgaatgatc aactcatgtt 3960
tctggaaaga gcatttattg atccattagg gttaccagac aggccttttt ataggcatgt 4020
catctatgct ccaagcagcc acaacaagta tgcaggggag tcattcccag gaatttatga 4080
tgctctgttt gatattgaaa gcaaagtgga cccttccaag gcctggggag aagtgaagag 4140
acagatttat gttgcagcct tcacagtgca ggcagctgca gagactttga gtgaagtagc 4200
cggatccgaa ggtaggggtt cattattgac ctgtggagat gtcgaagaaa acccaggacc 4260
cgcaagcaag gctgtgctgc ttgccctgtt gatggcaggc ttggccctgc agccaggcac 4320
tgccctgctg tgctactcct gcaaagccca ggtgagcaac gaggactgcc tgcaggtgga 4380
gaactgcacc cagctggggg agcagtgctg gaccgcgcgc atccgcgcag ttggcctcct 4440
gaccgtcatc agcaaaggct gcagcttgaa ctgcgtggat gactcacagg actactacgt 4500
gggcaagaag aacatcacgt gctgtgacac cgacttgtgc aacgccagcg gggcccatgc 4560
cctgcagccg gctgccgcca tccttgcgct gctccctgca ctcggcctgc tgctctgggg 4620
acccggccag ctatagagat ctgggcccta acaaaacaaa aagatggggt tattccctaa 4680
acttcatggg ttacgtaatt ggaagttggg ggacattgcc acaagatcat attgtacaaa 4740
agatcaaaca ctgttttaga aaacttcctg taaacaggcc tattgattgg aaagtatgtc 4800
aaaggattgt gggtcttttg ggctttgctg ctccatttac acaatgtgga tatcctgcct 4860
taatgccttt gtatgcatgt atacaagcta aacaggcttt cactttctcg ccaacttaca 4920
aggcctttct aagtaaacag tacatgaacc tttaccccgt tgctcggcaa cggcctggtc 4980
tgtgccaagt gtttgctgac gcaaccccca ctggctgggg cttggccata ggccatcagc 5040
gcatgcgtgg aacctttgtg gctcctctgc cgatccatac tgcggaactc ctagccgctt 5100
gttttgctcg cagccggtct ggagcaaagc tcataggaac tgacaattct gtcgtcctct 5160
cgcggaaata tacatcgttt cgatctacgt atgatctttt tccctctgcc aaaaattatg 5220
gggacatcat gaagcccctt gagcatctga cttctggcta ataaaggaaa tttattttca 5280
ttgcaatagt gtgttggaat tttttgtgtc tctcactcgg aaggaattct gcattaatga 5340
atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 5400
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 5460
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 5520
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 5580
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 5640
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 5700
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 5760
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 5820
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5880
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 5940
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 6000
agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 6060
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 6120
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 6180
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 6240
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 6300
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 6360
atctgtctat ttcgttcatc catagttgcc tgactc 6396
<210> 28
<211> 6405
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 28
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 2040
aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 2100
ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 2160
cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 2220
ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 2280
ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 2340
ctggggaccc ggccagctag gatcccagac cctgaacttt gatctgctga aactggcagg 2400
cgatgtggaa agcaacccag gcccaatggc aagcgcgcgc cgcccgcgct ggctgtgcgc 2460
tggggcgctg gtgctggcgg gtggcttctt tctcctcggc ttcctcttcg ggtggtttat 2520
aaaatcctcc aatgaagcta ctaacattac tccaaagcat aatatgaaag catttttgga 2580
tgaattgaaa gctgagaaca tcaagaagtt cttatataat tttacacaga taccacattt 2640
agcaggaaca gaacaaaact ttcagcttgc aaagcaaatt caatcccagt ggaaagaatt 2700
tggcctggat tctgttgagc tggcacatta tgatgtcctg ttgtcctacc caaataagac 2760
tcatcccaac tacatctcaa taattaatga agatggaaat gagattttca acacatcatt 2820
atttgaacca cctcctccag gatatgaaaa tgtttcggat attgtaccac ctttcagtgc 2880
tttctctcct caaggaatgc cagagggcga tctagtgtat gttaactatg cacgaactga 2940
agacttcttt aaattggaac gggacatgaa aatcaattgc tctgggaaaa ttgtaattgc 3000
cagatatggg aaagttttca gaggaaataa ggttaaaaat gcccagctgg caggggccaa 3060
aggagtcatt ctctactccg accctgctga ctactttgct cctggggtga agtcctatcc 3120
agatggttgg aatcttcctg gaggtggtgt ccagcgtgga aatatcctaa atctgaatgg 3180
tgcaggagac cctctcacac caggttaccc agcaaatgaa tatgcttata ggcgtggaat 3240
tgcagaggct gttggtcttc caagtattcc tgttcatcca attggatact atgatgcaca 3300
gaagctccta gaaaaaatgg gtggctcagc accaccagat agcagctgga gaggaagtct 3360
caaagtgccc tacaatgttg gacctggctt tactggaaac ttttctacac aaaaagtcaa 3420
gatgcacatc cactctacca atgaagtgac aagaatttac aatgtgatag gtactctcag 3480
aggagcagtg gaaccagaca gatatgtcat tctgggaggt caccgggact catgggtgtt 3540
tggtggtatt gaccctcaga gtggagcagc tgttgttcat gaaattgtga ggagctttgg 3600
aacactgaaa aaggaagggt ggagacctag aagaacaatt ttgtttgcaa gctgggatgc 3660
agaagaattt ggtcttcttg gttctactga gtgggcagag gagaattcaa gactccttca 3720
agagcgtggc gtggcttata ttaatgctga ctcatctata gaaggaaact acactctgag 3780
agttgattgt acaccgctga tgtacagctt ggtacacaac ctaacaaaag agctgaaaag 3840
ccctgatgaa ggctttgaag gcaaatctct ttatgaaagt tggactaaaa aaagtccttc 3900
cccagagttc agtggcatgc ccaggataag caaattggga tctggaaatg attttgaggt 3960
gttcttccaa cgacttggaa ttgcttcagg cagagcacgg tatactaaaa attgggaaac 4020
aaacaaattc agcggctatc cactgtatca cagtgtctat gaaacatatg agttggtgga 4080
aaagttttat gatccaatgt ttaaatatca cctcactgtg gcccaggttc gaggagggat 4140
ggtgtttgag ctggccaatt ccatagtgct cccttttgat tgtcgagatt atgctgtagt 4200
tttaagaaag tatgctgaca aaatctacag tatttctatg aaacatccac aggaaatgaa 4260
gacatacagt gtatcatttg attcactttt ttctgcagta aagaatttta cagaaattgc 4320
ttccaagttc agtgagagac tccaggactt tgacaaaagc aacccaatag tattaagaat 4380
gatgaatgat caactcatgt ttctggaaag agcatttatt gatccattag ggttaccaga 4440
caggcctttt tataggcatg tcatctatgc tccaagcagc cacaacaagt atgcagggga 4500
gtcattccca ggaatttatg atgctctgtt tgatattgaa agcaaagtgg acccttccaa 4560
ggcctgggga gaagtgaaga gacagattta tgttgcagcc ttcacagtgc aggcagctgc 4620
agagactttg agtgaagtag cctaaagatc tgggccctaa caaaacaaaa agatggggtt 4680
attccctaaa cttcatgggt tacgtaattg gaagttgggg gacattgcca caagatcata 4740
ttgtacaaaa gatcaaacac tgttttagaa aacttcctgt aaacaggcct attgattgga 4800
aagtatgtca aaggattgtg ggtcttttgg gctttgctgc tccatttaca caatgtggat 4860
atcctgcctt aatgcctttg tatgcatgta tacaagctaa acaggctttc actttctcgc 4920
caacttacaa ggcctttcta agtaaacagt acatgaacct ttaccccgtt gctcggcaac 4980
ggcctggtct gtgccaagtg tttgctgacg caacccccac tggctggggc ttggccatag 5040
gccatcagcg catgcgtgga acctttgtgg ctcctctgcc gatccatact gcggaactcc 5100
tagccgcttg ttttgctcgc agccggtctg gagcaaagct cataggaact gacaattctg 5160
tcgtcctctc gcggaaatat acatcgtttc gatctacgta tgatcttttt ccctctgcca 5220
aaaattatgg ggacatcatg aagccccttg agcatctgac ttctggctaa taaaggaaat 5280
ttattttcat tgcaatagtg tgttggaatt ttttgtgtct ctcactcgga aggaattctg 5340
cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 5400
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 5460
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 5520
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 5580
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 5640
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 5700
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 5760
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 5820
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 5880
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 5940
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 6000
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6060
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 6120
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 6180
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 6240
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 6300
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 6360
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactc 6405
<210> 29
<211> 6750
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 29
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcattgtgg gaggctggga gtgcgagaag cattcccaac cctggcaggt 2040
gcttgtggcc tctcgtggca gggcagtctg cggcggtgtt ctggtgcacc cccagtgggt 2100
cctcacagct gcccactgca tcaggaacaa aagcgtgatc ttgctgggtc ggcacagctt 2160
gtttcatcct gaagacacag gccaggtatt tcaggtcagc cacagcttcc cacacccgct 2220
ctacgatatg agcctcctga agaatcgatt cctcaggcca ggtgatgact ccagccacga 2280
cctcatgctg ctccgcctgt cagagcctgc cgagctcacg gatgctgtga aggtcatgga 2340
cctgcccacc caggagccag cactggggac cacctgctac gcctcaggct ggggcagcat 2400
tgaaccagag gagttcttga ccccaaagaa acttcagtgt gtggacctcc atgttatttc 2460
caatgacgtg tgtgcgcaag ttcaccctca gaaggtgacc aagttcatgc tgtgtgctgg 2520
acgctggaca gggggcaaaa gcacctgctc gggtgattct gggggcccac ttgtctgtaa 2580
tggtgtgctt caaggtatca cgtcatgggg cagtgaacca tgtgccctgc ccgaaaggcc 2640
ttccctgtac accaaggtgg tgcattaccg gaagtggatc aaggacacca tcgtggccaa 2700
ccccggatcc cagaccctga actttgatct gctgaaactg gcaggcgatg tggaaagcaa 2760
cccaggccca atggcaagcg cgcgccgccc gcgctggctg tgcgctgggg cgctggtgct 2820
ggcgggtggc ttctttctcc tcggcttcct cttcgggtgg tttataaaat cctccaatga 2880
agctactaac attactccaa agcataatat gaaagcattt ttggatgaat tgaaagctga 2940
gaacatcaag aagttcttat ataattttac acagatacca catttagcag gaacagaaca 3000
aaactttcag cttgcaaagc aaattcaatc ccagtggaaa gaatttggcc tggattctgt 3060
tgagctggca cattatgatg tcctgttgtc ctacccaaat aagactcatc ccaactacat 3120
ctcaataatt aatgaagatg gaaatgagat tttcaacaca tcattatttg aaccacctcc 3180
tccaggatat gaaaatgttt cggatattgt accacctttc agtgctttct ctcctcaagg 3240
aatgccagag ggcgatctag tgtatgttaa ctatgcacga actgaagact tctttaaatt 3300
ggaacgggac atgaaaatca attgctctgg gaaaattgta attgccagat atgggaaagt 3360
tttcagagga aataaggtta aaaatgccca gctggcaggg gccaaaggag tcattctcta 3420
ctccgaccct gctgactact ttgctcctgg ggtgaagtcc tatccagatg gttggaatct 3480
tcctggaggt ggtgtccagc gtggaaatat cctaaatctg aatggtgcag gagaccctct 3540
cacaccaggt tacccagcaa atgaatatgc ttataggcgt ggaattgcag aggctgttgg 3600
tcttccaagt attcctgttc atccaattgg atactatgat gcacagaagc tcctagaaaa 3660
aatgggtggc tcagcaccac cagatagcag ctggagagga agtctcaaag tgccctacaa 3720
tgttggacct ggctttactg gaaacttttc tacacaaaaa gtcaagatgc acatccactc 3780
taccaatgaa gtgacaagaa tttacaatgt gataggtact ctcagaggag cagtggaacc 3840
agacagatat gtcattctgg gaggtcaccg ggactcatgg gtgtttggtg gtattgaccc 3900
tcagagtgga gcagctgttg ttcatgaaat tgtgaggagc tttggaacac tgaaaaagga 3960
agggtggaga cctagaagaa caattttgtt tgcaagctgg gatgcagaag aatttggtct 4020
tcttggttct actgagtggg cagaggagaa ttcaagactc cttcaagagc gtggcgtggc 4080
ttatattaat gctgactcat ctatagaagg aaactacact ctgagagttg attgtacacc 4140
gctgatgtac agcttggtac acaacctaac aaaagagctg aaaagccctg atgaaggctt 4200
tgaaggcaaa tctctttatg aaagttggac taaaaaaagt ccttccccag agttcagtgg 4260
catgcccagg ataagcaaat tgggatctgg aaatgatttt gaggtgttct tccaacgact 4320
tggaattgct tcaggcagag cacggtatac taaaaattgg gaaacaaaca aattcagcgg 4380
ctatccactg tatcacagtg tctatgaaac atatgagttg gtggaaaagt tttatgatcc 4440
aatgtttaaa tatcacctca ctgtggccca ggttcgagga gggatggtgt ttgagctggc 4500
caattccata gtgctccctt ttgattgtcg agattatgct gtagttttaa gaaagtatgc 4560
tgacaaaatc tacagtattt ctatgaaaca tccacaggaa atgaagacat acagtgtatc 4620
atttgattca cttttttctg cagtaaagaa ttttacagaa attgcttcca agttcagtga 4680
gagactccag gactttgaca aaagcaaccc aatagtatta agaatgatga atgatcaact 4740
catgtttctg gaaagagcat ttattgatcc attagggtta ccagacaggc ctttttatag 4800
gcatgtcatc tatgctccaa gcagccacaa caagtatgca ggggagtcat tcccaggaat 4860
ttatgatgct ctgtttgata ttgaaagcaa agtggaccct tccaaggcct ggggagaagt 4920
gaagagacag atttatgttg cagccttcac agtgcaggca gctgcagaga ctttgagtga 4980
agtagcctaa agatctgggc cctaacaaaa caaaaagatg gggttattcc ctaaacttca 5040
tgggttacgt aattggaagt tgggggacat tgccacaaga tcatattgta caaaagatca 5100
aacactgttt tagaaaactt cctgtaaaca ggcctattga ttggaaagta tgtcaaagga 5160
ttgtgggtct tttgggcttt gctgctccat ttacacaatg tggatatcct gccttaatgc 5220
ctttgtatgc atgtatacaa gctaaacagg ctttcacttt ctcgccaact tacaaggcct 5280
ttctaagtaa acagtacatg aacctttacc ccgttgctcg gcaacggcct ggtctgtgcc 5340
aagtgtttgc tgacgcaacc cccactggct ggggcttggc cataggccat cagcgcatgc 5400
gtggaacctt tgtggctcct ctgccgatcc atactgcgga actcctagcc gcttgttttg 5460
ctcgcagccg gtctggagca aagctcatag gaactgacaa ttctgtcgtc ctctcgcgga 5520
aatatacatc gtttcgatct acgtatgatc tttttccctc tgccaaaaat tatggggaca 5580
tcatgaagcc ccttgagcat ctgacttctg gctaataaag gaaatttatt ttcattgcaa 5640
tagtgtgttg gaattttttg tgtctctcac tcggaaggaa ttctgcatta atgaatcggc 5700
caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 5760
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 5820
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 5880
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 5940
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 6000
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 6060
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 6120
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 6180
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 6240
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 6300
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 6360
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 6420
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 6480
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 6540
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 6600
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 6660
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 6720
ctatttcgtt catccatagt tgcctgactc 6750
<210> 30
<211> 6908
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 30
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcgcgcgcc gcccgcgctg gctgtgcgct ggggcgctgg tgctggcggg 2040
tggcttcttt ctcctcggct tcctcttcgg gtggtttata aaatcctcca atgaagctac 2100
taacattact ccaaagcata atatgaaagc atttttggat gaattgaaag ctgagaacat 2160
caagaagttc ttatataatt ttacacagat accacattta gcaggaacag aacaaaactt 2220
tcagcttgca aagcaaattc aatcccagtg gaaagaattt ggcctggatt ctgttgagct 2280
ggcacattat gatgtcctgt tgtcctaccc aaataagact catcccaact acatctcaat 2340
aattaatgaa gatggaaatg agattttcaa cacatcatta tttgaaccac ctcctccagg 2400
atatgaaaat gtttcggata ttgtaccacc tttcagtgct ttctctcctc aaggaatgcc 2460
agagggcgat ctagtgtatg ttaactatgc acgaactgaa gacttcttta aattggaacg 2520
ggacatgaaa atcaattgct ctgggaaaat tgtaattgcc agatatggga aagttttcag 2580
aggaaataag gttaaaaatg cccagctggc aggggccaaa ggagtcattc tctactccga 2640
ccctgctgac tactttgctc ctggggtgaa gtcctatcca gatggttgga atcttcctgg 2700
aggtggtgtc cagcgtggaa atatcctaaa tctgaatggt gcaggagacc ctctcacacc 2760
aggttaccca gcaaatgaat atgcttatag gcgtggaatt gcagaggctg ttggtcttcc 2820
aagtattcct gttcatccaa ttggatacta tgatgcacag aagctcctag aaaaaatggg 2880
tggctcagca ccaccagata gcagctggag aggaagtctc aaagtgccct acaatgttgg 2940
acctggcttt actggaaact tttctacaca aaaagtcaag atgcacatcc actctaccaa 3000
tgaagtgaca agaatttaca atgtgatagg tactctcaga ggagcagtgg aaccagacag 3060
atatgtcatt ctgggaggtc accgggactc atgggtgttt ggtggtattg accctcagag 3120
tggagcagct gttgttcatg aaattgtgag gagctttgga acactgaaaa aggaagggtg 3180
gagacctaga agaacaattt tgtttgcaag ctgggatgca gaagaatttg gtcttcttgg 3240
ttctactgag tgggcagagg agaattcaag actccttcaa gagcgtggcg tggcttatat 3300
taatgctgac tcatctatag aaggaaacta cactctgaga gttgattgta caccgctgat 3360
gtacagcttg gtacacaacc taacaaaaga gctgaaaagc cctgatgaag gctttgaagg 3420
caaatctctt tatgaaagtt ggactaaaaa aagtccttcc ccagagttca gtggcatgcc 3480
caggataagc aaattgggat ctggaaatga ttttgaggtg ttcttccaac gacttggaat 3540
tgcttcaggc agagcacggt atactaaaaa ttgggaaaca aacaaattca gcggctatcc 3600
actgtatcac agtgtctatg aaacatatga gttggtggaa aagttttatg atccaatgtt 3660
taaatatcac ctcactgtgg cccaggttcg aggagggatg gtgtttgagc tggccaattc 3720
catagtgctc ccttttgatt gtcgagatta tgctgtagtt ttaagaaagt atgctgacaa 3780
aatctacagt atttctatga aacatccaca ggaaatgaag acatacagtg tatcatttga 3840
ttcacttttt tctgcagtaa agaattttac agaaattgct tccaagttca gtgagagact 3900
ccaggacttt gacaaaagca acccaatagt attaagaatg atgaatgatc aactcatgtt 3960
tctggaaaga gcatttattg atccattagg gttaccagac aggccttttt ataggcatgt 4020
catctatgct ccaagcagcc acaacaagta tgcaggggag tcattcccag gaatttatga 4080
tgctctgttt gatattgaaa gcaaagtgga cccttccaag gcctggggag aagtgaagag 4140
acagatttat gttgcagcct tcacagtgca ggcagctgca gagactttga gtgaagtagc 4200
ctaaagatct gaccccctaa cgttactggc cgaagccgct tggaataagg ccggtgtgcg 4260
tttgtctata tgttattttc caccatattg ccgtcttttg gcaatgtgag ggcccggaaa 4320
cctggccctg tcttcttgac gagcattcct aggggtcttt cccctctcgc caaaggaatg 4380
caaggtctgt tgaatgtcgt gaaggaagca gttcctctgg aagcttcttg aagacaaaca 4440
acgtctgtag cgaccctttg caggcagcgg aaccccccac ctggcgacag gtgcctctgc 4500
ggccaaaagc cacgtgtata agatacacct gcaaaggcgg cacaacccca gtgccacgtt 4560
gtgagttgga tagttgtgga aagagtcaaa tggctctcct caagcgtatt caacaagggg 4620
ctgaaggatg cccagaaggt accccattgt atgggatctg atctggggcc tcggtgcaca 4680
tgctttacat gtgtttagtc gaggttaaaa aacgtctagg ccccccgaac cacggggacg 4740
tggttttcct ttgaaaaaca cgatgataat atggccagca aggctgtgct gcttgccctg 4800
ttgatggcag gcttggccct gcagccaggc actgccctgc tgtgctactc ctgcaaagcc 4860
caggtgagca acgaggactg cctgcaggtg gagaactgca cccagctggg ggagcagtgc 4920
tggaccgcgc gcatccgcgc agttggcctc ctgaccgtca tcagcaaagg ctgcagcttg 4980
aactgcgtgg atgactcaca ggactactac gtgggcaaga agaacatcac gtgctgtgac 5040
accgacttgt gcaacgccag cggggcccat gccctgcagc cggctgccgc catccttgcg 5100
ctgctccctg cactcggcct gctgctctgg ggacccggcc agctataggg atctgggccc 5160
taacaaaaca aaaagatggg gttattccct aaacttcatg ggttacgtaa ttggaagttg 5220
ggggacattg ccacaagatc atattgtaca aaagatcaaa cactgtttta gaaaacttcc 5280
tgtaaacagg cctattgatt ggaaagtatg tcaaaggatt gtgggtcttt tgggctttgc 5340
tgctccattt acacaatgtg gatatcctgc cttaatgcct ttgtatgcat gtatacaagc 5400
taaacaggct ttcactttct cgccaactta caaggccttt ctaagtaaac agtacatgaa 5460
cctttacccc gttgctcggc aacggcctgg tctgtgccaa gtgtttgctg acgcaacccc 5520
cactggctgg ggcttggcca taggccatca gcgcatgcgt ggaacctttg tggctcctct 5580
gccgatccat actgcggaac tcctagccgc ttgttttgct cgcagccggt ctggagcaaa 5640
gctcatagga actgacaatt ctgtcgtcct ctcgcggaaa tatacatcgt ttcgatctac 5700
gtatgatctt tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct 5760
gacttctggc taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg 5820
tctctcactc ggaaggaatt ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 5880
tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 5940
tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 6000
ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 6060
ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 6120
gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 6180
gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 6240
ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg 6300
tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 6360
gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 6420
tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 6480
tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt atctgcgctc 6540
tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 6600
ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 6660
ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 6720
gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt 6780
aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc 6840
aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg 6900
cctgactc 6908
<210> 31
<211> 6914
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 31
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 2040
aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 2100
ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 2160
cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 2220
ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 2280
ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 2340
ctggggaccc ggccagctat agagatctga ccccctaacg ttactggccg aagccgcttg 2400
gaataaggcc ggtgtgcgtt tgtctatatg ttattttcca ccatattgcc gtcttttggc 2460
aatgtgaggg cccggaaacc tggccctgtc ttcttgacga gcattcctag gggtctttcc 2520
cctctcgcca aaggaatgca aggtctgttg aatgtcgtga aggaagcagt tcctctggaa 2580
gcttcttgaa gacaaacaac gtctgtagcg accctttgca ggcagcggaa ccccccacct 2640
ggcgacaggt gcctctgcgg ccaaaagcca cgtgtataag atacacctgc aaaggcggca 2700
caaccccagt gccacgttgt gagttggata gttgtggaaa gagtcaaatg gctctcctca 2760
agcgtattca acaaggggct gaaggatgcc cagaaggtac cccattgtat gggatctgat 2820
ctggggcctc ggtgcacatg ctttacatgt gtttagtcga ggttaaaaaa cgtctaggcc 2880
ccccgaacca cggggacgtg gttttccttt gaaaaacacg atgataatat ggccacaacc 2940
atggcgcgcc gcccgcgctg gctgtgcgct ggggcgctgg tgctggcggg tggcttcttt 3000
ctcctcggct tcctcttcgg gtggtttata aaatcctcca atgaagctac taacattact 3060
ccaaagcata atatgaaagc atttttggat gaattgaaag ctgagaacat caagaagttc 3120
ttatataatt ttacacagat accacattta gcaggaacag aacaaaactt tcagcttgca 3180
aagcaaattc aatcccagtg gaaagaattt ggcctggatt ctgttgagct ggcacattat 3240
gatgtcctgt tgtcctaccc aaataagact catcccaact acatctcaat aattaatgaa 3300
gatggaaatg agattttcaa cacatcatta tttgaaccac ctcctccagg atatgaaaat 3360
gtttcggata ttgtaccacc tttcagtgct ttctctcctc aaggaatgcc agagggcgat 3420
ctagtgtatg ttaactatgc acgaactgaa gacttcttta aattggaacg ggacatgaaa 3480
atcaattgct ctgggaaaat tgtaattgcc agatatggga aagttttcag aggaaataag 3540
gttaaaaatg cccagctggc aggggccaaa ggagtcattc tctactccga ccctgctgac 3600
tactttgctc ctggggtgaa gtcctatcca gatggttgga atcttcctgg aggtggtgtc 3660
cagcgtggaa atatcctaaa tctgaatggt gcaggagacc ctctcacacc aggttaccca 3720
gcaaatgaat atgcttatag gcgtggaatt gcagaggctg ttggtcttcc aagtattcct 3780
gttcatccaa ttggatacta tgatgcacag aagctcctag aaaaaatggg tggctcagca 3840
ccaccagata gcagctggag aggaagtctc aaagtgccct acaatgttgg acctggcttt 3900
actggaaact tttctacaca aaaagtcaag atgcacatcc actctaccaa tgaagtgaca 3960
agaatttaca atgtgatagg tactctcaga ggagcagtgg aaccagacag atatgtcatt 4020
ctgggaggtc accgggactc atgggtgttt ggtggtattg accctcagag tggagcagct 4080
gttgttcatg aaattgtgag gagctttgga acactgaaaa aggaagggtg gagacctaga 4140
agaacaattt tgtttgcaag ctgggatgca gaagaatttg gtcttcttgg ttctactgag 4200
tgggcagagg agaattcaag actccttcaa gagcgtggcg tggcttatat taatgctgac 4260
tcatctatag aaggaaacta cactctgaga gttgattgta caccgctgat gtacagcttg 4320
gtacacaacc taacaaaaga gctgaaaagc cctgatgaag gctttgaagg caaatctctt 4380
tatgaaagtt ggactaaaaa aagtccttcc ccagagttca gtggcatgcc caggataagc 4440
aaattgggat ctggaaatga ttttgaggtg ttcttccaac gacttggaat tgcttcaggc 4500
agagcacggt atactaaaaa ttgggaaaca aacaaattca gcggctatcc actgtatcac 4560
agtgtctatg aaacatatga gttggtggaa aagttttatg atccaatgtt taaatatcac 4620
ctcactgtgg cccaggttcg aggagggatg gtgtttgagc tggccaattc catagtgctc 4680
ccttttgatt gtcgagatta tgctgtagtt ttaagaaagt atgctgacaa aatctacagt 4740
atttctatga aacatccaca ggaaatgaag acatacagtg tatcatttga ttcacttttt 4800
tctgcagtaa agaattttac agaaattgct tccaagttca gtgagagact ccaggacttt 4860
gacaaaagca acccaatagt attaagaatg atgaatgatc aactcatgtt tctggaaaga 4920
gcatttattg atccattagg gttaccagac aggccttttt ataggcatgt catctatgct 4980
ccaagcagcc acaacaagta tgcaggggag tcattcccag gaatttatga tgctctgttt 5040
gatattgaaa gcaaagtgga cccttccaag gcctggggag aagtgaagag acagatttat 5100
gttgcagcct tcacagtgca ggcagctgca gagactttga gtgaagtagc ctaaagatct 5160
gggccctaac aaaacaaaaa gatggggtta ttccctaaac ttcatgggtt acgtaattgg 5220
aagttggggg acattgccac aagatcatat tgtacaaaag atcaaacact gttttagaaa 5280
acttcctgta aacaggccta ttgattggaa agtatgtcaa aggattgtgg gtcttttggg 5340
ctttgctgct ccatttacac aatgtggata tcctgcctta atgcctttgt atgcatgtat 5400
acaagctaaa caggctttca ctttctcgcc aacttacaag gcctttctaa gtaaacagta 5460
catgaacctt taccccgttg ctcggcaacg gcctggtctg tgccaagtgt ttgctgacgc 5520
aacccccact ggctggggct tggccatagg ccatcagcgc atgcgtggaa cctttgtggc 5580
tcctctgccg atccatactg cggaactcct agccgcttgt tttgctcgca gccggtctgg 5640
agcaaagctc ataggaactg acaattctgt cgtcctctcg cggaaatata catcgtttcg 5700
atctacgtat gatctttttc cctctgccaa aaattatggg gacatcatga agccccttga 5760
gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt gttggaattt 5820
tttgtgtctc tcactcggaa ggaattctgc attaatgaat cggccaacgc gcggggagag 5880
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 5940
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 6000
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 6060
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 6120
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 6180
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 6240
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 6300
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 6360
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 6420
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 6480
cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 6540
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 6600
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 6660
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 6720
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 6780
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 6840
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 6900
tagttgcctg actc 6914
<210> 32
<211> 5411
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 32
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 2040
aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 2100
ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 2160
cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 2220
ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 2280
ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 2340
ctggggaccc ggccagctat agagatctga ccccctaacg ttactggccg aagccgcttg 2400
gaataaggcc ggtgtgcgtt tgtctatatg ttattttcca ccatattgcc gtcttttggc 2460
aatgtgaggg cccggaaacc tggccctgtc ttcttgacga gcattcctag gggtctttcc 2520
cctctcgcca aaggaatgca aggtctgttg aatgtcgtga aggaagcagt tcctctggaa 2580
gcttcttgaa gacaaacaac gtctgtagcg accctttgca ggcagcggaa ccccccacct 2640
ggcgacaggt gcctctgcgg ccaaaagcca cgtgtataag atacacctgc aaaggcggca 2700
caaccccagt gccacgttgt gagttggata gttgtggaaa gagtcaaatg gctctcctca 2760
agcgtattca acaaggggct gaaggatgcc cagaaggtac cccattgtat gggatctgat 2820
ctggggcctc ggtgcacatg ctttacatgt gtttagtcga ggttaaaaaa cgtctaggcc 2880
ccccgaacca cggggacgtg gttttccttt gaaaaacacg atgataatat ggccagcatt 2940
gtgggaggct gggagtgcga gaagcattcc caaccctggc aggtgcttgt ggcctctcgt 3000
ggcagggcag tctgcggcgg tgttctggtg cacccccagt gggtcctcac agctgcccac 3060
tgcatcagga acaaaagcgt gatcttgctg ggtcggcaca gcttgtttca tcctgaagac 3120
acaggccagg tatttcaggt cagccacagc ttcccacacc cgctctacga tatgagcctc 3180
ctgaagaatc gattcctcag gccaggtgat gactccagcc acgacctcat gctgctccgc 3240
ctgtcagagc ctgccgagct cacggatgct gtgaaggtca tggacctgcc cacccaggag 3300
ccagcactgg ggaccacctg ctacgcctca ggctggggca gcattgaacc agaggagttc 3360
ttgaccccaa agaaacttca gtgtgtggac ctccatgtta tttccaatga cgtgtgtgcg 3420
caagttcacc ctcagaaggt gaccaagttc atgctgtgtg ctggacgctg gacagggggc 3480
aaaagcacct gctcgggtga ttctgggggc ccacttgtct gtaatggtgt gcttcaaggt 3540
atcacgtcat ggggcagtga accatgtgcc ctgcccgaaa ggccttccct gtacaccaag 3600
gtggtgcatt accggaagtg gatcaaggac accatcgtgg ccaacccctg aggatctggg 3660
ccctaacaaa acaaaaagat ggggttattc cctaaacttc atgggttacg taattggaag 3720
ttgggggaca ttgccacaag atcatattgt acaaaagatc aaacactgtt ttagaaaact 3780
tcctgtaaac aggcctattg attggaaagt atgtcaaagg attgtgggtc ttttgggctt 3840
tgctgctcca tttacacaat gtggatatcc tgccttaatg cctttgtatg catgtataca 3900
agctaaacag gctttcactt tctcgccaac ttacaaggcc tttctaagta aacagtacat 3960
gaacctttac cccgttgctc ggcaacggcc tggtctgtgc caagtgtttg ctgacgcaac 4020
ccccactggc tggggcttgg ccataggcca tcagcgcatg cgtggaacct ttgtggctcc 4080
tctgccgatc catactgcgg aactcctagc cgcttgtttt gctcgcagcc ggtctggagc 4140
aaagctcata ggaactgaca attctgtcgt cctctcgcgg aaatatacat cgtttcgatc 4200
tacgtatgat ctttttccct ctgccaaaaa ttatggggac atcatgaagc cccttgagca 4260
tctgacttct ggctaataaa ggaaatttat tttcattgca atagtgtgtt ggaatttttt 4320
gtgtctctca ctcggaagga attctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 4380
gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 4440
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 4500
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 4560
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 4620
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 4680
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 4740
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 4800
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 4860
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 4920
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 4980
agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg 5040
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 5100
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 5160
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 5220
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 5280
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 5340
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 5400
ttgcctgact c 5411
<210> 33
<211> 7694
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 33
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcattgtgg gaggctggga gtgcgagaag cattcccaac cctggcaggt 2040
gcttgtggcc tctcgtggca gggcagtctg cggcggtgtt ctggtgcacc cccagtgggt 2100
cctcacagct gcccactgca tcaggaacaa aagcgtgatc ttgctgggtc ggcacagctt 2160
gtttcatcct gaagacacag gccaggtatt tcaggtcagc cacagcttcc cacacccgct 2220
ctacgatatg agcctcctga agaatcgatt cctcaggcca ggtgatgact ccagccacga 2280
cctcatgctg ctccgcctgt cagagcctgc cgagctcacg gatgctgtga aggtcatgga 2340
cctgcccacc caggagccag cactggggac cacctgctac gcctcaggct ggggcagcat 2400
tgaaccagag gagttcttga ccccaaagaa acttcagtgt gtggacctcc atgttatttc 2460
caatgacgtg tgtgcgcaag ttcaccctca gaaggtgacc aagttcatgc tgtgtgctgg 2520
acgctggaca gggggcaaaa gcacctgctc gggtgattct gggggcccac ttgtctgtaa 2580
tggtgtgctt caaggtatca cgtcatgggg cagtgaacca tgtgccctgc ccgaaaggcc 2640
ttccctgtac accaaggtgg tgcattaccg gaagtggatc aaggacacca tcgtggccaa 2700
ccccggatcc cagaccctga actttgatct gctgaaactg gcaggcgatg tggaaagcaa 2760
cccaggccca atggcaagcg cgcgccgccc gcgctggctg tgcgctgggg cgctggtgct 2820
ggcgggtggc ttctttctcc tcggcttcct cttcgggtgg tttataaaat cctccaatga 2880
agctactaac attactccaa agcataatat gaaagcattt ttggatgaat tgaaagctga 2940
gaacatcaag aagttcttat ataattttac acagatacca catttagcag gaacagaaca 3000
aaactttcag cttgcaaagc aaattcaatc ccagtggaaa gaatttggcc tggattctgt 3060
tgagctggca cattatgatg tcctgttgtc ctacccaaat aagactcatc ccaactacat 3120
ctcaataatt aatgaagatg gaaatgagat tttcaacaca tcattatttg aaccacctcc 3180
tccaggatat gaaaatgttt cggatattgt accacctttc agtgctttct ctcctcaagg 3240
aatgccagag ggcgatctag tgtatgttaa ctatgcacga actgaagact tctttaaatt 3300
ggaacgggac atgaaaatca attgctctgg gaaaattgta attgccagat atgggaaagt 3360
tttcagagga aataaggtta aaaatgccca gctggcaggg gccaaaggag tcattctcta 3420
ctccgaccct gctgactact ttgctcctgg ggtgaagtcc tatccagatg gttggaatct 3480
tcctggaggt ggtgtccagc gtggaaatat cctaaatctg aatggtgcag gagaccctct 3540
cacaccaggt tacccagcaa atgaatatgc ttataggcgt ggaattgcag aggctgttgg 3600
tcttccaagt attcctgttc atccaattgg atactatgat gcacagaagc tcctagaaaa 3660
aatgggtggc tcagcaccac cagatagcag ctggagagga agtctcaaag tgccctacaa 3720
tgttggacct ggctttactg gaaacttttc tacacaaaaa gtcaagatgc acatccactc 3780
taccaatgaa gtgacaagaa tttacaatgt gataggtact ctcagaggag cagtggaacc 3840
agacagatat gtcattctgg gaggtcaccg ggactcatgg gtgtttggtg gtattgaccc 3900
tcagagtgga gcagctgttg ttcatgaaat tgtgaggagc tttggaacac tgaaaaagga 3960
agggtggaga cctagaagaa caattttgtt tgcaagctgg gatgcagaag aatttggtct 4020
tcttggttct actgagtggg cagaggagaa ttcaagactc cttcaagagc gtggcgtggc 4080
ttatattaat gctgactcat ctatagaagg aaactacact ctgagagttg attgtacacc 4140
gctgatgtac agcttggtac acaacctaac aaaagagctg aaaagccctg atgaaggctt 4200
tgaaggcaaa tctctttatg aaagttggac taaaaaaagt ccttccccag agttcagtgg 4260
catgcccagg ataagcaaat tgggatctgg aaatgatttt gaggtgttct tccaacgact 4320
tggaattgct tcaggcagag cacggtatac taaaaattgg gaaacaaaca aattcagcgg 4380
ctatccactg tatcacagtg tctatgaaac atatgagttg gtggaaaagt tttatgatcc 4440
aatgtttaaa tatcacctca ctgtggccca ggttcgagga gggatggtgt ttgagctggc 4500
caattccata gtgctccctt ttgattgtcg agattatgct gtagttttaa gaaagtatgc 4560
tgacaaaatc tacagtattt ctatgaaaca tccacaggaa atgaagacat acagtgtatc 4620
atttgattca cttttttctg cagtaaagaa ttttacagaa attgcttcca agttcagtga 4680
gagactccag gactttgaca aaagcaaccc aatagtatta agaatgatga atgatcaact 4740
catgtttctg gaaagagcat ttattgatcc attagggtta ccagacaggc ctttttatag 4800
gcatgtcatc tatgctccaa gcagccacaa caagtatgca ggggagtcat tcccaggaat 4860
ttatgatgct ctgtttgata ttgaaagcaa agtggaccct tccaaggcct ggggagaagt 4920
gaagagacag atttatgttg cagccttcac agtgcaggca gctgcagaga ctttgagtga 4980
agtagcctaa agatctgacc ccctaacgtt actggccgaa gccgcttgga ataaggccgg 5040
tgtgcgtttg tctatatgtt attttccacc atattgccgt cttttggcaa tgtgagggcc 5100
cggaaacctg gccctgtctt cttgacgagc attcctaggg gtctttcccc tctcgccaaa 5160
ggaatgcaag gtctgttgaa tgtcgtgaag gaagcagttc ctctggaagc ttcttgaaga 5220
caaacaacgt ctgtagcgac cctttgcagg cagcggaacc ccccacctgg cgacaggtgc 5280
ctctgcggcc aaaagccacg tgtataagat acacctgcaa aggcggcaca accccagtgc 5340
cacgttgtga gttggatagt tgtggaaaga gtcaaatggc tctcctcaag cgtattcaac 5400
aaggggctga aggatgccca gaaggtaccc cattgtatgg gatctgatct ggggcctcgg 5460
tgcacatgct ttacatgtgt ttagtcgagg ttaaaaaacg tctaggcccc ccgaaccacg 5520
gggacgtggt tttcctttga aaaacacgat gataatatgg ccagcaaggc tgtgctgctt 5580
gccctgttga tggcaggctt ggccctgcag ccaggcactg ccctgctgtg ctactcctgc 5640
aaagcccagg tgagcaacga ggactgcctg caggtggaga actgcaccca gctgggggag 5700
cagtgctgga ccgcgcgcat ccgcgcagtt ggcctcctga ccgtcatcag caaaggctgc 5760
agcttgaact gcgtggatga ctcacaggac tactacgtgg gcaagaagaa catcacgtgc 5820
tgtgacaccg acttgtgcaa cgccagcggg gcccatgccc tgcagccggc tgccgccatc 5880
cttgcgctgc tccctgcact cggcctgctg ctctggggac ccggccagct atagggatct 5940
gggccctaac aaaacaaaaa gatggggtta ttccctaaac ttcatgggtt acgtaattgg 6000
aagttggggg acattgccac aagatcatat tgtacaaaag atcaaacact gttttagaaa 6060
acttcctgta aacaggccta ttgattggaa agtatgtcaa aggattgtgg gtcttttggg 6120
ctttgctgct ccatttacac aatgtggata tcctgcctta atgcctttgt atgcatgtat 6180
acaagctaaa caggctttca ctttctcgcc aacttacaag gcctttctaa gtaaacagta 6240
catgaacctt taccccgttg ctcggcaacg gcctggtctg tgccaagtgt ttgctgacgc 6300
aacccccact ggctggggct tggccatagg ccatcagcgc atgcgtggaa cctttgtggc 6360
tcctctgccg atccatactg cggaactcct agccgcttgt tttgctcgca gccggtctgg 6420
agcaaagctc ataggaactg acaattctgt cgtcctctcg cggaaatata catcgtttcg 6480
atctacgtat gatctttttc cctctgccaa aaattatggg gacatcatga agccccttga 6540
gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt gttggaattt 6600
tttgtgtctc tcactcggaa ggaattctgc attaatgaat cggccaacgc gcggggagag 6660
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 6720
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 6780
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 6840
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 6900
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 6960
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 7020
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 7080
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 7140
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 7200
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 7260
cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 7320
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 7380
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 7440
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 7500
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 7560
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 7620
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 7680
tagttgcctg actc 7694
<210> 34
<211> 7182
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 34
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcattgtgg gaggctggga gtgcgagaag cattcccaac cctggcaggt 2040
gcttgtggcc tctcgtggca gggcagtctg cggcggtgtt ctggtgcacc cccagtgggt 2100
cctcacagct gcccactgca tcaggaacaa aagcgtgatc ttgctgggtc ggcacagctt 2160
gtttcatcct gaagacacag gccaggtatt tcaggtcagc cacagcttcc cacacccgct 2220
ctacgatatg agcctcctga agaatcgatt cctcaggcca ggtgatgact ccagccacga 2280
cctcatgctg ctccgcctgt cagagcctgc cgagctcacg gatgctgtga aggtcatgga 2340
cctgcccacc caggagccag cactggggac cacctgctac gcctcaggct ggggcagcat 2400
tgaaccagag gagttcttga ccccaaagaa acttcagtgt gtggacctcc atgttatttc 2460
caatgacgtg tgtgcgcaag ttcaccctca gaaggtgacc aagttcatgc tgtgtgctgg 2520
acgctggaca gggggcaaaa gcacctgctc gggtgattct gggggcccac ttgtctgtaa 2580
tggtgtgctt caaggtatca cgtcatgggg cagtgaacca tgtgccctgc ccgaaaggcc 2640
ttccctgtac accaaggtgg tgcattaccg gaagtggatc aaggacacca tcgtggccaa 2700
ccccggatcc cagaccctga actttgatct gctgaaactg gcaggcgatg tggaaagcaa 2760
cccaggccca atggcaagcg cgcgccgccc gcgctggctg tgcgctgggg cgctggtgct 2820
ggcgggtggc ttctttctcc tcggcttcct cttcgggtgg tttataaaat cctccaatga 2880
agctactaac attactccaa agcataatat gaaagcattt ttggatgaat tgaaagctga 2940
gaacatcaag aagttcttat ataattttac acagatacca catttagcag gaacagaaca 3000
aaactttcag cttgcaaagc aaattcaatc ccagtggaaa gaatttggcc tggattctgt 3060
tgagctggca cattatgatg tcctgttgtc ctacccaaat aagactcatc ccaactacat 3120
ctcaataatt aatgaagatg gaaatgagat tttcaacaca tcattatttg aaccacctcc 3180
tccaggatat gaaaatgttt cggatattgt accacctttc agtgctttct ctcctcaagg 3240
aatgccagag ggcgatctag tgtatgttaa ctatgcacga actgaagact tctttaaatt 3300
ggaacgggac atgaaaatca attgctctgg gaaaattgta attgccagat atgggaaagt 3360
tttcagagga aataaggtta aaaatgccca gctggcaggg gccaaaggag tcattctcta 3420
ctccgaccct gctgactact ttgctcctgg ggtgaagtcc tatccagatg gttggaatct 3480
tcctggaggt ggtgtccagc gtggaaatat cctaaatctg aatggtgcag gagaccctct 3540
cacaccaggt tacccagcaa atgaatatgc ttataggcgt ggaattgcag aggctgttgg 3600
tcttccaagt attcctgttc atccaattgg atactatgat gcacagaagc tcctagaaaa 3660
aatgggtggc tcagcaccac cagatagcag ctggagagga agtctcaaag tgccctacaa 3720
tgttggacct ggctttactg gaaacttttc tacacaaaaa gtcaagatgc acatccactc 3780
taccaatgaa gtgacaagaa tttacaatgt gataggtact ctcagaggag cagtggaacc 3840
agacagatat gtcattctgg gaggtcaccg ggactcatgg gtgtttggtg gtattgaccc 3900
tcagagtgga gcagctgttg ttcatgaaat tgtgaggagc tttggaacac tgaaaaagga 3960
agggtggaga cctagaagaa caattttgtt tgcaagctgg gatgcagaag aatttggtct 4020
tcttggttct actgagtggg cagaggagaa ttcaagactc cttcaagagc gtggcgtggc 4080
ttatattaat gctgactcat ctatagaagg aaactacact ctgagagttg attgtacacc 4140
gctgatgtac agcttggtac acaacctaac aaaagagctg aaaagccctg atgaaggctt 4200
tgaaggcaaa tctctttatg aaagttggac taaaaaaagt ccttccccag agttcagtgg 4260
catgcccagg ataagcaaat tgggatctgg aaatgatttt gaggtgttct tccaacgact 4320
tggaattgct tcaggcagag cacggtatac taaaaattgg gaaacaaaca aattcagcgg 4380
ctatccactg tatcacagtg tctatgaaac atatgagttg gtggaaaagt tttatgatcc 4440
aatgtttaaa tatcacctca ctgtggccca ggttcgagga gggatggtgt ttgagctggc 4500
caattccata gtgctccctt ttgattgtcg agattatgct gtagttttaa gaaagtatgc 4560
tgacaaaatc tacagtattt ctatgaaaca tccacaggaa atgaagacat acagtgtatc 4620
atttgattca cttttttctg cagtaaagaa ttttacagaa attgcttcca agttcagtga 4680
gagactccag gactttgaca aaagcaaccc aatagtatta agaatgatga atgatcaact 4740
catgtttctg gaaagagcat ttattgatcc attagggtta ccagacaggc ctttttatag 4800
gcatgtcatc tatgctccaa gcagccacaa caagtatgca ggggagtcat tcccaggaat 4860
ttatgatgct ctgtttgata ttgaaagcaa agtggaccct tccaaggcct ggggagaagt 4920
gaagagacag atttatgttg cagccttcac agtgcaggca gctgcagaga ctttgagtga 4980
agtagccgga tccgaaggta ggggttcatt attgacctgt ggagatgtcg aagaaaaccc 5040
aggacccgca agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 5100
aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 5160
ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 5220
cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 5280
ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 5340
ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 5400
ctggggaccc ggccagctat agagatctgg gccctaacaa aacaaaaaga tggggttatt 5460
ccctaaactt catgggttac gtaattggaa gttgggggac attgccacaa gatcatattg 5520
tacaaaagat caaacactgt tttagaaaac ttcctgtaaa caggcctatt gattggaaag 5580
tatgtcaaag gattgtgggt cttttgggct ttgctgctcc atttacacaa tgtggatatc 5640
ctgccttaat gcctttgtat gcatgtatac aagctaaaca ggctttcact ttctcgccaa 5700
cttacaaggc ctttctaagt aaacagtaca tgaaccttta ccccgttgct cggcaacggc 5760
ctggtctgtg ccaagtgttt gctgacgcaa cccccactgg ctggggcttg gccataggcc 5820
atcagcgcat gcgtggaacc tttgtggctc ctctgccgat ccatactgcg gaactcctag 5880
ccgcttgttt tgctcgcagc cggtctggag caaagctcat aggaactgac aattctgtcg 5940
tcctctcgcg gaaatataca tcgtttcgat ctacgtatga tctttttccc tctgccaaaa 6000
attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 6060
ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcggaagg aattctgcat 6120
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 6180
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 6240
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 6300
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 6360
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 6420
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 6480
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 6540
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 6600
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 6660
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 6720
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 6780
tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 6840
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 6900
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 6960
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 7020
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 7080
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 7140
tcagcgatct gtctatttcg ttcatccata gttgcctgac tc 7182
<210> 35
<211> 7182
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 35
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcattgtgg gaggctggga gtgcgagaag cattcccaac cctggcaggt 2040
gcttgtggcc tctcgtggca gggcagtctg cggcggtgtt ctggtgcacc cccagtgggt 2100
cctcacagct gcccactgca tcaggaacaa aagcgtgatc ttgctgggtc ggcacagctt 2160
gtttcatcct gaagacacag gccaggtatt tcaggtcagc cacagcttcc cacacccgct 2220
ctacgatatg agcctcctga agaatcgatt cctcaggcca ggtgatgact ccagccacga 2280
cctcatgctg ctccgcctgt cagagcctgc cgagctcacg gatgctgtga aggtcatgga 2340
cctgcccacc caggagccag cactggggac cacctgctac gcctcaggct ggggcagcat 2400
tgaaccagag gagttcttga ccccaaagaa acttcagtgt gtggacctcc atgttatttc 2460
caatgacgtg tgtgcgcaag ttcaccctca gaaggtgacc aagttcatgc tgtgtgctgg 2520
acgctggaca gggggcaaaa gcacctgctc gggtgattct gggggcccac ttgtctgtaa 2580
tggtgtgctt caaggtatca cgtcatgggg cagtgaacca tgtgccctgc ccgaaaggcc 2640
ttccctgtac accaaggtgg tgcattaccg gaagtggatc aaggacacca tcgtggccaa 2700
ccccggatcc gaaggtaggg gttcattatt gacctgtgga gatgtcgaag aaaacccagg 2760
acccgctagc aaggctgtgc tgcttgccct gttgatggca ggcttggccc tgcagccagg 2820
cactgccctg ctgtgctact cctgcaaagc ccaggtgagc aacgaggact gcctgcaggt 2880
ggagaactgc acccagctgg gggagcagtg ctggaccgcg cgcatccgcg cagttggcct 2940
cctgaccgtc atcagcaaag gctgcagctt gaactgcgtg gatgactcac aggactacta 3000
cgtgggcaag aagaacatca cgtgctgtga caccgacttg tgcaacgcca gcggggccca 3060
tgccctgcag ccggctgccg ccatccttgc gctgctccct gcactcggcc tgctgctctg 3120
gggacccggc cagctaggat cccagaccct gaactttgat ctgctgaaac tggcaggcga 3180
tgtggaaagc aacccaggcc caatggcaag cgcgcgccgc ccgcgctggc tgtgcgctgg 3240
ggcgctggtg ctggcgggtg gcttctttct cctcggcttc ctcttcgggt ggtttataaa 3300
atcctccaat gaagctacta acattactcc aaagcataat atgaaagcat ttttggatga 3360
attgaaagct gagaacatca agaagttctt atataatttt acacagatac cacatttagc 3420
aggaacagaa caaaactttc agcttgcaaa gcaaattcaa tcccagtgga aagaatttgg 3480
cctggattct gttgagctgg cacattatga tgtcctgttg tcctacccaa ataagactca 3540
tcccaactac atctcaataa ttaatgaaga tggaaatgag attttcaaca catcattatt 3600
tgaaccacct cctccaggat atgaaaatgt ttcggatatt gtaccacctt tcagtgcttt 3660
ctctcctcaa ggaatgccag agggcgatct agtgtatgtt aactatgcac gaactgaaga 3720
cttctttaaa ttggaacggg acatgaaaat caattgctct gggaaaattg taattgccag 3780
atatgggaaa gttttcagag gaaataaggt taaaaatgcc cagctggcag gggccaaagg 3840
agtcattctc tactccgacc ctgctgacta ctttgctcct ggggtgaagt cctatccaga 3900
tggttggaat cttcctggag gtggtgtcca gcgtggaaat atcctaaatc tgaatggtgc 3960
aggagaccct ctcacaccag gttacccagc aaatgaatat gcttataggc gtggaattgc 4020
agaggctgtt ggtcttccaa gtattcctgt tcatccaatt ggatactatg atgcacagaa 4080
gctcctagaa aaaatgggtg gctcagcacc accagatagc agctggagag gaagtctcaa 4140
agtgccctac aatgttggac ctggctttac tggaaacttt tctacacaaa aagtcaagat 4200
gcacatccac tctaccaatg aagtgacaag aatttacaat gtgataggta ctctcagagg 4260
agcagtggaa ccagacagat atgtcattct gggaggtcac cgggactcat gggtgtttgg 4320
tggtattgac cctcagagtg gagcagctgt tgttcatgaa attgtgagga gctttggaac 4380
actgaaaaag gaagggtgga gacctagaag aacaattttg tttgcaagct gggatgcaga 4440
agaatttggt cttcttggtt ctactgagtg ggcagaggag aattcaagac tccttcaaga 4500
gcgtggcgtg gcttatatta atgctgactc atctatagaa ggaaactaca ctctgagagt 4560
tgattgtaca ccgctgatgt acagcttggt acacaaccta acaaaagagc tgaaaagccc 4620
tgatgaaggc tttgaaggca aatctcttta tgaaagttgg actaaaaaaa gtccttcccc 4680
agagttcagt ggcatgccca ggataagcaa attgggatct ggaaatgatt ttgaggtgtt 4740
cttccaacga cttggaattg cttcaggcag agcacggtat actaaaaatt gggaaacaaa 4800
caaattcagc ggctatccac tgtatcacag tgtctatgaa acatatgagt tggtggaaaa 4860
gttttatgat ccaatgttta aatatcacct cactgtggcc caggttcgag gagggatggt 4920
gtttgagctg gccaattcca tagtgctccc ttttgattgt cgagattatg ctgtagtttt 4980
aagaaagtat gctgacaaaa tctacagtat ttctatgaaa catccacagg aaatgaagac 5040
atacagtgta tcatttgatt cacttttttc tgcagtaaag aattttacag aaattgcttc 5100
caagttcagt gagagactcc aggactttga caaaagcaac ccaatagtat taagaatgat 5160
gaatgatcaa ctcatgtttc tggaaagagc atttattgat ccattagggt taccagacag 5220
gcctttttat aggcatgtca tctatgctcc aagcagccac aacaagtatg caggggagtc 5280
attcccagga atttatgatg ctctgtttga tattgaaagc aaagtggacc cttccaaggc 5340
ctggggagaa gtgaagagac agatttatgt tgcagccttc acagtgcagg cagctgcaga 5400
gactttgagt gaagtagcct aaagatctgg gccctaacaa aacaaaaaga tggggttatt 5460
ccctaaactt catgggttac gtaattggaa gttgggggac attgccacaa gatcatattg 5520
tacaaaagat caaacactgt tttagaaaac ttcctgtaaa caggcctatt gattggaaag 5580
tatgtcaaag gattgtgggt cttttgggct ttgctgctcc atttacacaa tgtggatatc 5640
ctgccttaat gcctttgtat gcatgtatac aagctaaaca ggctttcact ttctcgccaa 5700
cttacaaggc ctttctaagt aaacagtaca tgaaccttta ccccgttgct cggcaacggc 5760
ctggtctgtg ccaagtgttt gctgacgcaa cccccactgg ctggggcttg gccataggcc 5820
atcagcgcat gcgtggaacc tttgtggctc ctctgccgat ccatactgcg gaactcctag 5880
ccgcttgttt tgctcgcagc cggtctggag caaagctcat aggaactgac aattctgtcg 5940
tcctctcgcg gaaatataca tcgtttcgat ctacgtatga tctttttccc tctgccaaaa 6000
attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 6060
ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcggaagg aattctgcat 6120
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 6180
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 6240
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 6300
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 6360
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 6420
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 6480
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 6540
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 6600
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 6660
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 6720
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 6780
tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 6840
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 6900
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 6960
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 7020
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 7080
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 7140
tcagcgatct gtctatttcg ttcatccata gttgcctgac tc 7182
<210> 36
<211> 7694
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 36
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 2040
aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 2100
ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 2160
cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 2220
ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 2280
ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 2340
ctggggaccc ggccagctag gatcccagac cctgaacttt gatctgctga aactggcagg 2400
cgatgtggaa agcaacccag gcccaatggc aagcgcgcgc cgcccgcgct ggctgtgcgc 2460
tggggcgctg gtgctggcgg gtggcttctt tctcctcggc ttcctcttcg ggtggtttat 2520
aaaatcctcc aatgaagcta ctaacattac tccaaagcat aatatgaaag catttttgga 2580
tgaattgaaa gctgagaaca tcaagaagtt cttatataat tttacacaga taccacattt 2640
agcaggaaca gaacaaaact ttcagcttgc aaagcaaatt caatcccagt ggaaagaatt 2700
tggcctggat tctgttgagc tggcacatta tgatgtcctg ttgtcctacc caaataagac 2760
tcatcccaac tacatctcaa taattaatga agatggaaat gagattttca acacatcatt 2820
atttgaacca cctcctccag gatatgaaaa tgtttcggat attgtaccac ctttcagtgc 2880
tttctctcct caaggaatgc cagagggcga tctagtgtat gttaactatg cacgaactga 2940
agacttcttt aaattggaac gggacatgaa aatcaattgc tctgggaaaa ttgtaattgc 3000
cagatatggg aaagttttca gaggaaataa ggttaaaaat gcccagctgg caggggccaa 3060
aggagtcatt ctctactccg accctgctga ctactttgct cctggggtga agtcctatcc 3120
agatggttgg aatcttcctg gaggtggtgt ccagcgtgga aatatcctaa atctgaatgg 3180
tgcaggagac cctctcacac caggttaccc agcaaatgaa tatgcttata ggcgtggaat 3240
tgcagaggct gttggtcttc caagtattcc tgttcatcca attggatact atgatgcaca 3300
gaagctccta gaaaaaatgg gtggctcagc accaccagat agcagctgga gaggaagtct 3360
caaagtgccc tacaatgttg gacctggctt tactggaaac ttttctacac aaaaagtcaa 3420
gatgcacatc cactctacca atgaagtgac aagaatttac aatgtgatag gtactctcag 3480
aggagcagtg gaaccagaca gatatgtcat tctgggaggt caccgggact catgggtgtt 3540
tggtggtatt gaccctcaga gtggagcagc tgttgttcat gaaattgtga ggagctttgg 3600
aacactgaaa aaggaagggt ggagacctag aagaacaatt ttgtttgcaa gctgggatgc 3660
agaagaattt ggtcttcttg gttctactga gtgggcagag gagaattcaa gactccttca 3720
agagcgtggc gtggcttata ttaatgctga ctcatctata gaaggaaact acactctgag 3780
agttgattgt acaccgctga tgtacagctt ggtacacaac ctaacaaaag agctgaaaag 3840
ccctgatgaa ggctttgaag gcaaatctct ttatgaaagt tggactaaaa aaagtccttc 3900
cccagagttc agtggcatgc ccaggataag caaattggga tctggaaatg attttgaggt 3960
gttcttccaa cgacttggaa ttgcttcagg cagagcacgg tatactaaaa attgggaaac 4020
aaacaaattc agcggctatc cactgtatca cagtgtctat gaaacatatg agttggtgga 4080
aaagttttat gatccaatgt ttaaatatca cctcactgtg gcccaggttc gaggagggat 4140
ggtgtttgag ctggccaatt ccatagtgct cccttttgat tgtcgagatt atgctgtagt 4200
tttaagaaag tatgctgaca aaatctacag tatttctatg aaacatccac aggaaatgaa 4260
gacatacagt gtatcatttg attcactttt ttctgcagta aagaatttta cagaaattgc 4320
ttccaagttc agtgagagac tccaggactt tgacaaaagc aacccaatag tattaagaat 4380
gatgaatgat caactcatgt ttctggaaag agcatttatt gatccattag ggttaccaga 4440
caggcctttt tataggcatg tcatctatgc tccaagcagc cacaacaagt atgcagggga 4500
gtcattccca ggaatttatg atgctctgtt tgatattgaa agcaaagtgg acccttccaa 4560
ggcctgggga gaagtgaaga gacagattta tgttgcagcc ttcacagtgc aggcagctgc 4620
agagactttg agtgaagtag cctaaagatc tgacccccta acgttactgg ccgaagccgc 4680
ttggaataag gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt 4740
ggcaatgtga gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt 4800
tcccctctcg ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg 4860
gaagcttctt gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca 4920
cctggcgaca ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg 4980
gcacaacccc agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc 5040
tcaagcgtat tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct 5100
gatctggggc ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaacgtctag 5160
gccccccgaa ccacggggac gtggttttcc tttgaaaaac acgatgataa tatggccagc 5220
attgtgggag gctgggagtg cgagaagcat tcccaaccct ggcaggtgct tgtggcctct 5280
cgtggcaggg cagtctgcgg cggtgttctg gtgcaccccc agtgggtcct cacagctgcc 5340
cactgcatca ggaacaaaag cgtgatcttg ctgggtcggc acagcttgtt tcatcctgaa 5400
gacacaggcc aggtatttca ggtcagccac agcttcccac acccgctcta cgatatgagc 5460
ctcctgaaga atcgattcct caggccaggt gatgactcca gccacgacct catgctgctc 5520
cgcctgtcag agcctgccga gctcacggat gctgtgaagg tcatggacct gcccacccag 5580
gagccagcac tggggaccac ctgctacgcc tcaggctggg gcagcattga accagaggag 5640
ttcttgaccc caaagaaact tcagtgtgtg gacctccatg ttatttccaa tgacgtgtgt 5700
gcgcaagttc accctcagaa ggtgaccaag ttcatgctgt gtgctggacg ctggacaggg 5760
ggcaaaagca cctgctcggg tgattctggg ggcccacttg tctgtaatgg tgtgcttcaa 5820
ggtatcacgt catggggcag tgaaccatgt gccctgcccg aaaggccttc cctgtacacc 5880
aaggtggtgc attaccggaa gtggatcaag gacaccatcg tggccaaccc ctgaggatct 5940
gggccctaac aaaacaaaaa gatggggtta ttccctaaac ttcatgggtt acgtaattgg 6000
aagttggggg acattgccac aagatcatat tgtacaaaag atcaaacact gttttagaaa 6060
acttcctgta aacaggccta ttgattggaa agtatgtcaa aggattgtgg gtcttttggg 6120
ctttgctgct ccatttacac aatgtggata tcctgcctta atgcctttgt atgcatgtat 6180
acaagctaaa caggctttca ctttctcgcc aacttacaag gcctttctaa gtaaacagta 6240
catgaacctt taccccgttg ctcggcaacg gcctggtctg tgccaagtgt ttgctgacgc 6300
aacccccact ggctggggct tggccatagg ccatcagcgc atgcgtggaa cctttgtggc 6360
tcctctgccg atccatactg cggaactcct agccgcttgt tttgctcgca gccggtctgg 6420
agcaaagctc ataggaactg acaattctgt cgtcctctcg cggaaatata catcgtttcg 6480
atctacgtat gatctttttc cctctgccaa aaattatggg gacatcatga agccccttga 6540
gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt gttggaattt 6600
tttgtgtctc tcactcggaa ggaattctgc attaatgaat cggccaacgc gcggggagag 6660
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 6720
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 6780
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 6840
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 6900
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 6960
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 7020
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 7080
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 7140
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 7200
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 7260
cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 7320
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 7380
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 7440
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 7500
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 7560
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 7620
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 7680
tagttgcctg actc 7694
<210> 37
<211> 8461
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 37
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tactgtaata gtaatcaatt 360
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 420
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 480
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 540
actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 600
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 660
acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag 720
tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt 780
gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac 840
aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataagc 900
agagctggtt tagtgaaccg tcagatccgc tagagatcca ccatggctag cggtgccccg 960
acgttgcccc ctgcctggca gccctttctc aaggaccacc gcatctctac attcaagaac 1020
tggcccttct tggagggctg cgcctgcgcc ccggagcgga tggccgaggc tggcttcatc 1080
cactgcccca ctgagaacga gccagacttg gcccagtgtt tcttctgctt caaggagctg 1140
gaaggctggg agccagatga cgaccccata gaggaacata aaaagcattc gtccggttgc 1200
gctttccttt ctgtcaagaa gcagtttgaa gaattaaccc ttggtgaatt tttgaaactg 1260
gacagagaaa gagccaagaa caaaattgca aaggaaacca acaataagaa gaaagaattt 1320
gaggaaactg cggagaaagt gcgccgtgcc atcgagcagc tggctgccat ggattagaga 1380
tctgaccccc taacgttact ggccgaagcc gcttggaata aggccggtgt gcgtttgtct 1440
atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc 1500
ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc 1560
tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg 1620
tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa 1680
agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt 1740
ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg 1800
atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta 1860
catgtgttta gtcgaggtta aaaaacgtct aggccccccg aaccacgggg acgtggtttt 1920
cctttgaaaa acacgataat atggcggccg ctcgagccta agcttctaga taagatatcc 1980
gatccaccgg atctagataa ctgatcataa tcagccatac cacatttgta gaggttttac 2040
ttgctttaaa aaacctccca cacctccccc tgaacctgaa acataaaatg aatgcaattg 2100
ttgttgttaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 2160
atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 2220
atgtatctta acgcggatct gggcgtggtt aagggtggga aagaatatat aaggtggggg 2280
tcttatgtag ttttgtatct gttttgcagc agccgccgcc gccatgagca ccaactcgtt 2340
tgatggaagc attgtgagct catatttgac aacgcgcatg cccccatggg ccggggtgcg 2400
tcagaatgtg atgggctcca gcattgatgg tcgccccgtc ctgcccgcaa actctactac 2460
cttgacctac gagaccgtgt ctggaacgcc gttggagact gcagcctccg ccgccgcttc 2520
agccgctgca gccaccgccc gcgggattgt gactgacttt gctttcctga gcccgcttgc 2580
aagcagtgca gcttcccgtt catccgcccg cgatgacaag ttgacggctc ttttggcaca 2640
attggattct ttgacccggg aacttaatgt cgtttctcag cagctgttgg atctgcgcca 2700
gcaggtttct gccctgaagg cttcctcccc tcccaatgcg gtttaaaaca taaataaaaa 2760
accagactct gtttggattt ggatcaagca agtgtcttgc tgtctttatt taggggtttt 2820
gcgcgcgcgg taggcccggg accagcggtc tcggtcgttg agggtcctgt gtattttttc 2880
caggacgtgg taaaggtgac tctggatgtt cagatacatg ggcataagcc cgtctctggg 2940
gtggaggtag caccactgca gagcttcatg ctgcggggtg gtgttgtaga tgatccagtc 3000
gtagcaggag cgctgggcgt ggtgcctaaa aatgtctttc agtagcaagc tgattgccag 3060
gggcaggccc ttggtgtaag tgtttacaaa gcggttaagc tgggatgggt gcatacgtgg 3120
ggatatgaga tgcatcttgg actgtatttt taggttggct atgttcccag ccatatccct 3180
ccggggattc atgttgtgca gaaccaccag cacagtgtat ccggtgcact tgggaaattt 3240
gtcatgtagc ttagaaggaa atgcgtggaa gaacttggag acgcccttgt gacctccaag 3300
attttccatg cattcgtcca taatgatggc aatgggccca cgggcggcgg cctgggcgaa 3360
gatatttctg ggatcactaa cgtcatagtt gtgttccagg atgagatcgt cataggccat 3420
ttttacaaag cgcgggcgga gggtgccaga ctgcggtata atggttccat ccggcccagg 3480
ggcgtagtta ccctcacaga tttgcatttc ccacgctttg agttcagatg gggggatcat 3540
gtctacctgc ggggcgatga agaaaacggt ttccggggta ggggagatca gctgggaaga 3600
aagcaggttc ctgagcagct gcgacttacc gcagccggtg ggcccgtaaa tcacacctat 3660
taccggctgc aactggtagt taagagagct gcagctgccg tcatccctga gcaggggggc 3720
cacttcgtta agcatgtccc tgactcgcat gttttccctg accaaatccg ccagaaggcg 3780
ctcgccgccc agcgatagca gttcttgcaa ggaagcaaag tttttcaacg gtttgagacc 3840
gtccgccgta ggcatgcttt tgagcgtttg accaagcagt tccaggcggt cccacagctc 3900
ggtcacctgc tctacggcat ctcgatccag catatctcct cgtttcgcgg gttggggcgg 3960
ctttcgctgt acggcagtag tcggtgctcg tccagacggg ccagggtcat gtctttccac 4020
gggcgcaggg tcctcgtcag cgtagtctgg gtcacggtga aggggtgcgc tccgggctgc 4080
gcgctggcca gggtgcgctt gaggctggtc ctgctggtgc tgaagcgctg ccggtcttcg 4140
ccctgcgcgt cggccaggta gcatttgacc atggtgtcat agtccagccc ctccgcggcg 4200
tggcccttgg cgcgcagctt gcccttggag gaggcgccgc acgaggggca gtgcagactt 4260
ttgagggcgt agagcttggg cgcgagaaat accgattccg gggagtaggc atccgcgccg 4320
caggccccgc agacggtctc gcattccacg agccaggtga gctctggccg ttcggggtca 4380
aaaaccaggt ttcccccatg ctttttgatg cgtttcttac ctctggtttc catgagccgg 4440
tgtccacgct cggtgacgaa aaggctgtcc gtgtccccgt atacagactt gagagggagt 4500
ttaaacgaat tcaatagctt gttgcatggg cggcgatata aaatgcaagg tgctgctcaa 4560
aaaatcaggc aaagcctcgc gcaaaaaaga aagcacatcg tagtcatgct catgcagata 4620
aaggcaggta agctccggaa ccaccacaga aaaagacacc atttttctct caaacatgtc 4680
tgcgggtttc tgcataaaca caaaataaaa taacaaaaaa acatttaaac attagaagcc 4740
tgtcttacaa caggaaaaac aacccttata agcataagac ggactacggc catgccggcg 4800
tgaccgtaaa aaaactggtc accgtgatta aaaagcacca ccgacagctc ctcggtcatg 4860
tccggagtca taatgtaaga ctcggtaaac acatcaggtt gattcacatc ggtcagtgct 4920
aaaaagcgac cgaaatagcc cgggggaata catacccgca ggcgtagaga caacattaca 4980
gcccccatag gaggtataac aaaattaata ggagagaaaa acacataaac acctgaaaaa 5040
ccctcctgcc taggcaaaat agcaccctcc cgctccagaa caacatacag cgcttccaca 5100
gcggcagcca taacagtcag ccttaccagt aaaaaagaaa acctattaaa aaaacaccac 5160
tcgacacggc accagctcaa tcagtcacag tgtaaaaaag ggccaagtgc agagcgagta 5220
tatataggac taaaaaatga cgtaacggtt aaagtccaca aaaaacaccc agaaaaccgc 5280
acgcgaacct acgcccagaa acgaaagcca aaaaacccac aacttcctca aatcgtcact 5340
tccgttttcc cacgttacgt cacttcccat tttaagaaaa ctacaattcc caacacatac 5400
aagttactcc gccctaaaac ctacgtcacc cgccccgttc ccacgccccg cgccacgtca 5460
caaactccac cccctcatta tcatattggc ttcaatccaa aataaggtat attattgatg 5520
atgttaatta acatgcatgg atccatatgc ggtgtgaaat accgcacaga tgcgtaagga 5580
gaaaataccg catcaggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 5640
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 5700
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 5760
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 5820
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 5880
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 5940
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 6000
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 6060
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 6120
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 6180
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 6240
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 6300
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 6360
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 6420
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 6480
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 6540
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 6600
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 6660
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 6720
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 6780
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 6840
acgttgttgc cattgctgca gccatgagat tatcaaaaag gatcttcacc tagatccttt 6900
tcacgtagaa agccagtccg cagaaacggt gctgaccccg gatgaatgtc agctactggg 6960
ctatctggac aagggaaaac gcaagcgcaa agagaaagca ggtagcttgc agtgggctta 7020
catggcgata gctagactgg gcggttttat ggacagcaag cgaaccggaa ttgccagctg 7080
gggcgccctc tggtaaggtt gggaagccct gcaaagtaaa ctggatggct ttcttgccgc 7140
caaggatctg atggcgcagg ggatcaagct ctgatcaaga gacaggatga ggatcgtttc 7200
gcatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg gagaggctat 7260
tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg ttccggctgt 7320
cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc ctgaatgaac 7380
tgcaagacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct tgcgcagctg 7440
tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa gtgccggggc 7500
aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg gctgatgcaa 7560
tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa gcgaaacatc 7620
gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat gatctggacg 7680
aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg agcatgcccg 7740
acggcgagga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc atggtggaaa 7800
atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac cgctatcagg 7860
acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg gctgaccgct 7920
tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc tatcgccttc 7980
ttgacgagtt cttctgaatt ttgttaaaat ttttgttaaa tcagctcatt ttttaaccaa 8040
taggccgaaa tcggcaccat cccttataaa tcaaaagaat agaccgagat agggttgagt 8100
gttgttccag tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg 8160
cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac catcacccta atcaagtttt 8220
ttgtggtcga ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga 8280
gcttgacggg gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg 8340
ggcgctaggg cgctggcaag tgtagcggtc acgctgcgcg taaccaccac acccgcgcgc 8400
ttaatgcgcc gctacagggc gcgtccattc gccattcagg atcgaattaa ttcttaatta 8460
a 8461
<210> 38
<211> 956
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 38
Met Ala Ser Glu Leu Ala Ala Leu Cys Arg Trp Gly Leu Leu Leu Ala
1 5 10 15
Leu Leu Pro Pro Gly Ala Ala Ser Thr Gln Val Cys Thr Gly Thr Asp
20 25 30
Met Lys Leu Arg Leu Pro Ala Ser Pro Glu Thr His Leu Asp Met Leu
35 40 45
Arg His Leu Tyr Gln Gly Cys Gln Val Val Gln Gly Asn Leu Glu Leu
50 55 60
Thr Tyr Leu Pro Thr Asn Ala Ser Leu Ser Phe Leu Gln Asp Ile Gln
65 70 75 80
Glu Val Gln Gly Tyr Val Leu Ile Ala His Asn Gln Val Arg Gln Val
85 90 95
Pro Leu Gln Arg Leu Arg Ile Val Arg Gly Thr Gln Leu Phe Glu Asp
100 105 110
Asn Tyr Ala Leu Ala Val Leu Asp Asn Gly Asp Pro Leu Asp Ser Val
115 120 125
Ala Pro Ala Ala Gly Ala Thr Pro Gly Gly Leu Gln Glu Leu Gln Leu
130 135 140
Arg Ser Leu Thr Glu Ile Leu Lys Gly Gly Val Leu Ile Arg Arg Ser
145 150 155 160
Pro Gln Leu Cys His Gln Asp Thr Val Leu Trp Glu Asp Val Phe Arg
165 170 175
Lys Asn Asn Gln Leu Ala Leu Val Leu Met Asp Thr Asn Arg Ser Arg
180 185 190
Ala Cys His Pro Cys Ala Pro Met Cys Lys Ala Asn His Cys Trp Gly
195 200 205
Glu Ser Ser Gln Asp Cys Gln Thr Leu Thr Arg Thr Ile Cys Thr Ser
210 215 220
Ala Cys Ala Arg Cys Lys Ala Pro Leu Pro Thr Asp Cys Cys His Glu
225 230 235 240
Gln Cys Ala Ala Gly Cys Thr Gly Pro Lys His Ser Asp Cys Leu Ala
245 250 255
Cys Leu His Phe Asn His Ser Gly Ile Cys Glu Leu His Cys Pro Ala
260 265 270
Leu Val Thr Tyr Asn Thr Asp Thr Phe Glu Ser Met Pro Asn Pro Glu
275 280 285
Gly Arg Tyr Thr Phe Gly Ala Ser Cys Val Thr Ala Cys Pro Tyr Asn
290 295 300
Tyr Leu Ser Thr Asp Val Gly Ser Cys Thr Leu Val Cys Pro Leu His
305 310 315 320
Asn Gln Glu Val Thr Ala Glu Asp Gly Thr Gln Arg Cys Glu Lys Cys
325 330 335
Ser Lys Pro Cys Ala Arg Val Cys Tyr Gly Leu Gly Met Glu His Leu
340 345 350
Arg Glu Ala Arg Ala Ile Thr Ser Ala Asn Val Gln Asp Phe Val Gly
355 360 365
Cys Lys Lys Ile Phe Gly Ser Leu Ala Phe Leu Pro Glu Ser Phe Asp
370 375 380
Gly Asp Pro Ala Ser Gly Thr Ala Pro Leu Gln Pro Glu Gln Leu Gln
385 390 395 400
Val Phe Glu Thr Leu Glu Glu Ile Thr Gly Tyr Leu Tyr Ile Ser Ala
405 410 415
Trp Pro Asp Ser Phe Pro Asn Leu Ser Val Phe Gln Asn Leu Arg Val
420 425 430
Ile Arg Gly Arg Ile Leu His Asn Gly Ala Tyr Ser Leu Thr Leu Gln
435 440 445
Gly Leu Gly Ile Ser Trp Leu Gly Leu Arg Ser Leu Gln Glu Leu Gly
450 455 460
Ser Gly Leu Ala Leu Val His Arg Asn Ala Arg Leu Cys Phe Val His
465 470 475 480
Thr Val Pro Trp Asp Gln Leu Phe Arg Asn Pro His Gln Ala Leu Leu
485 490 495
His Ser Gly Asn Arg Pro Glu Glu Asp Cys Val Gly Glu Gly Phe Val
500 505 510
Cys Tyr Ser Leu Cys Ala His Gly His Cys Trp Gly Pro Gly Pro Thr
515 520 525
Gln Cys Val Asn Cys Ser His Phe Leu Arg Gly Gln Glu Cys Val Glu
530 535 540
Glu Cys Arg Val Leu Gln Gly Leu Pro Arg Glu Tyr Val Asn Ala Arg
545 550 555 560
His Cys Leu Pro Cys His Pro Glu Cys Gln Pro Gln Asn Gly Ser Val
565 570 575
Thr Cys Phe Gly Pro Glu Ala Asp Gln Cys Val Ala Cys Ala His Tyr
580 585 590
Lys Asp Pro Pro Phe Cys Val Ala Arg Cys Pro Ser Gly Val Lys Pro
595 600 605
Asp Leu Ser Tyr Met Pro Ile Trp Lys Phe Pro Asp Glu Glu Gly Ala
610 615 620
Cys Gln Pro Cys Pro Ile Asn Cys Thr His Ser Cys Val Asp Leu Asp
625 630 635 640
Asp Lys Gly Cys Pro Ala Glu Gln Arg Ala Ser Pro Leu Thr Ser Ile
645 650 655
Ile Ser Ala Val Val Gly Ile Leu Leu Val Val Val Leu Gly Val Val
660 665 670
Phe Gly Ile Leu Ile Lys Arg Arg Gln Gln Lys Ile Arg Lys Tyr Thr
675 680 685
Met Arg Arg Asn Glu Asp Leu Gly Pro Ser Ser Pro Met Asp Ser Thr
690 695 700
Phe Tyr Arg Ser Leu Leu Glu Asp Glu Asp Met Gly Glu Leu Val Asp
705 710 715 720
Ala Glu Glu Tyr Leu Val Pro Gln Gln Gly Phe Phe Cys Pro Asp Pro
725 730 735
Thr Pro Gly Thr Gly Ser Thr Ala His Arg Arg His Arg Ser Ser Ser
740 745 750
Ala Arg Asn Gly Gly Gly Asp Leu Thr Leu Gly Met Glu Pro Ser Gly
755 760 765
Glu Gly Pro Pro Arg Ser Pro Arg Ala Pro Ser Glu Gly Thr Gly Ser
770 775 780
Asp Val Phe Asp Gly Asp Leu Ala Val Gly Val Thr Lys Gly Leu Gln
785 790 795 800
Ser Leu Ser Pro Gln Asp Leu Ser Pro Leu Gln Arg Tyr Ser Glu Asp
805 810 815
Pro Thr Leu Pro Leu Pro Ser Glu Thr Asp Gly Lys Val Ala Pro Leu
820 825 830
Ser Cys Ser Pro Gln Pro Glu Phe Val Asn Gln Ser Asp Val Gln Pro
835 840 845
Lys Ser Pro Leu Thr Pro Glu Gly Pro Pro Ser Pro Ala Arg Pro Thr
850 855 860
Gly Ala Thr Leu Glu Arg Ala Lys Thr Leu Ser Pro Gly Lys Asn Gly
865 870 875 880
Val Val Lys Asp Val Phe Thr Phe Gly Gly Ala Val Glu Asn Pro Glu
885 890 895
Phe Leu Ala Pro Arg Glu Gly Thr Ala Ser Pro Pro His Pro Ser Pro
900 905 910
Ala Phe Ser Pro Ala Phe Asp Asn Leu Phe Phe Trp Asp Gln Asn Ser
915 920 925
Ser Glu Gln Gly Pro Pro Pro Ser Asn Phe Glu Gly Thr Pro Thr Ala
930 935 940
Glu Asn Pro Glu Phe Leu Gly Leu Asp Val Pro Val
945 950 955
<210> 39
<211> 2871
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 39
atggctagcg agctggccgc cctgtgtaga tggggactgc tgctggctct gctgcctcct 60
ggagccgctt ctacacaggt ctgcaccggc accgacatga agctgagact gcccgccagc 120
cccgagacac acctggacat gctgcggcac ctgtaccagg gctgccaggt ggtccagggg 180
aatctggaac tgacctacct gcccaccaac gccagcctga gcttcctgca ggacatccag 240
gaagtgcagg gctacgtcct gatcgcccac aaccaggtcc gccaggtgcc cctgcagcgg 300
ctgagaatcg tgcggggcac ccagctgttc gaggacaact acgccctggc cgtgctggac 360
aacggcgacc ctctggatag cgtggcccct gctgctgggg ctacacctgg cggactgcag 420
gaactgcagc tgcggagcct gaccgagatc ctgaagggcg gcgtgctgat caggcggagc 480
cctcagctgt gccaccagga caccgtgctg tgggaggacg tgttccggaa gaacaaccag 540
ctggccctcg tgctgatgga caccaacaga agccgggcct gccacccctg cgcccccatg 600
tgcaaggcca atcactgctg gggagagagc agccaggact gccagaccct gacccggacc 660
atctgcacca gcgcctgcgc cagatgcaag gcccccctgc ctaccgactg ctgccacgaa 720
cagtgcgccg ctggctgcac cggccccaag cacagcgatt gcctggcctg cctgcacttc 780
aaccacagcg gcatctgcga gctgcactgc cctgccctgg tgacatacaa caccgacacc 840
ttcgagagca tgcccaaccc cgagggccgg tacaccttcg gcgccagctg tgtgaccgcc 900
tgcccctaca actacctgag caccgacgtg ggcagctgca ccctggtgtg ccccctgcac 960
aaccaggaag tgaccgccga ggacggcacc cagagatgcg agaagtgcag caagccttgc 1020
gccagagtgt gctacggcct gggcatggaa cacctgagag aggccagagc catcaccagc 1080
gccaacgtgc aggacttcgt gggctgcaag aagattttcg gctccctggc cttcctgccc 1140
gagagcttcg acggcgatcc tgcctctggc accgcccctc tgcagcctga gcagctgcag 1200
gtcttcgaga cactggaaga gatcaccggc tacctgtaca tcagcgcctg gcccgacagc 1260
ttccccaacc tgagcgtgtt ccagaacctg agagtgatcc ggggcagaat cctgcacaac 1320
ggcgcctaca gcctgaccct gcagggcctg ggaatcagct ggctgggcct gcggagcctg 1380
caggaactgg gatctggcct ggctctggtg caccggaacg cccggctgtg cttcgtgcac 1440
accgtgccct gggaccagct gttcagaaac ccccaccagg ctctgctgca cagcggcaac 1500
cggcccgaag aggattgcgt gggcgagggc ttcgtgtgct actccctgtg cgcccacggc 1560
cactgttggg gacctggccc tacccagtgc gtgaactgca gccacttcct gcggggccaa 1620
gaatgcgtgg aagagtgccg ggtgctgcag ggactgcccc gggaatacgt gaacgccaga 1680
cactgcctgc cttgccaccc cgagtgccag ccccagaatg gcagcgtgac ctgcttcgga 1740
cccgaggccg atcagtgtgt ggcctgcgcc cactacaagg accccccatt ctgcgtggcc 1800
agatgcccca gcggcgtgaa gcccgacctg agctacatgc ccatctggaa gttccccgac 1860
gaggaaggcg cctgccagcc ttgccccatc aactgcaccc acagctgcgt ggacctggac 1920
gacaagggct gccctgccga gcagagagcc agccccctga ccagcatcat cagcgccgtg 1980
gtgggaatcc tgctggtggt ggtgctgggc gtggtgttcg gcatcctgat caagcggcgg 2040
cagcagaaga tccggaagta caccatgcgg cggaacgagg acctgggccc ctctagcccc 2100
atggacagca ccttctaccg gtccctgctg gaagatgagg acatgggcga gctggtggac 2160
gccgaggaat acctggtgcc tcagcagggc ttcttctgcc ccgaccctac ccctggcacc 2220
ggctctaccg cccacagacg gcacagaagc agcagcgcca gaaacggcgg aggcgacctg 2280
accctgggaa tggaacctag cggcgaggga cctcccagaa gccctagagc ccctagcgag 2340
ggcaccggca gcgacgtgtt cgatggcgat ctggccgtgg gcgtgaccaa gggactgcag 2400
agcctgagcc cccaggacct gtcccccctg cagagataca gcgaggaccc caccctgccc 2460
ctgcccagcg agacagatgg caaggtggcc cccctgagct gcagccctca gcccgagttc 2520
gtgaaccaga gcgacgtgca gcccaagtcc cccctgacac ccgagggacc tccaagccct 2580
gccagaccta ccggcgccac cctggaaaga gccaagaccc tgagccccgg caagaacggc 2640
gtggtgaaag acgtgttcac cttcggaggc gccgtggaaa accccgagtt cctggccccc 2700
agagagggca cagccagccc tccacacccc agcccagcct tctcccccgc cttcgacaac 2760
ctgttcttct gggaccagaa cagcagcgag cagggcccac cccccagcaa tttcgagggc 2820
acccccaccg ccgagaatcc tgagttcctg ggcctggacg tgcccgtgtg a 2871
<210> 40
<211> 471
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 40
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Ala His Ser Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Ala Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Thr Phe
35 40 45
Thr Gly Tyr Tyr Met His Trp Val Arg Gln Ala Pro Gly Gln Gly Leu
50 55 60
Glu Trp Met Gly Trp Ile Asn Pro Asp Ser Gly Gly Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Gly Arg Val Thr Met Thr Arg Asp Thr Ser Ile Ser
85 90 95
Thr Ala Tyr Met Glu Leu Asn Arg Leu Arg Ser Asp Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Arg Asp Gln Pro Leu Gly Tyr Cys Thr Asn Gly Val
115 120 125
Cys Ser Tyr Phe Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser
130 135 140
Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser
145 150 155 160
Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp
165 170 175
Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr
180 185 190
Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr
195 200 205
Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Asn Phe Gly Thr Gln
210 215 220
Thr Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp
225 230 235 240
Lys Thr Val Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala
245 250 255
Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
260 265 270
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
275 280 285
Asp Val Ser His Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp
290 295 300
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe
305 310 315 320
Asn Ser Thr Phe Arg Val Val Ser Val Leu Thr Val Val His Gln Asp
325 330 335
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu
340 345 350
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg
355 360 365
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys
370 375 380
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
385 390 395 400
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
405 410 415
Thr Thr Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
420 425 430
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
435 440 445
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
450 455 460
Leu Ser Leu Ser Pro Gly Lys
465 470
<210> 41
<211> 234
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 41
Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe Pro
1 5 10 15
Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Val Ser
20 25 30
Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly
35 40 45
Ile Tyr Ser Trp Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro
50 55 60
Asn Leu Leu Ile Tyr Thr Ala Ser Thr Leu Gln Ser Gly Val Pro Ser
65 70 75 80
Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser
85 90 95
Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ala Asn
100 105 110
Ile Phe Pro Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg
115 120 125
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
130 135 140
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
145 150 155 160
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
165 170 175
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
180 185 190
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
195 200 205
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
210 215 220
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
225 230
<210> 42
<211> 451
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 42
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr
20 25 30
Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Val Ile Trp Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Asp Pro Arg Gly Ala Thr Leu Tyr Tyr Tyr Tyr Tyr Gly Met
100 105 110
Asp Val Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr
115 120 125
Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser
130 135 140
Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu
145 150 155 160
Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His
165 170 175
Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser
180 185 190
Val Val Thr Val Pro Ser Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys
195 200 205
Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Thr Val Glu
210 215 220
Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Ala
225 230 235 240
Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met
245 250 255
Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His
260 265 270
Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val
275 280 285
His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe
290 295 300
Arg Val Val Ser Val Leu Thr Val Val His Gln Asp Trp Leu Asn Gly
305 310 315 320
Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ala Pro Ile
325 330 335
Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg Glu Pro Gln Val
340 345 350
Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser
355 360 365
Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu
370 375 380
Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro
385 390 395 400
Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val
405 410 415
Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met
420 425 430
His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser
435 440 445
Pro Gly Lys
450
<210> 43
<211> 214
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 43
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Asn Ser Tyr
20 25 30
Leu Asp Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Tyr Ser Thr Pro Phe
85 90 95
Thr Phe Gly Pro Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 44
<211> 24
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 44
tcgtcgtttt gtcgttttgt cgtt 24
<210> 45
<211> 21
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 45
tcgtcgtttt tcggtgcttt t 21
<210> 46
<211> 21
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 46
tcgtcgtttt tcggtcgttt t 21
<210> 47
<211> 239
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 47
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 48
<211> 185
<212> ПРТ
<213> Вирус гепатита B из рода ортогепандавирусов
<400> 48
Met Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Thr Val Glu Leu Leu
1 5 10 15
Ser Phe Leu Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp
20 25 30
Thr Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys
35 40 45
Ser Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu
50 55 60
Leu Met Thr Leu Ala Thr Trp Val Gly Asn Asn Leu Glu Asp Pro Ala
65 70 75 80
Ser Arg Asp Leu Val Val Asn Tyr Val Asn Thr Asn Met Gly Leu Lys
85 90 95
Ile Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg
100 105 110
Glu Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr
115 120 125
Pro Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro
130 135 140
Glu Thr Thr Val Val Arg Arg Arg Gly Arg Gly Arg Ser Pro Arg Arg
145 150 155 160
Arg Thr Pro Ser Pro Arg Arg Arg Arg Ser Gln Ser Pro Arg Arg Arg
165 170 175
Arg Ser Gln Ser Arg Glu Ser Gln Cys
180 185
<210> 49
<211> 226
<212> ПРТ
<213> Вирус гепатита B из рода ортогепандавирусов
<400> 49
Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln
1 5 10 15
Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu
20 25 30
Asp Ser Trp Trp Thr Ser Leu Asn Phe Leu Gly Gly Ser Pro Val Cys
35 40 45
Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser
50 55 60
Cys Pro Pro Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe
65 70 75 80
Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val
85 90 95
Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly
100 105 110
Ser Thr Thr Thr Ser Thr Gly Pro Cys Lys Thr Cys Thr Thr Pro Ala
115 120 125
Gln Gly Asn Ser Met Phe Pro Ser Cys Cys Cys Thr Lys Pro Thr Asp
130 135 140
Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Lys
145 150 155 160
Tyr Leu Trp Glu Trp Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu
165 170 175
Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu
180 185 190
Ser Ala Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Ser Ile
195 200 205
Val Ser Pro Phe Ile Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val
210 215 220
Tyr Ile
225
<210> 50
<211> 737
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 50
Met Ala Ser Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp
1 5 10 15
Val Pro Gly Ser Thr Gly Asp Ala Ala His His His His His His Lys
20 25 30
Ser Ser Ser Glu Ala Thr Asn Ile Thr Pro Lys His Asn Met Lys Ala
35 40 45
Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu His Asn
50 55 60
Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln Leu
65 70 75 80
Ala Lys Gln Ile Gln Ser Gln Trp Lys Glu Phe Gly Leu Asp Ser Val
85 90 95
Glu Leu Thr His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Lys Thr His
100 105 110
Pro Asn Tyr Ile Ser Ile Ile Asn Glu Asp Gly Asn Glu Ile Phe Asn
115 120 125
Thr Ser Leu Phe Glu Pro Pro Pro Ala Gly Tyr Glu Asn Val Ser Asp
130 135 140
Ile Val Pro Pro Phe Ser Ala Phe Ser Pro Gln Gly Met Pro Glu Gly
145 150 155 160
Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys Leu
165 170 175
Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile Val Ile Ala Arg
180 185 190
Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu Ala
195 200 205
Gly Ala Thr Gly Val Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe Ala
210 215 220
Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly Gly
225 230 235 240
Val Gln Arg Gly Asn Ile Leu Asn Leu Asn Gly Ala Gly Asp Pro Leu
245 250 255
Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile Ala
260 265 270
Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr Tyr
275 280 285
Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser Ala Ser Pro Asp
290 295 300
Ser Ser Trp Arg Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro Gly
305 310 315 320
Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met His Ile His Ser
325 330 335
Thr Ser Glu Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Arg Gly
340 345 350
Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp Ser
355 360 365
Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val His
370 375 380
Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Glu Gly Trp Arg Pro
385 390 395 400
Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly Leu
405 410 415
Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln Glu
420 425 430
Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn Tyr
435 440 445
Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser Leu Val Tyr Asn
450 455 460
Leu Thr Lys Glu Leu Glu Ser Pro Asp Glu Gly Phe Glu Gly Lys Ser
465 470 475 480
Leu Tyr Glu Ser Trp Thr Lys Ser Pro Ser Pro Glu Phe Ser Gly Met
485 490 495
Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val Phe Phe
500 505 510
Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys Asn Trp
515 520 525
Glu Thr Asn Lys Phe Ser Ser Tyr Pro Leu Tyr His Ser Val Tyr Glu
530 535 540
Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys Tyr His
545 550 555 560
Leu Thr Val Ala Gln Val Arg Gly Gly Met Val Phe Glu Leu Ala Asn
565 570 575
Ser Val Val Leu Pro Phe Asp Cys Arg Asp Tyr Ala Val Val Leu Arg
580 585 590
Lys Tyr Ala Asp Lys Ile Tyr Asn Ile Ser Met Lys His Pro Gln Glu
595 600 605
Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala Val Lys
610 615 620
Asn Phe Thr Glu Ile Ala Ser Lys Phe Ser Glu Arg Leu Arg Asp Phe
625 630 635 640
Asp Lys Ser Asn Pro Ile Leu Leu Arg Met Met Asn Asp Gln Leu Met
645 650 655
Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp Arg Pro
660 665 670
Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys Tyr Ala
675 680 685
Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile Glu Ser
690 695 700
Lys Val Asp Pro Ser Gln Ala Trp Gly Glu Val Lys Arg Gln Ile Ser
705 710 715 720
Ile Ala Thr Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser Glu Val
725 730 735
Ala
<210> 51
<211> 9
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 51
Thr Tyr Val Pro Ala Asn Ala Ser Leu
1 5
<210> 52
<211> 15
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 52
Asp Met Val Leu Trp Lys Asp Val Phe Arg Lys Asn Asn Gln Leu
1 5 10 15
<210> 53
<211> 9
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 53
Ser Tyr Val Asn Thr Asn Met Gly Leu
1 5
<210> 54
<211> 957
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 54
Met Ala Ser Glu Leu Ala Ala Trp Cys Arg Trp Gly Phe Leu Leu Ala
1 5 10 15
Leu Leu Pro Pro Gly Ile Ala Gly Thr Gln Val Cys Thr Gly Thr Asp
20 25 30
Met Lys Leu Arg Leu Pro Ala Ser Pro Glu Thr His Leu Asp Met Leu
35 40 45
Arg His Leu Tyr Gln Gly Cys Gln Val Val Gln Gly Asn Leu Glu Leu
50 55 60
Thr Tyr Val Pro Ala Asn Ala Ser Leu Ser Phe Leu Gln Asp Ile Gln
65 70 75 80
Glu Val Gln Gly Tyr Met Leu Ile Ala His Asn Gln Val Lys Arg Val
85 90 95
Pro Leu Gln Arg Leu Arg Ile Val Arg Gly Thr Gln Leu Phe Glu Asp
100 105 110
Lys Tyr Ala Leu Ala Val Leu Asp Asn Arg Asp Pro Gln Asp Asn Val
115 120 125
Ala Ala Ser Thr Pro Gly Arg Thr Pro Glu Gly Leu Arg Glu Leu Gln
130 135 140
Leu Arg Ser Leu Thr Glu Ile Leu Lys Gly Gly Val Leu Ile Arg Gly
145 150 155 160
Asn Pro Gln Leu Cys Tyr Gln Asp Met Val Leu Trp Lys Asp Val Phe
165 170 175
Arg Lys Asn Asn Gln Leu Ala Pro Val Asp Ile Asp Thr Asn Arg Ser
180 185 190
Arg Ala Cys Pro Pro Cys Ala Pro Ala Cys Lys Asp Asn His Cys Trp
195 200 205
Gly Glu Ser Pro Glu Asp Cys Gln Ile Leu Thr Gly Thr Ile Cys Thr
210 215 220
Ser Gly Cys Ala Arg Cys Lys Gly Arg Leu Pro Thr Asp Cys Cys His
225 230 235 240
Glu Gln Cys Ala Ala Gly Cys Thr Gly Pro Lys His Ser Asp Cys Leu
245 250 255
Ala Cys Leu His Phe Asn His Ser Gly Ile Cys Glu Leu His Cys Pro
260 265 270
Ala Leu Val Thr Tyr Asn Thr Asp Thr Phe Glu Ser Met His Asn Pro
275 280 285
Glu Gly Arg Tyr Thr Phe Gly Ala Ser Cys Val Thr Thr Cys Pro Tyr
290 295 300
Asn Tyr Leu Ser Thr Glu Val Gly Ser Cys Thr Leu Val Cys Pro Pro
305 310 315 320
Asn Asn Gln Glu Val Thr Ala Glu Asp Gly Thr Gln Arg Cys Glu Lys
325 330 335
Cys Ser Lys Pro Cys Ala Arg Val Cys Tyr Gly Leu Gly Met Glu His
340 345 350
Leu Arg Gly Ala Arg Ala Ile Thr Ser Asp Asn Val Gln Glu Phe Asp
355 360 365
Gly Cys Lys Lys Ile Phe Gly Ser Leu Ala Phe Leu Pro Glu Ser Phe
370 375 380
Asp Gly Asp Pro Ser Ser Gly Ile Ala Pro Leu Arg Pro Glu Gln Leu
385 390 395 400
Gln Val Phe Glu Thr Leu Glu Glu Ile Thr Gly Tyr Leu Tyr Ile Ser
405 410 415
Ala Trp Pro Asp Ser Leu Arg Asp Leu Ser Val Phe Gln Asn Leu Arg
420 425 430
Ile Ile Arg Gly Arg Ile Leu His Asp Gly Ala Tyr Ser Leu Thr Leu
435 440 445
Gln Gly Leu Gly Ile His Ser Leu Gly Leu Arg Ser Leu Arg Glu Leu
450 455 460
Gly Ser Gly Leu Ala Leu Ile His Arg Asn Ala His Leu Cys Phe Val
465 470 475 480
His Thr Val Pro Trp Asp Gln Leu Phe Arg Asn Pro His Gln Ala Leu
485 490 495
Leu His Ser Gly Asn Arg Pro Glu Glu Asp Cys Gly Leu Glu Gly Leu
500 505 510
Val Cys Asn Ser Leu Cys Ala His Gly His Cys Trp Gly Pro Gly Pro
515 520 525
Thr Gln Cys Val Asn Cys Ser His Phe Leu Arg Gly Gln Glu Cys Val
530 535 540
Glu Glu Cys Arg Val Trp Lys Gly Leu Pro Arg Glu Tyr Val Ser Asp
545 550 555 560
Lys Arg Cys Leu Pro Cys His Pro Glu Cys Gln Pro Gln Asn Ser Ser
565 570 575
Glu Thr Cys Phe Gly Ser Glu Ala Asp Gln Cys Ala Ala Cys Ala His
580 585 590
Tyr Lys Asp Ser Ser Ser Cys Val Ala Arg Cys Pro Ser Gly Val Lys
595 600 605
Pro Asp Leu Ser Tyr Met Pro Ile Trp Lys Tyr Pro Asp Glu Glu Gly
610 615 620
Ile Cys Gln Pro Cys Pro Ile Asn Cys Thr His Ser Cys Val Asp Leu
625 630 635 640
Asp Glu Arg Gly Cys Pro Ala Glu Gln Arg Ala Ser Pro Val Thr Phe
645 650 655
Ile Ile Ala Thr Val Val Gly Val Leu Leu Phe Leu Ile Leu Val Val
660 665 670
Val Val Gly Ile Leu Ile Lys Arg Arg Arg Gln Lys Ile Arg Lys Tyr
675 680 685
Thr Met Arg Arg Asn Glu Asp Leu Gly Pro Ser Ser Pro Met Asp Ser
690 695 700
Thr Phe Tyr Arg Ser Leu Leu Glu Asp Asp Asp Met Gly Asp Leu Val
705 710 715 720
Asp Ala Glu Glu Tyr Leu Val Pro Gln Gln Gly Phe Phe Ser Pro Asp
725 730 735
Pro Thr Pro Gly Thr Gly Ser Thr Ala His Arg Arg His Arg Ser Ser
740 745 750
Ser Thr Arg Ser Gly Gly Gly Glu Leu Thr Leu Gly Leu Glu Pro Ser
755 760 765
Glu Glu Gly Pro Pro Arg Ser Pro Leu Ala Pro Ser Glu Gly Ala Gly
770 775 780
Ser Asp Val Phe Asp Gly Asp Leu Ala Met Gly Val Thr Lys Gly Leu
785 790 795 800
Gln Ser Leu Ser Pro His Asp Leu Ser Pro Leu Gln Arg Tyr Ser Glu
805 810 815
Asp Pro Thr Leu Pro Leu Pro Pro Glu Thr Asp Gly Tyr Val Ala Pro
820 825 830
Leu Ala Cys Ser Pro Gln Pro Glu Phe Val Asn Gln Ser Glu Val Gln
835 840 845
Pro Gln Pro Pro Leu Thr Pro Glu Gly Pro Leu Pro Pro Val Arg Pro
850 855 860
Ala Gly Ala Thr Leu Glu Arg Pro Lys Thr Leu Ser Pro Gly Lys Asn
865 870 875 880
Gly Val Val Lys Asp Val Phe Ala Phe Gly Gly Ala Val Glu Asn Pro
885 890 895
Glu Phe Leu Val Pro Arg Glu Gly Thr Ala Ser Pro Pro His Pro Ser
900 905 910
Pro Ala Phe Ser Pro Ala Phe Asp Asn Leu Phe Phe Trp Asp Gln Asn
915 920 925
Ser Ser Glu Gln Gly Pro Pro Pro Ser Asn Phe Glu Gly Thr Pro Thr
930 935 940
Ala Glu Asn Pro Glu Phe Leu Gly Leu Asp Val Pro Val
945 950 955
<210> 55
<211> 739
<212> ПРТ
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 55
Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val
1 5 10 15
Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile
20 25 30
Lys Ser Ser Ser Glu Ala Thr Asn Ile Thr Pro Lys His Asn Met Lys
35 40 45
Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu His
50 55 60
Asn Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln
65 70 75 80
Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys Glu Phe Gly Leu Asp Ser
85 90 95
Val Glu Leu Thr His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Lys Thr
100 105 110
His Pro Asn Tyr Ile Ser Ile Ile Asn Glu Asp Gly Asn Glu Ile Phe
115 120 125
Asn Thr Ser Leu Phe Glu Pro Pro Pro Ala Gly Tyr Glu Asn Val Ser
130 135 140
Asp Ile Val Pro Pro Phe Ser Ala Phe Ser Pro Gln Gly Met Pro Glu
145 150 155 160
Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys
165 170 175
Leu Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile Val Ile Ala
180 185 190
Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu
195 200 205
Ala Gly Ala Thr Gly Val Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe
210 215 220
Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly
225 230 235 240
Gly Val Gln Arg Gly Asn Ile Leu Asn Leu Asn Gly Ala Gly Asp Pro
245 250 255
Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile
260 265 270
Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr
275 280 285
Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser Ala Ser Pro
290 295 300
Asp Ser Ser Trp Arg Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro
305 310 315 320
Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met His Ile His
325 330 335
Ser Thr Ser Glu Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Arg
340 345 350
Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp
355 360 365
Ser Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val
370 375 380
His Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Glu Gly Trp Arg
385 390 395 400
Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly
405 410 415
Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln
420 425 430
Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn
435 440 445
Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser Leu Val Tyr
450 455 460
Asn Leu Thr Lys Glu Leu Glu Ser Pro Asp Glu Gly Phe Glu Gly Lys
465 470 475 480
Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser Pro Ser Pro Glu Phe Ser
485 490 495
Gly Met Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val
500 505 510
Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys
515 520 525
Asn Trp Glu Thr Asn Lys Phe Ser Ser Tyr Pro Leu Tyr His Ser Val
530 535 540
Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys
545 550 555 560
Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Met Val Phe Glu Leu
565 570 575
Ala Asn Ser Val Val Leu Pro Phe Asp Cys Arg Asp Tyr Ala Val Val
580 585 590
Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Asn Ile Ser Met Lys His Pro
595 600 605
Gln Glu Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala
610 615 620
Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Ser Glu Arg Leu Arg
625 630 635 640
Asp Phe Asp Lys Ser Asn Pro Ile Leu Leu Arg Met Met Asn Asp Gln
645 650 655
Leu Met Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp
660 665 670
Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys
675 680 685
Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile
690 695 700
Glu Ser Lys Val Asp Pro Ser Gln Ala Trp Gly Glu Val Lys Arg Gln
705 710 715 720
Ile Ser Ile Ala Thr Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser
725 730 735
Glu Val Ala
<210> 56
<211> 2217
<212> ДНК
<213> Искуственная
<220>
<223> Синтетическая конструкция
<400> 56
atggctagcg ctagaaggcc cagatggctg tgcgctggcg ccctggtgct ggctggcgga 60
ttcttcctgc tgggcttcct gttcggctgg ttcatcaagt cctccagcga ggccaccaac 120
atcaccccca agcacaacat gaaggccttt ctggacgagc tgaaggccga gaatatcaag 180
aagttcctgc acaacttcac ccagatcccc cacctggccg gcaccgagca gaacttccag 240
ctggccaagc agatccagtc ccagtggaaa gagttcggcc tggactccgt ggaactgacc 300
cactacgacg tgctgctgtc ctaccccaac aagacccacc ccaactacat ctccatcatc 360
aacgaggacg gcaacgaaat cttcaacacc tccctgttcg agcccccacc agccggctac 420
gagaacgtgt ccgacatcgt gcccccattc tccgcattca gtccacaagg catgcccgag 480
ggcgacctgg tgtacgtgaa ctacgccagg accgaggact tcttcaagct ggaaagggac 540
atgaagatca actgctccgg caagatcgtg atcgccagat acggcaaggt gttcaggggc 600
aacaaagtga agaacgctca gctggctggg gccaccggcg tgatcctgta ctctgacccc 660
gccgactact tcgccccagg cgtgaagtcc taccccgacg gctggaacct gccaggtggc 720
ggagtgcaga ggggcaacat cctgaacctg aacggcgctg gcgaccccct gaccccagga 780
taccccgcca acgagtacgc ctacagaaga ggaatcgccg aggccgtggg cctgccctct 840
atcccagtgc accccatcgg ctactacgac gcccagaaac tgctggaaaa gatgggcggc 900
tccgcctccc ccgactcctc ttggagaggc tccctgaagg tgccctacaa cgtgggccca 960
ggcttcaccg gcaacttctc cacccagaaa gtgaagatgc acatccactc cacctccgaa 1020
gtgaccagga tctacaacgt gatcggcacc ctgagaggcg ccgtggaacc cgacagatac 1080
gtgatcctgg gcggccacag ggacagctgg gtgttcggcg gcatcgaccc acagtctggc 1140
gccgctgtgg tgcacgagat cgtgcggtcc ttcggaaccc tgaagaaaga gggatggcgc 1200
cccagaagga caatcctgtt cgcctcctgg gacgccgagg aattcggcct gctgggatcc 1260
accgagtggg ccgaggaaaa ctccaggctg ctgcaggaaa ggggcgtcgc ctacatcaac 1320
gccgactcct ccatcgaggg caactacacc ctgagggtgg actgcacccc cctgatgtac 1380
tccctggtgt acaacctgac caaagagctg gaatcccccg acgagggctt cgagggcaag 1440
tccctgtacg agtcctggac caagaagtcc ccatcccccg agttctccgg catgcccagg 1500
atctccaagc tgggctccgg caacgacttc gaggtgttct tccagaggct gggaatcgcc 1560
tccggcaggg ccagatacac caagaactgg gagacaaaca agttctcctc ctaccccctg 1620
taccactccg tgtacgaaac ctacgagctg gtggaaaagt tctacgaccc catgttcaag 1680
taccacctga ccgtggccca ggtccgcgga ggcatggtgt tcgagctggc caactccgtg 1740
gtgctgccct tcgactgcag agactatgct gtggtgctga ggaagtacgc cgacaaaatc 1800
tacaacatct ccatgaagca cccccaggaa atgaagacct actccgtgtc cttcgactcc 1860
ctgttctccg ccgtgaagaa tttcaccgag atcgcctcca agttctccga gaggctgagg 1920
gacttcgaca agtccaaccc catcctgctg aggatgatga acgaccagct gatgttcctg 1980
gaaagggcct tcatcgaccc cctgggcctg ccagacaggc ccttctacag gcacgtgatc 2040
tacgccccat cctcccacaa caaatacgcc ggcgagtcct tccccggcat ctacgatgcc 2100
ctgttcgaca tcgagtccaa ggtggacccc tcccaggctt ggggcgaagt gaagaggcag 2160
atcagtatcg ccacattcac agtgcaggcc gctgccgaaa ccctgtccga ggtggcc 2217
<210> 57
<211> 36519
<212> ДНК
<213> Обезьяний аденовирус, тип 25
<400> 57
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagatga ggcacctgag agacctgccc 600
gatgagaaaa tcatcatcgc ttccgggaac gagattctgg aactggtggt aaatgccatg 660
atgggcgacg accctccgga gccccccacc ccatttgaga caccttcgct gcacgatttg 720
tatgatctgg aggtggatgt gcccgaggac gatcccaatg aggaggcggt aaatgatttt 780
tttagcgatg ccgcgctgct agctgccgag gaggcttcga gctctagctc agacagcgac 840
tcttcactgc atacccctag acccggcaga ggtgagaaaa agatccccga gcttaaaggg 900
gaagagatgg acttgcgctg ctatgaggaa tgcttgcccc cgagcgatga tgaggacgag 960
caggcgatcc agaacgcagc gagccaggga gtgcaagccg ccagcgagag ctttgcgctg 1020
gactgcccgc ctctgcccgg acacggctgt aagtcttgtg aatttcatcg catgaatact 1080
ggagataaag ctgtgttgtg tgcactttgc tatatgagag cttacaacca ttgtgtttac 1140
agtaagtgtg attaagttga actttagagg gaggcagaga gcagggtgac tgggcgatga 1200
ctggtttatt tatgtatata tgttctttat ataggtcccg tctctgacgc agatgatgag 1260
acccccacta caaagtccac ttcgtcaccc ccagaaattg gcacatctcc acctgagaat 1320
attgttagac cagttcctgt tagagccact gggaggagag cagctgtgga atgtttggat 1380
gacttgctac agggtggggt tgaacctttg gacttgtgta cccggaaacg ccccaggcac 1440
taagtgccac acatgtgtgt ttacttgagg tgatgtcagt atttataggg tgtggagtgc 1500
aataaaaaat gtgttgactt taagtgcgtg gtttatgact caggggtggg gactgtgagt 1560
atataagcag gtgcagacct gtgtggttag ctcagagcgg catggagatt tggacggtct 1620
tggaagactt tcacaagact agacagctgc tagagaacgc ctcgaacgga gtctcttacc 1680
tgtggagatt ctgcttcggt ggcgacctag ctaggctagt ctacagggcc aaacaggatt 1740
atagtgaaca atttgaggtt attttgagag agtgttctgg tctttttgac gctcttaact 1800
tgggccatca gtctcacttt aaccagagga tttcgagagc ccttgatttt actactcctg 1860
gcagaaccac tgcagcagta gccttttttg cttttattct tgacaaatgg agtcaagaaa 1920
cccatttcag cagggattac cagctggatt tcttagcagt agctttgtgg agaacatgga 1980
agtgccagcg cctgaatgca atctccggct acttgccggt acagccgcta gacactctga 2040
ggatcctgaa tctccaggag agtcccaggg cacgccaacg tcgccagcag cagcagcagg 2100
aggaggatca agaagagaac ccgagagccg gcctggaccc tccggcggag gaggaggagt 2160
agctgacctg tttcctgaac tgcgccgggt gctgactagg tcttcgagtg gtcgggagag 2220
ggggattaag cgggagaggc atgatgagac taatcacaga actgaactga ctgtgggtct 2280
gatgagtcgc aagcgcccag aaacagtgtg gtggcatgag gtgcagtcga ctggcacaga 2340
tgaggtgtcg gtgatgcatg agaggttttc tctagaacaa gtcaagactt gttggttaga 2400
gcctgaggat gattgggagg tagccatcag gaattatgcc aagctggctc tgaggccaga 2460
caagaagtac aagattacta agctgataaa tatcagaaat gcctgctaca tctcagggaa 2520
tggggctgaa gtggagatct gtctccagga aagggtggct ttcagatgct gcatgatgaa 2580
tatgtacccg ggagtggtgg gcatggatgg ggttaccttt atgaacatga ggttcagggg 2640
agatgggtat aatggcacgg tctttatggc caataccaag ctgacagtcc atggctgctc 2700
cttctttggg tttaataaca cctgcatcga ggcctggggt caggtcggtg tgaggggctg 2760
cagtttttca gccaactgga tgggggtcgt gggcaggacc aagagtatgc tgtccgtgaa 2820
gaaatgcttg tttgagaggt gccacctggg ggtgatgagc gagggcgaag ccagaatccg 2880
ccactgcgcc tctaccgaga cgggctgctt tgtgctgtgc aagggcaatg ctaagatcaa 2940
gcataatatg atctgtggag cctcggacga gcgcggctac cagatgctga cctgcgccgg 3000
cgggaacagc catatgctgg ccaccgtaca tgtggcttcc catgctcgca agccctggcc 3060
cgagttcgag cacaatgtca tgaccaggtg caatatgcat ctggggtccc gccgaggcat 3120
gttcatgccc taccagtgca acctgaatta tgtgaaggtg ctgctggagc ccgatgccat 3180
gtccagagtg agcctgacgg gggtgtttga catgaatgtg gaggtgtgga agattctgag 3240
atatgatgaa tccaagacca ggtgccgagc ctgcgagtgc ggagggaagc atgccaggtt 3300
ccagcccgtg tgtgtggatg tgacggagga cctgcgaccc gatcatttgg tgttgccctg 3360
caccgggacg gagttcggtt ccagcgggga agaatctgac tagagtgagt agtgttctgg 3420
ggcgggggag gacctgcatg agggccagaa taactgaaat ctgtgctttt ctgtgtgttg 3480
cagcagcatg agcggaagcg gctcctttga gggaggggta ttcagccctt atctgacggg 3540
gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg tggacggccg 3600
gcccgtgcag cccgcgaact cttcaaccct gacctatgca accctgagct cttcgtcgtt 3660
ggacgcagct gccgccgcag ctgctgcatc tgccgccagc gccgtgcgcg gaatggccat 3720
gggcgccggc tactacggca ctctggtggc caactcgagt tccaccaata atcccgccag 3780
cctgaacgag gagaagctgt tgctgctgat ggcccagctc gaggccttga cccagcgcct 3840
gggcgagctg acccagcagg tggctcagct gcaggagcag acgcgggccg cggttgccac 3900
ggtgaaatcc aaataaaaaa tgaatcaata aataaacgga gacggttgtt gattttaaca 3960
cagagtctga atctttattt gatttttcgc gcgcggtagg ccctggacca ccggtctcga 4020
tcattgagca cccggtggat cttttccagg acccggtaga ggtgggcttg gatgttgagg 4080
tacatgggca tgagcccgtc ccgggggtgg aggtagctcc attgcagggc ctcgtgctcg 4140
ggggtggtgt tgtaaatcac ccagtcatag caggggcgca gggcatggtg ttgcacaata 4200
tctttgagga ggagactgat ggccacgggc agccctttgg tgtaggtgtt tacaaatctg 4260
ttgagctggg agggatgcat gcggggggag atgaggtgca tcttggcctg gatcttgaga 4320
ttggcgatgt taccgcccag atcccgcctg gggttcatgt tgtgcaggac caccagcacg 4380
gtgtatccgg tgcacttggg gaatttatca tgcaacttgg aagggaaggc gtgaaagaat 4440
ttggcgacgc ctttgtgccc gcccaggttt tccatgcact catccatgat gatggcgatg 4500
ggcccgtggg cggcggcctg ggcaaagacg tttcgggggt cggacacatc atagttgtgg 4560
tcctgggtga ggtcatcata ggccatttta atgaatttgg ggcggagggt gccggactgg 4620
gggacaaagg taccctcgat cccgggggcg tagttcccct cacagatctg catctcccag 4680
gctttgagct cggagggggg gatcatgtcc acctgcgggg cgataaagaa cacggtttcc 4740
ggggcggggg agatgagctg ggccgaaagc aagttccgga gcagctggga cttgccgcag 4800
ccggtggggc cgtagatgac cccgatgacc ggctgcaggt ggtagttgag ggagagacag 4860
ctgccgtcct cccggaggag gggggccacc tcgttcatca tctcgcgcac gtgcatgttc 4920
tcgcgcacca gttccgccag gaggcgctct ccccccaggg ataggagctc ctggagcgag 4980
gcgaagtttt tcagcggctt gagtccgtcg gccatgggca ttttggagag ggtttgttgc 5040
aagagttcca ggcggtccca gagctcggtg atgtgctcta cggcatctcg atccagcaga 5100
cctcctcgtt tcgcgggttg ggacggctgc gggagtaggg caccagacga tgggcgtcca 5160
gcgcagccag ggtccggtcc ttccagggtc gcagcgtccg cgtcagggtg gtctccgtca 5220
cggtgaaggg gtgcgcgccg ggctgggcgc ttgcgagggt gcgcttcagg ctcatccggc 5280
tggtcgaaaa ccgctcccga tcggcgccct gcgcgtcggc caggtagcaa ttgaccatga 5340
gttcgtagtt gagcgcctcg gccgcgtggc ctttggcgcg gagcttacct ttggaagtct 5400
gcccgcaggc gggacagagg agggacttga gggcgtagag cttgggggcg aggaagacgg 5460
actcgggggc gtaggcgtcc gcgccgcagt gggcgcagac ggtctcgcac tccacgagcc 5520
aggtgaggtc gggctggtcg gggtcaaaaa ccagtttccc gccgttcttt ttgatgcgtt 5580
tcttaccttt ggtctccatg agctcgtgtc cccgctgggt gacaaagagg ctgtccgtgt 5640
ccccgtagac cgactttatg ggccggtcct cgagcggtgt gccgcggtcc tcctcgtaga 5700
ggaaccccgc ccactccgag acgaaagccc gggtccaggc cagcacgaag gaggccacgt 5760
gggacgggta gcggtcgttg tccaccagcg ggtccacctt ttccagggta tgcaaacaca 5820
tgtccccctc gtccacatcc aggaaggtga ttggcttgta agtgtaggcc acgtgaccgg 5880
gggtcccggc cgggggggta taaaagggtg cgggtccctg ctcgtcctca ctgtcttccg 5940
gatcgctgtc caggagcgcc agctgttggg gtaggtattc cctctcgaag gcgggcatga 6000
cctcggcact caggttgtca gtttctagaa acgaggagga tttgatattg acggtgccgg 6060
cggagatgcc tttcaagagc ccctcgtcca tctggtcaga aaagacgatc tttttgttgt 6120
cgagcttggt ggcgaaggag ccgtagaggg cgttggagag gagcttggcg atggagcgca 6180
tggtctggtt tttttccttg tcggcgcgct ccttggcggc gatgttgagc tgcacgtact 6240
cgcgcgccac gcacttccat tcggggaaga cggtggtcag ctcgtcgggc acgattctga 6300
cctgccagcc ccgattatgc agggtgatga ggtccacact ggtggccacc tcgccgcgca 6360
ggggctcatt agtccagcag aggcgtccgc ccttgcgcga gcagaagggg ggcagggggt 6420
ccagcatgac ctcgtcgggg gggtcggcat cgatggtgaa gatgccgggc aggaggtcgg 6480
ggtcaaagta gctgatggaa gtggccagat cgtccagggc agcttgccat tcgcgcacgg 6540
ccagcgcgcg ctcgtaggga ctgaggggcg tgccccaggg catgggatgg gtaagcgcgg 6600
aggcgtacat gccgcagatg tcgtagacgt agaggggctc ctcgaggatg ccgatgtagg 6660
tggggtagca gcgccccccg cggatgctgg cgcgcacgta gtcatacagc tcgtgcgagg 6720
gggcgaggag ccccgggccc aggttggtgc gactgggctt ttcggcgcgg tagacgatct 6780
ggcggaaaat ggcatgcgag ttggaggaga tggtgggcct ttggaagatg ttgaagtggg 6840
cgtggggcag tccgaccgag tcgcggatga agtgggcgta ggagtcttgc agcttggcga 6900
cgagctcggc ggtgactagg acgtccagag cgcagtagtc gagggtctcc tggatgatgt 6960
catacttgag ctgtcccttt tgtttccaca gctcgcggtt gagaaggaac tcttcgcggt 7020
ccttccagta ctcttcgagg gggaacccgt cctgatctgc acggtaagag cctagcatgt 7080
agaactggtt gacggccttg taggcgcagc agcccttctc cacggggagg gcgtaggcct 7140
gggcggcctt gcgcagggag gtgtgcgtga gggcgaaagt gtccctgacc atgaccttga 7200
ggaactggtg cttgaagtcg atatcgtcgc agcccccctg ctcccagagc tggaagtccg 7260
tgcgcttctt gtaggcgggg ttgggcaaag cgaaagtaac atcgttgaag aggatcttgc 7320
ccgcgcgggg cataaagttg cgagtgatgc ggaaaggttg gggcacctcg gcccggttgt 7380
tgatgacctg ggcggcgagc acgatctcgt cgaagccgtt gatgttgtgg cccacgatgt 7440
agagttccac gaatcgcgga cggcccttga cgtggggcag tttcttgagc tcctcgtagg 7500
tgagctcgtc ggggtcgctg agcccgtgct gctcgagcgc ccagtcggcg agatgggggt 7560
tggcgcggag gaaggaagtc cagagatcca cggccagggc ggtttgcaga cggtcccggt 7620
actgacggaa ctgctgcccg acggccattt tttcgggggt gacgcagtag aaggtgcggg 7680
ggtccccgtg ccagcgatcc catttgagct ggagggcgag atcgagggcg agctcgacga 7740
gccggtcgtc cccggagagt ttcatgacca gcatgaaggg gacgagctgc ttgccgaagg 7800
accccatcca ggtgtaggtt tccacatcgt aggtgaggaa gagcctttcg gtgcgaggat 7860
gcgagccgat ggggaagaac tggatctcct gccaccaatt ggaggaatgg ctgttgatgt 7920
gatggaagta gaaatgccga cggcgcgccg aacactcgtg cttgtgttta tacaagcggc 7980
cacagtgctc gcaacgctgc acgggatgca cgtgctgcac gagctgtacc tgagttcctt 8040
tgacgaggaa tttcagtggg aagtggagtc gtggcgcctg catctcgtgc tgtactacgt 8100
cgtggtggtc ggcctggccc tcttctgcct cgatggtggt catgctgacg agcccgcgcg 8160
ggaggcaggt ccagacctcg gcgcgagcgg gtcggagagc gaggacgagg gcgcgcaggc 8220
cggagctgtc cagggtcctg agacgctgcg gagtcaggtc agtgggcagc ggcggcgcgc 8280
ggttgacttg caggagtttt tccagggcgc gcgggaggtc cagatggtac ttgatctcca 8340
ccgcgccatt ggtggcgacg tcgatggctt gcagggtccc gtgcccctgg ggtgtgacca 8400
ccgtcccccg tttcttcttg ggcggctggg gcgacggggg cggtgcctct tccatggtta 8460
gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520
cggcaggggc acgtcggcgc cgcgcgcggg taggttctgg tactgcgccc ggagaagact 8580
ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640
gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700
ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760
catgaactgc tcgatctcct cctcttgaag gtctccgcgg ccggcgcgct ccacggtggc 8820
cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc ccgcctcgtt 8880
ccagacgcgg ctgtagacca cgacgccctc gggatcgccg gcgcgcatga ccacctgggc 8940
gaggttgagc tccacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000
gttgagcgtg gtggcgatgt gctcggtgac gaagaaatac atgatccagc ggcggagcgg 9060
catctcgctg acgtcgccca gcgcctccaa acgttccatg gcctcgtaaa agtccacggc 9120
gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180
gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc cccgggagtt cctccacttc 9240
ctcttcttcc tcctccacta acatctcttc tacttcctcc tcaggcggca gtggtggcgg 9300
gggagggggc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360
ctcgccgcgc cggcgtcgca tggtctcggt gacggcgcgc ccgtcctcgc ggggccgcag 9420
cgtgaagacg ccgccgcgca tctccaggtg gccggggggg tccccgttgg gcagggagag 9480
ggcgctgacg atgcatctta tcaattgccc cgtagggact ccgcgcaagg acctgagcgt 9540
ctcgagatcc acgggatctg aaaaccgctg aacgaaggct tcgagccagt cgcagtcgca 9600
aggtaggctg agcacggttt cttctggcgg gtcatgttgg ttgggagcgg ggcgggcgat 9660
gctgctggtg atgaagttga aataggcggt tctgagacgg cggatggtgg cgaggagcac 9720
caggtctttg ggcccggctt gctggatgcg cagacggtcg gccatgcccc aggcgtggtc 9780
ctgacacctg gccaggtcct tgtagtagtc ctgcatgagc cgctccacgg gcacctcctc 9840
ctcgcccgcg cggccgtgca tgcgcgtgag cccgaagccg cgctggggct ggacgagcgc 9900
caggtcggcg acgacgcgct cggcgaggat ggcttgctgg atctgggtga gggtggtctg 9960
gaagtcatca aagtcgacga agcggtggta ggctccggtg ttgatggtgt aggagcagtt 10020
ggccatgacg gaccagttga cggtctggtg gcccggacgc acgagctcgt ggtacttgag 10080
gcgcgagtag gcgcgcgtgt cgaagatgta gtcgttgcag gtgcgcacca ggtactggta 10140
gccgatgagg aagtgcggcg gcggctggcg gtagagcggc catcgctcgg tggcgggggc 10200
gccgggcgcg aggtcctcga gcatggtgcg gtggtagccg tagatgtacc tggacatcca 10260
ggtgatgccg gcggcggtgg tggaggcgcg cgggaactcg cggacgcggt tccagatgtt 10320
gcgcagcggc aggaagtagt tcatggtggg cacggtctgg cccgtgaggc gcgcgcagtc 10380
gtggatgctc tatacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag 10440
gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag 10500
ccgcagctaa cgtggtattg gcactcccgt ctcgacccaa gcctgcacca accctccagg 10560
atacggaggc gggtcgtttt gcaacttttt tttggaggcc ggatgagact agtaagcgcg 10620
gaaagcggcc gaccgcgatg gctcgctgcc gtagtctgga gaagaatcgc cagggttgcg 10680
ttgcggtgtg ccccggttcg aggccggccg gattccgcgg ctaacgaggg cgtggctgcc 10740
ccgtcgtttc caagacccca tagccagccg acttctccag ttacggagcg agcccctctt 10800
ttgttttgtt tgtttttgcc agatgcatcc cgtactgcgg cagatgcgcc cccaccaccc 10860
tccaccgcaa caacagcccc ctccacagcc ggcgcttctg cccccgcccc agcagcaact 10920
tccagccacg accgccgcgg ccgccgtgag cggggctgga cagagttatg atcaccagct 10980
ggccttggaa gagggcgagg ggctggcgcg cctgggggcg tcgtcgccgg agcggcaccc 11040
gcgcgtgcag atgaaaaggg acgctcgcga ggcctacgtg cccaagcaga acctgttcag 11100
agacaggagc ggcgaggagc ccgaggagat gcgcgcggcc cggttccacg cggggcggga 11160
gctgcggcgc ggcctggacc gaaagagggt gctgagggac gaggatttcg aggcggacga 11220
gctgacgggg atcagccccg cgcgcgcgca cgtggccgcg gccaacctgg tcacggcgta 11280
cgagcagacc gtgaaggagg agagcaactt ccaaaaatcc ttcaacaacc acgtgcgcac 11340
cctgatcgcg cgcgaggagg tgaccctggg cctgatgcac ctgtgggacc tgctggaggc 11400
catcgtgcag aaccccacca gcaagccgct gacggcgcag ctgttcctgg tggtgcagca 11460
tagtcgggac aacgaagcgt tcagggaggc gctgctgaat atcaccgagc ccgagggccg 11520
ctggctcctg gacctggtga acattctgca gagcatcgtg gtgcaggagc gcgggctgcc 11580
gctgtccgag aagctggcgg ccatcaactt ctcggtgctg agtttgggca agtactacgc 11640
taggaagatc tacaagaccc cgtacgtgcc catagacaag gaggtgaaga tcgacgggtt 11700
ttacatgcgc atgaccctga aagtgctgac cctgagcgac gatctggggg tgtaccgcaa 11760
cgacaggatg caccgtgcgg tgagcgccag caggcggcgc gagctgagcg accaggagct 11820
gatgcatagt ctgcagcggg ccctgaccgg ggccgggacc gagggggaga gctactttga 11880
catgggcgcg gacctgcact ggcagcccag ccgccgggcc ttggaggcgg cggcaggacc 11940
ctacgtagaa gaggtggacg atgaggtgga cgaggagggc gagtacctgg aagactgatg 12000
gcgcgaccgt atttttgcta gatgcaacaa caacagccac ctcctgatcc cgcgatgcgg 12060
gcggcgctgc agagccagcc gtccggcatt aactcctcgg acgattggac ccaggccatg 12120
caacgcatca tggcgctgac gacccgcaac cccgaagcct ttagacagca gccccaggcc 12180
aaccggctct cggccatcct ggaggccgtg gtgccctcgc gctccaaccc cacgcacgag 12240
aaggtcctgg ccatcgtgaa cgcgctggtg gagaacaagg ccatccgcgg cgacgaggcc 12300
ggcctggtgt acaacgcgct gctggagcgc gtggcccgct acaacagcac caacgtgcag 12360
accaacctgg accgcatggt gaccgacgtg cgcgaggccg tggcccagcg cgagcggttc 12420
caccgcgagt ccaacctggg atccatggtg gcgctgaacg ccttcctcag cacccagccc 12480
gccaacgtgc cccggggcca ggaggactac accaacttca tcagcgccct gcgcctgatg 12540
gtgaccgagg tgccccagag cgaggtgtac cagtccgggc cggactactt cttccagacc 12600
agtcgccagg gcttgcagac cgtgaacctg agccaggctt tcaagaactt gcagggcctg 12660
tggggcgtgc aggccccggt cggggaccgc gcgacggtgt cgagcctgct gacgccgaac 12720
tcgcgcctgc tgctgctgct ggtggccccc ttcacggaca gcggcagcat caaccgcaac 12780
tcgtacctgg gctacctgat taacctgtac cgcgaggcca tcggccaggc gcacgtggac 12840
gagcagacct accaggagat cacccacgtg agccgcgccc tgggccagga cgacccgggc 12900
aacctggaag ccaccctgaa ctttttgctg accaaccggt cgcagaagat cccgccccag 12960
tacgcgctca gcaccgagga ggagcgcatc ctgcgttacg tgcagcagag cgtgggcctg 13020
ttcctgatgc aggagggggc cacccccagc gccgcgctcg acatgaccgc gcgcaacatg 13080
gagcccagca tgtacgccag caaccgcccg ttcatcaata aactgatgga ctacttgcat 13140
cgggcggccg ccatgaactc tgactatttc accaacgcca tcctgaatcc ccactggctc 13200
ccgccgccgg ggttctacac gggcgagtac gacatgcccg accccaatga cgggttcctg 13260
tgggacgatg tggacagcag cgtgttctcc ccccgaccgg gtgctaacga gcgccccttg 13320
tggaagaagg aaggcagcga ccgacgcccg tcctcggcgc tgtccggccg cgagggtgct 13380
gccgcggcgg tgcccgaggc cgccagtcct ttcccgagct tgcccttctc gctgaacagt 13440
atccgcagca gcgagctggg caggatcacg cgcccgcgct tgctgggcga agaggagtac 13500
ttgaatgact cgctgttgag acccgagcgg gagaagaact tccccaataa cgggatagaa 13560
agcctggtgg acaagatgag ccgctggaag acgtatgcgc aggagcacag ggacgatccc 13620
cgggcgtcgc agggggccac gagccggggc agcgccgccc gtaaacgccg gtggcacgac 13680
aggcagcggg gacagatgtg ggacgatgag gactccgccg acgacagcag cgtgttggac 13740
ttgggtggga gtggtaaccc gttcgctcac ctgcgccccc gtatcgggcg catgatgtaa 13800
gagaaaccga aaataaatga tactcaccaa ggccatggcg accagcgtgc gttcgtttct 13860
tctctgttgt tgttgtatct agtatgatga ggcgtgcgta cccggagggt cctcctccct 13920
cgtacgagag cgtgatgcag caggcgatgg cggcggcggc gatgcagccc ccgctggagg 13980
ctccttacgt gcccccgcgg tacctggcgc ctacggaggg gcggaacagc attcgttact 14040
cggagctggc acccttgtac gataccaccc ggttgtacct ggtggacaac aagtcggcgg 14100
acatcgcctc gctgaactac cagaacgacc acagcaactt cctgaccacc gtggtgcaga 14160
acaatgactt cacccccacg gaggccagca cccagaccat caactttgac gagcgctcgc 14220
ggtggggcgg ccagctgaaa accatcatgc acaccaacat gcccaacgtg aacgagttca 14280
tgtacagcaa caagttcaag gcgcgggtga tggtctcccg caagaccccc aatggggtga 14340
cagtgacaga ggattatgat ggtagtcagg atgagctgaa gtatgaatgg gtggaatttg 14400
agctgcccga aggcaacttc tcggtgacca tgaccatcga cctgatgaac aacgccatca 14460
tcgacaatta cttggcggtg gggcggcaga acggggtgct ggagagcgac atcggcgtga 14520
agttcgacac taggaacttc aggctgggct gggaccccgt gaccgagctg gtcatgcccg 14580
gggtgtacac caacgaggct ttccatcccg atattgtctt gctgcccggc tgcggggtgg 14640
acttcaccga gagccgcctc agcaacctgc tgggcattcg caagaggcag cccttccagg 14700
aaggcttcca gatcatgtac gaggatctgg aggggggcaa catccccgcg ctcctggatg 14760
tcgacgccta tgagaaaagc aaggaggatg cagcagctga agcaactgca gccgtagcta 14820
ccgcctctac cgaggtcagg ggcgataatt ttgcaagcgc cgcagcagtg gcagcggccg 14880
aggcggctga aaccgaaagt aagatagtca ttcagccggt ggagaaggat agcaagaaca 14940
ggagctacaa cgtactaccg gacaagataa acaccgccta ccgcagctgg tacctagcct 15000
acaactatgg cgaccccgag aagggcgtgc gctcctggac gctgctcacc acctcggacg 15060
tcacctgcgg cgtggagcaa gtctactggt cgctgcccga catgatgcaa gacccggtca 15120
ccttccgctc cacgcgtcaa gttagcaact acccggtggt gggcgccgag ctcctgcccg 15180
tctactccaa gagcttcttc aacgagcagg ccgtctactc gcagcagctg cgcgccttca 15240
cctcgcttac gcacgtcttc aaccgcttcc ccgagaacca gatcctcgtc cgcccgcccg 15300
cgcccaccat taccaccgtc agtgaaaacg ttcctgctct cacagatcac gggaccctgc 15360
cgctgcgcag cagtatccgg ggagtccagc gcgtgaccgt tactgacgcc agacgccgca 15420
cctgccccta cgtctacaag gccctgggca tagtcgcgcc gcgcgtcctc tcgagccgca 15480
ccttctaaat gtccattctc atctcgccca gtaataacac cggttggggc ctgcgcgcgc 15540
ccagcaagat gtacggaggc gctcgccaac gctccacgca acaccccgtg cgcgtgcgcg 15600
ggcacttccg cgctccctgg ggcgccctca agggccgcgt gcggtcgcgc accaccgtcg 15660
acgacgtgat cgaccaggtg gtggccgacg cgcgcaacta cacccccgcc gccgcgcccg 15720
tctccaccgt ggacgccgtc atcgacagcg tggtggcgga cgcgcgccgg tacgcccgcg 15780
ccaagagccg gcggcggcgc atcgcccggc ggcaccggag cacccccgcc atgcgcgcgg 15840
cgcgagcctt gctgcgcagg gccaggcgca cgggacgcag ggccatgctc agggcggcca 15900
gacgcgcggc ttcaggcgcc agcgccggca ggacccggag acgcgcggcc acggcggcgg 15960
cagcggccat cgccagcatg tcccgcccgc ggcgagggaa cgtgtactgg gtgcgcgacg 16020
ccgccaccgg tgtgcgcgtg cccgtgcgca cccgcccccc tcgcacttga agatgttcac 16080
ttcgcgatgt tgatgtgtcc cagcggcgag gaggatgtcc aagcgcaaat tcaaggaaga 16140
gatgctccag gtcatcgcgc ctgagatcta cggccctgcg gtggtgaagg aggaaagaaa 16200
gccccgcaaa atcaagcggg tcaaaaagga caaaaaggaa gaagaaagtg atgtggacgg 16260
attggtggag tttgtgcgcg agttcgcccc ccggcggcgc gtgcagtggc gcgggcggaa 16320
ggtgcaaccg gtgctgagac ccggcaccac cgtggtcttc acgcccggcg agcgctccgg 16380
caccgcttcc aagcgctcct acgacgaggt gtacggggat gatgatattc tggagcaggc 16440
ggccgagcgc ctgggcgagt ttgcttacgg caagcgcagc cgttccgcac cgaaggaaga 16500
ggcggtgtcc atcccgctgg accacggcaa ccccacgccg agcctcaagc ccgtgacctt 16560
gcagcaggtg ctgccgaccg cggcgccgcg ccgggggttc aagcgcgagg gcgaggatct 16620
gtaccccacc atgcagctga tggtgcccaa gcgccagaag ctggaagacg tgctggagac 16680
catgaaggtg gacccggacg tgcagcccga ggtcaaggtg cggcccatca agcaggtggc 16740
cccgggcctg ggcgtgcaga ccgtggacat caagattccc acggagccca tggaaacgca 16800
gaccgagccc atgatcaagc ccagcaccag caccatggag gtgcagacgg atccctggat 16860
gccatcggct cctagtcgaa gaccccggcg caagtacggc gcggccagcc tgctgatgcc 16920
caactacgcg ctgcatcctt ccatcatccc cacgccgggc taccgcggca cgcgcttcta 16980
ccgcggtcat accagcagcc gccgccgcaa gaccaccact cgccgccgcc gtcgccgcac 17040
cgccgctgca accacccctg ccgccctggt gcggagagtg taccgccgcg gccgcgcacc 17100
tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc atttaaactt tcgccagctt 17160
tgcagatcaa tggccctcac atgccgcctt cgcgttccca ttacgggcta ccgaggaaga 17220
aaaccgcgcc gtagaaggct ggcggggaac gggatgcgtc gccaccacca ccggcggcgg 17280
cgcgccatca gcaagcggtt ggggggaggc ttcctgcccg cgctgatccc catcatcgcc 17340
gcggcgatcg gggcgatccc cggcattgct tccgtggcgg tgcaggcctc tcagcgccac 17400
tgagacacac ttggaaacat cttgtaataa acccatggac tctgacgctc ctggtcctgt 17460
gatgtgtttt cgtagacaga tggaagacat caatttttcg tccctggctc cgcgacacgg 17520
cacgcggccg ttcatgggca cctggagcga catcggcacc agccaactga acgggggcgc 17580
cttcaattgg agcagtctct ggagcgggct taagaatttc gggtccacgc ttaaaaccta 17640
tggcagcaag gcgtggaaca gcaccacagg gcaggcgctg agggataagc tgaaagagca 17700
gaacttccag cagaaggtgg tcgatgggct cgcctcgggc atcaacgggg tggtggacct 17760
ggccaaccag gccgtgcagc ggcagatcaa cagccgcctg gacccggtgc cgcccgccgg 17820
ctccgtggag atgccgcagg tggaggagga gctgcctccc ctggacaagc ggggcgagaa 17880
gcgaccccgc cccgatgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta 17940
cgaggaggcg gtgaaactgg gtctgcccac cacgcggccc atcgcgcccc tggccaccgg 18000
ggtgctgaaa cccgaaaagc ccgcgaccct ggacttgcct cctccccagc cttcccgccc 18060
ctctacagtg gctaagcccc tgccgccggt ggccgtggcc cgcgcgcgac ccgggggcac 18120
cgcccgccct catgcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca 18180
gagtgtgaag cgccgccgct gctattaaac ctaccgtagc gcttaacttg cttgtctgtg 18240
tgtgtatgta ttatgtcgcc gccgccgctg tccaccagaa ggaggagtga agaggcgcgt 18300
cgccgagttg caagatggcc accccatcga tgctgcccca gtgggcgtac atgcacatcg 18360
ccggacagga cgcttcggag tacctgagtc cgggtctggt gcagtttgcc cgcgccacag 18420
acacctactt cagtctgggg aacaagttta ggaaccccac ggtggcgccc acgcacgatg 18480
tgaccaccga ccgcagccag cggctgacgc tgcgcttcgt gcccgtggac cgcgaggaca 18540
acacctactc gtacaaagtg cgctacacgc tggccgtggg cgacaaccgc gtgctggaca 18600
tggccagcac ctactttgac atccgcggcg tgctggatcg gggccctagc ttcaaaccct 18660
actccggcac cgcctacaac agtctggccc ccaagggagc acccaacact tgtcagtgga 18720
catataaagc cgatggtgaa actgccacag aaaaaaccta tacatatgga aatgcacccg 18780
tgcagggcat taacatcaca aaagatggta ttcaacttgg aactgacacc gatgatcagc 18840
caatctacgc agataaaacc tatcagcctg aacctcaagt gggtgatgct gaatggcatg 18900
acatcactgg tactgatgaa aagtatggag gcagagctct taagcctgat accaaaatga 18960
agccttgtta tggttctttt gccaagccta ctaataaaga aggaggtcag gcaaatgtga 19020
aaacaggaac aggcactact aaagaatatg acatagacat ggctttcttt gacaacagaa 19080
gtgcggctgc tgctggccta gctccagaaa ttgttttgta tactgaaaat gtggatttgg 19140
aaactccaga tacccatatt gtatacaaag caggcacaga tgacagcagc tcttctatta 19200
atttgggtca gcaagccatg cccaacagac ctaactacat tggtttcaga gacaacttta 19260
tcgggctcat gtactacaac agcactggca atatgggggt gctggccggt caggcttctc 19320
agctgaatgc tgtggttgac ttgcaagaca gaaacaccga gctgtcctac cagctcttgc 19380
ttgactctct gggtgacaga acccggtatt tcagtatgtg gaatcaggcg gtggacagct 19440
atgatcctga tgtgcgcatt attgaaaatc atggtgtgga ggatgaactt cccaactatt 19500
gtttccctct ggatgctgtt ggcagaacag atacttatca gggaattaag gctaatggaa 19560
ctgatcaaac cacatggacc aaagatgaca gtgtcaatga tgctaatgag ataggcaagg 19620
gtaatccatt cgccatggaa atcaacatcc aagccaacct gtggaggaac ttcctctacg 19680
ccaacgtggc cctgtacctg cccgactctt acaagtacac gccggccaat gttaccctgc 19740
ccaccaacac caacacctac gattacatga acggccgggt ggtggcgccc tcgctggtgg 19800
actcctacat caacatcggg gcgcgctggt cgctggatcc catggacaac gtgaacccct 19860
tcaaccacca ccgcaatgcg gggctgcgct accgctccat gctcctgggc aacgggcgct 19920
acgtgccctt ccacatccag gtgccccaga aatttttcgc catcaagagc ctcctgctcc 19980
tgcccgggtc ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga 20040
gctccctcgg caacgacctg cgcacggacg gggcctccat ctccttcacc agcatcaacc 20100
tctacgccac cttcttcccc atggcgcaca acacggcctc cacgctcgag gccatgctgc 20160
gcaacgacac caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc 20220
ccatcccggc caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct 20280
tccgcggctg gtccttcacg cgtctcaaga ccaaggagac gccctcgctg ggctccgggt 20340
tcgaccccta cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca 20400
accacacctt caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg 20460
accggctcct gacgcccaac gagttcgaaa tcaagcgcac cgtcgacggc gagggctaca 20520
acgtggccca gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca 20580
acatcggcta ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct 20640
tccgcaactt ccagcccatg agccgccagg tggtggacga ggtcaactac aaggactacc 20700
aggccgtcac cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca 20760
ccatgcgcca gggccagccc taccccgcca actaccccta cccgctcatc ggcaagagcg 20820
ccgtcaccag cgtcacccag aaaaagttcc tctgcgacag ggtcatgtgg cgcatcccct 20880
tctccagcaa cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctatg 20940
ccaactccgc ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc 21000
ttctctatgt tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg 21060
tcatcgaggc cgtctacctg cgcaccccct tctcggccgg taacgccacc acctaagctc 21120
ttgcttcttg caagccatgg ccgcgggctc cggcgagcag gagctcaggg ccatcatccg 21180
cgacctgggc tgcgggccct acttcctggg caccttcgat aagcgcttcc cgggattcat 21240
ggccccgcac aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcga 21300
gcactggctg gccttcgcct ggaacccgcg ctcgaacacc tgctacctct tcgacccctt 21360
cgggttctcg gacgagcgcc tcaagcagat ctaccagttc gagtacgagg gcctgctgcg 21420
ccgcagcgcc ctggccaccg aggaccgctg cgtcaccctg gaaaagtcca cccagaccgt 21480
gcagggtccg cgctcggccg cctgcgggct cttctgctgc atgttcctgc acgccttcgt 21540
gcactggccc gaccgcccca tggacaagaa ccccaccatg aacttgctga cgggggtgcc 21600
caacggcatg ctccagtcgc cccaggtgga acccaccctg cgccgcaacc aggaggcgct 21660
ctaccgcttc ctcaactccc actccgccta ctttcgctcc caccgcgcgc gcatcgagaa 21720
ggccaccgcc ttcgaccgca tgaatcaaga catgtaaacc gtgtgtgtat gttaaatgtc 21780
tttaataaac agcactttca tgttacacat gcatctgaga tgatttattt agaaatcgaa 21840
agggttctgc cgggtctcgg catggcccgc gggcagggac acgttgcgga actggtactt 21900
ggccagccac ttgaactcgg ggatcagcag tttgggcagc ggggtgtcgg ggaaggagtc 21960
ggtccacagc ttccgcgtca gttgcagggc gcccagcagg tcgggcgcgg agatcttgaa 22020
atcgcagttg ggacccgcgt tctgcgcgcg ggagttgcgg tacacggggt tgcagcactg 22080
gaacaccatc agggccgggt gcttcacgct cgccagcacc gtcgcgtcgg tgatgctctc 22140
cacgtcgagg tcctcggcgt tggccatccc gaagggggtc atcttgcagg tctgccttcc 22200
catggtgggc acgcacccgg gcttgtggtt gcaatcgcag tgcaggggga tcagcatcat 22260
ctgggcctgg tcggcgttca tccccgggta catggccttc atgaaagcct ccaattgcct 22320
gaacgcctgc tgggccttgg ctccctcggt gaagaagacc ccgcaggact tgctagagaa 22380
ctggttggtg gcgcacccgg cgtcgtgcac gcagcagcgc gcgtcgttgt tggccagctg 22440
caccacgctg cgcccccagc ggttctgggt gatcttggcc cggtcggggt tctccttcag 22500
cgcgcgctgc ccgttctcgc tcgccacatc catctcgatc atgtgctcct tctggatcat 22560
ggtggtcccg tgcaggcacc gcagcttgcc ctcggcctcg gtgcacccgt gcagccacag 22620
cgcgcacccg gtgcactccc agttcttgtg ggcgatctgg gaatgcgcgt gcacgaagcc 22680
ctgcaggaag cggcccatca tggtggtcag ggtcttgttg ctagtgaagg tcagcggaat 22740
gccgcggtgc tcctcgttga tgtacaggtg gcagatgcgg cggtacacct cgccctgctc 22800
gggcatcagc tggaagttgg ctttcaggtc ggtctccacg cggtagcggt ccatcagcat 22860
agtcatgatt tccataccct tctcccaggc cgagacgatg ggcaggctca tagggttctt 22920
caccatcatc ttagcgctag cagccgcggc cagggggtcg ctctcgtcca gggtctcaaa 22980
gctccgcttg ccgtccttct cggtgatccg caccgggggg tagctgaagc ccacggccgc 23040
cagctcctcc tcggcctgtc tttcgtcctc gctgtcctgg ctgacgtcct gcaggaccac 23100
atgcttggtc ttgcggggtt tcttcttggg cggcagcggc ggcggagatg ttggagatgg 23160
cgagggggag cgcgagttct cgctcaccac tactatctct tcctcttctt ggtccgaggc 23220
cacgcggcgg taggtatgtc tcttcggggg cagaggcgga ggcgacgggc tctcgccgcc 23280
gcgacttggc ggatggctgg cagagcccct tccgcgttcg ggggtgcgct cccggcggcg 23340
ctctgactga cttcctccgc ggccggccat tgtgttctcc tagggaggaa caacaagcat 23400
ggagactcag ccatcgccaa cctcgccatc tgcccccacc gccgacgaga agcagcagca 23460
gcagaatgaa agcttaaccg ccccgccgcc cagccccgcc acctccgacg cggccgtccc 23520
agacatgcaa gagatggagg aatccatcga gattgacctg ggctatgtga cgcccgcgga 23580
gcacgaggag gagctggcag tgcgcttttc acaagaagag atacaccaag aacagccaga 23640
gcaggaagca gagaatgagc agagtcaggc tgggctcgag catgacggcg actacctcca 23700
cctgagcggg ggggaggacg cgctcatcaa gcatctggcc cggcaggcca ccatcgtcaa 23760
ggatgcgctg ctcgaccgca ccgaggtgcc cctcagcgtg gaggagctca gccgcgccta 23820
cgagttgaac ctcttctcgc cgcgcgtgcc ccccaagcgc cagcccaatg gcacctgcga 23880
gcccaacccg cgcctcaact tctacccggt cttcgcggtg cccgaggccc tggccaccta 23940
ccacatcttt ttcaagaacc aaaagatccc cgtctcctgc cgcgccaacc gcacccgcgc 24000
cgacgccctt ttcaacctgg gtcccggcgc ccgcctacct gatatcgcct ccttggaaga 24060
ggttcccaag atcttcgagg gtctgggcag cgacgagact cgggccgcga acgctctgca 24120
aggagaagga ggagagcatg agcaccacag cgccctggtc gagttggaag gcgacaacgc 24180
gcggctggcg gtgctcaaac gcacggtcga gctgacccat ttcgcctacc cggctctgaa 24240
cctgcccccc aaagtcatga gcgcggtcat ggaccaggtg ctcatcaagc gcgcgtcgcc 24300
catctccgag gacgagggca tgcaagactc cgaggagggc aagcccgtgg tcagcgacga 24360
gcagctggcc cggtggctgg gtcctaatgc tagtccccag agtttggaag agcggcgcaa 24420
actcatgatg gccgtggtcc tggtgaccgt ggagctggag tgcctgcgcc gcttcttcgc 24480
cgacgcggag accctgcgca aggtcgagga gaacctgcac tacctcttca ggcacgggtt 24540
cgtgcgccag gcctgcaaga tctccaacgt ggagctgacc aacctggtct cctacatggg 24600
catcttgcac gagaaccgcc tggggcagaa cgtgctgcac accaccctgc gcggggaggc 24660
ccggcgcgac tacatccgcg actgcgtcta cctctacctc tgccacacct ggcagacggg 24720
catgggcgtg tggcagcagt gtctggagga gcagaacctg aaagagctct gcaagctcct 24780
gcagaagaac ctcaagggtc tgtggaccgg gttcgacgag cgcaccaccg cctcggacct 24840
ggccgacctc attttccccg agcgcctcag gctgacgctg cgcaacggcc tgcccgactt 24900
tatgagccaa agcatgttgc aaaactttcg ctctttcatc ctcgaacgct ccggaatcct 24960
gcccgccacc tgctccgcgc tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc 25020
cccgccgctg tggagccact gctacctgct gcgcctggcc aactacctgg cctaccactc 25080
ggacgtgatc gaggacgtca gcggcgaggg cctgctcgag tgccactgcc gctgcaacct 25140
ctgcacgccg caccgctccc tggcctgcaa cccccagctg ctgagcgaga cccagatcat 25200
cggcaccttc gagttgcaag ggcccagcga aggcgagggt tcagccgcca aggggggtct 25260
gaaactcacc ccggggctgt ggacctcggc ctacttgcgc aagttcgtgc ccgaggacta 25320
ccatcccttc gagatcaggt tctacgagga ccaatcccat ccgcccaagg ccgagctgtc 25380
ggcctgcgtc atcacccagg gggcgatcct ggcccaattg caagccatcc agaaatcccg 25440
ccaagaattc ttgctgaaaa agggccgcgg ggtctacctc gacccccaga ccggtgagga 25500
gctcaacccc ggcttccccc aggatgcccc gaggaaacaa gaagctgaaa gtggagctgc 25560
cgcccgtgga ggatttggag gaagactggg agaacagcag tcaggcagag gaggaggaga 25620
tggaggaaga ctgggacagc actcaggcag aggaggacag cctgcaagac agtctggagg 25680
aagacgagga ggaggcagag gaggaggtgg aagaagcagc cgccgccaga ccgtcgtcct 25740
cggcggggga gaaagcaagc agcacggata ccatctccgc tccgggtcgg ggtcccgctc 25800
gaccacacag tagatgggac gagaccggac gattcccgaa ccccaccacc cagaccggta 25860
agaaggagcg gcagggatac aagtcctggc gggggcacaa aaacgccatc gtctcctgct 25920
tgcaggcctg cgggggcaac atctccttca cccggcgcta cctgctcttc caccgcgggg 25980
tgaactttcc ccgcaacatc ttgcattact accgtcacct ccacagcccc tactacttcc 26040
aagaagaggc agcagcagca gaaaaagacc agcagaaaac cagcagctag aaaatccaca 26100
gcggcggcag caggtggact gaggatcgcg gcgaacgagc cggcgcaaac ccgggagctg 26160
aggaaccgga tctttcccac cctctatgcc atcttccagc agagtcgggg gcaggagcag 26220
gaactgaaag tcaagaaccg ttctctgcgc tcgctcaccc gcagttgtct gtatcacaag 26280
agcgaagacc aacttcagcg cactctcgag gacgccgagg ctctcttcaa caagtactgc 26340
gcgctcactc ttaaagagta gcccgcgccc gcccagtcgc agaaaaaggc gggaattacg 26400
tcacctgtgc ccttcgccct agccgcctcc acccatcatc atgagcaaag agattcccac 26460
gccttacatg tggagctacc agccccagat gggcctggcc gccggtgccg cccaggacta 26520
ctccacccgc atgaattggc tcagcgccgg gcccgcgatg atctcacggg tgaatgacat 26580
ccgcgcccac cgaaaccaga tactcctaga acagtcagcg ctcaccgcca cgccccgcaa 26640
tcacctcaat ccgcgtaatt ggcccgccgc cctggtgtac caggaaattc cccagcccac 26700
gaccgtacta cttccgcgag acgcccaggc cgaagtccag ctgactaact caggtgtcca 26760
gctggcgggc ggcgccaccc tgtgtcgtca ccgccccgct cagggtataa agcggctggt 26820
gatccggggc agaggcacac agctcaacga cgaggtggtg agctcttcgc tgggtctgcg 26880
acctgacgga gtcttccaac tcgccggatc ggggagatct tccttcacgc ctcgtcaggc 26940
cgtcctgact ttggagagtt cgtcctcgca gccccgctcg ggtggcatcg gcactctcca 27000
gttcgtggag gagttcactc cctcggtcta cttcaacccc ttctccggct cccccggcca 27060
ctacccggac gagttcatcc cgaacttcga cgccatcagc gagtcggtgg acggctacga 27120
ttgaatgtcc catggtggcg cagctgacct agctcggctt cgacacctgg accactgccg 27180
ccgcttccgc tgcttcgctc gggatctcgc cgagtttgcc tactttgagc tgcccgagga 27240
gcaccctcag ggcccggccc acggagtgcg gatcgtcgtc gaagggggcc tcgactccca 27300
cctgcttcgg atcttcagcc agcgtccgat cctggtcgag cgcgagcaag gacagaccct 27360
tctgactctg tactgcatct gcaaccaccc cggcctgcat gaaagtcttt gttgtctgct 27420
gtgtactgag tataataaaa gctgagatca gcgactactc cggacttccg tgtgttcctg 27480
aatccatcaa ccagtctttg ttcttcaccg ggaacgagac cgagctccag ctccagtgta 27540
agccccacaa gaagtacctc acctggctgt tccagggctc cccgatcgcc gttgtcaacc 27600
actgcgacaa cgacggagtc ctgctgagcg gccctgccaa ccttactttt tccacccgca 27660
gaagcaagct ccagctcttc caacccttcc tccccgggac ctatcagtgc gtctcgggac 27720
cctgccatca caccttccac ctgatcccga ataccacagc gtcgctcccc gctactaaca 27780
accaaactaa cctccaccaa cgccaccgtc gcgacctttc tgaatctaat actaccaccc 27840
acaccggagg tgagctccga ggtcaaccaa cctctgggat ttactacggc ccctgggagg 27900
tggttgggtt aatagcgcta ggcctagttg cgggtgggct tttggttctc tgctacctat 27960
acctcccttg ctgttcgtac ttagtggtgc tgtgttgctg gtttaagaaa tggggaagat 28020
caccctagtg agctgcggtg cgctggtggc ggtgttgctt tcgattgtgg gactgggcgg 28080
tgcggctgta gtgaaggaga aggccgatcc ctgcttgcat ttcaatccca acaaatgcca 28140
gctgagtttt cagcccgatg gcaatcggtg cgcggtactg atcaagtgcg gatgggaatg 28200
cgagaacgtg agaatcgagt acaataacaa gactcggaac aatactctcg cgtccgtgtg 28260
gcagcccggg gaccccgagt ggtacaccgt ctctgtcccc ggtgctgacg gctccccgcg 28320
caccgtgaat aatactttca tttttgcgca catgtgcgac acggtcatgt ggatgagcaa 28380
gcagtacgat atgtggcccc ccacgaagga gaacatcgtg gtcttctcca tcgcttacag 28440
cctgtgcacg gcgctaatca ccgctatcgt gtgcctgagc attcacatgc tcatcgctat 28500
tcgccccaga aataatgccg aaaaagaaaa acagccataa cgtttttttt cacacctttt 28560
tcagaccatg gcctctgtta aatttttgct tttatttgcc agtctcattg ccgtcattca 28620
tggaatgagt aatgagaaaa ttactattta cactggcact aatcacacat tgaaaggtcc 28680
agaaaaagcc acagaagttt catggtattg ttattttaat gaatcagatg tatctactga 28740
actctgtgga aacaataaca aaaaaaatga gagcattact ctcatcaagt ttcaatgtgg 28800
atctgactta accctaatta acatcactag agactatgta ggtatgtatt atggaactac 28860
agcaggcatt tcggacatgg aattttatca agtttctgtg tctgaaccca ccacgcctag 28920
aatgaccaca accacaaaaa ctacacctgt taccactatg cagctcacta ccaataacat 28980
ttttgccatg cgtcaaatgg tcaacaatag cactcaaccc accccaccca gtgaggaaat 29040
tcccaaatcc atgattggca ttattgttgc tgtagtggtg tgcatgttga tcatcgcctt 29100
gtgcatggtg tactatgcct tctgctacag aaagcacaga ctgaacgaca agctggaaca 29160
cttactaagt gttgaatttt aattttttag aaccatgaag atcctaggcc ttttaatttt 29220
ttctatcatt acctctgctc tatgcaattc tgacaatgag gacgttactg tcgttgtcgg 29280
atcaaattat acactgaaag gtccagcgaa gggtatgctt tcgtggtatt gctattttgg 29340
atctgacact acagaaactg aattatgcaa tcttaagaat ggcaaaattc aaaattctaa 29400
aattaacaat tatatatgca atggtactga tctgatactc ctcaatatca cgaaatcata 29460
tgctggcagt tacacctgcc ctggagatga tgctgacagt atgatttttt acaaagtaac 29520
tgttgttgat cccactactc cacctccacc caccacaact actcacacca cacacacaga 29580
tcaaaccgca gcagaggagg cagcaaagtt agccttgcag gtccaagaca gttcatttgt 29640
tggcattacc cctacacctg atcagcggtg tccggggctg ctagtcagcg gcattgtcgg 29700
tgtgctttcg ggattagcag tcataatcat ctgcatgttc atttttgctt gctgctatag 29760
aaggctttac cgacaaaaat cagacccact gctgaacctc tatgtttaat tttttccaga 29820
gtcatgaagg cagttagcgc tctagttttt tgttctttga ttggcattgt tttttgcaat 29880
cctattccta aagttagctt tattaaagat gtgaatgtta ctgagggggg caatgtgaca 29940
ctggtaggtg tagagggtgc tgaaaacacc acctggacaa aataccacct caatgggtgg 30000
aaagatattt gcaattggag tgtattagtt tatacatgtg agggagttaa tcttaccatt 30060
gtcaatgcca cctcagctca aaatggtaga attcaaggac aaagtgtcag tgtatctaat 30120
gggtatttta cccaacatac ttttatctat gacgttaaag tcataccact gcctacgcct 30180
agcccaccta gcactaccac acagacaacc cacactacac agacaaccac atacagtaca 30240
ttaaatcagc ctaccaccac tacagcagca gaggttgcca gctcgtctgg ggtccgagtg 30300
gcatttttga tgtgggcccc atctagcagt cccactgcta gtaccaatga gcagactact 30360
gaatttttgt ccactgtcga gagccacacc acagctacct ccagtgcctt ctctagcacc 30420
gccaatctct cctcgctttc ctctacacca atcagtcccg ctactactcc tagccccgct 30480
cctcttccca ctcccctgaa gcaaacagac ggcggcatgc aatggcagat caccctgctc 30540
attgtgatcg ggttggtcat cctggccgtg ttgctctact acatcttctg ccgccgcatt 30600
cccaacgcgc accgcaagcc ggtctacaag cccatcattg tcgggcagcc ggagccgctt 30660
caggtggaag ggggtctaag gaatcttctc ttctctttta cagtatggtg attgaactat 30720
gattcctaga caattcttga tcactattct tatctgcctc ctccaagtct gtgccaccct 30780
cgctctggtg gccaacgcca gtccagactg tattgggccc ttcgcctcct acgtgctctt 30840
tgccttcacc acctgcatct gctgctgtag catagtctgc ctgcttatca ccttcttcca 30900
gttcattgac tggatctttg tgcgcatcgc ctacctgcgc caccaccccc agtaccgcga 30960
ccagcgagtg gcgcggctgc tcaggctcct ctgataagca tgcgggctct gctacttctc 31020
gcgcttctgc tgttagtgct cccccgtccc gtcgaccccc ggtcccccac ccagtccccc 31080
gaggaggtcc gcaaatgcaa attccaagaa ccctggaaat tcctcaaatg ctaccgccaa 31140
aaatcagaca tgcatcccag ctggatcatg atcattggga tcgtgaacat tctggcctgc 31200
accctcatct cctttgtgat ttacccctgc tttgactttg gttggaactc gccagaggcg 31260
ctctatctcc cgcctgaacc tgacacacca ccacagcaac ctcaggcaca cgcactacca 31320
ccactacagc ctaggccaca atacatgccc atattagact atgaggccga gccacagcga 31380
cccatgctcc ccgctattag ttacttcaat ctaaccggcg gagatgactg acccactggc 31440
caacaacaac gtcaacgacc ttctcctgga catggacggc cgcgcctcgg agcagcgact 31500
cgcccaactt cgcattcgcc agcagcagga gagagccgtc aaggagctgc aggatgcggt 31560
ggccatccac cagtgcaaga gaggcatctt ctgcctggtg aaacaggcca agatctccta 31620
cgaggtcact ccaaacgacc atcgcctctc ctacgagctc ctgcagcagc gccagaagtt 31680
cacctgcctg gtcggagtca accccatcgt catcacccag cagtctggcg ataccaaggg 31740
gtgcatccac tgctcctgcg actcccccga ctgcgtccac actctgatca agaccctctg 31800
cggcctccgc gacctcctcc ccatgaacta atcaccccct tatccagtga aataaagatc 31860
atattgatga tgattttaca gaaataaaaa ataatcattt gatttgaaat aaagatacaa 31920
tcatattgat gatttgagtt taacaaaaaa ataaagaatc acttacttga aatctgatac 31980
caggtctctg tccatgtttt ctgccaacac cacttcactc ccctcttccc agctctggta 32040
ctgcaggccc cggcgggctg caaacttcct ccacacgctg aaggggatgt caaattcctc 32100
ctgtccctca atcttcattt tatcttctat cagatgtcca aaaagcgcgt ccgggtggat 32160
gatgacttcg accccgtcta cccctacgat gcagacaacg caccgaccgt gcccttcatc 32220
aaccccccct tcgtctcttc agatggattc caagagaagc ccctgggggt gttgtccctg 32280
cgactggccg accccgtcac caccaagaac ggggaaatca ccctcaagct gggagagggg 32340
gtggacctcg attcctcggg aaaactcatc tccaacacgg ccaccaaggc cgccgcccct 32400
ctcagttttt ccaacaacac catttccctt aacatggatc acccctttta cactaaagat 32460
ggaaaattat ccttacaagt ttctccacca ttaaatatac tgagaacaag cattctaaac 32520
acactagctt taggttttgg atcaggttta ggactccgtg gctctgcctt ggcagtacag 32580
ttagtctctc cacttacatt tgatactgat ggaaacataa agcttacctt agacagaggt 32640
ttgcatgtta caacaggaga tgcaattgaa agcaacataa gctgggctaa aggtttaaaa 32700
tttgaagatg gagccatagc aaccaacatt ggaaatgggt tagagtttgg aagcagtagt 32760
acagaaacag gtgttgatga tgcttaccca atccaagtta aacttggatc tggccttagc 32820
tttgacagta caggagccat aatggctggt aacaaagaag acgataaact cactttgtgg 32880
acaacacctg atccatcacc aaactgtcaa atactcgcag aaaatgatgc aaaactaaca 32940
ctttgcttga ctaaatgtgg tagtcaaata ctggccactg tgtcagtctt agttgtagga 33000
agtggaaacc taaaccccat tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt 33060
gatgcaaacg gtgttctttt aacagaacat tctacactaa aaaaatactg ggggtatagg 33120
cagggagata gcatagatgg cactccatat accaatgctg taggattcat gcccaattta 33180
aaagcttatc caaagtcaca aagttctact actaaaaata atatagtagg gcaagtatac 33240
atgaatggag atgtttcaaa acctatgctt ctcactataa ccctcaatgg tactgatgac 33300
agcaacagta catattcaat gtcattttca tacacctgga ctaatggaag ctatgttgga 33360
gcaacatttg gggctaactc ttataccttc tcatacatcg cccaagaatg aacactgtat 33420
cccaccctgc atgccaaccc ttcccacccc actctgtgga acaaactctg aaacacaaaa 33480
taaaataaag ttcaagtgtt ttattgattc aacagtttta caggattcga gcagttattt 33540
ttcctccacc ctcccaggac atggaataca ccaccctctc cccccgcaca gccttgaaca 33600
tctgaatgcc attggtgatg gacatgcttt tggtctccac gttccacaca gtttcagagc 33660
gagccagtct cgggtcggtc agggagatga aaccctccgg gcactcccgc atctgcacct 33720
cacagctcaa cagctgagga ttgtcctcgg tggtcgggat cacggttatc tggaagaagc 33780
agaagagcgg cggtgggaat catagtccgc gaacgggatc ggccggtggt gtcgcatcag 33840
gccccgcagc agtcgctgcc gccgccgctc cgtcaagctg ctgctcaggg ggtccgggtc 33900
cagggactcc ctcagcatga tgcccacggc cctcagcatc agtcgtctgg tgcggcgggc 33960
gcagcagcgc atgcggatct cgctcaggtc gctgcagtac gtgcaacaca gaaccaccag 34020
gttgttcaac agtccatagt tcaacacgct ccagccgaaa ctcatcgcgg gaaggatgct 34080
acccacgtgg ccgtcgtacc agatcctcag gtaaatcaag tggtgccccc tccagaacac 34140
gctgcccacg tacatgatct ccttgggcat gtggcggttc accacctccc ggtaccacat 34200
caccctctgg ttgaacatgc agccccggat gatcctgcgg aaccacaggg ccagcaccgc 34260
cccgcccgcc atgcagcgaa gagaccccgg gtcccggcaa tggcaatgga ggacccaccg 34320
ctcgtacccg tggatcatct gggagctgaa caagtctatg ttggcacagc acaggcatat 34380
gctcatgcat ctcttcagca ctctcaactc ctcgggggtc aaaaccatat cccagggcac 34440
ggggaactct tgcaggacag cgaaccccgc agaacagggc aatcctcgca cagaacttac 34500
attgtgcatg gacagggtat cgcaatcagg cagcaccggg tgatcctcca ccagagaagc 34560
gcgggtctcg gtctcctcac agcgtggtaa gggggccggc cgatacgggt gatggcggga 34620
cgcggctgat cgtgttcgcg accgtgtcat gatgcagttg ctttcggaca ttttcgtact 34680
tgctgtagca gaacctggtc cgggcgctgc acaccgatcg ccggcggcgg tctcggcgct 34740
tggaacgctc ggtgttgaaa ttgtaaaaca gccactctct cagaccgtgc agcagatcta 34800
gggcctcagg agtgatgaag atcccatcat gcctgatggc tctgatcaca tcgaccaccg 34860
tggaatgggc cagacccagc cagatgatgc aattttgttg ggtttcggtg acggcggggg 34920
agggaagaac aggaagaacc atgattaact tttaatccaa acggtctcgg agtacttcaa 34980
aatgaagatc gcggagatgg cacctctcgc ccccgctgtg ttggtggaaa ataacagcca 35040
ggtcaaaggt gatacggttc tcgagatgtt ccacggtggc ttccagcaaa gcctccacgc 35100
gcacatccag aaacaagaca atagcgaaag cgggagggtt ctctaattcc tcaatcatca 35160
tgttacactc ctgcaccatc cccagataat tttcattttt ccagccttga atgattcgaa 35220
ctagttcgtg aggtaaatcc aagccagcca tgataaagag ctcgcgcaga gcgccctcca 35280
ccggcattct taagcacacc ctcataattc caagatattc tgctcctggt tcacctgcag 35340
cagattgaca agcggaatat caaaatctct gccgcgatcc ctgagctcct ccctcagcaa 35400
taactgtaag tactctttca tatcctctcc gaaattttta gccataggac caccaggaat 35460
aagattaggg caagccacag tacagataaa ccgaagtcct ccccagtgag cattgccaaa 35520
tgcaagactg ctataagcat gctggctaga cccggtgata tcttccagat aactggacag 35580
aaaatcgccc aggcaatttt taagaaaatc aacaaaagaa aaatcctcca ggtggacgtt 35640
tagagcctcg ggaacaacga tgaagtaaat gcaagcggtg cgttccagca tggttagtta 35700
gctgatctgt agaaaaaaca aaaatgaaca ttaaaccatg ctagcctggc gaacaggtgg 35760
gtaaatcgtt ctctccagca ccaggcaggc cacggggtct ccggcgcgac cctcgtaaaa 35820
attgtcgcta tgattgaaaa ccatcacaga gagacgttcc cggtggccgg cgtgaatgat 35880
tcgacaagat gaatacaccc ccggaacatt ggcgtccgcg agtgaaaaaa agcgcccgag 35940
gaagcaataa ggcactacaa tgctcagtct caagtccagc aaagcgatgc catgcggatg 36000
aagcacaaaa ttctcaggtg cgtacaaaat gtaattactc ccctcctgca caggcagcaa 36060
agcccccgat ccctccaggt acacatacaa agcctcagcg tccatagctt accgagcagc 36120
agcacacaac aggcgcaaga gtcagagaaa ggctgagctc taacctgtcc acccgctctc 36180
tgctcaatat atagcccaga tctacactga cgtaaaggcc aaagtctaaa aatacccgcc 36240
aaataatcac acacgcccag cacacgccca gaaaccggtg acacactcaa aaaaatacgc 36300
gcacttcctc aaacgcccaa aactgccgtc atttccgggt tcccacgcta cgtcatcaaa 36360
acacgacttt caaattccgt cgaccgttaa aaacgtcacc cgccccgccc ctaacggtcg 36420
cccgtctctc agccaatcag cgccccgcat ccccaaattc aaacacctca tttgcatatt 36480
aacgcgcaca aaaagtttga ggtatattat tgatgatgg 36519
<210> 58
<211> 34819
<212> ДНК
<213> Искуственная последовательность
<220>
<223> Синтетическая конструкция
<400> 58
ttaattaacc atcttcaata atatacctca aactttttgt gcgcgttaat atgcaaatga 60
ggcgtttgaa tttggggagg aagggcggtg attggtcgag ggatgagcga ccgttagggg 120
cggggcgagt gacgttttga tgacgtggtt gcgaggagga gccagtttgc aagttctcgt 180
gggaaaagtg acgtcaaacg aggtgtggtt tgaacacgga aatactcaat tttcccgcgc 240
tctctgacag gaaatgaggt gtttctgggc ggatgcaagt gaaaacgggc cattttcgcg 300
cgaaaactga atgaggaagt gaaaatctga gtaatttcgc gtttatggca gggaggagta 360
tttgccgagg gccgagtaga ctttgaccga ttacgtgggg gtttcgatta ccgtgttttt 420
cacctaaatt tccgcgtacg gtgtcaaagt ccggtgtttt tactactgta atagtaatca 480
attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 540
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 600
gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 660
taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac 720
gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt 780
cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 840
cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 900
attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 960
aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 1020
agcagagctg tccctatcag tgatagagat ctccctatca gtgatagaga gtttagtgaa 1080
ccgtcagatc cgctagggta ccaacatggc tagcatcgtc ggagggtggg agtgcgaaaa 1140
gcactcacag ccatggcagg tcctggtcgc ctcgcgcgga cgcgccgtgt gtggaggtgt 1200
gctggtccac ccgcagtggg tgttgactgc ggcccattgc atcagaaata agtccgtgat 1260
cctcttgggg agacattccc tgtttcaccc cgaagatact ggacaggtgt tccaagtgag 1320
ccactccttc ccgcatccac tgtacgacat gagcctgctg aagaaccgct ttctgcggcc 1380
aggggacgac tcatcacacg atttgatgct gcttcggctc tcggaaccgg ccgagctcac 1440
cgacgcagtg aaggtcatgg acctccctac gcaagagcct gctctcggta ccacttgtta 1500
cgcatcggga tggggctcca tcgagccgga agaattcctg accccgaaaa agctgcagtg 1560
cgtggatctg cacgtgattt cgaatgacgt gtgcgcgcaa gtgcatccac aaaaggtcac 1620
taagttcatg ctgtgcgccg gaaggtggac cggcggaaaa tcgacctgtt ccggcgacag 1680
cggaggccca ctcgtgtgca acggtgtgct gcagggcatc actagctggg gatcagaacc 1740
gtgcgcgctt ccggagcggc cctcgctcta cacgaaggtg gtgcactacc gcaaatggat 1800
taaagatacc atcgtcgcaa accctggatc cgaaggtagg ggttcattat tgacctgtgg 1860
agatgtcgaa gaaaacccag gacccgctag caaagcagtg ctgctggcgc tcctgatggc 1920
tggactcgcg ctgcagcctg gaaccgccct gctctgttac tcgtgcaagg cccaagtctc 1980
gaatgaggac tgtttgcaag tggaaaactg cacccagctc ggagaacaat gctggactgc 2040
acggatccgc gctgtcggcc tgctgaccgt gatctccaaa gggtgctcat tgaactgcgt 2100
ggacgatagc caggactact acgtgggaaa gaagaatatc acttgttgcg acacggatct 2160
ttgcaacgcg tccggagcgc acgccctgca gccagcagcc gccattctgg ccctgcttcc 2220
ggccctgggg ttgctgctct ggggtccggg ccagctcgga tcccagaccc tgaactttga 2280
tctgctgaaa ctggcaggcg atgtggaaag caacccaggc ccaatggcta gcgctcgcag 2340
accgcggtgg ctgtgtgcag gggcgctcgt cctggcgggt ggcttctttt tgctcggctt 2400
tcttttcgga tggttcatca aatcgtcaaa cgaagctacc aatatcaccc cgaagcacaa 2460
catgaaggcc tttctggatg agctgaaggc tgagaacatt aagaagttcc tctacaactt 2520
cacccagatc ccacatttgg cgggcactga gcagaacttt cagttggcta agcagatcca 2580
gagccagtgg aaggaattcg gcctggactc cgtcgagctg gcgcattacg atgtgctgct 2640
gagctaccct aataagactc atccgaacta tatctcgatt atcaatgagg acggaaacga 2700
aatctttaac acgtccctct tcgagccgcc accgcctgga tacgagaacg tgtcagatat 2760
cgtgcctccg ttctcggcct tctcgcccca gggaatgccc gaaggggacc tggtgtacgt 2820
gaactacgca aggaccgagg acttcttcaa gttggagcgg gatatgaaga tcaattgcag 2880
cggaaagatc gtcatcgccc gctacggcaa agtgttccgc ggcaacaagg tgaagaatgc 2940
acagttggca ggcgccaagg gcgtcatcct ctactcggat cctgccgact acttcgctcc 3000
tggcgtgaaa tcctaccctg atggttggaa tctgccagga ggaggggtgc agaggggaaa 3060
tatcctgaac ctgaacggtg ccggtgaccc acttactccg ggttacccgg ccaacgaata 3120
cgcgtacagg cggggtatcg cggaagccgt cggactgccg tccatcccgg tccatccgat 3180
tggttactac gacgcccaga agctcctcga aaagatggga ggcagcgccc ctccggactc 3240
gtcatggaga ggctcgctga aggtgccata caacgtggga cccggattca ctggaaattt 3300
cagcactcaa aaagtgaaga tgcacattca ctccactaac gaagtcacca ggatctacaa 3360
cgtcatcgga accctccggg gagcggtgga accggaccgc tacgtgatcc tcggtggaca 3420
ccgggatagc tgggtgttcg gaggaatcga tcctcaatcg ggcgcagccg tcgtccatga 3480
aatcgtcagg tcctttggta ctcttaagaa ggagggctgg cgccctagac gcactattct 3540
gttcgcctcg tgggatgccg aagaatttgg tctgctcggc agcaccgaat gggctgagga 3600
aaactcccgc ctgctccaag aacgcggagt ggcgtacatc aatgccgact catccatcga 3660
aggaaactac acgctgcggg tggactgcac tccactgatg tactcgctcg tgcacaacct 3720
gaccaaagaa ctcaaatccc cagacgaagg attcgaggga aaatcgctgt acgagtcgtg 3780
gaccaagaag agcccatccc cggagttcag cgggatgccg cggatctcaa agctcggatc 3840
aggaaatgat ttcgaagtgt tctttcagag gctgggaatt gcgtcgggaa gggctcggta 3900
cacgaaaaac tgggaaacta acaagttctc gggatacccg ctgtaccact cggtgtatga 3960
aacttacgaa ctggtggaga aattctacga tcctatgttt aagtaccacc tgactgtggc 4020
ccaagtgaga ggcggaatgg tgttcgagtt ggccaattca attgtgctgc cattcgattg 4080
ccgcgactac gccgtggtgc tgagaaagta cgcagacaaa atctactcaa tcagcatgaa 4140
gcacccacaa gagatgaaaa cctactcagt ctccttcgac tccctcttct ccgcggtgaa 4200
gaacttcacc gagatcgcga gcaaattctc ggagcgcctt caagattttg acaaatccaa 4260
tccgatcgtc ctccgcatga tgaatgacca gctcatgttt ctcgaacggg ccttcatcga 4320
tccactggga cttccggacc ggccgtttta ccgccacgtg atctacgcgc cctcgtcgca 4380
taacaagtat gctggagaga gcttcccggg tatctacgac gcattgttcg acattgagtc 4440
caaggtggat ccgtccaaag cctggggtga agtgaagcgc caaatctacg tggcggcctt 4500
taccgtccag gcggcagcag aaaccttgag cgaggtggct tgactcgagc ctaagcttct 4560
agataagata tccgatccac cggatctaga taactgatca taatcagcca taccacattt 4620
gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa 4680
atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc 4740
aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg 4800
tccaaactca tcaatgtatc ttatatgctg gccaccgtac atgtggcttc ccatgctcgc 4860
aagccctggc ccgagttcga gcacaatgtc atgaccaggt gcaatatgca tctggggtcc 4920
cgccgaggca tgttcatgcc ctaccagtgc aacctgaatt atgtgaaggt gctgctggag 4980
cccgatgcca tgtccagagt gagcctgacg ggggtgtttg acatgaatgt ggaggtgtgg 5040
aagattctga gatatgatga atccaagacc aggtgccgag cctgcgagtg cggagggaag 5100
catgccaggt tccagcccgt gtgtgtggat gtgacggagg acctgcgacc cgatcatttg 5160
gtgttgccct gcaccgggac ggagttcggt tccagcgggg aagaatctga ctagagtgag 5220
tagtgttctg gggcggggga ggacctgcat gagggccaga ataactgaaa tctgtgcttt 5280
tctgtgtgtt gcagcagcat gagcggaagc ggctcctttg agggaggggt attcagccct 5340
tatctgacgg ggcgtctccc ctcctgggcg ggagtgcgtc agaatgtgat gggatccacg 5400
gtggacggcc ggcccgtgca gcccgcgaac tcttcaaccc tgacctatgc aaccctgagc 5460
tcttcgtcgt tggacgcagc tgccgccgca gctgctgcat ctgccgccag cgccgtgcgc 5520
ggaatggcca tgggcgccgg ctactacggc actctggtgg ccaactcgag ttccaccaat 5580
aatcccgcca gcctgaacga ggagaagctg ttgctgctga tggcccagct cgaggccttg 5640
acccagcgcc tgggcgagct gacccagcag gtggctcagc tgcaggagca gacgcgggcc 5700
gcggttgcca cggtgaaatc caaataaaaa atgaatcaat aaataaacgg agacggttgt 5760
tgattttaac acagagtctg aatctttatt tgatttttcg cgcgcggtag gccctggacc 5820
accggtctcg atcattgagc acccggtgga tcttttccag gacccggtag aggtgggctt 5880
ggatgttgag gtacatgggc atgagcccgt cccgggggtg gaggtagctc cattgcaggg 5940
cctcgtgctc gggggtggtg ttgtaaatca cccagtcata gcaggggcgc agggcatggt 6000
gttgcacaat atctttgagg aggagactga tggccacggg cagccctttg gtgtaggtgt 6060
ttacaaatct gttgagctgg gagggatgca tgcgggggga gatgaggtgc atcttggcct 6120
ggatcttgag attggcgatg ttaccgccca gatcccgcct ggggttcatg ttgtgcagga 6180
ccaccagcac ggtgtatccg gtgcacttgg ggaatttatc atgcaacttg gaagggaagg 6240
cgtgaaagaa tttggcgacg cctttgtgcc cgcccaggtt ttccatgcac tcatccatga 6300
tgatggcgat gggcccgtgg gcggcggcct gggcaaagac gtttcggggg tcggacacat 6360
catagttgtg gtcctgggtg aggtcatcat aggccatttt aatgaatttg gggcggaggg 6420
tgccggactg ggggacaaag gtaccctcga tcccgggggc gtagttcccc tcacagatct 6480
gcatctccca ggctttgagc tcggaggggg ggatcatgtc cacctgcggg gcgataaaga 6540
acacggtttc cggggcgggg gagatgagct gggccgaaag caagttccgg agcagctggg 6600
acttgccgca gccggtgggg ccgtagatga ccccgatgac cggctgcagg tggtagttga 6660
gggagagaca gctgccgtcc tcccggagga ggggggccac ctcgttcatc atctcgcgca 6720
cgtgcatgtt ctcgcgcacc agttccgcca ggaggcgctc tccccccagg gataggagct 6780
cctggagcga ggcgaagttt ttcagcggct tgagtccgtc ggccatgggc attttggaga 6840
gggtttgttg caagagttcc aggcggtccc agagctcggt gatgtgctct acggcatctc 6900
gatccagcag acctcctcgt ttcgcgggtt gggacggctg cgggagtagg gcaccagacg 6960
atgggcgtcc agcgcagcca gggtccggtc cttccagggt cgcagcgtcc gcgtcagggt 7020
ggtctccgtc acggtgaagg ggtgcgcgcc gggctgggcg cttgcgaggg tgcgcttcag 7080
gctcatccgg ctggtcgaaa accgctcccg atcggcgccc tgcgcgtcgg ccaggtagca 7140
attgaccatg agttcgtagt tgagcgcctc ggccgcgtgg cctttggcgc ggagcttacc 7200
tttggaagtc tgcccgcagg cgggacagag gagggacttg agggcgtaga gcttgggggc 7260
gaggaagacg gactcggggg cgtaggcgtc cgcgccgcag tgggcgcaga cggtctcgca 7320
ctccacgagc caggtgaggt cgggctggtc ggggtcaaaa accagtttcc cgccgttctt 7380
tttgatgcgt ttcttacctt tggtctccat gagctcgtgt ccccgctggg tgacaaagag 7440
gctgtccgtg tccccgtaga ccgactttat gggccggtcc tcgagcggtg tgccgcggtc 7500
ctcctcgtag aggaaccccg cccactccga gacgaaagcc cgggtccagg ccagcacgaa 7560
ggaggccacg tgggacgggt agcggtcgtt gtccaccagc gggtccacct tttccagggt 7620
atgcaaacac atgtccccct cgtccacatc caggaaggtg attggcttgt aagtgtaggc 7680
cacgtgaccg ggggtcccgg ccgggggggt ataaaagggt gcgggtccct gctcgtcctc 7740
actgtcttcc ggatcgctgt ccaggagcgc cagctgttgg ggtaggtatt ccctctcgaa 7800
ggcgggcatg acctcggcac tcaggttgtc agtttctaga aacgaggagg atttgatatt 7860
gacggtgccg gcggagatgc ctttcaagag cccctcgtcc atctggtcag aaaagacgat 7920
ctttttgttg tcgagcttgg tggcgaagga gccgtagagg gcgttggaga ggagcttggc 7980
gatggagcgc atggtctggt ttttttcctt gtcggcgcgc tccttggcgg cgatgttgag 8040
ctgcacgtac tcgcgcgcca cgcacttcca ttcggggaag acggtggtca gctcgtcggg 8100
cacgattctg acctgccagc cccgattatg cagggtgatg aggtccacac tggtggccac 8160
ctcgccgcgc aggggctcat tagtccagca gaggcgtccg cccttgcgcg agcagaaggg 8220
gggcaggggg tccagcatga cctcgtcggg ggggtcggca tcgatggtga agatgccggg 8280
caggaggtcg gggtcaaagt agctgatgga agtggccaga tcgtccaggg cagcttgcca 8340
ttcgcgcacg gccagcgcgc gctcgtaggg actgaggggc gtgccccagg gcatgggatg 8400
ggtaagcgcg gaggcgtaca tgccgcagat gtcgtagacg tagaggggct cctcgaggat 8460
gccgatgtag gtggggtagc agcgcccccc gcggatgctg gcgcgcacgt agtcatacag 8520
ctcgtgcgag ggggcgagga gccccgggcc caggttggtg cgactgggct tttcggcgcg 8580
gtagacgatc tggcggaaaa tggcatgcga gttggaggag atggtgggcc tttggaagat 8640
gttgaagtgg gcgtggggca gtccgaccga gtcgcggatg aagtgggcgt aggagtcttg 8700
cagcttggcg acgagctcgg cggtgactag gacgtccaga gcgcagtagt cgagggtctc 8760
ctggatgatg tcatacttga gctgtccctt ttgtttccac agctcgcggt tgagaaggaa 8820
ctcttcgcgg tccttccagt actcttcgag ggggaacccg tcctgatctg cacggtaaga 8880
gcctagcatg tagaactggt tgacggcctt gtaggcgcag cagcccttct ccacggggag 8940
ggcgtaggcc tgggcggcct tgcgcaggga ggtgtgcgtg agggcgaaag tgtccctgac 9000
catgaccttg aggaactggt gcttgaagtc gatatcgtcg cagcccccct gctcccagag 9060
ctggaagtcc gtgcgcttct tgtaggcggg gttgggcaaa gcgaaagtaa catcgttgaa 9120
gaggatcttg cccgcgcggg gcataaagtt gcgagtgatg cggaaaggtt ggggcacctc 9180
ggcccggttg ttgatgacct gggcggcgag cacgatctcg tcgaagccgt tgatgttgtg 9240
gcccacgatg tagagttcca cgaatcgcgg acggcccttg acgtggggca gtttcttgag 9300
ctcctcgtag gtgagctcgt cggggtcgct gagcccgtgc tgctcgagcg cccagtcggc 9360
gagatggggg ttggcgcgga ggaaggaagt ccagagatcc acggccaggg cggtttgcag 9420
acggtcccgg tactgacgga actgctgccc gacggccatt ttttcggggg tgacgcagta 9480
gaaggtgcgg gggtccccgt gccagcgatc ccatttgagc tggagggcga gatcgagggc 9540
gagctcgacg agccggtcgt ccccggagag tttcatgacc agcatgaagg ggacgagctg 9600
cttgccgaag gaccccatcc aggtgtaggt ttccacatcg taggtgagga agagcctttc 9660
ggtgcgagga tgcgagccga tggggaagaa ctggatctcc tgccaccaat tggaggaatg 9720
gctgttgatg tgatggaagt agaaatgccg acggcgcgcc gaacactcgt gcttgtgttt 9780
atacaagcgg ccacagtgct cgcaacgctg cacgggatgc acgtgctgca cgagctgtac 9840
ctgagttcct ttgacgagga atttcagtgg gaagtggagt cgtggcgcct gcatctcgtg 9900
ctgtactacg tcgtggtggt cggcctggcc ctcttctgcc tcgatggtgg tcatgctgac 9960
gagcccgcgc gggaggcagg tccagacctc ggcgcgagcg ggtcggagag cgaggacgag 10020
ggcgcgcagg ccggagctgt ccagggtcct gagacgctgc ggagtcaggt cagtgggcag 10080
cggcggcgcg cggttgactt gcaggagttt ttccagggcg cgcgggaggt ccagatggta 10140
cttgatctcc accgcgccat tggtggcgac gtcgatggct tgcagggtcc cgtgcccctg 10200
gggtgtgacc accgtccccc gtttcttctt gggcggctgg ggcgacgggg gcggtgcctc 10260
ttccatggtt agaagcggcg gcgaggacgc gcgccgggcg gcaggggcgg ctcggggccc 10320
ggaggcaggg gcggcagggg cacgtcggcg ccgcgcgcgg gtaggttctg gtactgcgcc 10380
cggagaagac tggcgtgagc gacgacgcga cggttgacgt cctggatctg acgcctctgg 10440
gtgaaggcca cgggacccgt gagtttgaac ctgaaagaga gttcgacaga atcaatctcg 10500
gtatcgttga cggcggcctg ccgcaggatc tcttgcacgt cgcccgagtt gtcctggtag 10560
gcgatctcgg tcatgaactg ctcgatctcc tcctcttgaa ggtctccgcg gccggcgcgc 10620
tccacggtgg ccgcgaggtc gttggagatg cggcccatga gctgcgagaa ggcgttcatg 10680
cccgcctcgt tccagacgcg gctgtagacc acgacgccct cgggatcgcg ggcgcgcatg 10740
accacctggg cgaggttgag ctccacgtgg cgcgtgaaga ccgcgtagtt gcagaggcgc 10800
tggtagaggt agttgagcgt ggtggcgatg tgctcggtga cgaagaaata catgatccag 10860
cggcggagcg gcatctcgct gacgtcgccc agcgcctcca aacgttccat ggcctcgtaa 10920
aagtccacgg cgaagttgaa aaactgggag ttgcgcgccg agacggtcaa ctcctcctcc 10980
agaagacgga tgagctcggc gatggtggcg cgcacctcgc gctcgaaggc ccccgggagt 11040
tcctccactt cctcttcttc ctcctccact aacatctctt ctacttcctc ctcaggcggc 11100
agtggtggcg ggggaggggg cctgcgtcgc cggcggcgca cgggcagacg gtcgatgaag 11160
cgctcgatgg tctcgccgcg ccggcgtcgc atggtctcgg tgacggcgcg cccgtcctcg 11220
cggggccgca gcgtgaagac gccgccgcgc atctccaggt ggccgggggg gtccccgttg 11280
ggcagggaga gggcgctgac gatgcatctt atcaattgcc ccgtagggac tccgcgcaag 11340
gacctgagcg tctcgagatc cacgggatct gaaaaccgct gaacgaaggc ttcgagccag 11400
tcgcagtcgc aaggtaggct gagcacggtt tcttctggcg ggtcatgttg gttgggagcg 11460
gggcgggcga tgctgctggt gatgaagttg aaataggcgg ttctgagacg gcggatggtg 11520
gcgaggagca ccaggtcttt gggcccggct tgctggatgc gcagacggtc ggccatgccc 11580
caggcgtggt cctgacacct ggccaggtcc ttgtagtagt cctgcatgag ccgctccacg 11640
ggcacctcct cctcgcccgc gcggccgtgc atgcgcgtga gcccgaagcc gcgctggggc 11700
tggacgagcg ccaggtcggc gacgacgcgc tcggcgagga tggcttgctg gatctgggtg 11760
agggtggtct ggaagtcatc aaagtcgacg aagcggtggt aggctccggt gttgatggtg 11820
taggagcagt tggccatgac ggaccagttg acggtctggt ggcccggacg cacgagctcg 11880
tggtacttga ggcgcgagta ggcgcgcgtg tcgaagatgt agtcgttgca ggtgcgcacc 11940
aggtactggt agccgatgag gaagtgcggc ggcggctggc ggtagagcgg ccatcgctcg 12000
gtggcggggg cgccgggcgc gaggtcctcg agcatggtgc ggtggtagcc gtagatgtac 12060
ctggacatcc aggtgatgcc ggcggcggtg gtggaggcgc gcgggaactc gcggacgcgg 12120
ttccagatgt tgcgcagcgg caggaagtag ttcatggtgg gcacggtctg gcccgtgagg 12180
cgcgcgcagt cgtggatgct ctatacgggc aaaaacgaaa gcggtcagcg gctcgactcc 12240
gtggcctgga ggctaagcga acgggttggg ctgcgcgtgt accccggttc gaatctcgaa 12300
tcaggctgga gccgcagcta acgtggtatt ggcactcccg tctcgaccca agcctgcacc 12360
aaccctccag gatacggagg cgggtcgttt tgcaactttt ttttggaggc cggatgagac 12420
tagtaagcgc ggaaagcggc cgaccgcgat ggctcgctgc cgtagtctgg agaagaatcg 12480
ccagggttgc gttgcggtgt gccccggttc gaggccggcc ggattccgcg gctaacgagg 12540
gcgtggctgc cccgtcgttt ccaagacccc atagccagcc gacttctcca gttacggagc 12600
gagcccctct tttgttttgt ttgtttttgc cagatgcatc ccgtactgcg gcagatgcgc 12660
ccccaccacc ctccaccgca acaacagccc cctccacagc cggcgcttct gcccccgccc 12720
cagcagcaac ttccagccac gaccgccgcg gccgccgtga gcggggctgg acagagttat 12780
gatcaccagc tggccttgga agagggcgag gggctggcgc gcctgggggc gtcgtcgccg 12840
gagcggcacc cgcgcgtgca gatgaaaagg gacgctcgcg aggcctacgt gcccaagcag 12900
aacctgttca gagacaggag cggcgaggag cccgaggaga tgcgcgcggc ccggttccac 12960
gcggggcggg agctgcggcg cggcctggac cgaaagaggg tgctgaggga cgaggatttc 13020
gaggcggacg agctgacggg gatcagcccc gcgcgcgcgc acgtggccgc ggccaacctg 13080
gtcacggcgt acgagcagac cgtgaaggag gagagcaact tccaaaaatc cttcaacaac 13140
cacgtgcgca ccctgatcgc gcgcgaggag gtgaccctgg gcctgatgca cctgtgggac 13200
ctgctggagg ccatcgtgca gaaccccacc agcaagccgc tgacggcgca gctgttcctg 13260
gtggtgcagc atagtcggga caacgaagcg ttcagggagg cgctgctgaa tatcaccgag 13320
cccgagggcc gctggctcct ggacctggtg aacattctgc agagcatcgt ggtgcaggag 13380
cgcgggctgc cgctgtccga gaagctggcg gccatcaact tctcggtgct gagtttgggc 13440
aagtactacg ctaggaagat ctacaagacc ccgtacgtgc ccatagacaa ggaggtgaag 13500
atcgacgggt tttacatgcg catgaccctg aaagtgctga ccctgagcga cgatctgggg 13560
gtgtaccgca acgacaggat gcaccgtgcg gtgagcgcca gcaggcggcg cgagctgagc 13620
gaccaggagc tgatgcatag tctgcagcgg gccctgaccg gggccgggac cgagggggag 13680
agctactttg acatgggcgc ggacctgcac tggcagccca gccgccgggc cttggaggcg 13740
gcggcaggac cctacgtaga agaggtggac gatgaggtgg acgaggaggg cgagtacctg 13800
gaagactgat ggcgcgaccg tatttttgct agatgcaaca acaacagcca cctcctgatc 13860
ccgcgatgcg ggcggcgctg cagagccagc cgtccggcat taactcctcg gacgattgga 13920
cccaggccat gcaacgcatc atggcgctga cgacccgcaa ccccgaagcc tttagacagc 13980
agccccaggc caaccggctc tcggccatcc tggaggccgt ggtgccctcg cgctccaacc 14040
ccacgcacga gaaggtcctg gccatcgtga acgcgctggt ggagaacaag gccatccgcg 14100
gcgacgaggc cggcctggtg tacaacgcgc tgctggagcg cgtggcccgc tacaacagca 14160
ccaacgtgca gaccaacctg gaccgcatgg tgaccgacgt gcgcgaggcc gtggcccagc 14220
gcgagcggtt ccaccgcgag tccaacctgg gatccatggt ggcgctgaac gccttcctca 14280
gcacccagcc cgccaacgtg ccccggggcc aggaggacta caccaacttc atcagcgccc 14340
tgcgcctgat ggtgaccgag gtgccccaga gcgaggtgta ccagtccggg ccggactact 14400
tcttccagac cagtcgccag ggcttgcaga ccgtgaacct gagccaggct ttcaagaact 14460
tgcagggcct gtggggcgtg caggccccgg tcggggaccg cgcgacggtg tcgagcctgc 14520
tgacgccgaa ctcgcgcctg ctgctgctgc tggtggcccc cttcacggac agcggcagca 14580
tcaaccgcaa ctcgtacctg ggctacctga ttaacctgta ccgcgaggcc atcggccagg 14640
cgcacgtgga cgagcagacc taccaggaga tcacccacgt gagccgcgcc ctgggccagg 14700
acgacccggg caacctggaa gccaccctga actttttgct gaccaaccgg tcgcagaaga 14760
tcccgcccca gtacgcgctc agcaccgagg aggagcgcat cctgcgttac gtgcagcaga 14820
gcgtgggcct gttcctgatg caggaggggg ccacccccag cgccgcgctc gacatgaccg 14880
cgcgcaacat ggagcccagc atgtacgcca gcaaccgccc gttcatcaat aaactgatgg 14940
actacttgca tcgggcggcc gccatgaact ctgactattt caccaacgcc atcctgaatc 15000
cccactggct cccgccgccg gggttctaca cgggcgagta cgacatgccc gaccccaatg 15060
acgggttcct gtgggacgat gtggacagca gcgtgttctc cccccgaccg ggtgctaacg 15120
agcgcccctt gtggaagaag gaaggcagcg accgacgccc gtcctcggcg ctgtccggcc 15180
gcgagggtgc tgccgcggcg gtgcccgagg ccgccagtcc tttcccgagc ttgcccttct 15240
cgctgaacag tatccgcagc agcgagctgg gcaggatcac gcgcccgcgc ttgctgggcg 15300
aagaggagta cttgaatgac tcgctgttga gacccgagcg ggagaagaac ttccccaata 15360
acgggataga aagcctggtg gacaagatga gccgctggaa gacgtatgcg caggagcaca 15420
gggacgatcc ccgggcgtcg cagggggcca cgagccgggg cagcgccgcc cgtaaacgcc 15480
ggtggcacga caggcagcgg ggacagatgt gggacgatga ggactccgcc gacgacagca 15540
gcgtgttgga cttgggtggg agtggtaacc cgttcgctca cctgcgcccc cgtatcgggc 15600
gcatgatgta agagaaaccg aaaataaatg atactcacca aggccatggc gaccagcgtg 15660
cgttcgtttc ttctctgttg ttgttgtatc tagtatgatg aggcgtgcgt acccggaggg 15720
tcctcctccc tcgtacgaga gcgtgatgca gcaggcgatg gcggcggcgg cgatgcagcc 15780
cccgctggag gctccttacg tgcccccgcg gtacctggcg cctacggagg ggcggaacag 15840
cattcgttac tcggagctgg cacccttgta cgataccacc cggttgtacc tggtggacaa 15900
caagtcggcg gacatcgcct cgctgaacta ccagaacgac cacagcaact tcctgaccac 15960
cgtggtgcag aacaatgact tcacccccac ggaggccagc acccagacca tcaactttga 16020
cgagcgctcg cggtggggcg gccagctgaa aaccatcatg cacaccaaca tgcccaacgt 16080
gaacgagttc atgtacagca acaagttcaa ggcgcgggtg atggtctccc gcaagacccc 16140
caatggggtg acagtgacag aggattatga tggtagtcag gatgagctga agtatgaatg 16200
ggtggaattt gagctgcccg aaggcaactt ctcggtgacc atgaccatcg acctgatgaa 16260
caacgccatc atcgacaatt acttggcggt ggggcggcag aacggggtgc tggagagcga 16320
catcggcgtg aagttcgaca ctaggaactt caggctgggc tgggaccccg tgaccgagct 16380
ggtcatgccc ggggtgtaca ccaacgaggc tttccatccc gatattgtct tgctgcccgg 16440
ctgcggggtg gacttcaccg agagccgcct cagcaacctg ctgggcattc gcaagaggca 16500
gcccttccag gaaggcttcc agatcatgta cgaggatctg gaggggggca acatccccgc 16560
gctcctggat gtcgacgcct atgagaaaag caaggaggat gcagcagctg aagcaactgc 16620
agccgtagct accgcctcta ccgaggtcag gggcgataat tttgcaagcg ccgcagcagt 16680
ggcagcggcc gaggcggctg aaaccgaaag taagatagtc attcagccgg tggagaagga 16740
tagcaagaac aggagctaca acgtactacc ggacaagata aacaccgcct accgcagctg 16800
gtacctagcc tacaactatg gcgaccccga gaagggcgtg cgctcctgga cgctgctcac 16860
cacctcggac gtcacctgcg gcgtggagca agtctactgg tcgctgcccg acatgatgca 16920
agacccggtc accttccgct ccacgcgtca agttagcaac tacccggtgg tgggcgccga 16980
gctcctgccc gtctactcca agagcttctt caacgagcag gccgtctact cgcagcagct 17040
gcgcgccttc acctcgctta cgcacgtctt caaccgcttc cccgagaacc agatcctcgt 17100
ccgcccgccc gcgcccacca ttaccaccgt cagtgaaaac gttcctgctc tcacagatca 17160
cgggaccctg ccgctgcgca gcagtatccg gggagtccag cgcgtgaccg ttactgacgc 17220
cagacgccgc acctgcccct acgtctacaa ggccctgggc atagtcgcgc cgcgcgtcct 17280
ctcgagccgc accttctaaa tgtccattct catctcgccc agtaataaca ccggttgggg 17340
cctgcgcgcg cccagcaaga tgtacggagg cgctcgccaa cgctccacgc aacaccccgt 17400
gcgcgtgcgc gggcacttcc gcgctccctg gggcgccctc aagggccgcg tgcggtcgcg 17460
caccaccgtc gacgacgtga tcgaccaggt ggtggccgac gcgcgcaact acacccccgc 17520
cgccgcgccc gtctccaccg tggacgccgt catcgacagc gtggtggccg acgcgcgccg 17580
gtacgcccgc gccaagagcc ggcggcggcg catcgcccgg cggcaccgga gcacccccgc 17640
catgcgcgcg gcgcgagcct tgctgcgcag ggccaggcgc acgggacgca gggccatgct 17700
cagggcggcc agacgcgcgg cttcaggcgc cagcgccggc aggacccgga gacgcgcggc 17760
cacggcggcg gcagcggcca tcgccagcat gtcccgcccg cggcgaggga acgtgtactg 17820
ggtgcgcgac gccgccaccg gtgtgcgcgt gcccgtgcgc acccgccccc ctcgcacttg 17880
aagatgttca cttcgcgatg ttgatgtgtc ccagcggcga ggaggatgtc caagcgcaaa 17940
ttcaaggaag agatgctcca ggtcatcgcg cctgagatct acggccctgc ggtggtgaag 18000
gaggaaagaa agccccgcaa aatcaagcgg gtcaaaaagg acaaaaagga agaagaaagt 18060
gatgtggacg gattggtgga gtttgtgcgc gagttcgccc cccggcggcg cgtgcagtgg 18120
cgcgggcgga aggtgcaacc ggtgctgaga cccggcacca ccgtggtctt cacgcccggc 18180
gagcgctccg gcaccgcttc caagcgctcc tacgacgagg tgtacgggga tgatgatatt 18240
ctggagcagg cggccgagcg cctgggcgag tttgcttacg gcaagcgcag ccgttccgca 18300
ccgaaggaag aggcggtgtc catcccgctg gaccacggca accccacgcc gagcctcaag 18360
cccgtgacct tgcagcaggt gctgccgacc gcggcgccgc gccgggggtt caagcgcgag 18420
ggcgaggatc tgtaccccac catgcagctg atggtgccca agcgccagaa gctggaagac 18480
gtgctggaga ccatgaaggt ggacccggac gtgcagcccg aggtcaaggt gcggcccatc 18540
aagcaggtgg ccccgggcct gggcgtgcag accgtggaca tcaagattcc cacggagccc 18600
atggaaacgc agaccgagcc catgatcaag cccagcacca gcaccatgga ggtgcagacg 18660
gatccctgga tgccatcggc tcctagtcga agaccccggc gcaagtacgg cgcggccagc 18720
ctgctgatgc ccaactacgc gctgcatcct tccatcatcc ccacgccggg ctaccgcggc 18780
acgcgcttct accgcggtca taccagcagc cgccgccgca agaccaccac tcgccgccgc 18840
cgtcgccgca ccgccgctgc aaccacccct gccgccctgg tgcggagagt gtaccgccgc 18900
ggccgcgcac ctctgaccct gccgcgcgcg cgctaccacc cgagcatcgc catttaaact 18960
ttcgcctgct ttgcagatca atggccctca catgccgcct tcgcgttccc attacgggct 19020
accgaggaag aaaaccgcgc cgtagaaggc tggcggggaa cgggatgcgt cgccaccacc 19080
accggcggcg gcgcgccatc agcaagcggt tggggggagg cttcctgccc gcgctgatcc 19140
ccatcatcgc cgcggcgatc ggggcgatcc ccggcattgc ttccgtggcg gtgcaggcct 19200
ctcagcgcca ctgagacaca cttggaaaca tcttgtaata aaccaatgga ctctgacgct 19260
cctggtcctg tgatgtgttt tcgtagacag atggaagaca tcaatttttc gtccctggct 19320
ccgcgacacg gcacgcggcc gttcatgggc acctggagcg acatcggcac cagccaactg 19380
aacgggggcg ccttcaattg gagcagtctc tggagcgggc ttaagaattt cgggtccacg 19440
cttaaaacct atggcagcaa ggcgtggaac agcaccacag ggcaggcgct gagggataag 19500
ctgaaagagc agaacttcca gcagaaggtg gtcgatgggc tcgcctcggg catcaacggg 19560
gtggtggacc tggccaacca ggccgtgcag cggcagatca acagccgcct ggacccggtg 19620
ccgcccgccg gctccgtgga gatgccgcag gtggaggagg agctgcctcc cctggacaag 19680
cggggcgaga agcgaccccg ccccgatgcg gaggagacgc tgctgacgca cacggacgag 19740
ccgcccccgt acgaggaggc ggtgaaactg ggtctgccca ccacgcggcc catcgcgccc 19800
ctggccaccg gggtgctgaa acccgaaaag cccgcgaccc tggacttgcc tcctccccag 19860
ccttcccgcc cctctacagt ggctaagccc ctgccgccgg tggccgtggc ccgcgcgcga 19920
cccgggggca ccgcccgccc tcatgcgaac tggcagagca ctctgaacag catcgtgggt 19980
ctgggagtgc agagtgtgaa gcgccgccgc tgctattaaa cctaccgtag cgcttaactt 20040
gcttgtctgt gtgtgtatgt attatgtcgc cgccgccgct gtccaccaga aggaggagtg 20100
aagaggcgcg tcgccgagtt gcaagatggc caccccatcg atgctgcccc agtgggcgta 20160
catgcacatc gccggacagg acgcttcgga gtacctgagt ccgggtctgg tgcagtttgc 20220
ccgcgccaca gacacctact tcagtctggg gaacaagttt aggaacccca cggtggcgcc 20280
cacgcacgat gtgaccaccg accgcagcca gcggctgacg ctgcgcttcg tgcccgtgga 20340
ccgcgaggac aacacctact cgtacaaagt gcgctacacg ctggccgtgg gcgacaaccg 20400
cgtgctggac atggccagca cctactttga catccgcggc gtgctggatc ggggccctag 20460
cttcaaaccc tactccggca ccgcctacaa cagtctggcc cccaagggag cacccaacac 20520
ttgtcagtgg acatataaag ccgatggtga aactgccaca gaaaaaacct atacatatgg 20580
aaatgcaccc gtgcagggca ttaacatcac aaaagatggt attcaacttg gaactgacac 20640
cgatgatcag ccaatctacg cagataaaac ctatcagcct gaacctcaag tgggtgatgc 20700
tgaatggcat gacatcactg gtactgatga aaagtatgga ggcagagctc ttaagcctga 20760
taccaaaatg aagccttgtt atggttcttt tgccaagcct actaataaag aaggaggtca 20820
ggcaaatgtg aaaacaggaa caggcactac taaagaatat gacatagaca tggctttctt 20880
tgacaacaga agtgcggctg ctgctggcct agctccagaa attgttttgt atactgaaaa 20940
tgtggatttg gaaactccag atacccatat tgtatacaaa gcaggcacag atgacagcag 21000
ctcttctatt aatttgggtc agcaagccat gcccaacaga cctaactaca ttggtttcag 21060
agacaacttt atcgggctca tgtactacaa cagcactggc aatatggggg tgctggccgg 21120
tcaggcttct cagctgaatg ctgtggttga cttgcaagac agaaacaccg agctgtccta 21180
ccagctcttg cttgactctc tgggtgacag aacccggtat ttcagtatgt ggaatcaggc 21240
ggtggacagc tatgatcctg atgtgcgcat tattgaaaat catggtgtgg aggatgaact 21300
tcccaactat tgtttccctc tggatgctgt tggcagaaca gatacttatc agggaattaa 21360
ggctaatgga actgatcaaa ccacatggac caaagatgac agtgtcaatg atgctaatga 21420
gataggcaag ggtaatccat tcgccatgga aatcaacatc caagccaacc tgtggaggaa 21480
cttcctctac gccaacgtgg ccctgtacct gcccgactct tacaagtaca cgccggccaa 21540
tgttaccctg cccaccaaca ccaacaccta cgattacatg aacggccggg tggtggcgcc 21600
ctcgctggtg gactcctaca tcaacatcgg ggcgcgctgg tcgctggatc ccatggacaa 21660
cgtgaacccc ttcaaccacc accgcaatgc ggggctgcgc taccgctcca tgctcctggg 21720
caacgggcgc tacgtgccct tccacatcca ggtgccccag aaatttttcg ccatcaagag 21780
cctcctgctc ctgcccgggt cctacaccta cgagtggaac ttccgcaagg acgtcaacat 21840
gatcctgcag agctccctcg gcaacgacct gcgcacggac ggggcctcca tctccttcac 21900
cagcatcaac ctctacgcca ccttcttccc catggcgcac aacacggcct ccacgctcga 21960
ggccatgctg cgcaacgaca ccaacgacca gtccttcaac gactacctct cggcggccaa 22020
catgctctac cccatcccgg ccaacgccac caacgtgccc atctccatcc cctcgcgcaa 22080
ctgggccgcc ttccgcggct ggtccttcac gcgtctcaag accaaggaga cgccctcgct 22140
gggctccggg ttcgacccct acttcgtcta ctcgggctcc atcccctacc tcgacggcac 22200
cttctacctc aaccacacct tcaagaaggt ctccatcacc ttcgactcct ccgtcagctg 22260
gcccggcaac gaccggctcc tgacgcccaa cgagttcgaa atcaagcgca ccgtcgacgg 22320
cgagggctac aacgtggccc agtgcaacat gaccaaggac tggttcctgg tccagatgct 22380
ggcccactac aacatcggct accagggctt ctacgtgccc gagggctaca aggaccgcat 22440
gtactccttc ttccgcaact tccagcccat gagccgccag gtggtggacg aggtcaacta 22500
caaggactac caggccgtca ccctggccta ccagcacaac aactcgggct tcgtcggcta 22560
cctcgcgccc accatgcgcc agggccagcc ctaccccgcc aactacccct acccgctcat 22620
cggcaagagc gccgtcacca gcgtcaccca gaaaaagttc ctctgcgaca gggtcatgtg 22680
gcgcatcccc ttctccagca acttcatgtc catgggcgcg ctcaccgacc tcggccagaa 22740
catgctctat gccaactccg cccacgcgct agacatgaat ttcgaagtcg accccatgga 22800
tgagtccacc cttctctatg ttgtcttcga agtcttcgac gtcgtccgag tgcaccagcc 22860
ccaccgcggc gtcatcgagg ccgtctacct gcgcaccccc ttctcggccg gtaacgccac 22920
cacctaagct cttgcttctt gcaagccatg gccgcgggct ccggcgagca ggagctcagg 22980
gccatcatcc gcgacctggg ctgcgggccc tacttcctgg gcaccttcga taagcgcttc 23040
ccgggattca tggccccgca caagctggcc tgcgccatcg tcaacacggc cggccgcgag 23100
accgggggcg agcactggct ggccttcgcc tggaacccgc gctcgaacac ctgctacctc 23160
ttcgacccct tcgggttctc ggacgagcgc ctcaagcaga tctaccagtt cgagtacgag 23220
ggcctgctgc gccgcagcgc cctggccacc gaggaccgct gcgtcaccct ggaaaagtcc 23280
acccagaccg tgcagggtcc gcgctcggcc gcctgcgggc tcttctgctg catgttcctg 23340
cacgccttcg tgcactggcc cgaccgcccc atggacaaga accccaccat gaacttgctg 23400
acgggggtgc ccaacggcat gctccagtcg ccccaggtgg aacccaccct gcgccgcaac 23460
caggaggcgc tctaccgctt cctcaactcc cactccgcct actttcgctc ccaccgcgcg 23520
cgcatcgaga aggccaccgc cttcgaccgc atgaatcaag acatgtaaac cgtgtgtgta 23580
tgttaaatgt ctttaataaa cagcactttc atgttacaca tgcatctgag atgatttatt 23640
tagaaatcga aagggttctg ccgggtctcg gcatggcccg cgggcaggga cacgttgcgg 23700
aactggtact tggccagcca cttgaactcg gggatcagca gtttgggcag cggggtgtcg 23760
gggaaggagt cggtccacag cttccgcgtc agttgcaggg cgcccagcag gtcgggcgcg 23820
gagatcttga aatcgcagtt gggacccgcg ttctgcgcgc gggagttgcg gtacacgggg 23880
ttgcagcact ggaacaccat cagggccggg tgcttcacgc tcgccagcac cgtcgcgtcg 23940
gtgatgctct ccacgtcgag gtcctcggcg ttggccatcc cgaagggggt catcttgcag 24000
gtctgccttc ccatggtggg cacgcacccg ggcttgtggt tgcaatcgca gtgcaggggg 24060
atcagcatca tctgggcctg gtcggcgttc atccccgggt acatggcctt catgaaagcc 24120
tccaattgcc tgaacgcctg ctgggccttg gctccctcgg tgaagaagac cccgcaggac 24180
ttgctagaga actggttggt ggcgcacccg gcgtcgtgca cgcagcagcg cgcgtcgttg 24240
ttggccagct gcaccacgct gcgcccccag cggttctggg tgatcttggc ccggtcgggg 24300
ttctccttca gcgcgcgctg cccgttctcg ctcgccacat ccatctcgat catgtgctcc 24360
ttctggatca tggtggtccc gtgcaggcac cgcagcttgc cctcggcctc ggtgcacccg 24420
tgcagccaca gcgcgcaccc ggtgcactcc cagttcttgt gggcgatctg ggaatgcgcg 24480
tgcacgaagc cctgcaggaa gcggcccatc atggtggtca gggtcttgtt gctagtgaag 24540
gtcagcggaa tgccgcggtg ctcctcgttg atgtacaggt ggcagatgcg gcggtacacc 24600
tcgccctgct cgggcatcag ctggaagttg gctttcaggt cggtctccac gcggtagcgg 24660
tccatcagca tagtcatgat ttccataccc ttctcccagg ccgagacgat gggcaggctc 24720
atagggttct tcaccatcat cttagcgcta gcagccgcgg ccagggggtc gctctcgtcc 24780
agggtctcaa agctccgctt gccgtccttc tcggtgatcc gcaccggggg gtagctgaag 24840
cccacggccg ccagctcctc ctcggcctgt ctttcgtcct cgctgtcctg gctgacgtcc 24900
tgcaggacca catgcttggt cttgcggggt ttcttcttgg gcggcagcgg cggcggagat 24960
gttggagatg gcgaggggga gcgcgagttc tcgctcacca ctactatctc ttcctcttct 25020
tggtccgagg ccacgcggcg gtaggtatgt ctcttcgggg gcagaggcgg aggcgacggg 25080
ctctcgccgc cgcgacttgg cggatggctg gcagagcccc ttccgcgttc gggggtgcgc 25140
tcccggcggc gctctgactg acttcctccg cggccggcca ttgtgttctc ctagggagga 25200
acaacaagca tggagactca gccatcgcca acctcgccat ctgcccccac cgccgacgag 25260
aagcagcagc agcagaatga aagcttaacc gccccgccgc ccagccccgc cacctccgac 25320
gcggccgtcc cagacatgca agagatggag gaatccatcg agattgacct gggctatgtg 25380
acgcccgcgg agcacgagga ggagctggca gtgcgctttt cacaagaaga gatacaccaa 25440
gaacagccag agcaggaagc agagaatgag cagagtcagg ctgggctcga gcatgacggc 25500
gactacctcc acctgagcgg gggggaggac gcgctcatca agcatctggc ccggcaggcc 25560
accatcgtca aggatgcgct gctcgaccgc accgaggtgc ccctcagcgt ggaggagctc 25620
agccgcgcct acgagttgaa cctcttctcg ccgcgcgtgc cccccaagcg ccagcccaat 25680
ggcacctgcg agcccaaccc gcgcctcaac ttctacccgg tcttcgcggt gcccgaggcc 25740
ctggccacct accacatctt tttcaagaac caaaagatcc ccgtctcctg ccgcgccaac 25800
cgcacccgcg ccgacgccct tttcaacctg ggtcccggcg cccgcctacc tgatatcgcc 25860
tccttggaag aggttcccaa gatcttcgag ggtctgggca gcgacgagac tcgggccgcg 25920
aacgctctgc aaggagaagg aggagagcat gagcaccaca gcgccctggt cgagttggaa 25980
ggcgacaacg cgcggctggc ggtgctcaaa cgcacggtcg agctgaccca tttcgcctac 26040
ccggctctga acctgccccc caaagtcatg agcgcggtca tggaccaggt gctcatcaag 26100
cgcgcgtcgc ccatctccga ggacgagggc atgcaagact ccgaggaggg caagcccgtg 26160
gtcagcgacg agcagctggc ccggtggctg ggtcctaatg ctagtcccca gagtttggaa 26220
gagcggcgca aactcatgat ggccgtggtc ctggtgaccg tggagctgga gtgcctgcgc 26280
cgcttcttcg ccgacgcgga gaccctgcgc aaggtcgagg agaacctgca ctacctcttc 26340
aggcacgggt tcgtgcgcca ggcctgcaag atctccaacg tggagctgac caacctggtc 26400
tcctacatgg gcatcttgca cgagaaccgc ctggggcaga acgtgctgca caccaccctg 26460
cgcggggagg cccggcgcga ctacatccgc gactgcgtct acctctacct ctgccacacc 26520
tggcagacgg gcatgggcgt gtggcagcag tgtctggagg agcagaacct gaaagagctc 26580
tgcaagctcc tgcagaagaa cctcaagggt ctgtggaccg ggttcgacga gcgcaccacc 26640
gcctcggacc tggccgacct cattttcccc gagcgcctca ggctgacgct gcgcaacggc 26700
ctgcccgact ttatgagcca aagcatgttg caaaactttc gctctttcat cctcgaacgc 26760
tccggaatcc tgcccgccac ctgctccgcg ctgccctcgg acttcgtgcc gctgaccttc 26820
cgcgagtgcc ccccgccgct gtggagccac tgctacctgc tgcgcctggc caactacctg 26880
gcctaccact cggacgtgat cgaggacgtc agcggcgagg gcctgctcga gtgccactgc 26940
cgctgcaacc tctgcacgcc gcaccgctcc ctggcctgca acccccagct gctgagcgag 27000
acccagatca tcggcacctt cgagttgcaa gggcccagcg aaggcgaggg ttcagccgcc 27060
aaggggggtc tgaaactcac cccggggctg tggacctcgg cctacttgcg caagttcgtg 27120
cccgaggact accatccctt cgagatcagg ttctacgagg accaatccca tccgcccaag 27180
gccgagctgt cggcctgcgt catcacccag ggggcgatcc tggcccaatt gcaagccatc 27240
cagaaatccc gccaagaatt cttgctgaaa aagggccgcg gggtctacct cgacccccag 27300
accggtgagg agctcaaccc cggcttcccc caggatgccc cgaggaaaca agaagctgaa 27360
agtggagctg ccgcccgtgg aggatttgga ggaagactgg gagaacagca gtcaggcaga 27420
ggaggaggag atggaggaag actgggacag cactcaggca gaggaggaca gcctgcaaga 27480
cagtctggag gaagacgagg aggaggcaga ggaggaggtg gaagaagcag ccgccgccag 27540
accgtcgtcc tcggcggggg agaaagcaag cagcacggat accatctccg ctccgggtcg 27600
gggtcccgct cgaccacaca gtagatggga cgagaccgga cgattcccga accccaccac 27660
ccagaccggt aagaaggagc ggcagggata caagtcctgg cgggggcaca aaaacgccat 27720
cgtctcctgc ttgcaggcct gcgggggcaa catctccttc acccggcgct acctgctctt 27780
ccaccgcggg gtgaactttc cccgcaacat cttgcattac taccgtcacc tccacagccc 27840
ctactacttc caagaagagg cagcagcagc agaaaaagac cagcagaaaa ccagcagcta 27900
gaaaatccac agcggcggca gcaggtggac tgaggatcgc ggcgaacgag ccggcgcaaa 27960
cccgggagct gaggaaccgg atctttccca ccctctatgc catcttccag cagagtcggg 28020
ggcaggagca ggaactgaaa gtcaagaacc gttctctgcg ctcgctcacc cgcagttgtc 28080
tgtatcacaa gagcgaagac caacttcagc gcactctcga ggacgccgag gctctcttca 28140
acaagtactg cgcgctcact cttaaagagt agcccgcgcc cgcccagtcg cagaaaaagg 28200
cgggaattac gtcacctgtg cccttcgccc tagccgcctc cacccatcat catgagcaaa 28260
gagattccca cgccttacat gtggagctac cagccccaga tgggcctggc cgccggtgcc 28320
gcccaggact actccacccg catgaattgg ctcagcgccg ggcccgcgat gatctcacgg 28380
gtgaatgaca tccgcgccca ccgaaaccag atactcctag aacagtcagc gctcaccgcc 28440
acgccccgca atcacctcaa tccgcgtaat tggcccgccg ccctggtgta ccaggaaatt 28500
ccccagccca cgaccgtact acttccgcga gacgcccagg ccgaagtcca gctgactaac 28560
tcaggtgtcc agctggcggg cggcgccacc ctgtgtcgtc accgccccgc tcagggtata 28620
aagcggctgg tgatccgggg cagaggcaca cagctcaacg acgaggtggt gagctcttcg 28680
ctgggtctgc gacctgacgg agtcttccaa ctcgccggat cggggagatc ttccttcacg 28740
cctcgtcagg ccgtcctgac tttggagagt tcgtcctcgc agccccgctc gggtggcatc 28800
ggcactctcc agttcgtgga ggagttcact ccctcggtct acttcaaccc cttctccggc 28860
tcccccggcc actacccgga cgagttcatc ccgaacttcg acgccatcag cgagtcggtg 28920
gacggctacg attgaatgtc ccatggtggc gcagctgacc tagctcggct tcgacacctg 28980
gaccactgcc gccgcttccg ctgcttcgct cgggatctcg ccgagtttgc ctactttgag 29040
ctgcccgagg agcaccctca gggcccggcc cacggagtgc ggatcgtcgt cgaagggggc 29100
ctcgactccc acctgcttcg gatcttcagc cagcgtccga tcctggtcga gcgcgagcaa 29160
ggacagaccc ttctgactct gtactgcatc tgcaaccacc ccggcctgca tgaaagtctt 29220
tgttgtctgc tgtgtactga gtataataaa agctgagatc agcgactact ccggacttcc 29280
gtgtgttcct gaatccatca accagtcttt gttcttcacc gggaacgaga ccgagctcca 29340
gctccagtgt aagccccaca agaagtacct cacctggctg ttccagggct ccccgatcgc 29400
cgttgtcaac cactgcgaca acgacggagt cctgctgagc ggccctgcca accttacttt 29460
ttccacccgc agaagcaagc tccagctctt ccaacccttc ctccccggga cctatcagtg 29520
cgtctcggga ccctgccatc acaccttcca cctgatcccg aataccacag cgtcgctccc 29580
cgctactaac aaccaaacta acctccacca acgccaccgt cgctaggcca caatacatgc 29640
ccatattaga ctatgaggcc gagccacagc gacccatgct ccccgctatt agttacttca 29700
atctaaccgg cggagatgac tgacccactg gccaacaaca acgtcaacga ccttctcctg 29760
gacatggacg gccgcgcctc ggagcagcga ctcgcccaac ttcgcattcg ccagcagcag 29820
gagagagccg tcaaggagct gcaggatgcg gtggccatcc accagtgcaa gagaggcatc 29880
ttctgcctgg tgaaacaggc caagatctcc tacgaggtca ctccaaacga ccatcgcctc 29940
tcctacgagc tcctgcagca gcgccagaag ttcacctgcc tggtcggagt caaccccatc 30000
gtcatcaccc agcagtctgg cgataccaag gggtgcatcc actgctcctg cgactccccc 30060
gactgcgtcc acactctgat caagaccctc tgcggcctcc gcgacctcct ccccatgaac 30120
taatcacccc cttatccagt gaaataaaga tcatattgat gatgatttta cagaaataaa 30180
aaataatcat ttgatttgaa ataaagatac aatcatattg atgatttgag tttaacaaaa 30240
aaataaagaa tcacttactt gaaatctgat accaggtctc tgtccatgtt ttctgccaac 30300
accacttcac tcccctcttc ccagctctgg tactgcaggc cccggcgggc tgcaaacttc 30360
ctccacacgc tgaaggggat gtcaaattcc tcctgtccct caatcttcat tttatcttct 30420
atcagatgtc caaaaagcgc gtccgggtgg atgatgactt cgaccccgtc tacccctacg 30480
atgcagacaa cgcaccgacc gtgcccttca tcaacccccc cttcgtctct tcagatggat 30540
tccaagagaa gcccctgggg gtgttgtccc tgcgactggc cgaccccgtc accaccaaga 30600
acggggaaat caccctcaag ctgggagagg gggtggacct cgattcctcg ggaaaactca 30660
tctccaacac ggccaccaag gccgccgccc ctctcagttt ttccaacaac accatttccc 30720
ttaacatgga tcaccccttt tacactaaag atggaaaatt atccttacaa gtttctccac 30780
cattaaatat actgagaaca agcattctaa acacactagc tttaggtttt ggatcaggtt 30840
taggactccg tggctctgcc ttggcagtac agttagtctc tccacttaca tttgatactg 30900
atggaaacat aaagcttacc ttagacagag gtttgcatgt tacaacagga gatgcaattg 30960
aaagcaacat aagctgggct aaaggtttaa aatttgaaga tggagccata gcaaccaaca 31020
ttggaaatgg gttagagttt ggaagcagta gtacagaaac aggtgttgat gatgcttacc 31080
caatccaagt taaacttgga tctggcctta gctttgacag tacaggagcc ataatggctg 31140
gtaacaaaga agacgataaa ctcactttgt ggacaacacc tgatccatca ccaaactgtc 31200
aaatactcgc agaaaatgat gcaaaactaa cactttgctt gactaaatgt ggtagtcaaa 31260
tactggccac tgtgtcagtc ttagttgtag gaagtggaaa cctaaacccc attactggca 31320
ccgtaagcag tgctcaggtg tttctacgtt ttgatgcaaa cggtgttctt ttaacagaac 31380
attctacact aaaaaaatac tgggggtata ggcagggaga tagcatagat ggcactccat 31440
ataccaatgc tgtaggattc atgcccaatt taaaagctta tccaaagtca caaagttcta 31500
ctactaaaaa taatatagta gggcaagtat acatgaatgg agatgtttca aaacctatgc 31560
ttctcactat aaccctcaat ggtactgatg acagcaacag tacatattca atgtcatttt 31620
catacacctg gactaatgga agctatgttg gagcaacatt tggggctaac tcttatacct 31680
tctcatacat cgcccaagaa tgaacactgt atcccaccct gcatgccaac ccttcccacc 31740
ccactctgtg gaacaaactc tgaaacacaa aataaaataa agttcaagtg ttttattgat 31800
tcaacagttt tacaggattc gagcagttat ttttcctcca ccctcccagg acatggaata 31860
caccaccctc tccccccgca cagccttgaa catctgaatg ccattggtga tggacatgct 31920
tttggtctcc acgttccaca cagtttcaga gcgagccagt ctcgggtcgg tcagggagat 31980
gaaaccctcc gggcactccc gcatctgcac ctcacagctc aacagctgag gattgtcctc 32040
ggtggtcggg atcacggtta tctggaagaa gcagaagagc ggcggtggga atcatagtcc 32100
gcgaacggga tcggccggtg gtgtcgcatc aggccccgca gcagtcgctg ccgccgccgc 32160
tccgtcaagc tgctgctcag ggggtccggg tccagggact ccctcagcat gatgcccacg 32220
gccctcagca tcagtcgtct ggtgcggcgg gcgcagcagc gcatgcggat ctcgctcagg 32280
tcgctgcagt acgtgcaaca cagaaccacc aggttgttca acagtccata gttcaacacg 32340
ctccagccga aactcatcgc gggaaggatg ctacccacgt ggccgtcgta ccagatcctc 32400
aggtaaatca agtggtgccc cctccagaac acgctgccca cgtacatgat ctccttgggc 32460
atgtggcggt tcaccacctc ccggtaccac atcaccctct ggttgaacat gcagccccgg 32520
atgatcctgc ggaaccacag ggccagcacc gccccgcccg ccatgcagcg aagagacccc 32580
gggtcccggc aatggcaatg gaggacccac cgctcgtacc cgtggatcat ctgggagctg 32640
aacaagtcta tgttggcaca gcacaggcat atgctcatgc atctcttcag cactctcaac 32700
tcctcggggg tcaaaaccat atcccagggc acggggaact cttgcaggac agcgaacccc 32760
gcagaacagg gcaatcctcg cacagaactt acattgtgca tggacagggt atcgcaatca 32820
ggcagcaccg ggtgatcctc caccagagaa gcgcgggtct cggtctcctc acagcgtggt 32880
aagggggccg gccgatacgg gtgatggcgg gacgcggctg atcgtgttcg cgaccgtgtc 32940
atgatgcagt tgctttcgga cattttcgta cttgctgtag cagaacctgg tccgggcgct 33000
gcacaccgat cgccggcggc ggtctcggcg cttggaacgc tcggtgttga aattgtaaaa 33060
cagccactct ctcagaccgt gcagcagatc tagggcctca ggagtgatga agatcccatc 33120
atgcctgatg gctctgatca catcgaccac cgtggaatgg gccagaccca gccagatgat 33180
gcaattttgt tgggtttcgg tgacggcggg ggagggaaga acaggaagaa ccatgattaa 33240
cttttaatcc aaacggtctc ggagtacttc aaaatgaaga tcgcggagat ggcacctctc 33300
gcccccgctg tgttggtgga aaataacagc caggtcaaag gtgatacggt tctcgagatg 33360
ttccacggtg gcttccagca aagcctccac gcgcacatcc agaaacaaga caatagcgaa 33420
agcgggaggg ttctctaatt cctcaatcat catgttacac tcctgcacca tccccagata 33480
attttcattt ttccagcctt gaatgattcg aactagttcc tgaggtaaat ccaagccagc 33540
catgataaag agctcgcgca gagcgccctc caccggcatt cttaagcaca ccctcataat 33600
tccaagatat tctgctcctg gttcacctgc agcagattga caagcggaat atcaaaatct 33660
ctgccgcgat ccctgagctc ctccctcagc aataactgta agtactcttt catatcctct 33720
ccgaaatttt tagccatagg accaccagga ataagattag ggcaagccac agtacagata 33780
aaccgaagtc ctccccagtg agcattgcca aatgcaagac tgctataagc atgctggcta 33840
gacccggtga tatcttccag ataactggac agaaaatcgc ccaggcaatt tttaagaaaa 33900
tcaacaaaag aaaaatcctc caggtggacg tttagagcct cgggaacaac gatgaagtaa 33960
atgcaagcgg tgcgttccag catggttagt tagctgatct gtagaaaaaa caaaaatgaa 34020
cattaaacca tgctagcctg gcgaacaggt gggtaaatcg ttctctccag caccaggcag 34080
gccacggggt ctccggcgcg accctcgtaa aaattgtcgc tatgattgaa aaccatcaca 34140
gagagacgtt cccggtggcc ggcgtgaatg attcgacaag atgaatacac ccccggaaca 34200
ttggcgtccg cgagtgaaaa aaagcgcccg aggaagcaat aaggcactac aatgctcagt 34260
ctcaagtcca gcaaagcgat gccatgcgga tgaagcacaa aattctcagg tgcgtacaaa 34320
atgtaattac tcccctcctg cacaggcagc aaagcccccg atccctccag gtacacatac 34380
aaagcctcag cgtccatagc ttaccgagca gcagcacaca acaggcgcaa gagtcagaga 34440
aaggctgagc tctaacctgt ccacccgctc tctgctcaat atatagccca gatctacact 34500
gacgtaaagg ccaaagtcta aaaatacccg ccaaataatc acacacgccc agcacacgcc 34560
cagaaaccgg tgacacactc aaaaaaatac gcgcacttcc tcaaacgccc aaaactgccg 34620
tcatttccgg gttcccacgc tacgtcatca aaacacgact ttcaaattcc gtcgaccgtt 34680
aaaaacgtca cccgccccgc ccctaacggt cgcccgtctc tcagccaatc agcgccccgc 34740
atccccaaat tcaaacacct catttgcata ttaacgcgca caaaaagttt gaggtatatt 34800
attgatgatg gttaattaa 34819
<210> 59
<211> 568
<212> ДНК
<213> Искуственная последовательность
<220>
<223> Синтетическая конструкция
<400> 59
taacgttact ggccgaagcc gcttggaata aggccggtgt gcgtttgtct atatgttatt 60
ttccaccata ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt 120
gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc tgttgaatgt 180
cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg tagcgaccct 240
ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa agccacgtgt 300
ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt ggatagttgt 360
ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg atgcccagaa 420
ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta catgtgttta 480
gtcgaggtta aaaaacgtct aggccccccg aaccacgggg acgtggtttt cctttgaaaa 540
acacgatgat aatatggcca caaccatg 568
<210> 60
<211> 1145
<212> ПРТ
<213> Искуственная последовательность
<220>
<223> Синтетическая конструкция
<400> 60
Met Ala Ser Ile Val Gly Gly Trp Glu Cys Glu Lys His Ser Gln Pro
1 5 10 15
Trp Gln Val Leu Val Ala Ser Arg Gly Arg Ala Val Cys Gly Gly Val
20 25 30
Leu Val His Pro Gln Trp Val Leu Thr Ala Ala His Cys Ile Arg Asn
35 40 45
Lys Ser Val Ile Leu Leu Gly Arg His Ser Leu Phe His Pro Glu Asp
50 55 60
Thr Gly Gln Val Phe Gln Val Ser His Ser Phe Pro His Pro Leu Tyr
65 70 75 80
Asp Met Ser Leu Leu Lys Asn Arg Phe Leu Arg Pro Gly Asp Asp Ser
85 90 95
Ser His Asp Leu Met Leu Leu Arg Leu Ser Glu Pro Ala Glu Leu Thr
100 105 110
Asp Ala Val Lys Val Met Asp Leu Pro Thr Gln Glu Pro Ala Leu Gly
115 120 125
Thr Thr Cys Tyr Ala Ser Gly Trp Gly Ser Ile Glu Pro Glu Glu Phe
130 135 140
Leu Thr Pro Lys Lys Leu Gln Cys Val Asp Leu His Val Ile Ser Asn
145 150 155 160
Asp Val Cys Ala Gln Val His Pro Gln Lys Val Thr Lys Phe Met Leu
165 170 175
Cys Ala Gly Arg Trp Thr Gly Gly Lys Ser Thr Cys Ser Gly Asp Ser
180 185 190
Gly Gly Pro Leu Val Cys Asn Gly Val Leu Gln Gly Ile Thr Ser Trp
195 200 205
Gly Ser Glu Pro Cys Ala Leu Pro Glu Arg Pro Ser Leu Tyr Thr Lys
210 215 220
Val Val His Tyr Arg Lys Trp Ile Lys Asp Thr Ile Val Ala Asn Pro
225 230 235 240
Gly Ser Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
245 250 255
Asn Pro Gly Pro Ala Ser Lys Ala Val Leu Leu Ala Leu Leu Met Ala
260 265 270
Gly Leu Ala Leu Gln Pro Gly Thr Ala Leu Leu Cys Tyr Ser Cys Lys
275 280 285
Ala Gln Val Ser Asn Glu Asp Cys Leu Gln Val Glu Asn Cys Thr Gln
290 295 300
Leu Gly Glu Gln Cys Trp Thr Ala Arg Ile Arg Ala Val Gly Leu Leu
305 310 315 320
Thr Val Ile Ser Lys Gly Cys Ser Leu Asn Cys Val Asp Asp Ser Gln
325 330 335
Asp Tyr Tyr Val Gly Lys Lys Asn Ile Thr Cys Cys Asp Thr Asp Leu
340 345 350
Cys Asn Ala Ser Gly Ala His Ala Leu Gln Pro Ala Ala Ala Ile Leu
355 360 365
Ala Leu Leu Pro Ala Leu Gly Leu Leu Leu Trp Gly Pro Gly Gln Leu
370 375 380
Gly Ser Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
385 390 395 400
Glu Ser Asn Pro Gly Pro Met Ala Ser Ala Arg Arg Pro Arg Trp Leu
405 410 415
Cys Ala Gly Ala Leu Val Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe
420 425 430
Leu Phe Gly Trp Phe Ile Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr
435 440 445
Pro Lys His Asn Met Lys Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn
450 455 460
Ile Lys Lys Phe Leu Tyr Asn Phe Thr Gln Ile Pro His Leu Ala Gly
465 470 475 480
Thr Glu Gln Asn Phe Gln Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys
485 490 495
Glu Phe Gly Leu Asp Ser Val Glu Leu Ala His Tyr Asp Val Leu Leu
500 505 510
Ser Tyr Pro Asn Lys Thr His Pro Asn Tyr Ile Ser Ile Ile Asn Glu
515 520 525
Asp Gly Asn Glu Ile Phe Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro
530 535 540
Gly Tyr Glu Asn Val Ser Asp Ile Val Pro Pro Phe Ser Ala Phe Ser
545 550 555 560
Pro Gln Gly Met Pro Glu Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg
565 570 575
Thr Glu Asp Phe Phe Lys Leu Glu Arg Asp Met Lys Ile Asn Cys Ser
580 585 590
Gly Lys Ile Val Ile Ala Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys
595 600 605
Val Lys Asn Ala Gln Leu Ala Gly Ala Lys Gly Val Ile Leu Tyr Ser
610 615 620
Asp Pro Ala Asp Tyr Phe Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly
625 630 635 640
Trp Asn Leu Pro Gly Gly Gly Val Gln Arg Gly Asn Ile Leu Asn Leu
645 650 655
Asn Gly Ala Gly Asp Pro Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr
660 665 670
Ala Tyr Arg Arg Gly Ile Ala Glu Ala Val Gly Leu Pro Ser Ile Pro
675 680 685
Val His Pro Ile Gly Tyr Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met
690 695 700
Gly Gly Ser Ala Pro Pro Asp Ser Ser Trp Arg Gly Ser Leu Lys Val
705 710 715 720
Pro Tyr Asn Val Gly Pro Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys
725 730 735
Val Lys Met His Ile His Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn
740 745 750
Val Ile Gly Thr Leu Arg Gly Ala Val Glu Pro Asp Arg Tyr Val Ile
755 760 765
Leu Gly Gly His Arg Asp Ser Trp Val Phe Gly Gly Ile Asp Pro Gln
770 775 780
Ser Gly Ala Ala Val Val His Glu Ile Val Arg Ser Phe Gly Thr Leu
785 790 795 800
Lys Lys Glu Gly Trp Arg Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp
805 810 815
Asp Ala Glu Glu Phe Gly Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu
820 825 830
Asn Ser Arg Leu Leu Gln Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp
835 840 845
Ser Ser Ile Glu Gly Asn Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu
850 855 860
Met Tyr Ser Leu Val His Asn Leu Thr Lys Glu Leu Lys Ser Pro Asp
865 870 875 880
Glu Gly Phe Glu Gly Lys Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser
885 890 895
Pro Ser Pro Glu Phe Ser Gly Met Pro Arg Ile Ser Lys Leu Gly Ser
900 905 910
Gly Asn Asp Phe Glu Val Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly
915 920 925
Arg Ala Arg Tyr Thr Lys Asn Trp Glu Thr Asn Lys Phe Ser Gly Tyr
930 935 940
Pro Leu Tyr His Ser Val Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe
945 950 955 960
Tyr Asp Pro Met Phe Lys Tyr His Leu Thr Val Ala Gln Val Arg Gly
965 970 975
Gly Met Val Phe Glu Leu Ala Asn Ser Ile Val Leu Pro Phe Asp Cys
980 985 990
Arg Asp Tyr Ala Val Val Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Ser
995 1000 1005
Ile Ser Met Lys His Pro Gln Glu Met Lys Thr Tyr Ser Val Ser
1010 1015 1020
Phe Asp Ser Leu Phe Ser Ala Val Lys Asn Phe Thr Glu Ile Ala
1025 1030 1035
Ser Lys Phe Ser Glu Arg Leu Gln Asp Phe Asp Lys Ser Asn Pro
1040 1045 1050
Ile Val Leu Arg Met Met Asn Asp Gln Leu Met Phe Leu Glu Arg
1055 1060 1065
Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp Arg Pro Phe Tyr Arg
1070 1075 1080
His Val Ile Tyr Ala Pro Ser Ser His Asn Lys Tyr Ala Gly Glu
1085 1090 1095
Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile Glu Ser Lys
1100 1105 1110
Val Asp Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln Ile Tyr
1115 1120 1125
Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser Glu
1130 1135 1140
Val Ala
1145
<210> 61
<211> 3435
<212> ДНК
<213> Искуственная последовательность
<220>
<223> Синтетическая конструкция
<400> 61
atggctagca tcgtcggagg gtgggagtgc gaaaagcact cacagccatg gcaggtcctg 60
gtcgcctcgc gcggacgcgc cgtgtgtgga ggtgtgctgg tccacccgca gtgggtgttg 120
actgcggccc attgcatcag aaataagtcc gtgatcctct tggggagaca ttccctgttt 180
caccccgaag atactggaca ggtgttccaa gtgagccact ccttcccgca tccactgtac 240
gacatgagcc tgctgaagaa ccgctttctg cggccagggg acgactcatc acacgatttg 300
atgctgcttc ggctctcgga accggccgag ctcaccgacg cagtgaaggt catggacctc 360
cctacgcaag agcctgctct cggtaccact tgttacgcat cgggatgggg ctccatcgag 420
ccggaagaat tcctgacccc gaaaaagctg cagtgcgtgg atctgcacgt gatttcgaat 480
gacgtgtgcg cgcaagtgca tccacaaaag gtcactaagt tcatgctgtg cgccggaagg 540
tggaccggcg gaaaatcgac ctgttccggc gacagcggag gcccactcgt gtgcaacggt 600
gtgctgcagg gcatcactag ctggggatca gaaccgtgcg cgcttccgga gcggccctcg 660
ctctacacga aggtggtgca ctaccgcaaa tggattaaag ataccatcgt cgcaaaccct 720
ggatccgaag gtaggggttc attattgacc tgtggagatg tcgaagaaaa cccaggaccc 780
gctagcaaag cagtgctgct ggcgctcctg atggctggac tcgcgctgca gcctggaacc 840
gccctgctct gttactcgtg caaggcccaa gtctcgaatg aggactgttt gcaagtggaa 900
aactgcaccc agctcggaga acaatgctgg actgcacgga tccgcgctgt cggcctgctg 960
accgtgatct ccaaagggtg ctcattgaac tgcgtggacg atagccagga ctactacgtg 1020
ggaaagaaga atatcacttg ttgcgacacg gatctttgca acgcgtccgg agcgcacgcc 1080
ctgcagccag cagccgccat tctggccctg cttccggccc tggggttgct gctctggggt 1140
ccgggccagc tcggatccca gaccctgaac tttgatctgc tgaaactggc aggcgatgtg 1200
gaaagcaacc caggcccaat ggctagcgct cgcagaccgc ggtggctgtg tgcaggggcg 1260
ctcgtcctgg cgggtggctt ctttttgctc ggctttcttt tcggatggtt catcaaatcg 1320
tcaaacgaag ctaccaatat caccccgaag cacaacatga aggcctttct ggatgagctg 1380
aaggctgaga acattaagaa gttcctctac aacttcaccc agatcccaca tttggcgggc 1440
actgagcaga actttcagtt ggctaagcag atccagagcc agtggaagga attcggcctg 1500
gactccgtcg agctggcgca ttacgatgtg ctgctgagct accctaataa gactcatccg 1560
aactatatct cgattatcaa tgaggacgga aacgaaatct ttaacacgtc cctcttcgag 1620
ccgccaccgc ctggatacga gaacgtgtca gatatcgtgc ctccgttctc ggccttctcg 1680
ccccagggaa tgcccgaagg ggacctggtg tacgtgaact acgcaaggac cgaggacttc 1740
ttcaagttgg agcgggatat gaagatcaat tgcagcggaa agatcgtcat cgcccgctac 1800
ggcaaagtgt tccgcggcaa caaggtgaag aatgcacagt tggcaggcgc caagggcgtc 1860
atcctctact cggatcctgc cgactacttc gctcctggcg tgaaatccta ccctgatggt 1920
tggaatctgc caggaggagg ggtgcagagg ggaaatatcc tgaacctgaa cggtgccggt 1980
gacccactta ctccgggtta cccggccaac gaatacgcgt acaggcgggg tatcgcggaa 2040
gccgtcggac tgccgtccat cccggtccat ccgattggtt actacgacgc ccagaagctc 2100
ctcgaaaaga tgggaggcag cgcccctccg gactcgtcat ggagaggctc gctgaaggtg 2160
ccatacaacg tgggacccgg attcactgga aatttcagca ctcaaaaagt gaagatgcac 2220
attcactcca ctaacgaagt caccaggatc tacaacgtca tcggaaccct ccggggagcg 2280
gtggaaccgg accgctacgt gatcctcggt ggacaccggg atagctgggt gttcggagga 2340
atcgatcctc aatcgggcgc agccgtcgtc catgaaatcg tcaggtcctt tggtactctt 2400
aagaaggagg gctggcgccc tagacgcact attctgttcg cctcgtggga tgccgaagaa 2460
tttggtctgc tcggcagcac cgaatgggct gaggaaaact cccgcctgct ccaagaacgc 2520
ggagtggcgt acatcaatgc cgactcatcc atcgaaggaa actacacgct gcgggtggac 2580
tgcactccac tgatgtactc gctcgtgcac aacctgacca aagaactcaa atccccagac 2640
gaaggattcg agggaaaatc gctgtacgag tcgtggacca agaagagccc atccccggag 2700
ttcagcggga tgccgcggat ctcaaagctc ggatcaggaa atgatttcga agtgttcttt 2760
cagaggctgg gaattgcgtc gggaagggct cggtacacga aaaactggga aactaacaag 2820
ttctcgggat acccgctgta ccactcggtg tatgaaactt acgaactggt ggagaaattc 2880
tacgatccta tgtttaagta ccacctgact gtggcccaag tgagaggcgg aatggtgttc 2940
gagttggcca attcaattgt gctgccattc gattgccgcg actacgccgt ggtgctgaga 3000
aagtacgcag acaaaatcta ctcaatcagc atgaagcacc cacaagagat gaaaacctac 3060
tcagtctcct tcgactccct cttctccgcg gtgaagaact tcaccgagat cgcgagcaaa 3120
ttctcggagc gccttcaaga ttttgacaaa tccaatccga tcgtcctccg catgatgaat 3180
gaccagctca tgtttctcga acgggccttc atcgatccac tgggacttcc ggaccggccg 3240
ttttaccgcc acgtgatcta cgcgccctcg tcgcataaca agtatgctgg agagagcttc 3300
ccgggtatct acgacgcatt gttcgacatt gagtccaagg tggatccgtc caaagcctgg 3360
ggtgaagtga agcgccaaat ctacgtggcg gcctttaccg tccaggcggc agcagaaacc 3420
ttgagcgagg tggct 3435
<210> 62
<211> 7182
<212> ДНК
<213> Искуственная последовательность
<220>
<223> Синтетическая конструкция
<400> 62
ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900
acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960
ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680
gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740
actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800
ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860
tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920
tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980
gaacatggct agcatcgtcg gagggtggga gtgcgaaaag cactcacagc catggcaggt 2040
cctggtcgcc tcgcgcggac gcgccgtgtg tggaggtgtg ctggtccacc cgcagtgggt 2100
gttgactgcg gcccattgca tcagaaataa gtccgtgatc ctcttgggga gacattccct 2160
gtttcacccc gaagatactg gacaggtgtt ccaagtgagc cactccttcc cgcatccact 2220
gtacgacatg agcctgctga agaaccgctt tctgcggcca ggggacgact catcacacga 2280
tttgatgctg cttcggctct cggaaccggc cgagctcacc gacgcagtga aggtcatgga 2340
cctccctacg caagagcctg ctctcggtac cacttgttac gcatcgggat ggggctccat 2400
cgagccggaa gaattcctga ccccgaaaaa gctgcagtgc gtggatctgc acgtgatttc 2460
gaatgacgtg tgcgcgcaag tgcatccaca aaaggtcact aagttcatgc tgtgcgccgg 2520
aaggtggacc ggcggaaaat cgacctgttc cggcgacagc ggaggcccac tcgtgtgcaa 2580
cggtgtgctg cagggcatca ctagctgggg atcagaaccg tgcgcgcttc cggagcggcc 2640
ctcgctctac acgaaggtgg tgcactaccg caaatggatt aaagatacca tcgtcgcaaa 2700
ccctggatcc gaaggtaggg gttcattatt gacctgtgga gatgtcgaag aaaacccagg 2760
acccgctagc aaagcagtgc tgctggcgct cctgatggct ggactcgcgc tgcagcctgg 2820
aaccgccctg ctctgttact cgtgcaaggc ccaagtctcg aatgaggact gtttgcaagt 2880
ggaaaactgc acccagctcg gagaacaatg ctggactgca cggatccgcg ctgtcggcct 2940
gctgaccgtg atctccaaag ggtgctcatt gaactgcgtg gacgatagcc aggactacta 3000
cgtgggaaag aagaatatca cttgttgcga cacggatctt tgcaacgcgt ccggagcgca 3060
cgccctgcag ccagcagccg ccattctggc cctgcttccg gccctggggt tgctgctctg 3120
gggtccgggc cagctcggat cccagaccct gaactttgat ctgctgaaac tggcaggcga 3180
tgtggaaagc aacccaggcc caatggctag cgctcgcaga ccgcggtggc tgtgtgcagg 3240
ggcgctcgtc ctggcgggtg gcttcttttt gctcggcttt cttttcggat ggttcatcaa 3300
atcgtcaaac gaagctacca atatcacccc gaagcacaac atgaaggcct ttctggatga 3360
gctgaaggct gagaacatta agaagttcct ctacaacttc acccagatcc cacatttggc 3420
gggcactgag cagaactttc agttggctaa gcagatccag agccagtgga aggaattcgg 3480
cctggactcc gtcgagctgg cgcattacga tgtgctgctg agctacccta ataagactca 3540
tccgaactat atctcgatta tcaatgagga cggaaacgaa atctttaaca cgtccctctt 3600
cgagccgcca ccgcctggat acgagaacgt gtcagatatc gtgcctccgt tctcggcctt 3660
ctcgccccag ggaatgcccg aaggggacct ggtgtacgtg aactacgcaa ggaccgagga 3720
cttcttcaag ttggagcggg atatgaagat caattgcagc ggaaagatcg tcatcgcccg 3780
ctacggcaaa gtgttccgcg gcaacaaggt gaagaatgca cagttggcag gcgccaaggg 3840
cgtcatcctc tactcggatc ctgccgacta cttcgctcct ggcgtgaaat cctaccctga 3900
tggttggaat ctgccaggag gaggggtgca gaggggaaat atcctgaacc tgaacggtgc 3960
cggtgaccca cttactccgg gttacccggc caacgaatac gcgtacaggc ggggtatcgc 4020
ggaagccgtc ggactgccgt ccatcccggt ccatccgatt ggttactacg acgcccagaa 4080
gctcctcgaa aagatgggag gcagcgcccc tccggactcg tcatggagag gctcgctgaa 4140
ggtgccatac aacgtgggac ccggattcac tggaaatttc agcactcaaa aagtgaagat 4200
gcacattcac tccactaacg aagtcaccag gatctacaac gtcatcggaa ccctccgggg 4260
agcggtggaa ccggaccgct acgtgatcct cggtggacac cgggatagct gggtgttcgg 4320
aggaatcgat cctcaatcgg gcgcagccgt cgtccatgaa atcgtcaggt cctttggtac 4380
tcttaagaag gagggctggc gccctagacg cactattctg ttcgcctcgt gggatgccga 4440
agaatttggt ctgctcggca gcaccgaatg ggctgaggaa aactcccgcc tgctccaaga 4500
acgcggagtg gcgtacatca atgccgactc atccatcgaa ggaaactaca cgctgcgggt 4560
ggactgcact ccactgatgt actcgctcgt gcacaacctg accaaagaac tcaaatcccc 4620
agacgaagga ttcgagggaa aatcgctgta cgagtcgtgg accaagaaga gcccatcccc 4680
ggagttcagc gggatgccgc ggatctcaaa gctcggatca ggaaatgatt tcgaagtgtt 4740
ctttcagagg ctgggaattg cgtcgggaag ggctcggtac acgaaaaact gggaaactaa 4800
caagttctcg ggatacccgc tgtaccactc ggtgtatgaa acttacgaac tggtggagaa 4860
attctacgat cctatgttta agtaccacct gactgtggcc caagtgagag gcggaatggt 4920
gttcgagttg gccaattcaa ttgtgctgcc attcgattgc cgcgactacg ccgtggtgct 4980
gagaaagtac gcagacaaaa tctactcaat cagcatgaag cacccacaag agatgaaaac 5040
ctactcagtc tccttcgact ccctcttctc cgcggtgaag aacttcaccg agatcgcgag 5100
caaattctcg gagcgccttc aagattttga caaatccaat ccgatcgtcc tccgcatgat 5160
gaatgaccag ctcatgtttc tcgaacgggc cttcatcgat ccactgggac ttccggaccg 5220
gccgttttac cgccacgtga tctacgcgcc ctcgtcgcat aacaagtatg ctggagagag 5280
cttcccgggt atctacgacg cattgttcga cattgagtcc aaggtggatc cgtccaaagc 5340
ctggggtgaa gtgaagcgcc aaatctacgt ggcggccttt accgtccagg cggcagcaga 5400
aaccttgagc gaggtggctt aaagatctgg gccctaacaa aacaaaaaga tggggttatt 5460
ccctaaactt catgggttac gtaattggaa gttgggggac attgccacaa gatcatattg 5520
tacaaaagat caaacactgt tttagaaaac ttcctgtaaa caggcctatt gattggaaag 5580
tatgtcaaag gattgtgggt cttttgggct ttgctgctcc atttacacaa tgtggatatc 5640
ctgccttaat gcctttgtat gcatgtatac aagctaaaca ggctttcact ttctcgccaa 5700
cttacaaggc ctttctaagt aaacagtaca tgaaccttta ccccgttgct cggcaacggc 5760
ctggtctgtg ccaagtgttt gctgacgcaa cccccactgg ctggggcttg gccataggcc 5820
atcagcgcat gcgtggaacc tttgtggctc ctctgccgat ccatactgcg gaactcctag 5880
ccgcttgttt tgctcgcagc cggtctggag caaagctcat aggaactgac aattctgtcg 5940
tcctctcgcg gaaatataca tcgtttcgat ctacgtatga tctttttccc tctgccaaaa 6000
attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 6060
ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcggaagg aattctgcat 6120
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 6180
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 6240
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 6300
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 6360
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 6420
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 6480
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 6540
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 6600
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 6660
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 6720
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 6780
tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 6840
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 6900
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 6960
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 7020
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 7080
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 7140
tcagcgatct gtctatttcg ttcatccata gttgcctgac tc 7182
<210> 63
<211> 34803
<212> ДНК
<213> Искуственная последовательность
<220>
<223> Синтетическая конструкция
<400> 63
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttactactg taatagtaat caattacggg 480
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 540
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 600
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 660
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 720
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 780
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 840
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 900
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 960
cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1020
tgtccctatc agtgatagag atctccctat cagtgataga gagtttagtg aaccgtcaga 1080
tccgctaggg taccaacatg gctagcatcg tcggagggtg ggagtgcgaa aagcactcac 1140
agccatggca ggtcctggtc gcctcgcgcg gacgcgccgt gtgtggaggt gtgctggtcc 1200
acccgcagtg ggtgttgact gcggcccatt gcatcagaaa taagtccgtg atcctcttgg 1260
ggagacattc cctgtttcac cccgaagata ctggacaggt gttccaagtg agccactcct 1320
tcccgcatcc actgtacgac atgagcctgc tgaagaaccg ctttctgcgg ccaggggacg 1380
actcatcaca cgatttgatg ctgcttcggc tctcggaacc ggccgagctc accgacgcag 1440
tgaaggtcat ggacctccct acgcaagagc ctgctctcgg taccacttgt tacgcatcgg 1500
gatggggctc catcgagccg gaagaattcc tgaccccgaa aaagctgcag tgcgtggatc 1560
tgcacgtgat ttcgaatgac gtgtgcgcgc aagtgcatcc acaaaaggtc actaagttca 1620
tgctgtgcgc cggaaggtgg accggcggaa aatcgacctg ttccggcgac agcggaggcc 1680
cactcgtgtg caacggtgtg ctgcagggca tcactagctg gggatcagaa ccgtgcgcgc 1740
ttccggagcg gccctcgctc tacacgaagg tggtgcacta ccgcaaatgg attaaagata 1800
ccatcgtcgc aaaccctgga tccgaaggta ggggttcatt attgacctgt ggagatgtcg 1860
aagaaaaccc aggacccgct agcaaagcag tgctgctggc gctcctgatg gctggactcg 1920
cgctgcagcc tggaaccgcc ctgctctgtt actcgtgcaa ggcccaagtc tcgaatgagg 1980
actgtttgca agtggaaaac tgcacccagc tcggagaaca atgctggact gcacggatcc 2040
gcgctgtcgg cctgctgacc gtgatctcca aagggtgctc attgaactgc gtggacgata 2100
gccaggacta ctacgtggga aagaagaata tcacttgttg cgacacggat ctttgcaacg 2160
cgtccggagc gcacgccctg cagccagcag ccgccattct ggccctgctt ccggccctgg 2220
ggttgctgct ctggggtccg ggccagctcg gatcccagac cctgaacttt gatctgctga 2280
aactggcagg cgatgtggaa agcaacccag gcccaatggc tagcgctcgc agaccgcggt 2340
ggctgtgtgc aggggcgctc gtcctggcgg gtggcttctt tttgctcggc tttcttttcg 2400
gatggttcat caaatcgtca aacgaagcta ccaatatcac cccgaagcac aacatgaagg 2460
cctttctgga tgagctgaag gctgagaaca ttaagaagtt cctctacaac ttcacccaga 2520
tcccacattt ggcgggcact gagcagaact ttcagttggc taagcagatc cagagccagt 2580
ggaaggaatt cggcctggac tccgtcgagc tggcgcatta cgatgtgctg ctgagctacc 2640
ctaataagac tcatccgaac tatatctcga ttatcaatga ggacggaaac gaaatcttta 2700
acacgtccct cttcgagccg ccaccgcctg gatacgagaa cgtgtcagat atcgtgcctc 2760
cgttctcggc cttctcgccc cagggaatgc ccgaagggga cctggtgtac gtgaactacg 2820
caaggaccga ggacttcttc aagttggagc gggatatgaa gatcaattgc agcggaaaga 2880
tcgtcatcgc ccgctacggc aaagtgttcc gcggcaacaa ggtgaagaat gcacagttgg 2940
caggcgccaa gggcgtcatc ctctactcgg atcctgccga ctacttcgct cctggcgtga 3000
aatcctaccc tgatggttgg aatctgccag gaggaggggt gcagagggga aatatcctga 3060
acctgaacgg tgccggtgac ccacttactc cgggttaccc ggccaacgaa tacgcgtaca 3120
ggcggggtat cgcggaagcc gtcggactgc cgtccatccc ggtccatccg attggttact 3180
acgacgccca gaagctcctc gaaaagatgg gaggcagcgc ccctccggac tcgtcatgga 3240
gaggctcgct gaaggtgcca tacaacgtgg gacccggatt cactggaaat ttcagcactc 3300
aaaaagtgaa gatgcacatt cactccacta acgaagtcac caggatctac aacgtcatcg 3360
gaaccctccg gggagcggtg gaaccggacc gctacgtgat cctcggtgga caccgggata 3420
gctgggtgtt cggaggaatc gatcctcaat cgggcgcagc cgtcgtccat gaaatcgtca 3480
ggtcctttgg tactcttaag aaggagggct ggcgccctag acgcactatt ctgttcgcct 3540
cgtgggatgc cgaagaattt ggtctgctcg gcagcaccga atgggctgag gaaaactccc 3600
gcctgctcca agaacgcgga gtggcgtaca tcaatgccga ctcatccatc gaaggaaact 3660
acacgctgcg ggtggactgc actccactga tgtactcgct cgtgcacaac ctgaccaaag 3720
aactcaaatc cccagacgaa ggattcgagg gaaaatcgct gtacgagtcg tggaccaaga 3780
agagcccatc cccggagttc agcgggatgc cgcggatctc aaagctcgga tcaggaaatg 3840
atttcgaagt gttctttcag aggctgggaa ttgcgtcggg aagggctcgg tacacgaaaa 3900
actgggaaac taacaagttc tcgggatacc cgctgtacca ctcggtgtat gaaacttacg 3960
aactggtgga gaaattctac gatcctatgt ttaagtacca cctgactgtg gcccaagtga 4020
gaggcggaat ggtgttcgag ttggccaatt caattgtgct gccattcgat tgccgcgact 4080
acgccgtggt gctgagaaag tacgcagaca aaatctactc aatcagcatg aagcacccac 4140
aagagatgaa aacctactca gtctccttcg actccctctt ctccgcggtg aagaacttca 4200
ccgagatcgc gagcaaattc tcggagcgcc ttcaagattt tgacaaatcc aatccgatcg 4260
tcctccgcat gatgaatgac cagctcatgt ttctcgaacg ggccttcatc gatccactgg 4320
gacttccgga ccggccgttt taccgccacg tgatctacgc gccctcgtcg cataacaagt 4380
atgctggaga gagcttcccg ggtatctacg acgcattgtt cgacattgag tccaaggtgg 4440
atccgtccaa agcctggggt gaagtgaagc gccaaatcta cgtggcggcc tttaccgtcc 4500
aggcggcagc agaaaccttg agcgaggtgg cttgactcga gcctaagctt ctagataaga 4560
tatccgatcc accggatcta gataactgat cataatcagc cataccacat ttgtagaggt 4620
tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc 4680
aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 4740
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 4800
catcaatgta tcttatatgc tggccaccgt acatgtggct tcccatgctc gcaagccctg 4860
gcccgagttc gagcacaatg tcatgaccag gtgcaatatg catctggggt cccgccgagg 4920
catgttcatg ccctaccagt gcaacctgaa ttatgtgaag gtgctgctgg agcccgatgc 4980
catgtccaga gtgagcctga cgggggtgtt tgacatgaat gtggaggtgt ggaagattct 5040
gagatatgat gaatccaaga ccaggtgccg agcctgcgag tgcggaggga agcatgccag 5100
gttccagccc gtgtgtgtgg atgtgacgga ggacctgcga cccgatcatt tggtgttgcc 5160
ctgcaccggg acggagttcg gttccagcgg ggaagaatct gactagagtg agtagtgttc 5220
tggggcgggg gaggacctgc atgagggcca gaataactga aatctgtgct tttctgtgtg 5280
ttgcagcagc atgagcggaa gcggctcctt tgagggaggg gtattcagcc cttatctgac 5340
ggggcgtctc ccctcctggg cgggagtgcg tcagaatgtg atgggatcca cggtggacgg 5400
ccggcccgtg cagcccgcga actcttcaac cctgacctat gcaaccctga gctcttcgtc 5460
gttggacgca gctgccgccg cagctgctgc atctgccgcc agcgccgtgc gcggaatggc 5520
catgggcgcc ggctactacg gcactctggt ggccaactcg agttccacca ataatcccgc 5580
cagcctgaac gaggagaagc tgttgctgct gatggcccag ctcgaggcct tgacccagcg 5640
cctgggcgag ctgacccagc aggtggctca gctgcaggag cagacgcggg ccgcggttgc 5700
cacggtgaaa tccaaataaa aaatgaatca ataaataaac ggagacggtt gttgatttta 5760
acacagagtc tgaatcttta tttgattttt cgcgcgcggt aggccctgga ccaccggtct 5820
cgatcattga gcacccggtg gatcttttcc aggacccggt agaggtgggc ttggatgttg 5880
aggtacatgg gcatgagccc gtcccggggg tggaggtagc tccattgcag ggcctcgtgc 5940
tcgggggtgg tgttgtaaat cacccagtca tagcaggggc gcagggcatg gtgttgcaca 6000
atatctttga ggaggagact gatggccacg ggcagccctt tggtgtaggt gtttacaaat 6060
ctgttgagct gggagggatg catgcggggg gagatgaggt gcatcttggc ctggatcttg 6120
agattggcga tgttaccgcc cagatcccgc ctggggttca tgttgtgcag gaccaccagc 6180
acggtgtatc cggtgcactt ggggaattta tcatgcaact tggaagggaa ggcgtgaaag 6240
aatttggcga cgcctttgtg cccgcccagg ttttccatgc actcatccat gatgatggcg 6300
atgggcccgt gggcggcggc ctgggcaaag acgtttcggg ggtcggacac atcatagttg 6360
tggtcctggg tgaggtcatc ataggccatt ttaatgaatt tggggcggag ggtgccggac 6420
tgggggacaa aggtaccctc gatcccgggg gcgtagttcc cctcacagat ctgcatctcc 6480
caggctttga gctcggaggg ggggatcatg tccacctgcg gggcgataaa gaacacggtt 6540
tccggggcgg gggagatgag ctgggccgaa agcaagttcc ggagcagctg ggacttgccg 6600
cagccggtgg ggccgtagat gaccccgatg accggctgca ggtggtagtt gagggagaga 6660
cagctgccgt cctcccggag gaggggggcc acctcgttca tcatctcgcg cacgtgcatg 6720
ttctcgcgca ccagttccgc caggaggcgc tctcccccca gggataggag ctcctggagc 6780
gaggcgaagt ttttcagcgg cttgagtccg tcggccatgg gcattttgga gagggtttgt 6840
tgcaagagtt ccaggcggtc ccagagctcg gtgatgtgct ctacggcatc tcgatccagc 6900
agacctcctc gtttcgcggg ttgggacggc tgcgggagta gggcaccaga cgatgggcgt 6960
ccagcgcagc cagggtccgg tccttccagg gtcgcagcgt ccgcgtcagg gtggtctccg 7020
tcacggtgaa ggggtgcgcg ccgggctggg cgcttgcgag ggtgcgcttc aggctcatcc 7080
ggctggtcga aaaccgctcc cgatcggcgc cctgcgcgtc ggccaggtag caattgacca 7140
tgagttcgta gttgagcgcc tcggccgcgt ggcctttggc gcggagctta cctttggaag 7200
tctgcccgca ggcgggacag aggagggact tgagggcgta gagcttgggg gcgaggaaga 7260
cggactcggg ggcgtaggcg tccgcgccgc agtgggcgca gacggtctcg cactccacga 7320
gccaggtgag gtcgggctgg tcggggtcaa aaaccagttt cccgccgttc tttttgatgc 7380
gtttcttacc tttggtctcc atgagctcgt gtccccgctg ggtgacaaag aggctgtccg 7440
tgtccccgta gaccgacttt atgggccggt cctcgagcgg tgtgccgcgg tcctcctcgt 7500
agaggaaccc cgcccactcc gagacgaaag cccgggtcca ggccagcacg aaggaggcca 7560
cgtgggacgg gtagcggtcg ttgtccacca gcgggtccac cttttccagg gtatgcaaac 7620
acatgtcccc ctcgtccaca tccaggaagg tgattggctt gtaagtgtag gccacgtgac 7680
cgggggtccc ggccgggggg gtataaaagg gtgcgggtcc ctgctcgtcc tcactgtctt 7740
ccggatcgct gtccaggagc gccagctgtt ggggtaggta ttccctctcg aaggcgggca 7800
tgacctcggc actcaggttg tcagtttcta gaaacgagga ggatttgata ttgacggtgc 7860
cggcggagat gcctttcaag agcccctcgt ccatctggtc agaaaagacg atctttttgt 7920
tgtcgagctt ggtggcgaag gagccgtaga gggcgttgga gaggagcttg gcgatggagc 7980
gcatggtctg gtttttttcc ttgtcggcgc gctccttggc ggcgatgttg agctgcacgt 8040
actcgcgcgc cacgcacttc cattcgggga agacggtggt cagctcgtcg ggcacgattc 8100
tgacctgcca gccccgatta tgcagggtga tgaggtccac actggtggcc acctcgccgc 8160
gcaggggctc attagtccag cagaggcgtc cgcccttgcg cgagcagaag gggggcaggg 8220
ggtccagcat gacctcgtcg ggggggtcgg catcgatggt gaagatgccg ggcaggaggt 8280
cggggtcaaa gtagctgatg gaagtggcca gatcgtccag ggcagcttgc cattcgcgca 8340
cggccagcgc gcgctcgtag ggactgaggg gcgtgcccca gggcatggga tgggtaagcg 8400
cggaggcgta catgccgcag atgtcgtaga cgtagagggg ctcctcgagg atgccgatgt 8460
aggtggggta gcagcgcccc ccgcggatgc tggcgcgcac gtagtcatac agctcgtgcg 8520
agggggcgag gagccccggg cccaggttgg tgcgactggg cttttcggcg cggtagacga 8580
tctggcggaa aatggcatgc gagttggagg agatggtggg cctttggaag atgttgaagt 8640
gggcgtgggg cagtccgacc gagtcgcgga tgaagtgggc gtaggagtct tgcagcttgg 8700
cgacgagctc ggcggtgact aggacgtcca gagcgcagta gtcgagggtc tcctggatga 8760
tgtcatactt gagctgtccc ttttgtttcc acagctcgcg gttgagaagg aactcttcgc 8820
ggtccttcca gtactcttcg agggggaacc cgtcctgatc tgcacggtaa gagcctagca 8880
tgtagaactg gttgacggcc ttgtaggcgc agcagccctt ctccacgggg agggcgtagg 8940
cctgggcggc cttgcgcagg gaggtgtgcg tgagggcgaa agtgtccctg accatgacct 9000
tgaggaactg gtgcttgaag tcgatatcgt cgcagccccc ctgctcccag agctggaagt 9060
ccgtgcgctt cttgtaggcg gggttgggca aagcgaaagt aacatcgttg aagaggatct 9120
tgcccgcgcg gggcataaag ttgcgagtga tgcggaaagg ttggggcacc tcggcccggt 9180
tgttgatgac ctgggcggcg agcacgatct cgtcgaagcc gttgatgttg tggcccacga 9240
tgtagagttc cacgaatcgc ggacggccct tgacgtgggg cagtttcttg agctcctcgt 9300
aggtgagctc gtcggggtcg ctgagcccgt gctgctcgag cgcccagtcg gcgagatggg 9360
ggttggcgcg gaggaaggaa gtccagagat ccacggccag ggcggtttgc agacggtccc 9420
ggtactgacg gaactgctgc ccgacggcca ttttttcggg ggtgacgcag tagaaggtgc 9480
gggggtcccc gtgccagcga tcccatttga gctggagggc gagatcgagg gcgagctcga 9540
cgagccggtc gtccccggag agtttcatga ccagcatgaa ggggacgagc tgcttgccga 9600
aggaccccat ccaggtgtag gtttccacat cgtaggtgag gaagagcctt tcggtgcgag 9660
gatgcgagcc gatggggaag aactggatct cctgccacca attggaggaa tggctgttga 9720
tgtgatggaa gtagaaatgc cgacggcgcg ccgaacactc gtgcttgtgt ttatacaagc 9780
ggccacagtg ctcgcaacgc tgcacgggat gcacgtgctg cacgagctgt acctgagttc 9840
ctttgacgag gaatttcagt gggaagtgga gtcgtggcgc ctgcatctcg tgctgtacta 9900
cgtcgtggtg gtcggcctgg ccctcttctg cctcgatggt ggtcatgctg acgagcccgc 9960
gcgggaggca ggtccagacc tcggcgcgag cgggtcggag agcgaggacg agggcgcgca 10020
ggccggagct gtccagggtc ctgagacgct gcggagtcag gtcagtgggc agcggcggcg 10080
cgcggttgac ttgcaggagt ttttccaggg cgcgcgggag gtccagatgg tacttgatct 10140
ccaccgcgcc attggtggcg acgtcgatgg cttgcagggt cccgtgcccc tggggtgtga 10200
ccaccgtccc ccgtttcttc ttgggcggct ggggcgacgg gggcggtgcc tcttccatgg 10260
ttagaagcgg cggcgaggac gcgcgccggg cggcaggggc ggctcggggc ccggaggcag 10320
gggcggcagg ggcacgtcgg cgccgcgcgc gggtaggttc tggtactgcg cccggagaag 10380
actggcgtga gcgacgacgc gacggttgac gtcctggatc tgacgcctct gggtgaaggc 10440
cacgggaccc gtgagtttga acctgaaaga gagttcgaca gaatcaatct cggtatcgtt 10500
gacggcggcc tgccgcagga tctcttgcac gtcgcccgag ttgtcctggt aggcgatctc 10560
ggtcatgaac tgctcgatct cctcctcttg aaggtctccg cggccggcgc gctccacggt 10620
ggccgcgagg tcgttggaga tgcggcccat gagctgcgag aaggcgttca tgcccgcctc 10680
gttccagacg cggctgtaga ccacgacgcc ctcgggatcg cgggcgcgca tgaccacctg 10740
ggcgaggttg agctccacgt ggcgcgtgaa gaccgcgtag ttgcagaggc gctggtagag 10800
gtagttgagc gtggtggcga tgtgctcggt gacgaagaaa tacatgatcc agcggcggag 10860
cggcatctcg ctgacgtcgc ccagcgcctc caaacgttcc atggcctcgt aaaagtccac 10920
ggcgaagttg aaaaactggg agttgcgcgc cgagacggtc aactcctcct ccagaagacg 10980
gatgagctcg gcgatggtgg cgcgcacctc gcgctcgaag gcccccggga gttcctccac 11040
ttcctcttct tcctcctcca ctaacatctc ttctacttcc tcctcaggcg gcagtggtgg 11100
cgggggaggg ggcctgcgtc gccggcggcg cacgggcaga cggtcgatga agcgctcgat 11160
ggtctcgccg cgccggcgtc gcatggtctc ggtgacggcg cgcccgtcct cgcggggccg 11220
cagcgtgaag acgccgccgc gcatctccag gtggccgggg gggtccccgt tgggcaggga 11280
gagggcgctg acgatgcatc ttatcaattg ccccgtaggg actccgcgca aggacctgag 11340
cgtctcgaga tccacgggat ctgaaaaccg ctgaacgaag gcttcgagcc agtcgcagtc 11400
gcaaggtagg ctgagcacgg tttcttctgg cgggtcatgt tggttgggag cggggcgggc 11460
gatgctgctg gtgatgaagt tgaaataggc ggttctgaga cggcggatgg tggcgaggag 11520
caccaggtct ttgggcccgg cttgctggat gcgcagacgg tcggccatgc cccaggcgtg 11580
gtcctgacac ctggccaggt ccttgtagta gtcctgcatg agccgctcca cgggcacctc 11640
ctcctcgccc gcgcggccgt gcatgcgcgt gagcccgaag ccgcgctggg gctggacgag 11700
cgccaggtcg gcgacgacgc gctcggcgag gatggcttgc tggatctggg tgagggtggt 11760
ctggaagtca tcaaagtcga cgaagcggtg gtaggctccg gtgttgatgg tgtaggagca 11820
gttggccatg acggaccagt tgacggtctg gtggcccgga cgcacgagct cgtggtactt 11880
gaggcgcgag taggcgcgcg tgtcgaagat gtagtcgttg caggtgcgca ccaggtactg 11940
gtagccgatg aggaagtgcg gcggcggctg gcggtagagc ggccatcgct cggtggcggg 12000
ggcgccgggc gcgaggtcct cgagcatggt gcggtggtag ccgtagatgt acctggacat 12060
ccaggtgatg ccggcggcgg tggtggaggc gcgcgggaac tcgcggacgc ggttccagat 12120
gttgcgcagc ggcaggaagt agttcatggt gggcacggtc tggcccgtga ggcgcgcgca 12180
gtcgtggatg ctctatacgg gcaaaaacga aagcggtcag cggctcgact ccgtggcctg 12240
gaggctaagc gaacgggttg ggctgcgcgt gtaccccggt tcgaatctcg aatcaggctg 12300
gagccgcagc taacgtggta ttggcactcc cgtctcgacc caagcctgca ccaaccctcc 12360
aggatacgga ggcgggtcgt tttgcaactt ttttttggag gccggatgag actagtaagc 12420
gcggaaagcg gccgaccgcg atggctcgct gccgtagtct ggagaagaat cgccagggtt 12480
gcgttgcggt gtgccccggt tcgaggccgg ccggattccg cggctaacga gggcgtggct 12540
gccccgtcgt ttccaagacc ccatagccag ccgacttctc cagttacgga gcgagcccct 12600
cttttgtttt gtttgttttt gccagatgca tcccgtactg cggcagatgc gcccccacca 12660
ccctccaccg caacaacagc cccctccaca gccggcgctt ctgcccccgc cccagcagca 12720
acttccagcc acgaccgccg cggccgccgt gagcggggct ggacagagtt atgatcacca 12780
gctggccttg gaagagggcg aggggctggc gcgcctgggg gcgtcgtcgc cggagcggca 12840
cccgcgcgtg cagatgaaaa gggacgctcg cgaggcctac gtgcccaagc agaacctgtt 12900
cagagacagg agcggcgagg agcccgagga gatgcgcgcg gcccggttcc acgcggggcg 12960
ggagctgcgg cgcggcctgg accgaaagag ggtgctgagg gacgaggatt tcgaggcgga 13020
cgagctgacg gggatcagcc ccgcgcgcgc gcacgtggcc gcggccaacc tggtcacggc 13080
gtacgagcag accgtgaagg aggagagcaa cttccaaaaa tccttcaaca accacgtgcg 13140
caccctgatc gcgcgcgagg aggtgaccct gggcctgatg cacctgtggg acctgctgga 13200
ggccatcgtg cagaacccca ccagcaagcc gctgacggcg cagctgttcc tggtggtgca 13260
gcatagtcgg gacaacgaag cgttcaggga ggcgctgctg aatatcaccg agcccgaggg 13320
ccgctggctc ctggacctgg tgaacattct gcagagcatc gtggtgcagg agcgcgggct 13380
gccgctgtcc gagaagctgg cggccatcaa cttctcggtg ctgagtttgg gcaagtacta 13440
cgctaggaag atctacaaga ccccgtacgt gcccatagac aaggaggtga agatcgacgg 13500
gttttacatg cgcatgaccc tgaaagtgct gaccctgagc gacgatctgg gggtgtaccg 13560
caacgacagg atgcaccgtg cggtgagcgc cagcaggcgg cgcgagctga gcgaccagga 13620
gctgatgcat agtctgcagc gggccctgac cggggccggg accgaggggg agagctactt 13680
tgacatgggc gcggacctgc actggcagcc cagccgccgg gccttggagg cggcggcagg 13740
accctacgta gaagaggtgg acgatgaggt ggacgaggag ggcgagtacc tggaagactg 13800
atggcgcgac cgtatttttg ctagatgcaa caacaacagc cacctcctga tcccgcgatg 13860
cgggcggcgc tgcagagcca gccgtccggc attaactcct cggacgattg gacccaggcc 13920
atgcaacgca tcatggcgct gacgacccgc aaccccgaag cctttagaca gcagccccag 13980
gccaaccggc tctcggccat cctggaggcc gtggtgccct cgcgctccaa ccccacgcac 14040
gagaaggtcc tggccatcgt gaacgcgctg gtggagaaca aggccatccg cggcgacgag 14100
gccggcctgg tgtacaacgc gctgctggag cgcgtggccc gctacaacag caccaacgtg 14160
cagaccaacc tggaccgcat ggtgaccgac gtgcgcgagg ccgtggccca gcgcgagcgg 14220
ttccaccgcg agtccaacct gggatccatg gtggcgctga acgccttcct cagcacccag 14280
cccgccaacg tgccccgggg ccaggaggac tacaccaact tcatcagcgc cctgcgcctg 14340
atggtgaccg aggtgcccca gagcgaggtg taccagtccg ggccggacta cttcttccag 14400
accagtcgcc agggcttgca gaccgtgaac ctgagccagg ctttcaagaa cttgcagggc 14460
ctgtggggcg tgcaggcccc ggtcggggac cgcgcgacgg tgtcgagcct gctgacgccg 14520
aactcgcgcc tgctgctgct gctggtggcc cccttcacgg acagcggcag catcaaccgc 14580
aactcgtacc tgggctacct gattaacctg taccgcgagg ccatcggcca ggcgcacgtg 14640
gacgagcaga cctaccagga gatcacccac gtgagccgcg ccctgggcca ggacgacccg 14700
ggcaacctgg aagccaccct gaactttttg ctgaccaacc ggtcgcagaa gatcccgccc 14760
cagtacgcgc tcagcaccga ggaggagcgc atcctgcgtt acgtgcagca gagcgtgggc 14820
ctgttcctga tgcaggaggg ggccaccccc agcgccgcgc tcgacatgac cgcgcgcaac 14880
atggagccca gcatgtacgc cagcaaccgc ccgttcatca ataaactgat ggactacttg 14940
catcgggcgg ccgccatgaa ctctgactat ttcaccaacg ccatcctgaa tccccactgg 15000
ctcccgccgc cggggttcta cacgggcgag tacgacatgc ccgaccccaa tgacgggttc 15060
ctgtgggacg atgtggacag cagcgtgttc tccccccgac cgggtgctaa cgagcgcccc 15120
ttgtggaaga aggaaggcag cgaccgacgc ccgtcctcgg cgctgtccgg ccgcgagggt 15180
gctgccgcgg cggtgcccga ggccgccagt cctttcccga gcttgccctt ctcgctgaac 15240
agtatccgca gcagcgagct gggcaggatc acgcgcccgc gcttgctggg cgaagaggag 15300
tacttgaatg actcgctgtt gagacccgag cgggagaaga acttccccaa taacgggata 15360
gaaagcctgg tggacaagat gagccgctgg aagacgtatg cgcaggagca cagggacgat 15420
ccccgggcgt cgcagggggc cacgagccgg ggcagcgccg cccgtaaacg ccggtggcac 15480
gacaggcagc ggggacagat gtgggacgat gaggactccg ccgacgacag cagcgtgttg 15540
gacttgggtg ggagtggtaa cccgttcgct cacctgcgcc cccgtatcgg gcgcatgatg 15600
taagagaaac cgaaaataaa tgatactcac caaggccatg gcgaccagcg tgcgttcgtt 15660
tcttctctgt tgttgttgta tctagtatga tgaggcgtgc gtacccggag ggtcctcctc 15720
cctcgtacga gagcgtgatg cagcaggcga tggcggcggc ggcgatgcag cccccgctgg 15780
aggctcctta cgtgcccccg cggtacctgg cgcctacgga ggggcggaac agcattcgtt 15840
actcggagct ggcacccttg tacgatacca cccggttgta cctggtggac aacaagtcgg 15900
cggacatcgc ctcgctgaac taccagaacg accacagcaa cttcctgacc accgtggtgc 15960
agaacaatga cttcaccccc acggaggcca gcacccagac catcaacttt gacgagcgct 16020
cgcggtgggg cggccagctg aaaaccatca tgcacaccaa catgcccaac gtgaacgagt 16080
tcatgtacag caacaagttc aaggcgcggg tgatggtctc ccgcaagacc cccaatgggg 16140
tgacagtgac agaggattat gatggtagtc aggatgagct gaagtatgaa tgggtggaat 16200
ttgagctgcc cgaaggcaac ttctcggtga ccatgaccat cgacctgatg aacaacgcca 16260
tcatcgacaa ttacttggcg gtggggcggc agaacggggt gctggagagc gacatcggcg 16320
tgaagttcga cactaggaac ttcaggctgg gctgggaccc cgtgaccgag ctggtcatgc 16380
ccggggtgta caccaacgag gctttccatc ccgatattgt cttgctgccc ggctgcgggg 16440
tggacttcac cgagagccgc ctcagcaacc tgctgggcat tcgcaagagg cagcccttcc 16500
aggaaggctt ccagatcatg tacgaggatc tggagggggg caacatcccc gcgctcctgg 16560
atgtcgacgc ctatgagaaa agcaaggagg atgcagcagc tgaagcaact gcagccgtag 16620
ctaccgcctc taccgaggtc aggggcgata attttgcaag cgccgcagca gtggcagcgg 16680
ccgaggcggc tgaaaccgaa agtaagatag tcattcagcc ggtggagaag gatagcaaga 16740
acaggagcta caacgtacta ccggacaaga taaacaccgc ctaccgcagc tggtacctag 16800
cctacaacta tggcgacccc gagaagggcg tgcgctcctg gacgctgctc accacctcgg 16860
acgtcacctg cggcgtggag caagtctact ggtcgctgcc cgacatgatg caagacccgg 16920
tcaccttccg ctccacgcgt caagttagca actacccggt ggtgggcgcc gagctcctgc 16980
ccgtctactc caagagcttc ttcaacgagc aggccgtcta ctcgcagcag ctgcgcgcct 17040
tcacctcgct tacgcacgtc ttcaaccgct tccccgagaa ccagatcctc gtccgcccgc 17100
ccgcgcccac cattaccacc gtcagtgaaa acgttcctgc tctcacagat cacgggaccc 17160
tgccgctgcg cagcagtatc cggggagtcc agcgcgtgac cgttactgac gccagacgcc 17220
gcacctgccc ctacgtctac aaggccctgg gcatagtcgc gccgcgcgtc ctctcgagcc 17280
gcaccttcta aatgtccatt ctcatctcgc ccagtaataa caccggttgg ggcctgcgcg 17340
cgcccagcaa gatgtacgga ggcgctcgcc aacgctccac gcaacacccc gtgcgcgtgc 17400
gcgggcactt ccgcgctccc tggggcgccc tcaagggccg cgtgcggtcg cgcaccaccg 17460
tcgacgacgt gatcgaccag gtggtggccg acgcgcgcaa ctacaccccc gccgccgcgc 17520
ccgtctccac cgtggacgcc gtcatcgaca gcgtggtggc cgacgcgcgc cggtacgccc 17580
gcgccaagag ccggcggcgg cgcatcgccc ggcggcaccg gagcaccccc gccatgcgcg 17640
cggcgcgagc cttgctgcgc agggccaggc gcacgggacg cagggccatg ctcagggcgg 17700
ccagacgcgc ggcttcaggc gccagcgccg gcaggacccg gagacgcgcg gccacggcgg 17760
cggcagcggc catcgccagc atgtcccgcc cgcggcgagg gaacgtgtac tgggtgcgcg 17820
acgccgccac cggtgtgcgc gtgcccgtgc gcacccgccc ccctcgcact tgaagatgtt 17880
cacttcgcga tgttgatgtg tcccagcggc gaggaggatg tccaagcgca aattcaagga 17940
agagatgctc caggtcatcg cgcctgagat ctacggccct gcggtggtga aggaggaaag 18000
aaagccccgc aaaatcaagc gggtcaaaaa ggacaaaaag gaagaagaaa gtgatgtgga 18060
cggattggtg gagtttgtgc gcgagttcgc cccccggcgg cgcgtgcagt ggcgcgggcg 18120
gaaggtgcaa ccggtgctga gacccggcac caccgtggtc ttcacgcccg gcgagcgctc 18180
cggcaccgct tccaagcgct cctacgacga ggtgtacggg gatgatgata ttctggagca 18240
ggcggccgag cgcctgggcg agtttgctta cggcaagcgc agccgttccg caccgaagga 18300
agaggcggtg tccatcccgc tggaccacgg caaccccacg ccgagcctca agcccgtgac 18360
cttgcagcag gtgctgccga ccgcggcgcc gcgccggggg ttcaagcgcg agggcgagga 18420
tctgtacccc accatgcagc tgatggtgcc caagcgccag aagctggaag acgtgctgga 18480
gaccatgaag gtggacccgg acgtgcagcc cgaggtcaag gtgcggccca tcaagcaggt 18540
ggccccgggc ctgggcgtgc agaccgtgga catcaagatt cccacggagc ccatggaaac 18600
gcagaccgag cccatgatca agcccagcac cagcaccatg gaggtgcaga cggatccctg 18660
gatgccatcg gctcctagtc gaagaccccg gcgcaagtac ggcgcggcca gcctgctgat 18720
gcccaactac gcgctgcatc cttccatcat ccccacgccg ggctaccgcg gcacgcgctt 18780
ctaccgcggt cataccagca gccgccgccg caagaccacc actcgccgcc gccgtcgccg 18840
caccgccgct gcaaccaccc ctgccgccct ggtgcggaga gtgtaccgcc gcggccgcgc 18900
acctctgacc ctgccgcgcg cgcgctacca cccgagcatc gccatttaaa ctttcgcctg 18960
ctttgcagat caatggccct cacatgccgc cttcgcgttc ccattacggg ctaccgagga 19020
agaaaaccgc gccgtagaag gctggcgggg aacgggatgc gtcgccacca ccaccggcgg 19080
cggcgcgcca tcagcaagcg gttgggggga ggcttcctgc ccgcgctgat ccccatcatc 19140
gccgcggcga tcggggcgat ccccggcatt gcttccgtgg cggtgcaggc ctctcagcgc 19200
cactgagaca cacttggaaa catcttgtaa taaaccaatg gactctgacg ctcctggtcc 19260
tgtgatgtgt tttcgtagac agatggaaga catcaatttt tcgtccctgg ctccgcgaca 19320
cggcacgcgg ccgttcatgg gcacctggag cgacatcggc accagccaac tgaacggggg 19380
cgccttcaat tggagcagtc tctggagcgg gcttaagaat ttcgggtcca cgcttaaaac 19440
ctatggcagc aaggcgtgga acagcaccac agggcaggcg ctgagggata agctgaaaga 19500
gcagaacttc cagcagaagg tggtcgatgg gctcgcctcg ggcatcaacg gggtggtgga 19560
cctggccaac caggccgtgc agcggcagat caacagccgc ctggacccgg tgccgcccgc 19620
cggctccgtg gagatgccgc aggtggagga ggagctgcct cccctggaca agcggggcga 19680
gaagcgaccc cgccccgatg cggaggagac gctgctgacg cacacggacg agccgccccc 19740
gtacgaggag gcggtgaaac tgggtctgcc caccacgcgg cccatcgcgc ccctggccac 19800
cggggtgctg aaacccgaaa agcccgcgac cctggacttg cctcctcccc agccttcccg 19860
cccctctaca gtggctaagc ccctgccgcc ggtggccgtg gcccgcgcgc gacccggggg 19920
caccgcccgc cctcatgcga actggcagag cactctgaac agcatcgtgg gtctgggagt 19980
gcagagtgtg aagcgccgcc gctgctatta aacctaccgt agcgcttaac ttgcttgtct 20040
gtgtgtgtat gtattatgtc gccgccgccg ctgtccacca gaaggaggag tgaagaggcg 20100
cgtcgccgag ttgcaagatg gccaccccat cgatgctgcc ccagtgggcg tacatgcaca 20160
tcgccggaca ggacgcttcg gagtacctga gtccgggtct ggtgcagttt gcccgcgcca 20220
cagacaccta cttcagtctg gggaacaagt ttaggaaccc cacggtggcg cccacgcacg 20280
atgtgaccac cgaccgcagc cagcggctga cgctgcgctt cgtgcccgtg gaccgcgagg 20340
acaacaccta ctcgtacaaa gtgcgctaca cgctggccgt gggcgacaac cgcgtgctgg 20400
acatggccag cacctacttt gacatccgcg gcgtgctgga tcggggccct agcttcaaac 20460
cctactccgg caccgcctac aacagtctgg cccccaaggg agcacccaac acttgtcagt 20520
ggacatataa agccgatggt gaaactgcca cagaaaaaac ctatacatat ggaaatgcac 20580
ccgtgcaggg cattaacatc acaaaagatg gtattcaact tggaactgac accgatgatc 20640
agccaatcta cgcagataaa acctatcagc ctgaacctca agtgggtgat gctgaatggc 20700
atgacatcac tggtactgat gaaaagtatg gaggcagagc tcttaagcct gataccaaaa 20760
tgaagccttg ttatggttct tttgccaagc ctactaataa agaaggaggt caggcaaatg 20820
tgaaaacagg aacaggcact actaaagaat atgacataga catggctttc tttgacaaca 20880
gaagtgcggc tgctgctggc ctagctccag aaattgtttt gtatactgaa aatgtggatt 20940
tggaaactcc agatacccat attgtataca aagcaggcac agatgacagc agctcttcta 21000
ttaatttggg tcagcaagcc atgcccaaca gacctaacta cattggtttc agagacaact 21060
ttatcgggct catgtactac aacagcactg gcaatatggg ggtgctggcc ggtcaggctt 21120
ctcagctgaa tgctgtggtt gacttgcaag acagaaacac cgagctgtcc taccagctct 21180
tgcttgactc tctgggtgac agaacccggt atttcagtat gtggaatcag gcggtggaca 21240
gctatgatcc tgatgtgcgc attattgaaa atcatggtgt ggaggatgaa cttcccaact 21300
attgtttccc tctggatgct gttggcagaa cagatactta tcagggaatt aaggctaatg 21360
gaactgatca aaccacatgg accaaagatg acagtgtcaa tgatgctaat gagataggca 21420
agggtaatcc attcgccatg gaaatcaaca tccaagccaa cctgtggagg aacttcctct 21480
acgccaacgt ggccctgtac ctgcccgact cttacaagta cacgccggcc aatgttaccc 21540
tgcccaccaa caccaacacc tacgattaca tgaacggccg ggtggtggcg ccctcgctgg 21600
tggactccta catcaacatc ggggcgcgct ggtcgctgga tcccatggac aacgtgaacc 21660
ccttcaacca ccaccgcaat gcggggctgc gctaccgctc catgctcctg ggcaacgggc 21720
gctacgtgcc cttccacatc caggtgcccc agaaattttt cgccatcaag agcctcctgc 21780
tcctgcccgg gtcctacacc tacgagtgga acttccgcaa ggacgtcaac atgatcctgc 21840
agagctccct cggcaacgac ctgcgcacgg acggggcctc catctccttc accagcatca 21900
acctctacgc caccttcttc cccatggcgc acaacacggc ctccacgctc gaggccatgc 21960
tgcgcaacga caccaacgac cagtccttca acgactacct ctcggcggcc aacatgctct 22020
accccatccc ggccaacgcc accaacgtgc ccatctccat cccctcgcgc aactgggccg 22080
ccttccgcgg ctggtccttc acgcgtctca agaccaagga gacgccctcg ctgggctccg 22140
ggttcgaccc ctacttcgtc tactcgggct ccatccccta cctcgacggc accttctacc 22200
tcaaccacac cttcaagaag gtctccatca ccttcgactc ctccgtcagc tggcccggca 22260
acgaccggct cctgacgccc aacgagttcg aaatcaagcg caccgtcgac ggcgagggct 22320
acaacgtggc ccagtgcaac atgaccaagg actggttcct ggtccagatg ctggcccact 22380
acaacatcgg ctaccagggc ttctacgtgc ccgagggcta caaggaccgc atgtactcct 22440
tcttccgcaa cttccagccc atgagccgcc aggtggtgga cgaggtcaac tacaaggact 22500
accaggccgt caccctggcc taccagcaca acaactcggg cttcgtcggc tacctcgcgc 22560
ccaccatgcg ccagggccag ccctaccccg ccaactaccc ctacccgctc atcggcaaga 22620
gcgccgtcac cagcgtcacc cagaaaaagt tcctctgcga cagggtcatg tggcgcatcc 22680
ccttctccag caacttcatg tccatgggcg cgctcaccga cctcggccag aacatgctct 22740
atgccaactc cgcccacgcg ctagacatga atttcgaagt cgaccccatg gatgagtcca 22800
cccttctcta tgttgtcttc gaagtcttcg acgtcgtccg agtgcaccag ccccaccgcg 22860
gcgtcatcga ggccgtctac ctgcgcaccc ccttctcggc cggtaacgcc accacctaag 22920
ctcttgcttc ttgcaagcca tggccgcggg ctccggcgag caggagctca gggccatcat 22980
ccgcgacctg ggctgcgggc cctacttcct gggcaccttc gataagcgct tcccgggatt 23040
catggccccg cacaagctgg cctgcgccat cgtcaacacg gccggccgcg agaccggggg 23100
cgagcactgg ctggccttcg cctggaaccc gcgctcgaac acctgctacc tcttcgaccc 23160
cttcgggttc tcggacgagc gcctcaagca gatctaccag ttcgagtacg agggcctgct 23220
gcgccgcagc gccctggcca ccgaggaccg ctgcgtcacc ctggaaaagt ccacccagac 23280
cgtgcagggt ccgcgctcgg ccgcctgcgg gctcttctgc tgcatgttcc tgcacgcctt 23340
cgtgcactgg cccgaccgcc ccatggacaa gaaccccacc atgaacttgc tgacgggggt 23400
gcccaacggc atgctccagt cgccccaggt ggaacccacc ctgcgccgca accaggaggc 23460
gctctaccgc ttcctcaact cccactccgc ctactttcgc tcccaccgcg cgcgcatcga 23520
gaaggccacc gccttcgacc gcatgaatca agacatgtaa accgtgtgtg tatgttaaat 23580
gtctttaata aacagcactt tcatgttaca catgcatctg agatgattta tttagaaatc 23640
gaaagggttc tgccgggtct cggcatggcc cgcgggcagg gacacgttgc ggaactggta 23700
cttggccagc cacttgaact cggggatcag cagtttgggc agcggggtgt cggggaagga 23760
gtcggtccac agcttccgcg tcagttgcag ggcgcccagc aggtcgggcg cggagatctt 23820
gaaatcgcag ttgggacccg cgttctgcgc gcgggagttg cggtacacgg ggttgcagca 23880
ctggaacacc atcagggccg ggtgcttcac gctcgccagc accgtcgcgt cggtgatgct 23940
ctccacgtcg aggtcctcgg cgttggccat cccgaagggg gtcatcttgc aggtctgcct 24000
tcccatggtg ggcacgcacc cgggcttgtg gttgcaatcg cagtgcaggg ggatcagcat 24060
catctgggcc tggtcggcgt tcatccccgg gtacatggcc ttcatgaaag cctccaattg 24120
cctgaacgcc tgctgggcct tggctccctc ggtgaagaag accccgcagg acttgctaga 24180
gaactggttg gtggcgcacc cggcgtcgtg cacgcagcag cgcgcgtcgt tgttggccag 24240
ctgcaccacg ctgcgccccc agcggttctg ggtgatcttg gcccggtcgg ggttctcctt 24300
cagcgcgcgc tgcccgttct cgctcgccac atccatctcg atcatgtgct ccttctggat 24360
catggtggtc ccgtgcaggc accgcagctt gccctcggcc tcggtgcacc cgtgcagcca 24420
cagcgcgcac ccggtgcact cccagttctt gtgggcgatc tgggaatgcg cgtgcacgaa 24480
gccctgcagg aagcggccca tcatggtggt cagggtcttg ttgctagtga aggtcagcgg 24540
aatgccgcgg tgctcctcgt tgatgtacag gtggcagatg cggcggtaca cctcgccctg 24600
ctcgggcatc agctggaagt tggctttcag gtcggtctcc acgcggtagc ggtccatcag 24660
catagtcatg atttccatac ccttctccca ggccgagacg atgggcaggc tcatagggtt 24720
cttcaccatc atcttagcgc tagcagccgc ggccaggggg tcgctctcgt ccagggtctc 24780
aaagctccgc ttgccgtcct tctcggtgat ccgcaccggg gggtagctga agcccacggc 24840
cgccagctcc tcctcggcct gtctttcgtc ctcgctgtcc tggctgacgt cctgcaggac 24900
cacatgcttg gtcttgcggg gtttcttctt gggcggcagc ggcggcggag atgttggaga 24960
tggcgagggg gagcgcgagt tctcgctcac cactactatc tcttcctctt cttggtccga 25020
ggccacgcgg cggtaggtat gtctcttcgg gggcagaggc ggaggcgacg ggctctcgcc 25080
gccgcgactt ggcggatggc tggcagagcc ccttccgcgt tcgggggtgc gctcccggcg 25140
gcgctctgac tgacttcctc cgcggccggc cattgtgttc tcctagggag gaacaacaag 25200
catggagact cagccatcgc caacctcgcc atctgccccc accgccgacg agaagcagca 25260
gcagcagaat gaaagcttaa ccgccccgcc gcccagcccc gccacctccg acgcggccgt 25320
cccagacatg caagagatgg aggaatccat cgagattgac ctgggctatg tgacgcccgc 25380
ggagcacgag gaggagctgg cagtgcgctt ttcacaagaa gagatacacc aagaacagcc 25440
agagcaggaa gcagagaatg agcagagtca ggctgggctc gagcatgacg gcgactacct 25500
ccacctgagc gggggggagg acgcgctcat caagcatctg gcccggcagg ccaccatcgt 25560
caaggatgcg ctgctcgacc gcaccgaggt gcccctcagc gtggaggagc tcagccgcgc 25620
ctacgagttg aacctcttct cgccgcgcgt gccccccaag cgccagccca atggcacctg 25680
cgagcccaac ccgcgcctca acttctaccc ggtcttcgcg gtgcccgagg ccctggccac 25740
ctaccacatc tttttcaaga accaaaagat ccccgtctcc tgccgcgcca accgcacccg 25800
cgccgacgcc cttttcaacc tgggtcccgg cgcccgccta cctgatatcg cctccttgga 25860
agaggttccc aagatcttcg agggtctggg cagcgacgag actcgggccg cgaacgctct 25920
gcaaggagaa ggaggagagc atgagcacca cagcgccctg gtcgagttgg aaggcgacaa 25980
cgcgcggctg gcggtgctca aacgcacggt cgagctgacc catttcgcct acccggctct 26040
gaacctgccc cccaaagtca tgagcgcggt catggaccag gtgctcatca agcgcgcgtc 26100
gcccatctcc gaggacgagg gcatgcaaga ctccgaggag ggcaagcccg tggtcagcga 26160
cgagcagctg gcccggtggc tgggtcctaa tgctagtccc cagagtttgg aagagcggcg 26220
caaactcatg atggccgtgg tcctggtgac cgtggagctg gagtgcctgc gccgcttctt 26280
cgccgacgcg gagaccctgc gcaaggtcga ggagaacctg cactacctct tcaggcacgg 26340
gttcgtgcgc caggcctgca agatctccaa cgtggagctg accaacctgg tctcctacat 26400
gggcatcttg cacgagaacc gcctggggca gaacgtgctg cacaccaccc tgcgcgggga 26460
ggcccggcgc gactacatcc gcgactgcgt ctacctctac ctctgccaca cctggcagac 26520
gggcatgggc gtgtggcagc agtgtctgga ggagcagaac ctgaaagagc tctgcaagct 26580
cctgcagaag aacctcaagg gtctgtggac cgggttcgac gagcgcacca ccgcctcgga 26640
cctggccgac ctcattttcc ccgagcgcct caggctgacg ctgcgcaacg gcctgcccga 26700
ctttatgagc caaagcatgt tgcaaaactt tcgctctttc atcctcgaac gctccggaat 26760
cctgcccgcc acctgctccg cgctgccctc ggacttcgtg ccgctgacct tccgcgagtg 26820
ccccccgccg ctgtggagcc actgctacct gctgcgcctg gccaactacc tggcctacca 26880
ctcggacgtg atcgaggacg tcagcggcga gggcctgctc gagtgccact gccgctgcaa 26940
cctctgcacg ccgcaccgct ccctggcctg caacccccag ctgctgagcg agacccagat 27000
catcggcacc ttcgagttgc aagggcccag cgaaggcgag ggttcagccg ccaagggggg 27060
tctgaaactc accccggggc tgtggacctc ggcctacttg cgcaagttcg tgcccgagga 27120
ctaccatccc ttcgagatca ggttctacga ggaccaatcc catccgccca aggccgagct 27180
gtcggcctgc gtcatcaccc agggggcgat cctggcccaa ttgcaagcca tccagaaatc 27240
ccgccaagaa ttcttgctga aaaagggccg cggggtctac ctcgaccccc agaccggtga 27300
ggagctcaac cccggcttcc cccaggatgc cccgaggaaa caagaagctg aaagtggagc 27360
tgccgcccgt ggaggatttg gaggaagact gggagaacag cagtcaggca gaggaggagg 27420
agatggagga agactgggac agcactcagg cagaggagga cagcctgcaa gacagtctgg 27480
aggaagacga ggaggaggca gaggaggagg tggaagaagc agccgccgcc agaccgtcgt 27540
cctcggcggg ggagaaagca agcagcacgg ataccatctc cgctccgggt cggggtcccg 27600
ctcgaccaca cagtagatgg gacgagaccg gacgattccc gaaccccacc acccagaccg 27660
gtaagaagga gcggcaggga tacaagtcct ggcgggggca caaaaacgcc atcgtctcct 27720
gcttgcaggc ctgcgggggc aacatctcct tcacccggcg ctacctgctc ttccaccgcg 27780
gggtgaactt tccccgcaac atcttgcatt actaccgtca cctccacagc ccctactact 27840
tccaagaaga ggcagcagca gcagaaaaag accagcagaa aaccagcagc tagaaaatcc 27900
acagcggcgg cagcaggtgg actgaggatc gcggcgaacg agccggcgca aacccgggag 27960
ctgaggaacc ggatctttcc caccctctat gccatcttcc agcagagtcg ggggcaggag 28020
caggaactga aagtcaagaa ccgttctctg cgctcgctca cccgcagttg tctgtatcac 28080
aagagcgaag accaacttca gcgcactctc gaggacgccg aggctctctt caacaagtac 28140
tgcgcgctca ctcttaaaga gtagcccgcg cccgcccagt cgcagaaaaa ggcgggaatt 28200
acgtcacctg tgcccttcgc cctagccgcc tccacccatc atcatgagca aagagattcc 28260
cacgccttac atgtggagct accagcccca gatgggcctg gccgccggtg ccgcccagga 28320
ctactccacc cgcatgaatt ggctcagcgc cgggcccgcg atgatctcac gggtgaatga 28380
catccgcgcc caccgaaacc agatactcct agaacagtca gcgctcaccg ccacgccccg 28440
caatcacctc aatccgcgta attggcccgc cgccctggtg taccaggaaa ttccccagcc 28500
cacgaccgta ctacttccgc gagacgccca ggccgaagtc cagctgacta actcaggtgt 28560
ccagctggcg ggcggcgcca ccctgtgtcg tcaccgcccc gctcagggta taaagcggct 28620
ggtgatccgg ggcagaggca cacagctcaa cgacgaggtg gtgagctctt cgctgggtct 28680
gcgacctgac ggagtcttcc aactcgccgg atcggggaga tcttccttca cgcctcgtca 28740
ggccgtcctg actttggaga gttcgtcctc gcagccccgc tcgggtggca tcggcactct 28800
ccagttcgtg gaggagttca ctccctcggt ctacttcaac cccttctccg gctcccccgg 28860
ccactacccg gacgagttca tcccgaactt cgacgccatc agcgagtcgg tggacggcta 28920
cgattgaatg tcccatggtg gcgcagctga cctagctcgg cttcgacacc tggaccactg 28980
ccgccgcttc cgctgcttcg ctcgggatct cgccgagttt gcctactttg agctgcccga 29040
ggagcaccct cagggcccgg cccacggagt gcggatcgtc gtcgaagggg gcctcgactc 29100
ccacctgctt cggatcttca gccagcgtcc gatcctggtc gagcgcgagc aaggacagac 29160
ccttctgact ctgtactgca tctgcaacca ccccggcctg catgaaagtc tttgttgtct 29220
gctgtgtact gagtataata aaagctgaga tcagcgacta ctccggactt ccgtgtgttc 29280
ctgaatccat caaccagtct ttgttcttca ccgggaacga gaccgagctc cagctccagt 29340
gtaagcccca caagaagtac ctcacctggc tgttccaggg ctccccgatc gccgttgtca 29400
accactgcga caacgacgga gtcctgctga gcggccctgc caaccttact ttttccaccc 29460
gcagaagcaa gctccagctc ttccaaccct tcctccccgg gacctatcag tgcgtctcgg 29520
gaccctgcca tcacaccttc cacctgatcc cgaataccac agcgtcgctc cccgctacta 29580
acaaccaaac taacctccac caacgccacc gtcgctaggc cacaatacat gcccatatta 29640
gactatgagg ccgagccaca gcgacccatg ctccccgcta ttagttactt caatctaacc 29700
ggcggagatg actgacccac tggccaacaa caacgtcaac gaccttctcc tggacatgga 29760
cggccgcgcc tcggagcagc gactcgccca acttcgcatt cgccagcagc aggagagagc 29820
cgtcaaggag ctgcaggatg cggtggccat ccaccagtgc aagagaggca tcttctgcct 29880
ggtgaaacag gccaagatct cctacgaggt cactccaaac gaccatcgcc tctcctacga 29940
gctcctgcag cagcgccaga agttcacctg cctggtcgga gtcaacccca tcgtcatcac 30000
ccagcagtct ggcgatacca aggggtgcat ccactgctcc tgcgactccc ccgactgcgt 30060
ccacactctg atcaagaccc tctgcggcct ccgcgacctc ctccccatga actaatcacc 30120
cccttatcca gtgaaataaa gatcatattg atgatgattt tacagaaata aaaaataatc 30180
atttgatttg aaataaagat acaatcatat tgatgatttg agtttaacaa aaaaataaag 30240
aatcacttac ttgaaatctg ataccaggtc tctgtccatg ttttctgcca acaccacttc 30300
actcccctct tcccagctct ggtactgcag gccccggcgg gctgcaaact tcctccacac 30360
gctgaagggg atgtcaaatt cctcctgtcc ctcaatcttc attttatctt ctatcagatg 30420
tccaaaaagc gcgtccgggt ggatgatgac ttcgaccccg tctaccccta cgatgcagac 30480
aacgcaccga ccgtgccctt catcaacccc cccttcgtct cttcagatgg attccaagag 30540
aagcccctgg gggtgttgtc cctgcgactg gccgaccccg tcaccaccaa gaacggggaa 30600
atcaccctca agctgggaga gggggtggac ctcgattcct cgggaaaact catctccaac 30660
acggccacca aggccgccgc ccctctcagt ttttccaaca acaccatttc ccttaacatg 30720
gatcacccct tttacactaa agatggaaaa ttatccttac aagtttctcc accattaaat 30780
atactgagaa caagcattct aaacacacta gctttaggtt ttggatcagg tttaggactc 30840
cgtggctctg ccttggcagt acagttagtc tctccactta catttgatac tgatggaaac 30900
ataaagctta ccttagacag aggtttgcat gttacaacag gagatgcaat tgaaagcaac 30960
ataagctggg ctaaaggttt aaaatttgaa gatggagcca tagcaaccaa cattggaaat 31020
gggttagagt ttggaagcag tagtacagaa acaggtgttg atgatgctta cccaatccaa 31080
gttaaacttg gatctggcct tagctttgac agtacaggag ccataatggc tggtaacaaa 31140
gaagacgata aactcacttt gtggacaaca cctgatccat caccaaactg tcaaatactc 31200
gcagaaaatg atgcaaaact aacactttgc ttgactaaat gtggtagtca aatactggcc 31260
actgtgtcag tcttagttgt aggaagtgga aacctaaacc ccattactgg caccgtaagc 31320
agtgctcagg tgtttctacg ttttgatgca aacggtgttc ttttaacaga acattctaca 31380
ctaaaaaaat actgggggta taggcaggga gatagcatag atggcactcc atataccaat 31440
gctgtaggat tcatgcccaa tttaaaagct tatccaaagt cacaaagttc tactactaaa 31500
aataatatag tagggcaagt atacatgaat ggagatgttt caaaacctat gcttctcact 31560
ataaccctca atggtactga tgacagcaac agtacatatt caatgtcatt ttcatacacc 31620
tggactaatg gaagctatgt tggagcaaca tttggggcta actcttatac cttctcatac 31680
atcgcccaag aatgaacact gtatcccacc ctgcatgcca acccttccca ccccactctg 31740
tggaacaaac tctgaaacac aaaataaaat aaagttcaag tgttttattg attcaacagt 31800
tttacaggat tcgagcagtt atttttcctc caccctccca ggacatggaa tacaccaccc 31860
tctccccccg cacagccttg aacatctgaa tgccattggt gatggacatg cttttggtct 31920
ccacgttcca cacagtttca gagcgagcca gtctcgggtc ggtcagggag atgaaaccct 31980
ccgggcactc ccgcatctgc acctcacagc tcaacagctg aggattgtcc tcggtggtcg 32040
ggatcacggt tatctggaag aagcagaaga gcggcggtgg gaatcatagt ccgcgaacgg 32100
gatcggccgg tggtgtcgca tcaggccccg cagcagtcgc tgccgccgcc gctccgtcaa 32160
gctgctgctc agggggtccg ggtccaggga ctccctcagc atgatgccca cggccctcag 32220
catcagtcgt ctggtgcggc gggcgcagca gcgcatgcgg atctcgctca ggtcgctgca 32280
gtacgtgcaa cacagaacca ccaggttgtt caacagtcca tagttcaaca cgctccagcc 32340
gaaactcatc gcgggaagga tgctacccac gtggccgtcg taccagatcc tcaggtaaat 32400
caagtggtgc cccctccaga acacgctgcc cacgtacatg atctccttgg gcatgtggcg 32460
gttcaccacc tcccggtacc acatcaccct ctggttgaac atgcagcccc ggatgatcct 32520
gcggaaccac agggccagca ccgccccgcc cgccatgcag cgaagagacc ccgggtcccg 32580
gcaatggcaa tggaggaccc accgctcgta cccgtggatc atctgggagc tgaacaagtc 32640
tatgttggca cagcacaggc atatgctcat gcatctcttc agcactctca actcctcggg 32700
ggtcaaaacc atatcccagg gcacggggaa ctcttgcagg acagcgaacc ccgcagaaca 32760
gggcaatcct cgcacagaac ttacattgtg catggacagg gtatcgcaat caggcagcac 32820
cgggtgatcc tccaccagag aagcgcgggt ctcggtctcc tcacagcgtg gtaagggggc 32880
cggccgatac gggtgatggc gggacgcggc tgatcgtgtt cgcgaccgtg tcatgatgca 32940
gttgctttcg gacattttcg tacttgctgt agcagaacct ggtccgggcg ctgcacaccg 33000
atcgccggcg gcggtctcgg cgcttggaac gctcggtgtt gaaattgtaa aacagccact 33060
ctctcagacc gtgcagcaga tctagggcct caggagtgat gaagatccca tcatgcctga 33120
tggctctgat cacatcgacc accgtggaat gggccagacc cagccagatg atgcaatttt 33180
gttgggtttc ggtgacggcg ggggagggaa gaacaggaag aaccatgatt aacttttaat 33240
ccaaacggtc tcggagtact tcaaaatgaa gatcgcggag atggcacctc tcgcccccgc 33300
tgtgttggtg gaaaataaca gccaggtcaa aggtgatacg gttctcgaga tgttccacgg 33360
tggcttccag caaagcctcc acgcgcacat ccagaaacaa gacaatagcg aaagcgggag 33420
ggttctctaa ttcctcaatc atcatgttac actcctgcac catccccaga taattttcat 33480
ttttccagcc ttgaatgatt cgaactagtt cctgaggtaa atccaagcca gccatgataa 33540
agagctcgcg cagagcgccc tccaccggca ttcttaagca caccctcata attccaagat 33600
attctgctcc tggttcacct gcagcagatt gacaagcgga atatcaaaat ctctgccgcg 33660
atccctgagc tcctccctca gcaataactg taagtactct ttcatatcct ctccgaaatt 33720
tttagccata ggaccaccag gaataagatt agggcaagcc acagtacaga taaaccgaag 33780
tcctccccag tgagcattgc caaatgcaag actgctataa gcatgctggc tagacccggt 33840
gatatcttcc agataactgg acagaaaatc gcccaggcaa tttttaagaa aatcaacaaa 33900
agaaaaatcc tccaggtgga cgtttagagc ctcgggaaca acgatgaagt aaatgcaagc 33960
ggtgcgttcc agcatggtta gttagctgat ctgtagaaaa aacaaaaatg aacattaaac 34020
catgctagcc tggcgaacag gtgggtaaat cgttctctcc agcaccaggc aggccacggg 34080
gtctccggcg cgaccctcgt aaaaattgtc gctatgattg aaaaccatca cagagagacg 34140
ttcccggtgg ccggcgtgaa tgattcgaca agatgaatac acccccggaa cattggcgtc 34200
cgcgagtgaa aaaaagcgcc cgaggaagca ataaggcact acaatgctca gtctcaagtc 34260
cagcaaagcg atgccatgcg gatgaagcac aaaattctca ggtgcgtaca aaatgtaatt 34320
actcccctcc tgcacaggca gcaaagcccc cgatccctcc aggtacacat acaaagcctc 34380
agcgtccata gcttaccgag cagcagcaca caacaggcgc aagagtcaga gaaaggctga 34440
gctctaacct gtccacccgc tctctgctca atatatagcc cagatctaca ctgacgtaaa 34500
ggccaaagtc taaaaatacc cgccaaataa tcacacacgc ccagcacacg cccagaaacc 34560
ggtgacacac tcaaaaaaat acgcgcactt cctcaaacgc ccaaaactgc cgtcatttcc 34620
gggttcccac gctacgtcat caaaacacga ctttcaaatt ccgtcgaccg ttaaaaacgt 34680
cacccgcccc gcccctaacg gtcgcccgtc tctcagccaa tcagcgcccc gcatccccaa 34740
attcaaacgc ctcatttgca tattaacgcg cacaaaaagt ttgaggtata ttattgatga 34800
tgg 34803
<210> 64
<211> 1145
<212> ПРТ
<213> Искуственная последовательность
<220>
<223> Синтетическая конструкция
<400> 64
Met Ala Ser Ile Val Gly Gly Trp Glu Cys Glu Lys His Ser Gln Pro
1 5 10 15
Trp Gln Val Leu Val Ala Ser Arg Gly Arg Ala Val Cys Gly Gly Val
20 25 30
Leu Val His Pro Gln Trp Val Leu Thr Ala Ala His Cys Ile Arg Asn
35 40 45
Lys Ser Val Ile Leu Leu Gly Arg His Ser Leu Phe His Pro Glu Asp
50 55 60
Thr Gly Gln Val Phe Gln Val Ser His Ser Phe Pro His Pro Leu Tyr
65 70 75 80
Asp Met Ser Leu Leu Lys Asn Arg Phe Leu Arg Pro Gly Asp Asp Ser
85 90 95
Ser His Asp Leu Met Leu Leu Arg Leu Ser Glu Pro Ala Glu Leu Thr
100 105 110
Asp Ala Val Lys Val Met Asp Leu Pro Thr Gln Glu Pro Ala Leu Gly
115 120 125
Thr Thr Cys Tyr Ala Ser Gly Trp Gly Ser Ile Glu Pro Glu Glu Phe
130 135 140
Leu Thr Pro Lys Lys Leu Gln Cys Val Asp Leu His Val Ile Ser Asn
145 150 155 160
Asp Val Cys Ala Gln Val His Pro Gln Lys Val Thr Lys Phe Met Leu
165 170 175
Cys Ala Gly Arg Trp Thr Gly Gly Lys Ser Thr Cys Ser Gly Asp Ser
180 185 190
Gly Gly Pro Leu Val Cys Asn Gly Val Leu Gln Gly Ile Thr Ser Trp
195 200 205
Gly Ser Glu Pro Cys Ala Leu Pro Glu Arg Pro Ser Leu Tyr Thr Lys
210 215 220
Val Val His Tyr Arg Lys Trp Ile Lys Asp Thr Ile Val Ala Asn Pro
225 230 235 240
Gly Ser Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
245 250 255
Glu Ser Asn Pro Gly Pro Met Ala Ser Ala Arg Arg Pro Arg Trp Leu
260 265 270
Cys Ala Gly Ala Leu Val Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe
275 280 285
Leu Phe Gly Trp Phe Ile Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr
290 295 300
Pro Lys His Asn Met Lys Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn
305 310 315 320
Ile Lys Lys Phe Leu Tyr Asn Phe Thr Gln Ile Pro His Leu Ala Gly
325 330 335
Thr Glu Gln Asn Phe Gln Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys
340 345 350
Glu Phe Gly Leu Asp Ser Val Glu Leu Ala His Tyr Asp Val Leu Leu
355 360 365
Ser Tyr Pro Asn Lys Thr His Pro Asn Tyr Ile Ser Ile Ile Asn Glu
370 375 380
Asp Gly Asn Glu Ile Phe Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro
385 390 395 400
Gly Tyr Glu Asn Val Ser Asp Ile Val Pro Pro Phe Ser Ala Phe Ser
405 410 415
Pro Gln Gly Met Pro Glu Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg
420 425 430
Thr Glu Asp Phe Phe Lys Leu Glu Arg Asp Met Lys Ile Asn Cys Ser
435 440 445
Gly Lys Ile Val Ile Ala Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys
450 455 460
Val Lys Asn Ala Gln Leu Ala Gly Ala Lys Gly Val Ile Leu Tyr Ser
465 470 475 480
Asp Pro Ala Asp Tyr Phe Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly
485 490 495
Trp Asn Leu Pro Gly Gly Gly Val Gln Arg Gly Asn Ile Leu Asn Leu
500 505 510
Asn Gly Ala Gly Asp Pro Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr
515 520 525
Ala Tyr Arg Arg Gly Ile Ala Glu Ala Val Gly Leu Pro Ser Ile Pro
530 535 540
Val His Pro Ile Gly Tyr Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met
545 550 555 560
Gly Gly Ser Ala Pro Pro Asp Ser Ser Trp Arg Gly Ser Leu Lys Val
565 570 575
Pro Tyr Asn Val Gly Pro Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys
580 585 590
Val Lys Met His Ile His Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn
595 600 605
Val Ile Gly Thr Leu Arg Gly Ala Val Glu Pro Asp Arg Tyr Val Ile
610 615 620
Leu Gly Gly His Arg Asp Ser Trp Val Phe Gly Gly Ile Asp Pro Gln
625 630 635 640
Ser Gly Ala Ala Val Val His Glu Ile Val Arg Ser Phe Gly Thr Leu
645 650 655
Lys Lys Glu Gly Trp Arg Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp
660 665 670
Asp Ala Glu Glu Phe Gly Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu
675 680 685
Asn Ser Arg Leu Leu Gln Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp
690 695 700
Ser Ser Ile Glu Gly Asn Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu
705 710 715 720
Met Tyr Ser Leu Val His Asn Leu Thr Lys Glu Leu Lys Ser Pro Asp
725 730 735
Glu Gly Phe Glu Gly Lys Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser
740 745 750
Pro Ser Pro Glu Phe Ser Gly Met Pro Arg Ile Ser Lys Leu Gly Ser
755 760 765
Gly Asn Asp Phe Glu Val Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly
770 775 780
Arg Ala Arg Tyr Thr Lys Asn Trp Glu Thr Asn Lys Phe Ser Gly Tyr
785 790 795 800
Pro Leu Tyr His Ser Val Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe
805 810 815
Tyr Asp Pro Met Phe Lys Tyr His Leu Thr Val Ala Gln Val Arg Gly
820 825 830
Gly Met Val Phe Glu Leu Ala Asn Ser Ile Val Leu Pro Phe Asp Cys
835 840 845
Arg Asp Tyr Ala Val Val Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Ser
850 855 860
Ile Ser Met Lys His Pro Gln Glu Met Lys Thr Tyr Ser Val Ser Phe
865 870 875 880
Asp Ser Leu Phe Ser Ala Val Lys Asn Phe Thr Glu Ile Ala Ser Lys
885 890 895
Phe Ser Glu Arg Leu Gln Asp Phe Asp Lys Ser Asn Pro Ile Val Leu
900 905 910
Arg Met Met Asn Asp Gln Leu Met Phe Leu Glu Arg Ala Phe Ile Asp
915 920 925
Pro Leu Gly Leu Pro Asp Arg Pro Phe Tyr Arg His Val Ile Tyr Ala
930 935 940
Pro Ser Ser His Asn Lys Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr
945 950 955 960
Asp Ala Leu Phe Asp Ile Glu Ser Lys Val Asp Pro Ser Lys Ala Trp
965 970 975
Gly Glu Val Lys Arg Gln Ile Tyr Val Ala Ala Phe Thr Val Gln Ala
980 985 990
Ala Ala Glu Thr Leu Ser Glu Val Ala Gly Ser Glu Gly Arg Gly Ser
995 1000 1005
Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Ala Ser
1010 1015 1020
Lys Ala Val Leu Leu Ala Leu Leu Met Ala Gly Leu Ala Leu Gln
1025 1030 1035
Pro Gly Thr Ala Leu Leu Cys Tyr Ser Cys Lys Ala Gln Val Ser
1040 1045 1050
Asn Glu Asp Cys Leu Gln Val Glu Asn Cys Thr Gln Leu Gly Glu
1055 1060 1065
Gln Cys Trp Thr Ala Arg Ile Arg Ala Val Gly Leu Leu Thr Val
1070 1075 1080
Ile Ser Lys Gly Cys Ser Leu Asn Cys Val Asp Asp Ser Gln Asp
1085 1090 1095
Tyr Tyr Val Gly Lys Lys Asn Ile Thr Cys Cys Asp Thr Asp Leu
1100 1105 1110
Cys Asn Ala Ser Gly Ala His Ala Leu Gln Pro Ala Ala Ala Ile
1115 1120 1125
Leu Ala Leu Leu Pro Ala Leu Gly Leu Leu Leu Trp Gly Pro Gly
1130 1135 1140
Gln Leu
1145
<210> 65
<211> 246
<212> ДНК
<213> Искуственная последовательность
<220>
<223> Синтетическая конструкция
<400> 65
atggctagca tcgtcggagg gtgggagtgc gaaaagcact cacagccatg gcaggtcctg 60
gtcgcctcgc gcggacgcgc cgtgtgtgga ggtgtgctgg tccacccgca gtgggtgttg 120
actgcggccc attgcatcag aaataagtcc gtgatcctct tggggagaca ttccctgttt 180
caccccgaag atactggaca ggtgttccaa gtgagccact ccttcccgca tccactgtac 240
gacatg 246
<210> 66
<211> 245
<212> ДНК
<213> Искуственная последовательность
<220>
<223> Синтетическая конструкция
<400> 66
atggctagca aagcagtgct gctggcgctc ctgatggctg gactcgcgct gcagcctgga 60
accgccctgc tctgttactc gtgcaaggcc caagtctcga atgaggactg tttgcaagtg 120
gaaaactgca cccagctcgg agaacaatgc tggactgcac ggatccgcgc tgtcggcctg 180
ctgaccgtga tctccaaagg gtgctcattg aactgcgtgg acgatagcca ggactactac 240
gtggg 245
название | год | авторы | номер документа |
---|---|---|---|
ХИМЕРНЫЕ РЕЦЕПТОРЫ АНТИГЕНА, НАЦЕЛЕННЫЕ НА PSCA | 2016 |
|
RU2759879C2 |
ИММУННЫЕ КЛЕТКИ, ЭКСПРЕССИРУЮЩИЕ ОБРАТНЫЙ УНИВЕРСАЛЬНЫЙ ХИМЕРНЫЙ АНТИГЕННЫЙ РЕЦЕПТОР, ДЛЯ НАЦЕЛИВАНИЯ НА РАЗЛИЧНЫЕ МНОГОЧИСЛЕННЫЕ АНТИГЕНЫ И СПОСОБ ИХ ПОЛУЧЕНИЯ И ПРИМЕНЕНИЯ ДЛЯ ЛЕЧЕНИЯ РАКА, ИНФЕКЦИЙ И АУТОИММУННЫХ ЗАБОЛЕВАНИЙ | 2019 |
|
RU2824391C2 |
ХИМЕРНЫЙ ЦИТОКИНОВЫЙ РЕЦЕПТОР | 2016 |
|
RU2826122C1 |
АМАТОКСИНОВЫЕ КОНЪЮГАТЫ АНТИТЕЛА С ЛЕКАРСТВЕННЫМ СРЕДСТВОМ И ИХ ПРИМЕНЕНИЕ | 2020 |
|
RU2826004C2 |
БИСПЕЦИФИЧНЫЙ СЛИТЫЙ БЕЛОК И ЕГО ПРИМЕНЕНИЕ | 2021 |
|
RU2801528C2 |
ГУМАНИЗИРОВАННЫЕ АНТИТЕЛА ПРОТИВ PSMA | 2019 |
|
RU2794450C2 |
IL-12 ГЕТЕРОДИМЕРНЫЕ СЛИТЫЕ БЕЛКИ FC | 2019 |
|
RU2819097C2 |
УЛУЧШЕННЫЕ АНТИГЕНСВЯЗЫВАЮЩИЕ РЕЦЕПТОРЫ | 2018 |
|
RU2825816C2 |
МОДИФИЦИРОВАННЫЕ ГЕМОПОЭТИЧЕСКИЕ СТВОЛОВЫЕ КЛЕТКИ/КЛЕТКИ-ПРЕДШЕСТВЕННИКИ И Не-Т ЭФФЕКТОРНЫЕ КЛЕТКИ, И ИХ ПРИМЕНЕНИЕ | 2014 |
|
RU2733652C2 |
ИНСЕКТИЦИДНЫЕ БЕЛКИ РАСТИТЕЛЬНОГО ПРОИСХОЖДЕНИЯ И СПОСОБЫ ИХ ПРИМЕНЕНИЯ | 2016 |
|
RU2762832C2 |
Изобретение относится к области биотехнологии, конкретно к получению вектора экспрессии, содержащего (а) нуклеотидную последовательность С68 и (б) мультиантигенную конструкцию ДНК, кодирующую иммуногенные полипептиды простатоассоциированных антигенов (РАА), что может быть использовано в медицине. Рекомбинантным путем получают вектор экспрессии С68, который используют в составе фармацевтической композиции для вызова иммунного ответа на РАА. Изобретение позволяет повысить эффективность лечения рака предстательной железы у человека. 5 н. и 19 з.п. ф-лы, 13 ил., 15 табл., 11 пр.
1. Вектор экспрессии С68, содержащий:
(а) нуклеотидную последовательность С68 и
(б) мультиантигенную конструкцию ДНК, которая содержит по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA (простатоспецифический антиген), по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA (антиген стволовых клеток простаты), и по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA (простатоспецифический мембранный антиген), где иммуногенный полипептид PSA содержит аминокислоты 27-263 из SEQ ID NO: 15 или аминокислоты 4-240 из SEQ ID NO: 17.
2. Вектор С68 по п. 1, где нуклеотидная последовательность С68 представляет собой последовательность SEQ ID NO: 57, в которой отсутствует по меньшей мере один ген, выбранный из группы, состоящей из генов Е1А, Е1В, Е2А, Е2В, Е3, Е4, L1, L2, L3, L4 и L5, где иммуногенный полипептид PSCA содержит аминокислотную последовательность SEQ ID NO: 21 или аминокислоты 4-125 из SEQ ID NO: 21 и где иммуногенный полипептид PSMA выбран из группы, состоящей из:
1) полипептида, содержащего аминокислоты 15-750 из SEQ ID NO: 1;
2) полипептида, содержащего аминокислотную последовательность SEQ ID NO: 3;
3) полипептида, содержащего аминокислотную последовательность SEQ ID NO: 5;
4) полипептида, содержащего аминокислотную последовательность SEQ ID NO: 7;
5) полипептида, содержащего аминокислоты 4-739 из SEQ ID NO: 9;
6) полипептида, содержащего аминокислоты 4-739 из SEQ ID NO: 3;
7) полипептида, содержащего аминокислоты 4-739 из SEQ ID NO: 5;
8) полипептида, содержащего аминокислоты 4-739 из SEQ ID NO: 7, и
9) полипептида, содержащего аминокислотную последовательность SEQ ID NO: 9.
3. Вектор С68 по п. 2, где нуклеотидная последовательность С68 представляет собой последовательность SEQ ID NO: 57, в которой отсутствуют гены Е1А, Е1В и Е3, и где мультиантигенная конструкция дополнительно содержит разделяющую последовательность между двумя нуклеотидными последовательностями, кодирующими два разных иммуногенных полипептида, и имеет структуру формулы (I)
где в формуле (I):
(1) РАА1 (простатоассоциированный антиген 1), РАА2 и РАА3, каждый, представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, или нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, при условии, что РАА1, РАА2 и РАА3 кодируют разные полипептиды РАА, и
(2) SS1 и SS2 представляют собой разделяющие последовательности и могут быть одинаковыми или разными.
4. Вектор С68 по п. 3, где разделяющие последовательности выбраны из последовательностей 2А-пептидов и участков внутренней посадки рибосомы (IRES).
5. Вектор С68 по п. 4, где последовательность 2А-пептида выбрана из группы, состоящей из последовательности 2А-пептида из вируса ящура (FMDV), вируса А, вызывающего ринит у лошадей (ERAV), вируса 1 болезни Тешена у свиней (PTV1), вируса энцефаломиокардита, варианта В (ЕМС-В), вируса энцефаломиокардита (EMCV), вируса мышиного энцефаломиелита Тейлора GD7 (TME-GD7), вируса В, вызывающего ринит у лошадей (ERBV), вируса Thosea asigna (TaV), вируса С дрозофилы (DrosC), вируса паралича сверчка (CrPV), вируса острого паралича пчел (ABPV), вируса инфекционного заболевания тутового шелкопряда (IFV), ротавируса свиней, ротавируса человека, TSR1 Т. brucei и апуриновой/апиримидиновой (АР) эндонуклеазы Т. cruzi, и где IRES (участок внутренней посадки рибосомы) представляет собой IRES из EMCV.
6. Вектор С68 по п. 5, где РАА1 в формуле (I) представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, или нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA.
7. Вектор С68 по п. 6, где:
(1) РАА1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA;
(2) РАА2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA или PSMA;
(3) SS1 представляет собой последовательность 2А-пептида и
(4) SS2 представляет собой последовательность 2А-пептида или IRES из EMCV.
8. Вектор С68 по п. 7, где последовательность 2А-пептида представляет собой последовательность 2А-пептида FMDV или последовательность 2А-пептида TaV.
9. Вектор С68 по п. 8, где:
(1) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности SEQ ID NO: 18; (б) нуклеотидной последовательности SEQ ID NO: 20; (в) нуклеотидной последовательности, содержащей нуклеотиды 10-720 из SEQ ID NO: 18; (г) нуклеотидной последовательности, содержащей нуклеотиды 1115-1825 из SEQ ID NO: 58; и (д) нуклеотидной последовательности, содержащей нуклеотиды 1106-1825 из SEQ ID NO: 58;
(2) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSCA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности SEQ ID NO: 22; (б) нуклеотидной последовательности, содержащей нуклеотиды 10-372 из SEQ ID NO: 22; (в) нуклеотидной последовательности, содержащей нуклеотиды 1892-2257 из SEQ ID NO: 58; и (г) нуклеотидной последовательности, содержащей нуклеотиды 1886-2257 из SEQ ID NO: 58; и
(3) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSMA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности, содержащей нуклеотиды 43-2250 из SEQ ID NO: 2; (б) нуклеотидной последовательности SEQ ID NO: 4; (в) нуклеотидной последовательности SEQ ID NO: 6; (г) нуклеотидной последовательности SEQ ID NO: 8; (д) нуклеотидной последовательности SEQ ID NO: 10; (e) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 4; (ж) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 6; (з) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 8; (и) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 10; (к) нуклеотидной последовательности, содержащей нуклеотиды 2333-4543 из SEQ ID NO: 58; и (л) нуклеотидной последовательности, содержащей нуклеотиды 2324-4543 из SEQ ID NO: 58.
10. Вектор С68 по п. 3, где в формуле (I):
(1) РАА1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, и содержит нуклеотиды 1115-1825 из SEQ ID NO: 58 или содержит нуклеотиды 1106-1114 из SEQ ID NO: 58;
(2) РАА2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, и содержит нуклеотиды 1892-2257 из SEQ ID NO: 58 или содержит нуклеотиды 1886-2257 из SEQ ID NO: 58;
(3) РАА3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, и содержит нуклеотиды 2333-4543 из SEQ ID NO: 58 или содержит нуклеотиды 2324-4543 из SEQ ID NO: 58;
(4) SS1 представляет собой нуклеотидную последовательность, кодирующую Т2А (2А-пептид TaV), и
(5) SS2 представляет собой нуклеотидную последовательность, кодирующую F2A (2А-пептид вируса ящура).
11. Вектор С68 по п. 1, где мультиантигенная конструкция содержит нуклеотидную последовательность, кодирующую аминокислотную последовательность SEQ ID NO: 60 или SEQ ID NO: 64.
12. Вектор C68 по п. 1, где мультиантигенная конструкция содержит нуклеотидную последовательность SEQ ID NO: 61, SEQ ID NO: 65, SEQ ID NO: 66 или вырожденный вариант нуклеотидной последовательности SEQ ID NO: 61, SEQ ID NO: 65, SEQ ID NO: 66.
13. Вектор C68 по п. 11 или 12, дополнительно содержащий промотор CMV.
14. Вектор С68 по п. 1, содержащий нуклеотидную последовательность SEQ ID NO: 58, нуклеотиды 9-34811 из SEQ ID NO: 58 или нуклеотидную последовательность SEQ ID NO: 63.
15. Композиция для вызова иммунного ответа на РАА (простатоассоциированный антиген), содержащая эффективное количество вектора С68 по любому из пп. 1-14.
16. Клетка для экспрессии вектора по п. 1, содержащая вектор С68 по любому из пп. 1-14.
17. Фармацевтическая композиция для лечения или предупреждения рака, ассоциированного со сверхэкспрессией РАА, содержащая эффективное количество вектора по любому из пп. 1-14 и фармацевтически приемлемый эксципиент.
18. Способ лечения рака предстательной железы у человека, включающий введение человеку эффективного количества фармацевтической композиции по п. 17.
19. Способ по п. 18, дополнительно включающий введение человеку эффективного количества иммуномодулятора.
20. Способ по п. 18, дополнительно включающий введение человеку (а) эффективного количества по меньшей мере одного ингибитора супрессорных клеток иммунной системы и (б) эффективного количества по меньшей мере одного усилителя эффекторных клеток иммунной системы.
21. Способ по п. 20, где ингибитор супрессорных клеток иммунной системы выбран из группы, состоящей из ингибитора протеинкиназы, ингибитора циклооксигеназы-2 (СОХ-2) и ингибитора фосфодиэстеразы типа 5 (PDE5), и где усилитель эффекторных клеток иммунной системы выбран из группы, состоящей из ингибитора цитотоксического Т-лимфоцитарного антигена-4 (CTLA-4), агониста CD40, агониста toll-подобного рецептора (TLR), агониста 4-1 ВВ, агониста ОХ40, агониста индуцированного глюкокортикоидами рецептора фактора некроза опухолей (GITR), антагониста белка 1 программируемой клеточной смерти (PD-1) и антагониста лиганда 1 PD-1 (PD-L1).
22. Способ по п. 21, где:
(1) ингибитор протеинкиназы выбран из группы, состоящей из иматиниба, сорафениба, лапатиниба, зактима, МР-412, дазатиниба, лестауртиниба, сунитиниба малата, акситиниба, эрлотиниба, гефитиниба, босутиниба, темсиролимуса и нилотиниба;
(2) ингибитор CTLA-4 выбран из группы, состоящей из ипилимумаба и тремелимумаба;
(3) агонист CD40 представляет собой антитело к CD40, выбранное из группы, состоящей из G28-5, mAb89, ЕА-5, S2C6, СР870893 и дацетузумаба, и
(4) агонист TLR представляет собой CpG-олигонуклеотид, выбранный из группы, состоящей из CpG 24555, CpG 10103, CpG7909 и CpG1018.
23. Способ по п. 22, где ингибитор супрессорных клеток иммунной системы представляет собой ингибитор протеинкиназы, выбранный из группы, состоящей из сорафениба, дазатиниба, иматиниба, акситиниба и сунитиниба малата, и где усилитель эффекторных клеток иммунной системы представляет собой тремелимумаб.
24. Способ по п. 22, где ингибитор супрессорных клеток иммунной системы представляет собой ингибитор протеинкиназы, выбранный из группы, состоящей из сорафениба, дазатиниба, иматиниба, акситиниба и сунитиниба малата, и где усилитель эффекторных клеток иммунной системы представляет собой CpG-олигонуклеотид, выбранный из группы, состоящей из CpG24555, CpG10103, CpG7909 и CpG1018.
COHEN C.J | |||
Способ получения смеси хлоргидратов опийных алкалоидов (пантопона) из опийных вытяжек с любым содержанием морфия | 1921 |
|
SU68A1 |
Journal of General Virology, 2002, v.83, p.151-155 | |||
FERRARO B | |||
et al | |||
Co-Delivery of PSA and PSMA DNA Vaccines with Electroporation Induces Potent Immune Responses, Molecular Therapy, 2011, v.19, sup.1 | |||
WO 2009046739 A1, 16.04.2009 | |||
WAECKERLE-MEN Y | |||
et.al., Dendritic cell-based multi-epitope immunotherapy of hormone-refractory prostate carcinoma, Cancer Immunol | |||
Immunother., 2006, v.55, p.1524-1533 | |||
KARAN D | |||
et.al., Cancer immunotherapy: a paradigm shift for prostate cancer treatment, Nat | |||
Rev | |||
Urol., 2012, v.9, p.376-385 | |||
ЛЕКАРСТВЕННОЕ СРЕДСТВО И СПОСОБ ЛЕЧЕНИЯ ЗАБОЛЕВАНИЙ ПРЕДСТАТЕЛЬНОЙ ЖЕЛЕЗЫ | 2001 |
|
RU2192889C1 |
Авторы
Даты
2018-04-17—Публикация
2014-10-17—Подача