ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ
По настоящей заявке испрашивается приоритет временной заявки на патент США № 62/280636, поданной 19 января 2016, и временной заявки на патент США № 62/419190, поданной 8 ноября 2016. Полное содержание каждой из вышеприведенных заявок включено в настоящее описание посредством ссылки.
ОБЛАСТЬ ТЕХНИКИ
Настоящее изобретение в целом относится к иммунотерапии, и в частности, к вакцинам и способам лечения или профилактики неопластических заболеваний.
УРОВЕНЬ ТЕХНИКИ
Злокачественные новообразования являются основной причиной смертности во всем мире. Они могут возникать в различных органах, таких как поджелудочная железа, яичники, молочная железа, легкие, толстая кишка и прямая кишка. Рак поджелудочной железы является четвертой по распространенности причиной смерти от злокачественных новообразований в Соединенных Штатах. Рак поджелудочной железы может возникать в экзокринном или эндокринном компоненте поджелудочной железы. Экзокринные злокачественные опухоли включают (1) аденокарциному поджелудочной железы, которая на сегодняшний день является наиболее распространенным типом, (2) карциному ацинарных клеток, которая составляет 5% экзокринных опухолей поджелудочной железы, (3) цистаденокарциному, которая составляет 1% злокачественных опухолей поджелудочной железы, и (4) другие редкие формы рака, такие как панкреатобластома, аденосквамозные карциномы, перстневидно-клеточный рак, гепатоидные карциномы, коллоидные карциномы, недифференцированные карциномы и недифференцированные карциномы с остеокластно-подобными гигантскими клетками.
Рак яичников составляет приблизительно 3% случаев злокачественных новообразований у женщин, но вызывает больше смертей, чем любое другое злокачественное новообразование женской репродуктивной системы. Рак яичников включает (1) эпителиальные типы рака, такие как эпителиальные карциномы яичников; (2) герминогенные злокачественные новообразования, такие как незрелые тератомы; и (3) стромальные типы рака, такие как гранулезоклеточные опухоли.
Рак молочной железы является вторым наиболее распространенным раком у американских женщин и второй ведущей причиной смерти от рака у женщин. Рак молочной железы можно классифицировать на основании наличия рецепторов гормонов и статуса HER2/neu, например (1) гормон-рецептор-позитивные типы рака (при котором раковые клетки содержат либо рецепторы эстрогена, либо рецепторы прогестерона); (2) гормон-рецептор-негативные типы рака (при котором раковые клетки не содержат на рецепторов эстрогена, ни рецепторов прогестерона); (3) HER2/neu позитивные (если злокачественные опухоли имеют избыточное содержание белка HER2/neu или дополнительные копии гена HER2/neu); (4) HER2/neu негативные типы рака (когда злокачественные опухоли не обладают избыточным содержанием HER2/neu); (5) тройной негативный тип рака (при котором раковые клетки молочной железы не содержат ни рецепторов эстрогена, ни рецепторов прогестерона, ни избыточного HER2); и (6) тройной позитивный тип рака (когда злокачественные опухоли позитивны по рецептору эстрогена, позитивны по рецептору прогестерона и содержа избыток HER2).
Рак легких составляет более четверти всех смертей от рака и на сегодняшний день является главной причиной смерти от рака среди мужчин и женщин. Наиболее распространенным типом рака легкого является немелкоклеточный рак легкого (NSCLC), на долю которого приходится приблизительно 85%-90% случаев рака легких. NSCLC можно дополнительно классифицировать по нескольким подтипам, таким как плоскоклеточная (эпидермоидная) карцинома, аденокарцинома, крупноклеточная (недифференцированная) карцинома, аденосквамозная карцинома и саркоматоидная карцинома. Вторым распространенным типом рака легких является мелкоклеточный рак легкого (SCLC), на долю которого приходится приблизительно 10-15% случаев рака легких.
Колоректальный рак (CRC) является второй по значимости причиной смертей от рака в Соединенных Штатах, если учитывать как мужчин, так и женщин. Аденокарцинома является наиболее распространенным типом CRC, на долю которого приходится более 95% случаев колоректального рака. Другие менее распространенные типы CRC включают карциноидные опухоли, желудочно-кишечные стромальные опухоли (GIST), лимфомы и саркому.
Рак желудка является третьей по распространенности причиной смерти от рака в мире. Он трудно поддается лечению, прежде всего потому, что у большинства пациентов представлен на прогрессирующей стадии заболевания. В США рак желудка в настоящее время является 15ым среди наиболее распространенных злокачественных заболеваний. Приблизительно 90-95% случаев рака желудка являются аденокарциномой; другие менее распространенные типы включают лимфому (4%), GIST и карциноидные опухоли (3%).
Традиционные схемы борьбы с раком были успешны при контроле выбранной группы циркулирующего и солидного рака. Однако многие виды рака устойчивы к традиционным подходам. В последние годы изучают иммунотерапию рака, в частности, противораковые вакцины и терапию антителами. Один из подходов в иммунотерапии рака включает введение иммуногена для продукции активного системного иммунного ответа на опухолевый антиген (ТАА) на раковой клетке-мишени. Хотя было идентифицировано большое число опухолевых антигенов, и многие из этих антигенов были исследованы в качестве противовирусных, противобактериальных, белковых, пептидных или ДНК- вакцин для лечения или профилактики злокачественных новообразований, большинство клинических испытаний до настоящего времени не смогли создать терапевтический продукт. Следовательно, существует потребность в иммуногене, который может быть использован для лечения или профилактики рака.
Настоящее описание относится к иммуногенам, полученным из опухолевых антигенов MUC1, Мезотелина и TERT, а также к композициям, содержащим такие иммуногены для применения в иммунотерапии рака.
Муцин 1 человека (MUC1; также известен как эписиалин, PEM, H23Ag, EMA, CA15-3 и MCA) представляет собой полиморфный трансмембранный гликопротеин, экспрессируемый на апикальных поверхностях простого и железистого эпителия. Ген MUC1 кодирует предшественник с одной полипептидной цепью, который включает последовательность сигнального пептида. Сразу после трансляции последовательность сигнального пептида удаляется, а оставшаяся часть предшественника MUC1 дополнительно расщепляется на два пептидных фрагмента: более длинную N-концевую субъединицу (MUC1-N или MUC1α) и более короткую C-концевую субъединицу (MUC1-C или MUC1β). Зрелый MUC1 содержит MUC1-N и MUC1-C, связанные посредством стабильных водородных связей. MUC1-N, который является внеклеточным доменом, содержит от 25 до 125 тандемных повторов с переменным числом (VNTR) из 20 аминокислотных остатков. MUC1-C содержит короткую внеклеточную область (приблизительно 53 аминокислоты), трансмембранный домен (приблизительно 28 аминокислот) и цитоплазматический хвост (приблизительно 72 аминокислоты). Цитоплазматический хвост MUC1 (MUC1-CT) содержит высококонсервативные остатки серина и тирозина, которые фосфорилируются с помощью рецепторов фактора роста и внутриклеточных киназ. MUC1 человека существует в нескольких изоформах, возникающих в результате различных типов альтернативного сплайсинга РНК MUC1. В SEQ ID NO: 1 представлена аминокислотная последовательность полноразмерного белка-предшественника MUC1 человека с изоформой 1 (изоформа 1, Uniprot P15941-1) («ссылочный полипептид MUC1 изоформы 1»). До сих пор сообщалось по меньшей мере о 16 других изоформах MUC-1 человека (Uniprot P15941-2-P15941-17), которые включают различные вставки, делеции или замены по сравнению с последовательностью изоформы 1. Эти изоформы известны как изоформы 2, 3, 4, 5, 6, Y, 8, 9, F, Y-LSP, S2, M6, ZD, T10, E2 и J13 (Uniprot P15941-2-P15941-17, соответственно). Полноразмерный белок-предшественник MUC1 человека с изоформой 1 состоит из 1255 аминокислот и включает последовательность сигнального пептида от 1 до 23 аминокислоты. Домены MUC1-N и MUC1-C зрелого белка MUC1 состоят из аминокислот 24-1097 и 1098-1255, соответственно.
Мезотелин (также известен как MSLN) представляет собой мембранно-связанный гликопротеин, присутствующий на поверхности клеток, выстилающих плевру, брюшину и перикард, и сверхэкспрессируется в нескольких опухолях человека, включая мезотелиому, аденокарциному яичников и поджелудочной железы. Ген мезотелина кодирует белок-предшественник длиной 71 килодальтон (кДа), который процессируется в белок мезотелин длиной 40 кДа и секретируемый белок потенцирующего фактора мегакариоцитов (MPF) (Chang, et al., Proc Natl Acad Sci USA (1996) 93:136-40). Альтернативный сплайсинг гена MSLN приводит к по меньшей мере четырем изоформам мезотелина. На сайте Uniprot (www.uniprot.org) доступны аминокислотные последовательности изоформы 1 (Uniprot Q13421-1), изоформы 2 (Uniprot Q13421-3), изоформы 3 (Uniprot Q13421-2) и изоформы 4 (Uniprot Q13421-4). Аминокислотная последовательность полноразмерного белка-предшественника MSLN человека с изоформой 2 (идентификатор Uniprot Q13421-3), который состоит из 622 аминокислот, представлен в SEQ ID NO:2 («ссылочный полипептид-предшественник мезотелина изоформы 2»). Цитоплазматическая часть MSLN содержит аминокислотные остатки от 37 до 597 SEQ ID NO:2. Изомформа 2 является основной формой MSLN. Изоформа 1, которая состоит из 630 аминокислот, отличается от изоформы 2 наличием 8 аминокислот (PQAPRRPL) в положении 409 последовательности изоформы 2. Изоформа 3 имеет альтернативный C-конец (в положениях 593-622 изоформы 2), а изоформа 4 имеет делецию аминокислоты 44 по сравнению с изоформой 2. Изоформа 2 первоначально транслируется как предшественник длиной 622 аминокислоты, который содержит последовательность сигнального пептида (аминокислоты 1-36) на N-конце и последовательность GPI-якоря на С-конце. Последовательность сигнального пептида и последовательность GPI-якоря могут быть отщеплены в зрелом мезотелине.
Теломеразная обратная транскриптаза (или TERT) является каталитическим компонентом теломеразы, которая представляет собой рибонуклеопротеидную полимеразу, ответственную за поддержание теломеразных концов путем добавления теломеразного повтора TTAGGG. Кроме TERT теломераза также включает компонент РНК, который служит матрицей для теломеразного повтора. Ген TERT человека кодирует 1132 аминокислотный белок. Существует несколько изоформ TERT человека, которые являются результатом альтернативного сплайсинга. Аминокислотные последовательности изоформы 1, изоформы 2, изоформы 3 и изоформы 4 доступны на сайте Uniprot (<www.uniprot.org>; индикаторы Uniprot O14746-1, O14746-2, O14746-3 и O14746-4, соответственно). Аминокислотная последовательность полноразмерного белка TERT человека изоформы 1 (изоформа 1, Genbank AAD30037, Uniprot O14746-1) также приведена в настоящем документе как SEQ ID NO: 3 («ссылочный полипептид TERT изоформы 1»). По сравнению с изоформой TERT 1 (O14746-1) изоформа 2 (O14746-2) имеет замену аминокислот 764-807 (STLTDLQPYM...LNEASSGLFD→LRPVPGDPAG...AGRAAPAFGG) и делеции С-концевых аминокислот 808-1132), изоформа 3 (O14746-3) имеет делецию аминокислот 885-947, и изоформа 4 (O14746-4) имеет делеции аминокислот 711-722 и 808- 1132 и замену аминокислот 764-807 (STLTDLQPYM...LNEASSGLFD→LRPVPGDPAG...AGRAAPAFGG).
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В некоторых аспектах настоящее описание относится к выделенным иммуногенным полипептидам, полученным из MUC1, MSLN и TERT, которые эффективны, например, для индукции иммунного ответа in vivo (например, у животного, включая человека), или для применения в качестве компонента в вакцинах для лечения злокачественного новообразования.
В других аспектах настоящее изобретение относится к молекулам нуклеиновой кислоты, которые кодируют иммуногенный полипептид по настоящему изобретению. В некоторых вариантах осуществления настоящее изобретение относится к мультиантигенным конструкциям нуклеиновых кислот, каждая из которых кодирует два, три или более иммуногенных полипептида.
Описание также относится к векторам, содержащим одну или более молекул нуклеиновых кислот по изобретению. Векторы могут использоваться для клонирования или экспрессии иммуногенных полипептидов TAA, кодируемых молекулами нуклеиновых кислот, или для доставки молекул нуклеиновых кислот в композиции, такой как вакцина, в клетку-хозяин или в хозяин, которым является животное или человек.
В некоторых других аспектах настоящее изобретение относится к композициям, содержащим один или более иммуногенных полипептидов TAA, выделенных молекул нуклеиновых кислот, кодирующих иммуногенные полипептиды TAA, или вектора или плазмиды, содержащие молекулы нуклеиновых кислот, кодирующие иммуногенные полипептиды TAA. В некоторых вариантах осуществления композиция представляет собой иммуногенную композицию, которая может использоваться для индукции иммунного ответа против ТАА у млекопитающего, такого как мышь, собака, обезьяна или человек. В некоторых вариантах осуществления композиция представляет собой вакцинную композицию, которая может использоваться для иммунизации млекопитающего, например человека, для ингибирования патологической клеточной пролиферации, для предотвращения развития злокачественного новообразования (используется в качестве профилактического средства) или для лечения расстройств (используется в качестве терапевтического средства), связанных со сверхэкспрессией TAA, например злокачественного новообразования, в частности рака поджелудочного железы, яичников и тройного-негативного рака молочной железы.
В других аспектах настоящее изобретение относится к способам применения иммуногенных полипептидов TAA, выделенных молекул нуклеиновых кислот и композиций, содержащих иммуногенный полипептид TAA или выделенные молекулы нуклеиновых кислот, как описано выше. В некоторых вариантах осуществления настоящее изобретение относится к способу индукции иммунного ответа против ТАА у млекопитающего, в частности, человека, включающему введение млекопитающему эффективного количества полипептида по изобретению, который является иммуногенным против мишеневого ТАА, эффективного количества выделенной молекулы нуклеиновой кислоты, кодирующей такой иммуногенный полипептид, или композиции, содержащую такой иммуногенный полипептид TAA или выделенную молекулу нуклеиновой кислоты, кодирующую такой иммуногенный полипептид TAA. Вакцины на основе полипептидов или нуклеиновых кислот могут использоваться вместе с одним или несколькими адъювантами или иммуномодуляторами.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
A. ОПРЕДЕЛЕНИЯ
Термин «адъювант» относится к веществу, которое способно усиливать, ускорять или пролонгировать иммунный ответ, вызванный вакцинным иммуногеном.
Термин «агонист» относится к веществу, которое способствует (индуцирует, вызывает, усиливает или увеличивает) активность другой молекулы (такой как рецептор). Термин агонист включает вещества, которые связываются с рецептором, и вещества, которые усиливают рецепторную функцию, не связываясь с рецептором.
Термин «антагонист» или «ингибитор» относится к веществу, которое частично или полностью блокирует, ингибирует или нейтрализует биологическую активность другой молекулы или рецептора.
Термин "совместное введение" относится к введению двух или более агентов одному и тому же индивиду в период лечения. Два или более агентов могут быть включены в одну композицию и, таким образом, вводиться одновременно. Альтернативно, два или более агента могут находится в разных физических составах и вводиться по отдельности, либо последовательно, либо одновременно индивиду. Термин «вводятся одновременно» или «одновременное введение» означает, что введение первого агента и второго агента совпадают по времени друг с другом, а термин «вводятся последовательно» или «последовательное введение» означает, что введение первого агента и второго агента не совпадают по времени друг с другом.
Термин «цитозольный» или «цитоплазматический» означает, что после того, как нуклеотидная последовательность, кодирующая конкретный полипептид, экспрессируется клеткой-хозяином, предполагается, что экспрессированный полипептид будет сохранен внутри клетки-хозяина.
Термин «вырожденные варианты» относится к последовательностям нуклеиновых кислот, которые имеют замены оснований, но кодируют один и тот же полипептид.
Термин «эффективное количество» относится к количеству, вводимому млекопитающему, которое является достаточным для того, чтобы вызвать желаемый эффект у млекопитающего.
Термин «фрагмент» заданного полипептида относится к полипептиду, который короче, чем заданный полипептид, и который на 100% идентичен последовательности заданного полипептида.
Термин «функциональный вариант» иммуногенного полипептида ТАА относится к полипептиду, который содержит 90%-110% от числа аминокислот ссылочного иммуногенного полипептида ТАА, меньше чем на 100%, но больше чем на 95% идентичен аминокислотной последовательности ссылочного полипептида TAA и обладает теми же или сходными иммуногенными свойствами ссылочного иммуногенного полипептида TAA.
Термин «идентичный» относится к двум или более нуклеиновым кислотам или к двум или более полипептидам, которые имеют ту же самую последовательность нуклеотидов или аминокислот, соответственно. Термин «процентная идентичность» описывает уровень сходства двух или более нуклеиновых кислот или полипептидов. Если две последовательности выровнены с помощью биоинформационного программного обеспечения, то «процентная идентичность» вычисляется путем умножения числа точных нуклеотидных/аминокислотных совпадений в последовательностях на 100 и путем деления на длину выровненной области, включая пробелы. Например, два полипептида длиной 100 аминокислот, у которых имеется 10 ошибочных спариваний при выравнивании, считаются на 90% идентичными.
Термин «энхансер иммунной эффекторной клетки» или «энхансер IEC», относится к веществу, способному увеличивать и/или усиливать число, качество и/или функцию одного или нескольких типов иммунных эффекторных клеток млекопитающего. Примеры иммунных эффекторных клеток включают цитолитические CD8 Т-клетки, CD4 Т-клетки, NK-клетки и В-клетки.
Термин «иммунный модулятор» относится к веществу, способному изменять (например, ингибировать, уменьшать, увеличивать, усиливать или стимулировать) работу или функцию любого компонента врожденной, гуморальной или клеточной иммунной системы млекопитающего. Таким образом, термин "иммунный модулятор" включает "энхансер иммунной эффекторной клетки", как определено в настоящем документе, и "ингибитор иммунной супрессорной клетки", как определено в настоящем документе, а также вещество, которое воздействует на любые другие компоненты иммунной системы млекопитающего.
Термин "иммунный ответ" относится к любому обнаруживаемому ответу на конкретное вещество (например, антиген или иммуноген) иммунной системой позвоночного-хозяина, включая, но не ограничиваясь ими, врожденные иммунные ответы (например, активацию сигнального каскада Toll-подобного рецептора), клеточные иммунные ответы (например, ответы, опосредуемые Т-клетками, такими как антиген-специфические Т-клетки и неспецифические клетки иммунной системы) и гуморальные иммунные ответы (например, ответы, опосредованные В-клетками, такие как продукция и секреция антител в плазму, лимфу и/или тканевые жидкости). Примеры иммунных ответов включают изменение (например, увеличение) активации Toll-подобных рецепторов, экспрессию или секрецию лимфокинов (например, цитокинов (например, цитокинов типа Th1, Th2 или Th17) или хемокинов), активацию макрофагов, активацию дендритных клеток, активацию Т-клеток (например, CD4+ или CD8+ Т-клеток), активацию NK-клеток, активацию B-клеток (например, выработку и/или секрецию антител), связывание иммуногена (например, антигена, иммуногенного полипептида) с молекулой MHC, индукцию цитотоксического ответа Т-лимфоцитов («CTL»), индукцию В-клеточного ответа (например, продукцию антител), и увеличение количества (например, рост популяции клеток) клеток иммунной системы (например, Т-клеток и В-клеток), а также усиление процессинга и презентации антигена антиген-презентирующими клетками. Термин «иммунный ответ» также включает в себя любой обнаруживаемый ответ на конкретное вещество (такое как антиген или иммуноген) одним или несколькими компонентами иммунной системы позвоночного животного in vitro.
Термин «иммуноген» относится к веществу, которое является иммуногенным.
Термин «иммуногенный» относится к способности вещества при введении млекопитающему (например, человеку) вызывать, активировать, стимулировать или индуцировать иммунный ответ или улучшать, усиливать, увеличивать или продлевать ранее существовавший иммунные ответ на конкретный антиген у млекопитающего, независимо от того, представлен ли он в чистом виде или связан с носителем, в присутствии или в отсутствие адъюванта.
Термин «иммуногенная композиция» относится к композиции, которая является иммуногенной.
Термин «иммуногенный полипептид MUC1» относится к полипептиду, который является иммуногенным в отношении нативного белка MUC1 человека или клеток, экспрессирующих нативный белок MUC1 человека. Полипептид может иметь такую же аминокислотную последовательность как и нативный белок MUC1 человека, или обнаруживать одну или несколько мутаций по сравнению с аминокислотной последовательностью нативного белка MUC1 человека.
Термин «иммуногенный полипептид MSLN» относится к полипептиду, который является иммуногенным в отношении нативного белка MSLN человека или клеток, экспрессирующих нативный белок MSLN человека. Полипептид может иметь такую же аминокислотную последовательность как и нативный белок MLSN человека, или обнаруживать одну или несколько мутаций по сравнению с аминокислотной последовательностью нативного белка MLNS человека.
Термин «иммуногенный полипептид TERT» относится к полипептиду, который является иммуногенным в отношении нативного белка TERT человека или клеток, экспрессирующих нативный белок TERT человека. Полипептид может иметь такую же аминокислотную последовательность как и нативный белок TERT человека, или обнаруживать одну или несколько мутаций по сравнению с аминокислотной последовательностью белка TERT человека.
Термин «иммуногенный полипептид TAA» относится к «иммуногенному полипептиду MSLN», «иммуногенному полипептиду MUC1» или «иммуногенному полипептиду TERT», каждый из которых был определен выше.
Термин «иммуногенная молекула нуклеиновой кислоты MUC1» относится к молекуле нуклеиновой кислоты, которая кодирует «иммуногенный полипептид MUC1», который определен в настоящем описании.
Термин «иммуногенная молекула нуклеиновой кислоты MSLN» относится к молекуле нуклеиновой кислоты, которая кодирует «иммуногенный полипептид MSLN», который определен в настоящем описании.
Термин «иммуногенная молекула нуклеиновой кислоты TERT» относится к молекуле нуклеиновой кислоты, которая кодирует «иммуногенный полипептид TERT», который определен в настоящем описании.
Термин «иммуногенная молекула нуклеиновой кислоты TAA» относится к молекуле нуклеиновой кислоты, которая кодирует «иммуногенный полипептид MUC1», «иммуногенный полипептид MSLN» или «иммуногенный полипептид TERT», которые определены выше.
Термин «ингибитор иммунных супрессорных клеток» или «ISC ингибитор» относится к веществу, способному снижать и/или подавлять количество и/или функцию иммунных супрессорных клеток млекопитающего. Примеры иммунных супрессорных клеток включают регуляторные Т-клетки («Treg»), супрессорные клетки миелоидного происхождения и макрофаги опухоли.
Термин «млекопитающее» относится к любым видам животных класса Mammalia. Примеры млекопитающих включают: людей; нечеловеческих приматов, таких как обезьяны; лабораторных животных, таких как крысы, мыши, морские свинки; домашних животных, таких как кошки, собаки, кролики, крупный рогатый скот, овцы, козы, лошади и свиньи; и находящихся в неволе диких животных, таких как львы, тигры, слоны и тому подобное.
Термин «мембрано-связанный» означает, что после того, как нуклеотидная последовательность, кодирующая конкретный полипептид, экспрессируется клеткой-хозяином, экспрессированный полипептид связан, присоединен или иным образом ассоциирован с мембраной клетки.
Термин «неопластическое расстройство» относится к состоянию, при котором пролиферация клеток протекает на патологически высоком и некотролируемом уровне, этот уровень превышает и не согласован с уровнем пролиферации окружающих нормальных тканей. Это обычно приводит к солидному патологическому изменению или уплотнению, известной как «опухоль». Этот термин включает в себя доброкачественные и злокачественные неопластические расстройства. Термин «злокачественное неопластическое расстройство», которое в настоящем описании используется как синоним термину «рак», относится к новообразованию, отличающемуся способностью опухолевых клеток распространяться в другие места организма (называется «метастаз»). Термин «доброкачественное неопластическое расстройство" относится к новообразованию, в котором опухолевые клетки не способны к метастазированию.
Термин «мутация» относится к делеции, добавлению или замене аминокислотных остатков в аминокислотной последовательности белка или полипептида по сравнению с аминокислотной последовательностью стандартного белка или полипептида.
Термин «функционально связанный» относится к непосредственному соседству, в котором описанные компоненты находятся во взаимосвязи, позволяющей им функционировать предполагаемым образом. Контрольную последовательность, «функционально связанную» с трансгеном, лигируют таким образом, чтобы достигалась экспрессия трансгена в условиях, совместимых с контрольными последовательностями.
Термин «фармацевтическая композиция» относится к твердой или жидкой композиции, подходящей для введения субъекту (например, человеку) для активации желаемого физиологического, фармакологического или терапевтического эффекта. Кроме содержащегося одного или нескольких активных ингредиентов, фармацевтическая композиция может содержать один или несколько фармацевтически приемлемых вспомогательных веществ.
Термин «фармацевтически приемлемое вспомогательное вещество» относится к веществу в иммуногенной, фармацевтической или вакцинной композиции, отличному от активных ингредиентов (например, антигена, антиген-кодирующей нуклеиновой кислоты, иммуномодулятора или адъюванта), которое совместимо с активными ингредиентами и не вызывает значительного неблагоприятного эффекта у субъектов, которым его вводят.
Термины «пептид», «полипептид» и «белок» используются в настоящем документе как синонимы, и относятся к полимерной форме аминокислот любой длины, которая может включать кодируемые и некодируемые аминокислоты, химически или биохимически модифицированные аминокислоты и полипептиды или производные аминокислот и полипептидов, имеющие модифицированные полипептидные скелеты.
Термин «предупреждение» или «предупреждать» относится к (а) предотвращению возникновения расстройства или (b) задержке возникновения расстройства или возникновения симптомов расстройства.
Термин «секретируемый» в контексте полипептида означает, что после того, как нуклеотидная последовательность, кодирующая полипептид, экспрессируется клеткой-хозяином, экспрессированный полипептид секретируется за пределы клетки-хозяина.
Термин «субоптимальная доза» при использовании для описания количества иммуномодулятора, такого как ингибитор протеинкиназы, относится к дозе иммуномодулятора, которая ниже минимального количества, требуемого для получения желаемого терапевтического эффекта при лечении заболевания, если пациенту вводят исключительно иммуномодулятор.
Термин «субъект» относится к человеку или не относящемуся к человеку млекопитающему.
Термин «лечение» или «лечить» относится к прекращению расстройства, уменьшению тяжести расстройства или уменьшению степени тяжести или частоты проявления симптома расстройства.
Термин "опухолевый антиген» или «TAA» относится к антигену, который специфически экспрессируется опухолевыми клетками или экспрессируется на более высоком уровне или с большей плотностью опухолевыми клетками, чем неопухолевыми клетками того же типа ткани. Опухолевые антигены могут быть антигенами, в норме не экспрессируемыми хозяином; они могут быть мутированными, усеченными, неправильно свернутыми или иным образом проявляющими патологию молекулами, экспрессируемыми в норме хозяином; они могут быть идентичны молекулам, экспрессируемым в норме, но экспрессируемыми на патологически высоких уровнях; или они могут быть экспрессированы в условиях или в среде, которые являются патологическими. Опухолевые антигены могут быть, например, белками или фрагментами белков, сложными углеводами, ганглиозидами, гаптенами, нуклеиновыми кислотами или любой комбинацией этих или других биологических молекул.
Термин «вакцина» относится к иммуногенной композиции для введения млекопитающему (например, человеку) для активации защитного иммунного ответа против конкретного антигена или антигенов. Основным активным ингредиентом вакцины является иммуноген(ы).
Термин «вектор» относится к молекуле нуклеиновой кислоты или модифицированному микроорганизму, которые способны осуществлять транспорт или переносить чужую молекулу нуклеиновой кислоты в клетку-хозяин. Чужеродную молекулу нуклеиновой кислоты называют «вставкой» или «трансгеном». Вектор обычно состоит из вставки и большей последовательности, которая служит скелетом вектора. Основываясь на структуре или происхождении векторов, основные типы векторов включают плазмидные векторы, космидные векторы, фаговые векторы (такие как лямбда-фаг), вирусные векторы (такие как аденовирусные векторы), искусственные хромосомы и бактериальные векторы.
B. Иммуногенные полипептиды опухолевых антигенов (tAA)
В некоторых аспектах настоящее изобретение относится к выделенным иммуногенным полипептидам MUC1, полипептидам TERT и полипептидам MSLN, которые могут быть эффективны, например, для активации иммунного ответа in vivo (например, у животного, включая человека) или in vitro, активируя эффекторные Т-клетки или продукция антитела, специфичные для MUC1, TERT и MSLN, соответственно, или для применения в качестве компонента в вакцинах для лечения рака, такого как рак поджелудочной железы, яичника и молочной железы, в частности тройного негативного рака молочной железы.
Эти иммуногенные полипептиды TAA могут быть получены способами, известными в данной области в свете настоящего описания. Способность полипептидов индуцировать иммунный ответ может быть измерена в in vitro анализах или in vivo анализах. In vitro анализы для определения способности полипептида или конструкции ДНК активировать иммунные реакции известны в данной области. Один из примеров такого in vitro анализа предназначен для измерения способности полипептида или нуклеиновой кислоты, экспрессирующей полипептид, стимулировать Т-клеточный ответ, как раскрыто в патенте США 7387882, описание которого включено в настоящую заявку. Способ оценки включает стадии: (1) приведения антиген-презентирующих клеток в контакт антигеном в культуре, так чтобы антиген может быть захвачен и процессирован антиген-презентирующими клетками, продуцируя один или несколько процессированных антигенов; (2) приведения в контакт антиген-презентирующих клеток с Т-клетками в условиях, достаточных для того, чтобы Т-клетки прореагировали на один или несколько процессированных антигенов; (3) определение того, прореагировала ли Т-клетки на один или несколько процессированных антигенов. Используемыми Т-клетками могут быть CD8+ Т-клетки или CD4+ Т-клетки. Т-клеточный ответ может быть определен измерением высвобождения одного из большего числа цитокинов, таких как интерферон-гамма и интерлейкин-2, и лизиса антиген-презентирующих клеток (опухолевых клеток). В-клеточный ответ может быть определен измерением продукции антител.
B-1. Иммуногенные полипептиды MUC1
В одном из аспектов настоящее описание относится к выделенным иммуногенным полипептидам MUC1, происходящим из нативных MUC1 человека, причем полипептиды MUC1 обнаруживают одну или несколько введенных мутаций относительно нативного белка MUC1 человека. Примеры мутаций включают делецию некоторых, но не всех, тандемных повторов 20 аминокислот в области VNTR белка MUC1, делецию последовательности сигнального пептида, полностью или частично, и делецию аминокислот неконсенсусных аминокислотных последовательностей, обнаруживаемых в изоформах MUC1. Таким образом, в некоторых вариантах осуществления иммуногенные полипептиды MUC1, представленные в настоящем изобретении, включают (1) аминокислотную последовательность из 3-30 тандемных повторов 20 аминокислот белка MUC1 человека и (2) аминокислотные последовательности белка MUC1 человека, которые фланкируют область VNTR. В некоторых конкретных вариантах осуществления иммуногенные полипептиды MUC1 содержат (1) аминокислотную последовательность из 5-25 тандемных повторов MUC1 человека и (2) аминокислотные последовательности белка MUC1 человека, которые фланкируют область VNTR. В некоторых других вариантах осуществления иммуногенные полипептиды MUC1 находятся в цитоплазматической форме (или «цMUC1»). Термин «цитоплазматическая форма» относится к иммуногенному полипептиду MUC1, в котором отсутствует вся или часть секреторной последовательности (аминокислоты 1-23; также известны как «последовательность сигнального пептида») нативного белка MUC1 человека. Предполагается, что удаление аминокислот секреторной последовательности предотвратит вхождение полипептида в секреторный путь, так как он экспрессируется в клетках. В некоторых других вариантах осуществления иммуногенные полипептиды MUC1 содержат аминокислотную последовательность мембранно-связанной формы MUC1.
Иммуногенные полипептиды MUC1 по настоящему изобретению могут быть извлечены, сконструированы или получены из аминокислотной последовательности любой из изоформ MUC1 человека, известных в данной области или найденных в будущем, включая, например, изоформы Uniprot 1, 2, 3, 4, 5, 6, Y, 8, 9, F, Y-LSP, S2, M6, ZD, T10, E2 и J13 (Uniprot с P15941-1 по P15941-17, соответственно). В некоторых вариантах осуществления иммуногенные полипептиды MUC1 содержат аминокислотную последовательность, которая является частью белка 1 MUC1 человека изоформы 1, причем аминокислотная последовательность изоформы 1 MUC1 человека представлена в SEQ ID NO:1. В конкретном варианте осуществления иммуногенный полипептид MUC1 содержит аминокислоты 24-225 и 1098-1255 аминокислотной последовательности SEQ ID NO:1. В другом конкретном варианте осуществления иммуногенный полипептид MUC1 содержит аминокислоты 22-225 и 946-1255 аминокислотной последовательности SEQ ID NO:1. В некоторых других конкретных вариантах осуществления иммуногенный полипептид MUC1 включает или состоит из аминокислотной последовательности, выбранной из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO:8 (полипептид плазмиды 1027);
(2) аминокислотной последовательности, содержащей аминокислоты 4-537 SEQ ID NO:8;
(3) аминокислотной последовательности, содержащей аминокислоты 24-537 SEQ ID NO:8;
(4) аминокислотной последовательности SEQ ID NO:16 (полипептид плазмиды 1197);
(5) аминокислотной последовательности, содержащей аминокислоты 4-517 SEQ ID NO:16; и
(6) аминокислотной последовательности, содержащей аминокислоты 4-517 SEQ ID NO:16, причем в SEQ ID NO:16 аминокислота в положении 513 представляет собой T.
В некоторых конкретных вариантах осуществления иммуногенные полипептиды MUC1 содержат аминокислотную последовательность SEQ ID NO:8 (полипептид плазмиды 1027) или SEQ ID NO:16 (полипептид плазмиды 1197).
B-2. Иммуногенные полипептиды MSLN
В одном из аспектов настоящее изобретение относится к выделенным иммуногенным полипептидам MSLN, происходящим из предшественника MSLN человека, в котором произведена делеция части или всей последовательности сигнального пептида предшественника MSLN. Таким образом, иммуногенные полипептиды MSLN содержат аминокислотную последовательность нативного предшественника MSLN человека, в котором отсутствует часть или вся последовательность сигнального пептида предшественника MSLN. В некоторых вариантах осуществления в иммуногенном полипептиде MSLN также отсутствует часть или вся якорная последовательность GPI нативного MSLN человека (то есть, аминокислоты 598-622 SEQ ID NO:2). Как используется в настоящем документе, термин «MSLN человека» включает в себя любую изоформу MSLN человека, такую как изоформа 1, 2, 3 или 4. В некоторых конкретных вариантах осуществления MSLN человека представляет собой изоформу 2 MSLN человека.
В некоторых конкретных вариантах осуществления выделенный иммуногенный полипептид MSLN выбран из группы, состоящей из:
1) полипептида, содержащего или состоящего из аминокислот 37-597 аминокислотной последовательности SEQ ID NO:2;
2) полипептида, содержащего аминокислотную последовательность, которая по меньшей мере на 90%, 95%, 98% или 99% идентична аминокислотной последовательности, состоящей из аминокислот 37-597 аминокислотной последовательности SEQ ID NO:2;
3) полипептида, содержащего или состоящего из аминокислотной последовательности SEQ ID NO: 6 или аминокислот 4-564 аминокислотной последовательности SEQ ID NO: 6; и
4) полипептида, содержащего аминокислотную последовательность, которая по меньшей мере на 93%-99%, 94%-98% или 94%-97% идентична аминокислотной последовательности SEQ ID NO: 6 («полипептид плазмиды 1103»).
B-3. Иммуногенные полипептиды TERT
В еще одном аспекте настоящее описание относится к выделенным иммуногенным полипептидам TERT, происходящим из белка TERT человека, в котором произведена делеция вплоть до 600 аминокислот N-конца белка TERT. Таким образом, в некоторых вариантах осуществления иммуногенные полипептиды TERT содержат аминокислотную последовательность изоформы 1 TERT, представленную в SEQ ID NO: 3, в которой отсутствуют вплоть до приблизительно 600 аминокислот N-конца (аминоконец) аминокислотной последовательности TERT изоформы 1. В иммуногенном полипептиде TERT может отсутствовать любое количество аминокислот, вплоть до 600, на N-конце TERT изоформы 1. Например, в иммуногенном полипептиде TERT могут отсутствовать N-концевые аминокислоты от положения 1 до положения 50, 100, 50, 200, 245, 300, 350, 400, 450, 500, 550 или 600 изоформы 1 TERT SEQ ID NO:3. Таким образом, иммуногенный полипептид TERT по настоящему изобретению может содержать аминокислоты 51-1132, 101-1132, 151-1132, 201-1132, 251-1132, 301-1132, 351-1132, 401-1132, 451-1132, 501-1132 или 551-1132 SEQ ID NO: 3. Иммуногенные полипептиды TERT также могут быть сконструированы из других изоформ TERT. Однако, если полипептиды сконструированы из изоформ TERT с C-концевыми усечениями, то, предпочтительно, чтобы несколько аминокислот были удалены с N-конца.
В некоторых других вариантах осуществления иммуногенный полипептид TERT дополнительно содержит одну или несколько аминокислотных мутаций, которые инактивируют каталитический домен TERT. Примеры таких аминокислотных мутаций включают замену аспарагиновой кислоты на аланин в положении 712 SEQ ID NO:3 (D712A) и замену валина на изолейцин в положении 713 SEQ ID NO:3 (V713I). В некоторых вариантах осуществления иммуногенный полипептид TERT содержит и мутацию D712A, и мутацию V713I.
В некоторых конкретных вариантах осуществления настоящее описание относится к иммуногенному полипептиду TERT, выбранному из группы, состоящей из:
1) полипептида, содержащего аминокислотную последовательность SEQ ID NO: 10 или аминокислоты 2-892 SEQ ID NO: 10 («полипептид плазмиды 1112»), или функционального варианта полипептида;
2), полипептида, содержащего аминокислотную последовательность SEQ ID NO: 14 или аминокислоты 3-789 SEQ ID NO: 14 («полипептид плазмиды 1326»), или функционального варианта полипептида; и
3) полипептида, содержащего аминокислотную последовательность SEQ ID NO: 12 или аминокислоты 4-591 SEQ ID NO: 12 («полипептид плазмиды 1330»), или функционального варианта полипептида.
C. Молекулы нуклеиновой кислоты, кодирующие иммуногенные полипептиды TAA
В некоторых аспектах настоящее изобретение относится к молекулам нуклеиновых кислот, каждая из которых кодируют один, два, три или более независимых иммуногенных полипептидов TAA по настоящему изобретению. Молекулы нуклеиновых кислот могут быть дезоксирибонуклеотидами (ДНК) или рибонуклеотидами (РНК). Таким образом, молекула нуклеиновой кислоты может содержать описанную в настоящем документе нуклеотидную последовательность, в которой тимидин (Т) также может быть урацилом (U), что отражает различия между химическими структурами ДНК и РНК. Молекулы нуклеиновых кислот могут быть модифицированными формами, одно- или двухцепочечными формами, линейными или кольцевыми формами. Молекулы нуклеиновых кислот могут быть получены способами, известными в данной области в свете настоящего описания.
C-1. Моноантигенные конструкции
В одном аспекте настоящее изобретение относится к выделенной молекуле нуклеиновой кислоты, которая содержит нуклеотидную последовательность, кодирующую один иммуногенный полипептид MUC1, один иммуногенный полипептид MSLN или один иммуногенный полипептид TERT, как описано в настоящем изобретении. Молекула нуклеиновой кислоты, которая кодирует только один иммуногенный полипептид TAA, такой как иммуногенный полипептид MUC1, иммуногенный полипептид MSLN или иммуногенный полипептид TERT, также называется в настоящем описании «моноантигенной конструкцией».
C-1a. MUC1 моноантигенные конструкции
В некоторых вариантах осуществления настоящее изобретение относится к выделенным молекулам нуклеиновых кислот, которые кодируют иммуногенный полипептид MUC1 по настоящему изобретению. Иммуногенный полипептид MUC1, кодируемый молекулой нуклеиновой кислоты, может находиться в цитоплазматической форме (или цMUC1) или в «мембрано-связанной форме" (или мMUC1). Термин «мембрано-связанная форма» относится к иммуногенному полипептиду MUC1, который, после того, как был экспрессирован кодирующей нуклеиновой кислотой в клетке-хозяине, связан, присоединен или иным образом ассоциирован с мембраной клетки хозяина.
В некоторых конкретных вариантах осуществления выделенные молекулы нуклеиновых кислот по настоящему изобретению содержат нуклеотидную последовательность, которая кодирует иммуногенный полипептид MUC1, выбранный из группы, состоящей из:
(1) иммуногенного полипептида MUC1, содержащего аминокислотную последовательность SEQ ID NO:8 (полипептид плазмиды 1027);
(2) имунногенного полипептида MUC1, содержащего аминокислоты 4-537 SEQ ID NO:8;
(3) имунногенного полипептида MUC1, содержащего аминокислоты 24-537 SEQ ID NO: 8;
(4) иммуногенного полипептида MUC1, содержащего аминокислотную последовательность SEQ ID NO:16 (полипептид плазмиды 1197);
(5) имунногенного полипептида MUC1, содержащего аминокислоты 4-517 SEQ ID NO:16;
(6) имунногенного полипептида MUC1, содержащего аминокислоты 4-517 SEQ ID NO:16, причем аминокислота в положении 513 представляет собой T; и
(7) имунногенного полипептида MUC1, содержащего аминокислоты 24-225 и 946-1255 SEQ ID NO: 1.
В некоторых других конкретных вариантах осуществления выделенные молекулы нуклеиновых кислот по настоящему изобретению содержат нуклеотидную последовательность или ее производное, выбранные из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO:7 (плазмида 1027);
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1611 SEQ ID NO: 7;
(3) нуклеотидной последовательности SEQ ID NO: 15 (плазмида 1197); и
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1551 SEQ ID NO: 15;
С-1b. MSLN моноантигенные конструкции
В некоторых вариантах осуществления настоящее изобретение относится к выделенным молекулам нуклеиновых кислот, которые кодируют иммуногенный полипептид MSLN по настоящему изобретению.
В некоторых конкретных вариантах осуществления выделенная молекула нуклеиновой кислоты кодирует иммуногенный полипептид MSLN, выбранный из группы, состоящей из:
1) иммуногенного полипептида MSLN, содержащего или состоящего из аминокислот 37-597 аминокислотной последовательности SEQ ID NO:2;
2) иммуногенного полипептида MSLN, содержащего аминокислотную последовательность, которая по меньшей мере на 90%, 95%, 98% или 99% идентична аминокислотной последовательности, состоящей из аминокислот 37-597 аминокислотной последовательности SEQ ID NO:2;
3) иммуногенного полипептида MSLN, содержащего или состоящего из аминокислотной последовательности SEQ ID NO: 6; и
4) иммуногенного полипептида MSLN, содержащего аминокислотную последовательность, которая по меньшей мере на 93%-99%, 94%-98% или 94%-97% идентична аминокислотной последовательности SEQ ID NO: 6 («полипептид плазмиды 1103»).
В некоторых других конкретных вариантах осуществления выделенные молекулы нуклеиновых кислот по настоящему изобретению содержат нуклеотидную последовательность или ее производное, выбранные из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 5; и
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 SEQ ID NO: 5.
С-1c. TERT моноантигенные конструкции
В некоторых других вариантах осуществления настоящее изобретение относится к выделенным молекулам нуклеиновых кислот, которые кодируют иммуногенный полипептид TERT по настоящему изобретению.
Иммуногенный полипептид TERT, кодируемый нуклеиновой кислотой по настоящему изобретению, может содержать делецию вплоть до 600 аминокислот на N-конце аминокислотной последовательности TERT изоформы 1. Как правило, можно ожидать, что иммуногенный полипептид TERT обладает более сильной иммуногенностью, если у него имеется делеция нескольких аминокислот на N-конце белка TERT. Число N-концевых аминокислот, которые могут быть делетированы в белке TERT, можно определить на основании того, как предполагается использовать или доставлять молекулу нуклеиновой кислоты, кодирующую полипептид. Например, если молекулу нуклеиновой кислоты предполагается доставлять с помощью конкретного вирусного вектора, то делецию можно определить в зависимости от емкости используемого вектора.
В некоторых вариантах осуществления иммуногенные полипептиды TERT, кодируемые молекулами нуклеиновых кислот, содержат одну или несколько аминокислотных мутаций, которые инактивируют каталитический домен TERT. Примеры таких аминокислотных мутаций включают замену аспарагиновой кислоты на аланин в положении 712 SEQ ID NO:3 (D712A) и замену валина на изолейцин в положении 713 SEQ ID NO:3 (V713I). В некоторых вариантах осуществления иммуногенный полипептид TERT содержит и мутацию D712A, и мутацию V713I.
В некоторых конкретных вариантах осуществления выделенная молекула нуклеиновой кислоты кодирует иммуногенный полипептид TERT, выбранный из группы, состоящей из:
1) иммуногенного полипептида TERT, содержащего аминокислотную последовательность SEQ ID NO: 10 или аминокислоты 2-892 SEQ ID NO: 10 («полипептид плазмиды 1112»), или функционального варианта полипептида;
2) иммуногенного полипептида TERT, содержащего аминокислотную последовательность SEQ ID NO: 14 или аминокислоты 3-789 SEQ ID NO: 14 («полипептид плазмиды 1326»), или функционального варианта полипептида; и
3) иммуногенного полипептида TERT, содержащего аминокислотную последовательность SEQ ID NO: 12 или аминокислоты 4-591 SEQ ID NO: 12 («полипептид плазмиды 1330»), или функционального варианта полипептида.
В некоторых конкретных вариантах осуществления выделенные молекулы нуклеиновых кислот содержат нуклеотидную последовательность или ее производное, выбранные из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 9 (TERT240);
(2) нуклеотидной последовательности, содержащей нуклеотиды 4-2679 SEQ ID NO: 9;
(3) нуклеотидной последовательности SEQ ID NO: 11 (TERT541);
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1782 SEQ ID NO: 11;
(5) нуклеотидной последовательности SEQ ID NO: 13 (TERT342); и
(6) нуклеотидной последовательности, содержащей нуклеотиды 7-2373 SEQ ID NO: 13.
C-2. Мультиантигенные конструкции
В еще одном аспекте настоящее описание относится к молекулам нуклеиновых кислот, каждая из которых кодирует два, три или более различных иммуногенных полипептидов TAA. Молекула нуклеиновой кислоты, которая кодирует более одного иммуногенного полипептида TAA, также называется в настоящем описании «мультиантигенной конструкцией», «мультиантигенной вакциной», «мультиантигенной плазмидой» и тому подобное. В настоящем описании молекула нуклеиновой кислоты, которая кодирует два различных иммуногенных полипептида TAA, также называется «двойная антигенная конструкция», «двойная антигенная вакцина» или «двойная антигенная плазмида» и тому подобное. В настоящем описании молекула нуклеиновой кислоты, которая кодирует три различных иммуногенных полипептида TAA, также называется «тройная антигенная конструкция», «тройная антигенная вакцина» или «тройная антигенная плазмида».
Мультиантигенные конструкции по настоящему изобретению могут быть получены различными способами, известными в данной области в свете настоящего описания. Например, мультиантигенная конструкция может быть сконструирована путем включения нескольких независимых промоторов в одну плазмиду (Huang, Y., Z. Chen, et al. (2008). "Design, construction, and characterization of a dual-promoter multigenic DNA vaccine directed against an HIV-1 subtype C/B' recombinant." J Acquir Immune Defic Syndr 47(4): 403-411; Xu, K., Z. Y. Ling, et al. (2011). "Broad humoral and cellular immunity elicited by a bivalent DNA vaccine encoding HA and NP genes from an H5N1 virus." Viral Immunol 24(1): 45-56). Плазмиду можно сконструировать для переноса множества кассет экспрессии, каждая из которых состоит из а) эукариотического промотора для инициации транскрипции, зависящей от РНК-полимеразы, содержащего или не содержащего энхансерный элемент, b) гена, кодирующего мишеневый антиген, и с) последовательности терминатора транскрипции. При доставке плазмиды в трансфицированное клеточное ядро транскрипция начинается с каждого промотора, что приводит к получению отдельных мРНК, каждая из которых кодирует один из мишеневый антиген. мРНК независимо транслируются, тем самым давая желаемые антигены.
Конструкции с множественными антигенами по настоящему изобретению также могут быть сконструированы с помощью вирусных пептидов 2А (Szymczak, A.L. and D.A. Vignali (2005). "Development of 2A peptide-based strategies in the design of multicistronic vectors." Expert Opin Biol Ther 5(5): 627-638; de Felipe, P., G. A. Luke, et al. (2006). "E unum pluribus: multiple proteins from a self-processing polyprotein." Trends Biotechnol 24(2): 68-75; Luke, G. A., P. de Felipe, et al. (2008). "Occurrence, function and evolutionary origins of '2A-like' sequences in virus genomes." J Gen Virol 89(Pt 4): 1036-1042; Ibrahimi, A., G. Vande Velde, et al. (2009). "Highly efficient multicistronic lentiviral vectors with peptide 2A sequences." Hum Gene Ther 20(8): 845-860; Kim, J. H., S. R. Lee, et al. (2011). "High cleavage efficiency of a 2A peptide derived from porcine teschovirus-1 in human cell lines, zebrafish and mice." PLoS One 6(4): e18556). Эти пептиды, также называемые расщепляемыми кассетами или CHYSEL (цис-действующие гидролазные элементы), составляют в длину приблизительно 20 аминокислот и имеют высококонсервативный карбокси-концевой мотив D-V/I-EXNPGP (Таблица 19). Эти пептиды редко встречаются в природе, чаще всего обнаруживаются в таких вирусах, как вирус ящура (FMDV), вирус лошадиного ринита A (ERAV), вирус лошадиного ринита B (ERBV), вирус энцефаломиокардита (EMCV), свиной тошевирус (PTV) и вирус Thosea asigna (TAV) (Luke, GA, P. de Felipe, et al. (2008). "Occurrence, function and evolutionary origins of '2A-like' sequences in virus genomes." J Gen Virol 89(Pt 4): 1036-1042). С помощью стратегии экспрессии множественных антигенов на основе 2А, гены, кодирующие несколько мишеневых антигенов, связаны друг с другом в одной открытой рамке считывания, разделенной последовательностями, кодирующими вирусные пептиды 2А. Вся открытая рамка считывания может быть клонирована в вектор с единственным промотором и терминатором. После доставки конструкций в клетку-хозяина, мРНК, кодирующая множественные антигены, будет транскрибироваться и транслироваться как единый полипротеин. Во время трансляции пептидов 2А, рибосомы пропускают связь между С-концевым глицином и пролином. Рибосомальное проскальзывание действует как котрансляционное автокаталитическое «расщепление», которое освобождает последовательности пептидов, находящиеся в направлении 3'-5' от пептида 2А, от последовательностей, которые находятся в направлении 5'-3'. Встраивание пептида 2А между двумя белковыми антигенами может привести к добавлению ~20 аминокислот к С-концу полипептида, расположенного в направлении 3'-5', и 1 аминокислоты (пролина) к N-концу белка, расположенного в направлении 5'-3'. При применении этой методики сайты расщепления протеазой могут быть введены на N-конец кассеты 2А, так что повсеместно распространенные протеазы будут расщеплять кассету в направлении 3'-5' белка (Fang, J., S. Yi, et al. (2007). "An antibody delivery system for regulated expression of therapeutic levels of monoclonal antibodies in vivo." Mol Ther 15(6): 1153-1159).
Другая стратегия конструирования мультиантигенных конструкций по настоящему изобретению включает применение участка внутренней посадки рибосомы, или IRES. Участки внутренней посадки рибосом представляют собой РНК-элементы, обнаруживаемые в 5'-нетранслируемых областях некоторых молекул РНК (Bonnal, S., C. Boutonnet, et al. (2003). "IRESdb: the Internal Ribosome Entry Site database." Nucleic Acids Res 31(1): 427-428). Они привлекают рибосомы эукариот к РНК для облегчения трансляции открытых рамок считывания. В отличие от нормальной трансляции, зависимой от 7-метилгуанозинового кэпа, IRES-опосредованная трансляция может быть инициирована на кодонах AUG, находящихся глубоко внутри молекулы РНК. Высокоэффективный процесс может быть использован для применения в мультицистронных векторах экспрессии (Bochkov, Y. A. and A. C. Palmenberg (2006). "Translational efficiency of EMCV IRES in bicistronic vectors is dependent upon IRES sequence and gene location." Biotechniques 41(3): 283-284, 286, 288). Как правило, два трансгена вводят в вектор между промотором и терминатором транскрипции в виде двух отдельных открытых рамок считывания, разделенных IRES. После доставки конструкций в клетку-хозяин, будет транскрибироваться один длинный транскрипт, кодирующий оба трансгена. Первая ORF транслируется традиционным кэп-зависимым образом, заканчиваясь стоп-кодоном в направлении 3'-5' от IRES. Вторая ORF транслируется кэп-независимым образом, используя IRES. Таким образом, из одной мРНК, транскрибируемой из вектора с единственной экспрессионной кассетой, могут быть получены два независимых белка.
В некоторых аспектах настоящее описание относится к двойной антигенной конструкции, содержащей две кодирующие нуклеотидные последовательности, причем каждая из кодирующих нуклеотидных последовательностей кодирует отдельный иммуногенный полипептид TAA. Структура такой двойной антигенной конструкции показана в формуле (I):
TAA1-СПЕЙСЕР1-TAA2 (I),
где в формуле (I):
(i) TAA1 и TAA2 представляют собой нуклеотидные последовательности, каждая из которых кодирует иммуногенные полипептиды TAA, выбранные из группы, состоящей из иммуногенного полипептида MUC1, иммуногенного полипептида MSLN и иммуногенного полипептида TERT, где TAA1 и TAA 2 кодируют различные иммуногенные полипептиды TAA; и
(ii) СПЕЙСЕР1 представляет собой спейсерную нуклеотидную последовательностью и может отсутствовать.
В некоторых вариантах осуществления настоящее изобретение относится к двойной антигенной конструкции формулы (I), где в формуле (I) TAA1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1, и TAA2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MSLN или иммуногенный полипептид TERT.
В некоторых других вариантах осуществления настоящее изобретение относится к двойной антигенной конструкции формулы (I), где в формуле (I) TAA1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MSLN, и TAA2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1 или иммуногенный полипептид TERT.
В некоторых других вариантах осуществления настоящее изобретение относится к двойной антигенной конструкции формулы (I), где в формуле (I) TAA1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид TERT, и TAA2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1 или иммуногенный полипептид MSLN.
В некоторых конкретных вариантах осуществления настоящее описание относится к двойной антигенной конструкции формулы, выбранной из группы, состоящей из:
(1) MUC1-2A-TERT (II)
(2) MUC1-2A-MSLN (III)
(3) MSLN-2A-TERT (IV)
(4) MSLN-2A-MUC1 (V)
(5) TERT-2A-MSLN (VI)
(6) TERT-2A-MUC1 (VII)
где в каждой из формул (II)-(VII): (i) MUC1, MSLN и TERT представляют собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1, иммуногенный полипептид MSLN и иммуногенный полипептид TERT, соответственно, и (ii) 2A представляет собой нуклеотидную последовательность, кодирующую пептид 2A.
В некоторых других аспектах настоящее описание относится к тройной антигенной конструкции, содержащей три кодирующие нуклеотидные последовательности, где каждая из кодирующих нуклеотидных последовательностей экспрессирует различные независимые иммуногенные полипептиды TAA. Структура тройной антигенной конструкции показана в формуле (VIII):
TAA1-СПЕЙСЕР1-TAA2-СПЕЙСЕР2-TAA3 (VIII)
где в формуле (VIII):
(i) каждый TAA1 и TAA3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид TAA, выбранный из группы, состоящей из иммуногенного полипептида MUC1, иммуногенного полипептида MSLN и иммуногенного полипептида TERT, где TAA1, TAA2 и TAA3 кодируют различные иммуногенные полипептиды TAA; и
(ii) СПЕЙСЕР1 и СПЕЙСЕР2 представляют собой спейсерную нуклеотидную последовательность, причем (a) СПЕЙСЕР1 и СПЕЙСЕР2 могут быть одинаковыми или различными и (b) либо СПЕЙСЕР1 может отсутствовать, либо СПЕЙСЕР2 может отсутствовать, либо и СПЕЙСЕР1, и СПЕЙСЕР2 могут отсутствовать.
Термин «спейсерная нуклеотидная последовательность», используемый в настоящем описании, относится к нуклеотидной последовательности, которая введена между двух кодирующих последовательностей или трансгенами в открытую рамку считывания молекулы нуклеиновой кислоты и функционирует, обеспечивая соэкспрессию или трансляцию двух отдельных генным продуктов из молекулы нуклеиновой кислоты. Примеры спейсерных нуклеотидных последовательностей, которые могут быть использованы в мультиантигенных конструкциях по настоящему изобретению, включают в себя эукариотические промоторы, нуклеотидные последовательности, кодирующие пептид 2A, и участки внутренней посадки рибосомы (IRES). Примеры пептидов 2А включают пептид 2А вируса ящура (FMD2A), пептид 2A вируса лошадиного ринита A (ERA2A), пептид 2А вируса лошадиного ринита B (ERB2A), пептид 2А вируса энцефаломиокардита (EMC2A), пептид 2А свиного тошевируса (PT2A) и пептид 2А вируса Thosea asigna (T2A). Последовательности этих пептидов 2А представлены в Таблице 19.
В некоторых вариантах осуществления СПЕЙСЕР1 и СПЕЙСЕР2 независимо представляют собой нуклеотидную последовательность, кодирующую пептид 2A, или нуклеотидную последовательность, кодирующую GGSGG.
В некоторых вариантах осуществления настоящее изобретение относится к тройной антигенной конструкции формулы (VIII), где в формуле (VIII) (i) TAA1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1, (ii) TAA2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MSLN, и (iii) TAA3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид TERT.
В некоторых других вариантах осуществления настоящее описание относится к тройной антигенной конструкции формулы (VIII), где в формуле (VIII) (i) TAA1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1, (ii) TAA2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид TERT и (iii) TAA3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MSLN.
В некоторых других вариантах осуществления настоящее описание относится к тройной антигенной конструкции формулы (VIII), где в формуле (VIII) (i) TAA1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MSLN, (ii) TAA2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид TERT и (iii) TAA3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1.
В некоторых вариантах осуществления настоящее изобретение относится к тройной антигенной конструкции формулы (VIII), где в формуле (VIII) (i) TAA1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MSLN, (ii) TAA2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1, и (iii) TAA3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид TERT.
В некоторых конкретных вариантах осуществления настоящее описание относится к тройной антигенной конструкции формулы, выбранной из группы, состоящей из:
(1) MUC1-2A-MSLN-2A-TERT (IX)
(2) MUC1-2A-TERT-2A-MSLN (X)
(3) MSLN-2A-MUC1-2A-TERT (XI)
(4) MSLN-2A-TERT-2A-MUC1 (XII)
(5) TERT-2A-MUC1-2A-MSLN (XIII)
(6) TERT-2A-MSLN-2A-MUC1 (XIV)
где в каждой из формул (IX)-(XIV): (i) MUC1, MSLN и TERT представляют собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1, иммуногенный полипептид MSLN и иммуногенный полипептид TERT, соответственно, и (ii) 2A представляет собой нуклеотидную последовательность, кодирующую пептид 2A.
Иммуногенный полипептид MSLN, кодируемый мультиантигенной конструкцией, может представлять собой полноразмерный MSLN-белок или его фрагмент, такой как цитоплазматический, секретируемый или связанный с мембраной фрагмент. В некоторых вариантах осуществления мультиантигенная конструкция содержит нуклеотидную последовательность, кодирующую иммуногенный полипептид MSLN, выбранный из группы, состоящей из:
1) полипептида, содержащего или состоящего из аминокислот 37-597 аминокислотной последовательности SEQ ID NO:2;
2) полипептида, содержащего аминокислотную последовательность, которая по меньшей мере на 90%, 95%, 98% или 99% идентична аминокислотной последовательности, состоящей из аминокислот 37-597 аминокислотной последовательности SEQ ID NO:2;
3) полипептида, содержащего или состоящего из аминокислотной последовательности SEQ ID NO: 6 или аминокислот 4-564 аминокислотной последовательности SEQ ID NO: 6; и
4) полипептида, содержащего аминокислотную последовательность, которая по меньшей мере на 93%-99%, 94%-98% или 94%-97% идентична аминокислотной последовательности SEQ ID NO: 8 («полипептид плазмиды 1103»).
В некоторых конкретных вариантах осуществления мультиантигенная конструкция содержит нуклеотидную последовательность SEQ ID NO: 5 или ее вырожденный вариант.
Иммуногенный полипептид MUC1, кодируемый мультиантигенной конструкцией может содержать (1) аминокислотную последовательность из 3-30 тандемных повторов из 20 аминокислот белка MUC1 человека и (2) аминокислотные последовательности белка MUC1 человека, который фланкирует область VNTR. В некоторых вариантах осуществления мультиантигенная конструкция содержит нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1, где иммуногенный полипептид MUC1 содержит аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO:8 (полипептид плазмиды 1027);
(2) аминокислотной последовательности, содержащей аминокислоты 4-537 SEQ ID NO:8;
(3) аминокислотной последовательности, содержащей аминокислоты 24-537 SEQ ID NO:8;
(4) аминокислотной последовательности SEQ ID NO:16 (полипептид плазмиды 1197);
(5) аминокислотной последовательности, содержащей аминокислоты 4-517 SEQ ID NO:16; и
(6) аминокислотной последовательности, содержащей аминокислоты 4-517 SEQ ID NO: 16, при условии, что аминокислота в положении 513 представляет собой T.
В некоторых конкретных вариантах осуществления мультиантигенная конструкция содержит нуклеотидную последовательность SEQ ID NO: 7, нуклеотидную последовательность SEQ ID NO: 15 или вырожденный вариант нуклеотидной последовательности SEQ ID NO: 7 или 15.
Иммуногенный полипептид TERT, кодируемый мультиантигенной конструкцией, может представлять собой полноразмерный белок или любую усеченную форму. Ожидается, что полноразмерный белок TERT будет давать более сильные иммунные ответы, чем усеченная форма. Однако в зависимости от конкретного вектора, выбранного для доставки конструкции, вектор может не обладать возможностью нести ген, кодирующий полноразмерный белок TERT. Поэтому в белке могут бы проведены делеции некоторых аминокислот так, чтобы трансгены подходили для конкретного вектора. Делеции аминокислот могут быть проведены с N-конца, С-конца или в любом месте последовательности белка TERT. Для удаления сигнала ядерной локализации могут быть проведены дополнительные делеции, тем самым превращая полипептиды в цитоплазматические, повышая доступ к механизмам процессинга/презентации клеточного антигена. В некоторых вариантах осуществления в иммунных полипептидах TERT отсутствуют аминокислоты вплоть до положения 200, 300, 400, 500 или 600 N-конца. Для инактивации каталитического домена TERT могут быть введены мутации дополнительных аминокислот. Примеры таких мутаций включают D712A и V713T.
В некоторых других вариантах осуществления мультиантигенная конструкция содержит нуклеотидную последовательность, кодирующую иммуногенный полипептид TERT, где иммуногенный полипептид TERT содержит или состоит из аминокислотной последовательности, выбранной из группы, состоящей из:
1) аминокислотной последовательности SEQ ID NO:10 («полипептид плазмиды 1112»; TERT 240);
(2) аминокислотной последовательности SEQ ID NO:12 ("полипептид плазмиды 1330"; TERT 541); и
3) аминокислотной последовательности SEQ ID NO: 14 («полипептид плазмиды 1326», TERT 343).
В некоторых конкретных вариантах осуществления мультиантигенная конструкция содержит нуклеотидную последовательность SEQ ID NO: 9, 11 или 13 или вырожденный вариант нуклеотидной последовательности SEQ ID NO: 9, 11 или 13.
В некоторых конкретных вариантах осуществления настоящее изобретение относится к двойной антигенной конструкции, кодирующей иммуногенный полипептид MUC1 и иммуногенный полипептид MSLN, который содержит нуклеотидную последовательность, выбранную из группы, состоящей из:
(1) нуклеотидной последовательности, кодирующей аминокислотную последовательность SEQ ID NO: 18, 20, 22 или 24;
(2) нуклеотидной последовательности SEQ ID NO: 17, 19, 21 или 23; и
(3) вырожденного варианта нуклеотидной последовательности SEQ ID NO: 17, 19, 21 или 23.
В некоторых других вариантах осуществления настоящее изобретение относится к двойной антигенной конструкции, кодирующей иммуногенный полипептид MUC1 и иммуногенный полипептид TERT, который содержит нуклеотидную последовательность, выбранную из группы, состоящей из:
(1) нуклеотидной последовательности, кодирующей аминокислотную последовательность SEQ ID NO: 26, 28, 30, 32 или 34;
(2) нуклеотидной последовательности SEQ ID NO: 25, 27, 29, 31 или 33; и
(3) вырожденного варианта нуклеотидной последовательности SEQ ID NO: 25, 27, 29, 31 или 33.
В некоторых других вариантах осуществления настоящее изобретение относится к двойной антигенной конструкции, кодирующей иммуногенный полипептид MSLN и иммуногенный полипептид TERT, который содержит нуклеотидную последовательность, выбранную из группы, состоящей из:
(1) нуклеотидной последовательности, кодирующей аминокислотную последовательность SEQ ID NO: 36, 38, 40 или 42;
(2) нуклеотидной последовательности SEQ ID NO: 35, 37, 39 или 41; и
(3) вырожденного варианта нуклеотидной последовательности SEQ ID NO: 35, 37, 39 или 41.
В некоторых других вариантах осуществления настоящее изобретение относится к тройной антигенной конструкции, кодирующей иммуногенный полипептид MUC1, иммуногенный полипептид MSLN и иммуногенный полипептид TERT, который содержит нуклеотидную последовательность, выбранную из группы, состоящей из:
(1) нуклеотидной последовательности, кодирующей аминокислотную последовательность SEQ ID NO: 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64 или 66;
(2) нуклеотидной последовательности SEQ ID NO: 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63 или 65; и
(3) вырожденного варианта нуклеотидной последовательности SEQ ID NO: 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63 или 65.
D. Векторы, содержащие молекулу нуклеиновой кислоты, кодирующую иммуногенный полипептид TAA
В другом аспекте изобретение относится к векторам, содержащим одну или несколько любых молекул нуклеиновых кислот по настоящему изобретению, включая моноантигенные конструкции, двойные антигенные конструкции, тройные антигенные конструкции и другие мультиантигенные конструкции. Векторы могут использоваться для клонирования или экспрессии иммуногенных полипептидов TAA, кодируемых молекулами нуклеиновых кислот, или для доставки молекул нуклеиновых кислот в композиции, такой как вакцина, в клетку-хозяин или в хозяин, которым является животное, например человек. В некоторых конкретных вариантах осуществления вектор содержит тройную антигенную конструкцию, кодирующую иммуногенный полипептид MUC1, иммуногенный полипептид MSLN и иммуногенный полипептид TERT, где тройная антигенная конструкция содержит нуклеотидную последовательность, выбранную из группы, состоящей из:
(1) нуклеотидной последовательности, кодирующей аминокислотную последовательность SEQ ID NO: 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64 или 66;
(2) нуклеотидной последовательности SEQ ID NO: 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63 или 65; и
(3) вырожденного варианта нуклеотидной последовательности SEQ ID NO: 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63 или 65.
Большое разнообразие векторов может быть получено и содержать и экспрессировать молекулу нуклеиновой кислоты по изобретению, например плазмидные векторы, космидные векторы, фаговые векторы и вирусные векторы.
В некоторых вариантах осуществления изобретение относится к вектору на основе плазмиды, содержащему молекулу нуклеиновой кислоты по изобретению. Примеры подходящих плазмидных векторов включают pBR325, pUC18, pSKF, pET23D и pGB-2. Другие примеры плазмидных векторов, а также способ конструирования таких векторов описаны в патентах США 5580859, 5589466, 5688688, 5814482 и 5580859.
В других вариантах осуществления настоящее изобретение относится к векторам, которые сконструированы из вирусов, таких как ретровирусы, альфавирусы и аденовирусы. Примеры ретровирусных векторов описаны в патентах США №№ 5219740, 5716613, 5851529, 5591624, 5716826, 5716832 и 5817491. Типичные примеры векторов, которые могут быть получены из альфавирусов, описаны в патентах США №№ 5091309 и 5217879, 5843723 и 5789245.
В некоторых конкретных вариантах осуществления настоящее изобретение относится к аденовирусным векторам, полученным из аденовирусов приматов, отличных от человека, таких как аденовирусы обезьяны. Примеры таких аденовирусных векторов, а также их получение, описаны в публикациях заявок PCT WO 2005/071093 и WO 2010/086189 и включают в себя нереплицирующие векторы, сконструированные из аденовирусов обезьян, таких как ChAd3, ChAd4, ChAd5, ChAd7, ChAd8, ChAd9, ChAd10, ChAd11, ChAd16, ChAd17, ChAd19, ChAd20, ChAd22, ChAd24, ChAd26, ChAd30, ChAd31, ChAd37, ChAd38, ChAd44, ChAd63, ChAd68, ChAd82, ChAd55, ChAd73, ChAd83, ChAd146, ChAd147, PanAd1, Pan Ad2 и Pan Ad3, и грамотрицательные векторы, сконструированные из аденовирусов Ad4 или Ad7 обезьян. Предпочтительно, при конструировании аденовирусных векторов из аденовирусов обезьян один или несколько ранних генов геномной области вируса, выбранных из E1A, E1B, E2A, E2B, E3 и E4, были либо удалены, либо оказались нефункциональными за счет делеции или мутации. В конкретном варианте осуществления вектор сконструирован из ChAd3 или ChAd68. Подходящие векторы также могут быть получены из других вирусов, таких как: (1) вирусы оспы, такие как вирус оспы канареек или вирус осповакцины (Fisher-Hoch et al., PNAS 86: 317-321, 1989; Flexner et al., Ann. N.Y. Acad. Sci. 569:86-103, 1989; Flexner et al., Vaccine 8:17-21, 1990; патенты США №№ 4603112, 4769330 и 5017487; WO 89/01973); (2) SV40 (Mulligan et al., Nature 277:108-114, 1979); (3) герпес (Kit, Adv. Exp. Med. Biol. 215: 219-236, 1989; патент США № № 5288641); и (4) лентивирус, такой как ВИЧ (Poznansky, J. Virol. 65: 532-536, 1991).
Способы конструирования векторов хорошо известны в данной области. Векторы экспрессии обычно включают один или несколько контрольных элементов, которые функционально связаны с экспрессируемой последовательностью нуклеиновой кислоты. Термин «контрольные элементы» относится в совокупности к промоторным областям, сигналам полиаденилирования, последовательностям терминации транскрипции, регуляторным доменам, расположенным в направлении 3'-5', точкам начала репликации, участкам внутренней посадки рибосомы («IRES»), энхансерам и тому подобное, которые в совокупности обеспечивают репликацию, транскрипцию и трансляцию кодирующей последовательности в клетке-реципиенте. Если выбранная кодирующая последовательность способна реплицироваться, транскрибироваться и транслироваться в соответствующей клетке-хозяине, то не все из этих контрольных элементов должны всегда присутствовать. Контрольные элементы выбирают на основе ряда факторов, известных специалистам в данной области, таких как конкретные клетки-хозяева и источник или структуры других векторных компонентов. Для усиления экспрессии иммуногенного полипептида TAA в направлении 3'-5' от последовательности, кодирующей иммуногенный полипептид TAA, может присутствовать последовательность Козака. Для позвоночных известная последовательность Козака представляет собой (GCC)NCCATGG, где N является A или G, а GCC менее консервативна. Примеры последовательностей Козака, которые могут быть использованы, включают GAACATGG, ACCAUGG и ACCATGG.
E. Композиции, содержащие иммуногенный полипептид TAA (полипептидные композиции)
В еще одном аспекте настоящее изобретение относится к полипептидным композициям, которые содержат один или несколько выделенных иммуногенных полипептидов TAA по настоящему изобретению («полипептидная композиция»). В некоторых вариантах осуществления полипептидная композиция представляет собой иммуногенную композицию, которая может использоваться для индукции иммунного ответа против белка ТАА у млекопитающего, такого как мышь, собака, приматы, не относящиеся к человеку, или человек. В некоторых других вариантах осуществления полипептидная композиция представляет собой фармацевтическую композицию для введения человеку. В еще других вариантах осуществления полипептидная композиция представляет собой вакцинную композицию, подходящую для иммунизации млекопитающего, такого как человек, для ингибирования патологической клеточной пролиферации, для защиты от развития рака (используется в качестве профилактической вакцины) или для лечения расстройств (используется в качестве терапевтической вакцины), связанных со сверхэкспрессией ТАА, например рака.
Полипептидная композиция по настоящему изобретению может содержать иммуногенный полипептид TAA одного типа, такой как иммуногенный полипептид MSLN, иммуногенный полипептид MUC1 или иммуногенный полипептид TERT. Композиция также может содержать комбинацию двух или более различных типов иммуногенных полипептидов ТАА. Например, полипептидная композиция может содержать иммуногенные полипептиды TAA в любой из следующих комбинаций:
1) иммуногенный полипептид MSLN и иммуногенный полипептид MUC1;
2) иммуногенный полипептид MSLN и полипептид TERT; или
3) иммуногенный полипептид MSLN, иммуногенный полипептид MUC1 и полипептид TERT.
В некоторых вариантах осуществления полипептидная композиция по настоящему изобретению, например иммуногенная композиция, фармацевтическая композиция или вакцинная композиция, дополнительно содержит фармацевтически приемлемое вспомогательное вещество. Фармацевтически приемлемые вспомогательные вещества, подходящие для иммуногенных, фармацевтических или вакцинных композиций, известны в данной области. Примеры подходящих вспомогательных веществ, которые могут быть использованы в композициях, включают биосовместимые масла, такие как масло из рапсового масла, подсолнечное масло, арахисовое масло, масло семян хлопчатника, масло жожоба, сквалан, сквален, физиологический солевой раствор, консерванты и средства для контроля осмотического давления, газ-носители, агенты, регулирующие рН, органические растворители, гидрофобные агенты, ингибиторы ферментов, водопоглощающие полимеры, поверхностно-активные вещества, стимуляторы абсорбции, модификаторы рН и антиоксидантные агенты.
Иммуногенный полипептид TAA в композиции, в частности иммуногенной композиции или вакцинной композиции, может быть связан, конъюгирован или иным образом включен в носитель для введения реципиенту. Термин «носитель» относится к веществу или структуре, к которой иммуногенный полипептид может быть присоединен или с которой он может быть иным образом связан для доставки иммуногенного полипептида реципиенту (например, пациенту). Носитель сам может быть иммуногенным. Примеры носителей включают иммуногенные полипептиды, иммунные CpG-островки, гемоцианин лимфы улитки (KLH), столбнячный токсоид (TT), субъединицу В холерного токсина (CTB), бактерию или бактериальные "тени", липосому, хитосому, виросомы, микросферы, дендритные клетки или тому подобное. Одна или несколько иммуногенных молекул полипептида ТАА могут быть связаны с одной молекулой-носителем. Способы связывания иммуногенного полипептида с носителем известны в данной области.
Вакцинную композицию или иммуногенную композицию по настоящему изобретению можно использовать в сочетании или в комбинации с одним или несколькими иммуномодуляторами или адъювантами. Иммуномодуляторы или адъюванты могут быть получены независимо от вакцинной композиции или иммуногенной композиции или они могут быть частью одного и того же состава композиции. Таким образом, в некоторых вариантах осуществления настоящее изобретение относится к вакцинной композиции, которая дополнительно содержит один или несколько иммуномодуляторов или адъювантов. Примеры иммуномодуляторов и адъювантов приведены ниже.
Полипептидные композиции, включая иммуногенные и вакцинные композиции, могут быть получены в любых подходящих дозированных формах, таких как жидкие формы (например, растворы, суспензии или эмульсии) и твердые формы (например, капсулы, таблетки или порошок) и способами, известными специалистам в данной области.
F. Композиции, содержащие иммуногенную молекулу нуклеиновой кислоты TAA (композиции нуклеиновых кислот)
Настоящее изобретение также относится к композициям нуклеиновых кислот, которые содержат выделенную молекулу нуклеиновой кислоты или вектор по настоящему изобретению («композиция нуклеиновой кислоты»). Композиции нуклеиновых кислот могут использоваться для индукции иммунного ответа против белка ТАА in vitro или in vivo у млекопитающего, включая человека. В некоторых вариантах осуществления композиции нуклеиновых кислот представляют собой иммуногенные композиции или фармацевтические композиции.
В некоторых конкретных вариантах осуществления композиция нуклеиновой кислоты представляет собой ДНК-вакцинную композицию для введения человеку для (1) ингибирования патологической пролиферации клеток, обеспечивая защиту от развития рака (используется в качестве профилактического средства), (2) лечения рака (используется в качестве терапевтического средства), связанного со сверхэкспрессией TAA, или (3) индукции иммунного ответа против конкретного TAA человека, например MSLN, MUC1 или TERT. Молекула нуклеиновой кислоты в композиции может быть «голой» молекулой нуклеиновой кислоты, то есть просто в форме выделенной ДНК, свободной от элементов, которые способствуют трансфекции или экспрессии. Альтернативно, молекулу нуклеиновой кислоты в композиции вводят в вектор, такой как плазмидный вектор или вирусный вектор.
Композиция нуклеиновой кислоты по настоящему изобретению может содержать отдельные выделенные молекулы нуклеиновой кислоты, каждая из которых кодирует только один тип иммуногенного полипептида TAA, такой как иммуногенный полипептид MSLN, иммуногенный полипептид MUC1 или иммуногенный полипептид TERT.
Композиция нуклеиновой кислоты может содержать мультиантигенную конструкцию, которая кодирует два или более типов иммуногенных полипептидов TAA. Например, мультиантигенная конструкция может кодировать два или более иммуногенных полипептида TAA в любой из следующих комбинаций:
(1) иммуногенный полипептид MSLN и иммуногенный полипептид MUC1;
(2) иммуногенный полипептид MSLN и иммуногенный полипептид TERT;
(3) иммуногенный полипептид MUC1 и иммуногенный полипептид TERT; и
(4) иммуногенный полипептид MSLN, иммуногенный полипептид MUC1 и иммуногенный полипептид TERT.
В некоторых конкретных вариантах осуществления композиции по настоящему изобретению содержат двойную антигенную конструкцию, содержащую нуклеотидную последовательность, выбранную из группы, состоящей из:
(1) нуклеотидной последовательности, кодирующей аминокислотную последовательность SEQ ID NO: 18, 20, 22 или 24, 26, 28, 30, 32 или 34, 36, 38, 30, 40 или 42;
(2) нуклеотидной последовательности SEQ ID NO: 17, 19, 21 или 23, 25, 27, 29, 31 или 33, 35, 37, 39 или 41; и
(3) вырожденного варианта нуклеотидной последовательности SEQ ID NO: 17, 19, 21 или 23, 25, 27, 29, 31 или 33, 35, 37, 39 или 41.
В некоторых других конкретных вариантах осуществления композиции по настоящему изобретению содержат тройную антигенную конструкцию, содержащую нуклеотидную последовательность, выбранную из группы, состоящей из:
(1) нуклеотидной последовательности, кодирующей аминокислотную последовательность SEQ ID NO: 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64 или 66;
(2) нуклеотидной последовательности SEQ ID NO: 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63 или 65; и
(3) вырожденного варианта нуклеотидной последовательности SEQ ID NO: 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63 или 65.
Композиции нуклеиновых кислот, такие как фармацевтическая композиция или ДНК-вакцинная композиция, могут дополнительно содержать фармацевтически приемлемое вспомогательное вещество. Фармацевтические приемлемые вспомогательные вещества, подходящие для композиций нуклеиновых кислот, в том числе для ДНК-вакцинных композиций, хорошо известны специалистам в данной области. Такими вспомогательными веществами могут быть водные или неводные растворы, суспензии и эмульсии. Примеры неводных вспомогательных веществ включают пропиленгликоль, полиэтиленгликоль, растительные масла, такие как оливковое масло, и органические сложные эфиры для инъекций, такие как этилолеат. Примеры водного вспомогательного вещества включают воду, спиртовые/водные растворы, эмульсии или суспензии, включая физиологический раствор и буферную среду. Подходящие вспомогательные вещества также включают вещества, которые способствуют клеточному захвату молекулы полинуклеотида. Примеры таких агентов являются (i) химические вещества, которые изменяют проницаемость клеточной стенки, такие как бупивакаин, (ii) липосомы или вирусные частицы для инкапсуляции полинуклеотида или (iii) катионные липиды или диоксид кремния, золото или микрочастицы вольфрама, которые сами связываются с полинуклеотидами. Анионные и нейтральные липосомы хорошо известны в данной области (см., например, Liposomes: A Practical Approach, RPC New Ed, IRL press (1990), где подробно описаны способы создания липосом) и их можно использовать для доставки большого числа продуктов, включая полинуклеотиды. Катионные липиды также известны в данной области и их обычно использую для доставки генов. Такие липиды включают липофектин.ТМ., также известный как DOTMA (N-[I-(2,3-диолеилокси)пропил N,N, N-триметиламмония хлорид), DOTAP (1,2-бис(олеилокси)-3 (триметиламмонио)пропан), DDAB (диметилдиоктадецил-аммоний бромид), DOGS (диоктадециламидоглицил спермин) и производные холестерина, такие как DCChol (3-бета-(N-(N',N'-диметил аминометан)карбамоил) холестерин). Описание этих катионных липидов можно найти в ЕР 187702, WO 90/11092, патенте США № 5283185, WO 91/15501, WO 95/26356 и патенте США № 5527928. Конкретным эффективным составом катионного липида, который может использоваться вместе с нуклеиновой вакциной по настоящему изобретению, является VAXFECTIN, который представляет собой смесь катионного липида (GAP-DMORIE) и нейтрального фосфолипида (DPyPE), который при объединении в водном носителе, самостоятельно собирается с образованием липосом. Катионные липиды для доставки генов предпочтительно используют в сочетании с нейтральным липидом, таким как DOPE (диолеил фосфатидилэтаноламин), как описано в WO 90/11092 в качестве примера. Кроме того, конструкцию нуклеиновой кислоты, такую как конструкция ДНК, также можно получить вместе с неионным блок-сополимером, таким как CRL1005.
Вакцинную композицию нуклеиновой кислоты или иммуногенную композицию нуклеиновой кислоты по настоящему изобретению можно использовать в сочетании или в комбинации с одним или несколькими иммуномодуляторами. Вакцинную композицию нуклеиновой кислоты или иммуногенную композицию нуклеиновой кислоты по настоящему изобретению также можно использовать в сочетании или в комбинации с одним или несколькими адъювантами. Кроме того, вакцинную композицию нуклеиновой кислоты или иммуногенную композицию нуклеиновой кислоты по настоящему изобретению можно использовать в сочетании или в комбинации с одним или несколькими иммуномодуляторами и одним или несколькими адъювантами. Иммуномодуляторы или адъюванты могут быть введены в состав независимо от нуклеиновой композиции или они могут быть частью того же состава композиции. Таким образом, в некоторых вариантах осуществления настоящее изобретение относится к вакцинной композиции нуклеиновой кислоты, которая дополнительно содержит один или несколько иммуномодуляторов и/или один или несколько адъювантов. Примеры иммуномодуляторов и адъювантов приведены ниже.
Композиции нуклеиновых кислот, включая вакцинные композиции, могут быть получены в любых подходящих дозированных формах, таких как жидкие формы (например, растворы, суспензии или эмульсии) и твердые формы (например, капсулы, таблетки или порошок) и способами, известными специалистам в данной области.
G. Применение иммуногенных полипептидов TAA, молекул нуклеиновых кислот и композиций
В других аспектах настоящее изобретение относится к способам использования иммуногенных полипептидов TAA, выделенных молекул нуклеиновой кислоты и композиций, описанных выше.
В одном из аспектов настоящее изобретение относится к способу индукции иммунного ответа против ТАА у млекопитающего, в частности у человека, включающему введение млекопитающему эффективного количества (1) иммуногенного полипептида TAA, который является иммуногенным против мишеневого ТАА, (2) выделенной молекулы нуклеиновой кислоты, кодирующей один или несколько иммуногенных полипептидов TAA, (3) композиции, содержащей один или несколько иммуногенных полипептидов TAA, или (4) композиции, содержащей выделенную молекулу нуклеиновой кислоты, кодирующую один или несколько иммуногенных полипептидов TAA. В некоторых вариантах осуществления настоящее изобретение относится к способу индукции иммунного ответа против MSLN у человека, включающему введение человеку эффективного количества иммуногенной композиции MSLN по настоящему изобретению, где иммуногенная композиция MSLN выбрана из: (1) иммуногенного полипептида MSLN, (2) выделенной молекулы нуклеиновой кислоты, кодирующей иммуногенный полипептид MSLN, (3) композиции, содержащей иммуногенный полипептид MSLN, или (4) композиции, содержащей выделенную молекулу нуклеиновой кислоты, кодирующую иммуногенный полипептид MSLN. В некоторых других вариантах осуществления изобретение относится к способу индукции иммунного ответа против MUC1 у человека, включающему введение человеку эффективного количества иммуногенной композиции MUC1 по настоящему изобретению, где иммуногенная композиция MUC1 выбрана из: (1) иммуногенного полипептида MUC1, (2) выделенной молекулы нуклеиновой кислоты, кодирующей иммуногенный полипептид MUC1, (3) композиции, содержащей иммуногенный полипептид MUC1, или (4) композиции, содержащей выделенную молекулу нуклеиновой кислоты, кодирующую иммуногенный полипептид MUC1. В некоторых вариантах осуществления настоящее изобретение относится к способу индукции иммунного ответа против TERT у человека, включающему введение человеку эффективного количества иммуногенной композиции TERT по настоящему изобретению, где иммуногенная композиция TERT выбрана из: (1) иммуногенного полипептида TERT, (2) выделенной молекулы нуклеиновой кислоты, кодирующей иммуногенный полипептид TERT, (3) композиции, содержащей иммуногенный полипептид TERT, или (4) композиции, содержащей выделенную молекулу нуклеиновой кислоты, кодирующую иммуногенный полипептид TERT.
В другом аспекте настоящее изобретение относится к способу ингибирования патологической пролиферации клеток у человека, где патологическая пролиферация клеток связана со сверхэкспрессией ТАА. Способ включает введение человеку эффективного количества иммуногенной композиции ТАА по настоящему изобретению, которая является иммуногенной против сверхэкспрессированного ТАА. Композиция иммуногенного ТАА может быть (1) иммуногенным полипептидом TAA, (2) выделенной молекулой нуклеиновой кислоты, кодирующей один или несколько иммуногенных полипептидов TAA, (3) композицией, содержащую иммуногенный полипептид TAA, или (4) композицией, содержащую выделенную нуклеиновую кислоту, кодирующую один или несколько иммуногенных полипептидов TAA. Патологическая пролиферация клеток может быть в любом органе или тканях человека, таких как грудь, желудок, яичники, легкие, мочевой пузырь, толстый кишечник (например, толстая кишка и прямая кишка), почки, поджелудочная железа и простата. В некоторых вариантах осуществления способ предназначен для ингибирования патологической пролиферации клеток в молочной железе, яичниках, поджелудочной железе, толстой кишке, легком, желудке и прямой кишке.
В другом аспекте настоящее изобретение относится к способу лечения рака у человека, где рак связан со сверхэкспрессией ТАА. Способ включает введение человеку эффективного количества композиции иммуногенного ТАА, способной вызывать иммунный ответ против сверхэкспрессированного ТАА. Композиция иммуногенного ТАА может быть (1) иммуногенным полипептидом TAA, (2) выделенной молекулой нуклеиновой кислоты, кодирующей один или несколько иммуногенных полипептидов TAA, (3) композицией, содержащую иммуногенный полипептид TAA, или (4) композицией, содержащую выделенную нуклеиновую кислоту, кодирующую один или несколько иммуногенных полипептидов TAA.
В некоторых вариантах осуществления настоящее изобретение относится к способу лечения рака у человека, включающему введение человеку эффективного количества композиции нуклеиновой кислоты, представленной выше. Нуклеиновые кислоты в композиции могут быть моноантигенной конструкцией, кодирующей только один конкретный иммуногенный полипептид TAA, такой как иммуногенный полипептид MSLN, иммуногенный полипептид MUC1 или иммуногенный полипептид TERT. Нуклеиновые кислоты в композиции также могут быть мультиантигенной конструкцией, кодирующей два, три или более различных иммуногенных полипептида TAA.
В некоторых конкретных вариантах осуществления изобретение относится к способу лечения рака у человека, включающему введение человеку эффективного количества композиции, содержащей двойную антигенную конструкцию. Двойная антигенная конструкция может кодировать любые два различных иммуногенных полипептида TAA, выбранных из: (1) иммуногенного полипептида MSLN и иммуногенного полипептида MUC1; (2) иммуногенного полипептида MSLN и иммуногенного полипептида TERT; (3) иммуногенного полипептида TERT и иммуногенного полипептида MUC1.
В некоторых других конкретных вариантах осуществления изобретение относится к способу лечения рака у человека, где рак связан со сверхэкспрессией одного или нескольких ТАА, выбранных из MUC1, MSLN и TERT, где способ включает введение человеку эффективного количества композиции, содержащей тройную антигенную конструкцию, кодирующую иммуногенный полипептид MSLN, иммуногенный полипептид MUC1 и иммуногенный полипептид TERT.
Любой рак со сверхэкспрессией опухолевого антигена MUC1, MSLN и/или TERT можно лечить способом по настоящему изобретению. Примеры рака включают рак молочной железы, рак яичников, рак легкого (например, мелкоклеточный рак легкого и немелкоклеточный рак легких), колоректальный рак, рак желудка и рак поджелудочной железы. В некоторых конкретных вариантах осуществления настоящее изобретение относится к способу лечения рака у человека, который включает введение человеку эффективного количества композиции, содержащей тройную антигенную конструкцию, где рак представляет собой (1) рак молочной железы, такой как тройной негативный рак молочной железы, (2) рак поджелудочной железы, такой как аденокарцинома поджелудочной железы или (3) рак яичников, такой как аденокарцинома яичника.
Композиции полипептидов и нуклеиновых кислот можно вводить животному, включая человека, рядом подходящих способов, известных в данной области. Примеры подходящих способов включают: (1) внутримышечное, внутрикожное, внутриэпидермальное или подкожное введение, (2) пероральное введение и (3) местное применение (например, введение в глаза, интраназальное и внутривагинальное применение). Один из конкретных способов внутрикожного или внутриэпидермального введения вакцинной композиции нуклеиновой кислоты, которая может быть использована, представляет собой доставку с помощью генной пушки, используя устройство для эпидермальной доставки, опосредованной частицами (PMEDTM), для доставки вакцины, коммерчески доступное от PowderMed. PMED является безыгольный способ введения вакцин животным или людям. Система PMED включает осаждение ДНК на микроскопические частицы золота, которые затем выталкиваются газом гелия в эпидермис. Частицы золота, покрытые ДНК, доставляются в APC и кератиноциты эпидермиса, и после того, как они попадают в ядро этих клеток ДНК элюируются с золота и становится транскрипционно-активным, продуцируя кодированный белок. Одним из конкретных способов внутримышечного введения вакцины нуклеиновой кислотой является электропорация. Электропорация использует контролируемые электрические импульсы для создания временных пор в клеточной мембране, что облегчает клеточный захват вакцины нуклеиновой кислоты, вводимой в мышцу. Если в комбинации с вакциной на основе нуклеиновой кислоты используется CpG, то CpG и вакцина на основе нуклеиновой кислоты могут быть включены вместе в один состав, и состав вводят внутримышечно электропорацией.
Эффективное количество иммуногенного полипептида TAA или нуклеиновой кислоты, кодирующей иммуногенный полипептид TAA в вводимой композиции в этом способе по настоящему изобретению, может быть легко определено специалистом в данной области и будет зависеть от ряда факторов. В способе лечения рака, такого как рак поджелудочной железы, рак яичников и рак молочной железы, факторы, которые могут быть учтены при определении эффективного количества иммуногенного полипептида TAAP или нуклеиновой кислоты, включают, но не ограничиваются: (1) субъекта, получающего лечение, (2) тяжесть или стадию рака, подлежащего лечению, (3) используемые или экспрессируемые специфические иммуногенные полипептиды TAA, (4) степень желаемой защиты или лечения (5) путь и схему введения и (6) другие используемые терапевтические агенты (такие как адъюванты или иммуномодуляторы). В случае вакцинных композиций на основе нуклеиновых кислот, включая мультиантигенную вакцинную композицию, способ их составления и доставки является одним из ключевых факторов для определения дозы нуклеиновой кислоты, необходимой для индукции эффективного иммунного ответа. Например, эффективные количества нуклеиновой кислоты могут находиться в диапазоне от 2 мкг/доза до 10 мг/доза, если композиция вакцины нуклеиновой кислоты составлена в виде водного раствора и вводится инъекцией иглой для подкожных инъекций или пневматической инъекцией, при этом если нуклеиновую кислоту получают в виде золотых бусин с покрытием и вводят с помощью технологии генной пушки, то может потребоваться от 16 нг/доза до 16 мкг/доза. Диапазон доз для вакцины на основе нуклеиновой кислоты, вводимой электропорацией, обычно составляет от 0,5 до 10 мг/доза. В случае, если вакцину на основе нуклеиновой кислоты вводят вместе с CpG путем электропорации в одном составе, то доза вакцины на основе нуклеиновой кислоты может находиться в диапазоне от 0,5 до 5 мг/доза, а доза CpG обычно находится в диапазоне от 0,05 мг до 5 мг/доза, например 0,05, 0,2, 0,6 или 1,2 мг/доза на персону.
Композиции вакцин на основе нуклеиновых кислот или полипептидов по настоящему изобретению могут быть использованы в стратегии праймирование-стимулирование для индукции стабильного и долговременного иммунного ответа. Протоколы праймирования и стимулирования вакцинации, основанные на повторных инъекциях одной и той же иммуногенной конструкцией, хорошо известны. В общем, первая доза может не вызывать защитный иммунитет, а только «праймировать/сенсибилизровать» иммунную систему. Защитная иммунная реакция развивается после второй или третьей дозы («стимулирующие»). Стимулирование выполняют в соответствии с общепринятыми методиками и они могут быть дополнительно оптимизированы эмпирически с учетом графика введения, пути введения, выбора адъюванта, дозы и возможные последствия при введении другой вакцины. В одном из вариантов осуществления изобретения вакцины на основе нуклеиновой кислоты или полипептидов по настоящему изобретению используются в обычной гомологичной стратегии праймирования-стимулирования, при которой одна и та же вакцина вводится животному в нескольких дозах. В другом варианте осуществления вакцинные композиции на основе нуклеиновых кислот или полипептидов используют при гетерологичной вакцинации по типу праймирования-стимулирования, в которой различные типы вакцин, содержащие одни и те же антигены, вводят с заранее определенными временными интервалами. Например, конструкцию нуклеиновой кислоты можно вводить в виде плазмиды в начальной дозе («праймирование») и как часть вектора в последующих дозах («стимулирование») или наоборот.
Вакцинные композиции на основе полипептидов или нуклеиновых кислот по настоящему изобретению можно использовать вместе с одним или несколькими адъювантами. Примеры подходящих адъювантов включают: (1) эмульсионные составы "масло-в-воде" (с или без других специфических иммуностимулирующих агентов, таких как мурамиловые полипептиды или компоненты бактериальной клеточной стенки), такие как (а) MF59™ (публикация PCT WO 90/14837; Глава 10 в Vaccine design: the subunit and adjuvant approach, eds. Powell & Newman, Plenum Press, 1995), содержащая 5% сквален, 0,5% Tween 80 (полиоксиэтилен сорбит моноолеат) и 0,5% Span 85 (сорбитан триолеат), составленный в субмикронные частицы с использованием микрофлюидизатора, (b) SAF, содержащий 10% сквалена, 0,4% Tween 80, 5% плюрнового-блокированного полимера L121 и thr-MDP, либо микрофлюидизированный в субмикронную эмульсию, либо перемешанный на Vortex с образованием эмульсии с частицами большего размера, и (c) адъювантная система RIBI™ (RAS) (Ribi Immunochem, Гамильтон, МТ), содержащая 2% сквален, 0,2% Tween 80 и один или несколько компонентов бактериальной клеточной стенки, таких как монофосфорилипид А (MPL), трегалоза димиколат (TDM) и скелет клеточной стенки (CWS); (2) сапониновые адъюванты, такие как QS21, STIMULON™ (Cambridge Bioscience, Worcester, MA), Abisco® (Isconova, Sweden) или Iscomatrix® (Commonwealth Serum Laboratories, Australia); (3) полный адъювант Фрейнда (CFA) и неполный адъювант Фрейнда (IFA); (4) цитокины, такие как интерлейкины (например, IL-1, IL-2, IL-4, IL-5, IL-6, IL-7, IL-12 (публикация PCT WO 99/44636), и тому подобное), интерфероны (например, гамма-интерферон), макрофагальный колониестимулирующий фактор (M-CSF) и фактор некроза опухоли (TNF); (5) монофосфорил липид A (MPL) или 3-O-деацилированный MPL (3dMPL), (WO 00/56358); (6) комбинации 3dMPL с эмульсиями QS21 и/или "масло-в-воде" (EP-A-0835318, EP-A-0735898, EP-A-0761231); (7) олигонуклеотиды, содержащие мотивы CpG, то есть содержащие по меньшей мере один CG динуклеотид, где цитозин не метилирован (WO 98/40100, WO 98/55495, WO 98/37919 и WO 98/52581); (8) полиоксиэтиленовый эфир или полиоксиэтиленовый эфир (WO 99/52549); (9) поверхностно-активное вещество сложный эфир полиоксиэтиленсорбита в комбинации с октоксинолом (WO 01/21207) или полиоксиэтиленалкиловым эфиром или поверхностно-активное вещество сложного эфира в комбинации по меньшей мере с одним дополнительным неионным поверхностно-активным веществом, таким как октоксинол (WO01/21152); (10) сапонин и иммуностимулирующий олигонуклеотид (например, CpG-олигонуклеотид) (WO00/62800); (11) соль металла, включая соли алюминия (квасцы), такие как фосфат алюминия и гидроксид алюминия; (12) сапонин и эмульсия "масло-в-воде" (WO 99/11241); и; (13) комбинация сапонина (например, QS21), 3dMPL и IM2 (WO 98/57659).
Кроме того, для лечения неопластического расстройства, включая рак, у млекопитающего, можно вводить полипептидные композиции или композиции на основе нуклеиновых кислот, включая вакцинные композиции, по настоящему изобретению, вместе с одним или несколькими иммуномодуляторами. Иммуномодулятор может быть ингибитором иммунных супрессивных клеток (ингибитор ISC) или энхансером иммунных эффекторных клетоки (энхансер IEC). Кроме того, один или несколько ингибиторов ISC могут использоваться в комбинации с одним или несколькими энхансерами IEC. Иммуномодуляторы можно вводить любыми подходящими способами и путями, включая (1) системное введение, такое как внутривенное, внутримышечное или пероральное введение, и (2) местное введение, такое как внутрикожное и подкожное введение. В соответствующих или приемлемых случаях, местное применение обычно предпочтительнее системного введения. Местное применение любых иммуномодуляторов может быть осуществлено в любом месте организма млекопитающего, которое подходит для местного применения лекарственных средств; однако, более предпочтительно, эти иммуномодуляторы вводят местно в непосредственной близости от лимфоузла, дренирующего место введения вакцины.
Композиции, такие как вакцина, могут вводиться одновременно или последовательно с любым или всеми используемыми иммуномодуляторами. Аналогично, если используют два или более иммуномодулятора, их можно вводить одновременно или последовательно друг относительно друга. В некоторых вариантах осуществления вакцину вводят одновременно (например, в смеси) с одним иммуномодулятором, но последовательно с одним или несколькими дополнительным иммуномодуляторами. Совместное введение вакцины и иммуномодуляторов может включать случаи, когда вакцина и по меньшей мере один иммуномодулятор вводят таким образом, что каждый присутствует в месте введения, например, в лимфоузле, дренирующем место введения вакцины, при этом антиген и иммуномодуляторы не вводят одновременно. Одновременное введение вакцины и иммуномодуляторов также может включать случаи, когда происходит клиренс вакцины или иммунного модулятора с места введения, но по меньшей мере один клеточный эффект очищенной вакцины или иммуномодулятора сохраняется на месте введения, например, в лимофузле, дренирующем место введения вакцины, по крайней мере, до тех пор, пока один или несколько дополнительных иммуномодуляторов не будут введены в сайт введения. В тех случаях, когда вакцину на основе нуклеиновой кислоты вводят в комбинации с CpG, вакцина и CpG могут находится в одном составе и вводиться вместе любым подходящим способом. В некоторых вариантах осуществления вакцина на основе нуклеиновой кислоты и CpG в общем препарате (смеси) вводят внутримышечной инъекцией в сочетании с электропорацией.
В некоторых вариантах осуществления иммуномодулятор, который используется в комбинации с композицией на основе полипептида или нуклеиновой кислоты, является ингибитором ISC.
Примеры ингибиторов SIC включают (1) ингибиторы протеинкиназы, такие как иматиниб, сорафениб, лапатиниб, BIRB-796 и AZD-1152, AMG706, Zactima (ZD6474), MP-412, сорафениб (BAY 43-9006), дазатиниб, CEP-701 (лестауртиниб), XL647, XL999, Tykerb (лапатиниб), MLN518, (ранее известный как CT53518), PKC412, ST1571, AEE 788, OSI-930, OSI-817, сунитиниб малат (SUTENT), акситиниб (AG-013736), эрлотиниб, гефитиниб, акситиниб, босутиниб, темсиролимус и нилотиниб (AMN107). В некоторых конкретных вариантах осуществления ингибитор тирозинкиназы представляет собой сунитиниб, сорафениб или фармацевтически приемлемую соль или производное (такое как малат или тозилат) сунитиниба или сорафениба; (2) ингибиторы циклооксигеназы-2 (СОХ-2), такие как целекоксиб и рофекоксиб; (3) ингибиторы фосфодиэстеразы типа 5 (PDE5), такие как примеры ингибиторов PDE5, включают в себя: аванафил, лоденафил, мироденафил, силденафил, тадалафил, варденафил, уденафил и запринаст и (4) перекрестно-связывающие ДНК линкеры, такие как циклофосфамид.
В некоторых вариантах осуществления иммуномодулятор, который используется в комбинации с композицией на основе полипептида или нуклеиновой кислоты, является энхансером IEC. Два или более энхансера IEC могут использоваться вместе.
Примеры энхансеров IEC, которые могут быть использованы, включают: (1) агонисты TNFR, такие как агонисты OX40, 4-1BB (такие как BMS-663513), GITR (например, TRX518) и CD40 (такие как антитела-агонисты CD40); (2) ингибиторы CTLA-4, такие как ипилимумаб и тремелимумаб; (3) агонисты TLR, такие как CpG 7909 (5' TCGTCGTTTTGTCGTTTTGTCGTT3'), CpG 24555 (5' TCGTCGTTTTTCGGTGCTTTT3' (CpG 24555); и CpG 10103 (5' TCGTCGTTTTTCGGTCGTTTT3'); (4) ингибиторы белка 1 программируемой клеточной гибели (PD-1), такие как ниволумаб и пембролизумаб; и (5) ингибиторы PD-L1, такие как атезолизумаб, дурвалумаб и велумаб; и (6) ингибиторы IDO1.
В некоторых вариантах осуществления энхансер IEC является антителом-агонистом против CD40, которое может быть человеческим, гуманизированном или частично человеческим химерным антителом против CD40. Примеры конкретных антител-агонистов против CD40 включают моноклональные антитела G28-5, mAb89, EA-5 или S2C6, и CP870893. CP-870893 представляет собой полностью человеческое агонистическое моноклональное антитело против CD40 (mAb), которое было клинически исследовалось в качестве противоопухолевой терапии. Структура и получение CP870893 раскрыты в WO2003041070 (где антитело идентифицировано по внутреннему идентификатору «21.4.1», а аминокислотные последовательности тяжелой цепи и легкой цепи антитела представлены как SEQ ID NO: 40 и SEQ ID NO: 41, соответственно). Для применения в комбинации с композицией по настоящему изобретению, СР-870893 можно вводить любым подходящим путем, таким как внутрикожная, подкожная или внутримышечная инъекция. Эффективное количество CP870893 обычно находится в пределах от 0,01 до 0,25 мг/кг. В некотором варианте осуществления CP870893 вводят в количестве от 0,05 до 0,1 мг/кг.
В некоторых других вариантах осуществления энхансер IEC является ингибитором CTLA-4, таким как ипилимумаб и тремелимумаб. Ипилимумаб (также известный как MEX-010 или MDX-101), доступный на рынке как YERVOY, представляет собой человеческое антитело против CTLA-4 человека. Ипилимумаб также может упоминаться в реестре CAS под номером 477202-00-9 и описано как антитело 10DI в публикации PCT WO 01/14424. Тремелимумаб (также известный как CP-675206) является полностью человеческим моноклональным антителом IgG2 и имеет номер CAS 745013-59-6. Тремелимумаб раскрыт в патенте США № 6682736, который включен в настоящий документ в качестве ссылки в полном объеме, где он идентифицирован как антитело 11.2.1, и аминокислотные последовательности его тяжелой цепи и легкой цепи представлены как SEQ ID NO: 42 и 43, соответственно. Для применения в комбинации с композицией по настоящему изобретению, тремилимумаб можно вводить любым подходящим путем, таким как внутрикожная, подкожная или внутримышечная инъекция. Эффективное количество тремелимумаба, вводимое внутрикожно или подкожно, обычно находится в пределах от 5 до 200 мг/доза на человека. В некоторых вариантах осуществления эффективное количество тремелимумаба находится в диапазоне от 10 до 150 мг/доза на человека на дозу. В некоторых конкретных вариантах осуществления эффективное количество тремелимумаба составляет около 10, 25, 50, 75, 100, 125, 150, 175 или 200 мг/доза на человека.
В некоторых других вариантах иммунный модулятор представляет собой ингибитор PD-1 или ингибитор PD-L1, такой как ниволумаб, пембролизумаб, RN888 (антитело против PD-1), атезолизумаб (PD-L1-специфичные mAb от Roche), дурвалумаб (PD-L1-специфичные mAb от Astra Zeneca) и авелумаб (PD-L1-специфичные mAb от Merck). (Okazaki T et al., International Immunology (2007);19,7:813-824, Sunshine J et al., Curr Opin Pharmacol. 2015 август; 23:32-8).
В других вариантах осуществления настоящее описание относится к применению иммуномодулятора вместе с вакциной, включая противораковые вакцины, причем иммуномодулятор представляет собой ингибитор индолеамин 2,3-диоксигеназы 1 (также известной как «IDO1»). Было обнаружено, что IDO1 модулирует функцию иммунных клеток до супрессивного фенотипа и, как полагают, частично связан с выходом опухоли из иммунного контроля хозяина. Фермент деградирует незаменимый аминокислотный триптофан в кинуренин и другие метаболиты. Было обнаружено, что эти метаболиты и нехватка триптофана приводят к подавлению эффекторной функции Т-клеток и усиленной дифференцировке регуляторных Т-клеток. Ингибиторами IDO1 могут быть высокомолекулярные молекулы, такие как антитело, или низкомолекулярные молекулы, такие как химическое соединение.
В некоторых конкретных вариантах осуществления композиция на основе полипептида или нуклеиновой кислоты по настоящему изобретению, используется в комбинации с ингибитором на основе 1,2,5-оксадиазолового производного IDO1M, раскрытым в WO 2010/005958. Примеры специфического 1,2,5-оксадиазоловых производных в качестве ингибиторов IDO1 включают следующие соединения:
4-({2-[(аминосульфонил)амино]этил}амино)-N-(3-бром-4-фторфенил)-N'-гидрокси-1,2,5-оксадиазол-3-карбоксимидамид;
4-({2-[(аминосульфонил)амино]этил}амино)-N-(3-хлор-4-фторфенил)-N'-гидрокси-1,2,5-оксадиазол-3-карбоксимидамид;
4-({2-[(аминосульфонил)амино]этил}амино)-N-[4-фтор-3-трифторметил)фенил]-N'-гидрокси-1,2,5-оксадиазол-3-карбоксимидамид;
4-({2-[(аминосульфонил)амино]этил}амино)-N'-гидрокси-N-[3-(трифторметил)фенил]-1,2,5-оксадиазол-3-карбоксимидамид;
4-({2-[(аминосульфонил)амино]этил}амино)-N-(3-циано-4-фторфенил)-N'-гидрокси-1,2,5-оксадиазол-3-карбоксимидамид;
4-({2-[(аминосульфонил)амино]этил}амино)-N-[(4-бром-2-фурил)метил]-N'-гидрокси-1,2,5-оксадиазол-3-карбоксимидамид; или
4-({2-[(аминосульфонил)амино]этил}амино)-N-[(4-хлор-2-фурил)метил]-N'-гидрокси-1,2,5-оксадиазол-3-карбоксимидамид.
1,2,5-оксадиазоловые производные в качестве ингибиторов IDO1 обычно вводят перорально один или два раза в день, и эффективное количество при пероральном введении составляет обычно 25 мг-1000 мг на дозу на пациента, например 25 мг, 50 мг, 100 мг, 200 мг, 300 мг, 400 мг, 500 мг, 600 мг, 700 мг, 800 мг или 1000 мг. В конкретном варианте осуществления композиция на основе полипептида или нуклеиновой кислоты по настоящему изобретению используется в комбинации с 4-({2-[(аминосульфонил)амино]этил}амино)-N-(3-бром-4-фторфенил)-N'-гидрокси-1,2,5-оксадиазол-3-карбоксимидамидом, вводимым перорально дважды в день при 25 мг или 50 мг на дозу. 1,2,5-оксадиазольные производные могут быть синтезированы, как описано в патенте США № 8088803, который полностью включен в настоящее описание в качестве ссылки.
В некоторых других конкретных вариантах осуществления композиция на основе полипептида или нуклеиновой кислоты по настоящему изобретению, используется в комбинации с ингибитором IDO1M на основе пирролидин-2,5-дионового производного, описанного в WO2015/173764. Примеры конкретных ингибиторов на основе пирролидин-2,5-дионлового производного включают следующие соединения:
3-(5-фтор-1Н-индол-3-ил)пирролидин-2,5-дион;
(3-2Н)-3-(5-фтор-1Н-индол-3-ил)пирролидин-2,5-дион;
(-)-(R)-3-(5-фтор-1Н-индол-3-ил)пирролидин-2,5-дион;
3-(1H-индол-3-ил)пирролидин-2,5-дион;
(-)-(R)-3-(1H-индол-3-ил)пирролидин-2,5-дион;
3-(5-хлор-1Н-индол-3-ил)пирролидин-2,5-дион;
(-)-(R)-3-(5-хлор-1H-индол-3-ил)пирролидин-2,5-дион;
3-(5-бром-1H-индол-3-ил)пирролидин-2,5-дион;
3-(5,6-дифтор-1Н-индол-3-ил)пирролидин-2,5-дион; и
3-(6-хлор-1Н-индол-3-ил)пирролидин-2,5-дион.
Ингибиторы IOD1 на основе пирролидин-2,5-дионового производного обычно вводят перорально один или два раза в день, и эффективное количество при пероральном введении обычно составляет от 50 до 1000 мг на дозу на пациента, например 125 мг, 250 мг, 500 мг, 750 мг или 1000 мг. В конкретном варианте осуществления, композиция на основе полипептида или нуклеиновой кислоты по настоящему изобретению используется в комбинации с 3-(5-фтор-1Н-индол-3-ил)пирролидин-2,5-дионом, вводимым перорально один раз в день при 125-100 мг на дозу на пациента. Пирролидин-2,5-дионовые производные могут быть синтезированы, как описано в публикации патентной заявки США US2015329525, которая включена в настоящий документ в качестве ссылки в полном объеме.
H. ПРИМЕРЫ
Следующие примеры приведены для иллюстрации некоторых вариантов осуществления изобретения. Они не должны быть истолкованы как ограничивающие объем изобретения каким-либо образом. Из приведенного выше описания и этих примеров специалист в данной области сможет определить существенные признаки изобретения и не отходить от сущности и объема изобретения, сможет внести различные изменения и модификации изобретения, чтобы адаптировать его к различным условиям использования и условиям.
ПРИМЕР 1. КОНСТРУИРОВАНИЕ МОНОАНТИГЕННЫХ, ДВОЙНЫХ АНТИГЕННЫХ И ТРОЙНЫХ АНТИГЕННЫХ КОНСТРУКЦИЙ
Пример 1 иллюстрирует построение моноантигенных конструкций, двойных антигенных конструкций и тройных антигенных конструкций. Если не указано иного, ссылка на аминокислотные положения или остатки белка MUC1, MSLN и TERT относится к аминокислотной последовательности белка-предшественника изоформы 1 MUC1 человека, как представлено в SEQ ID NO:1, аминокислотной последовательности белка-предшественника мезотелина человека изоформы 2 (MSLN), как представлено в SEQ ID NO:2, и аминокислотной последовательности белка-предшественника TERT человека изоформы 1, как представлено в SEQ ID NO:3, соответственно.
1A. МОНОАНТИГЕННЫЕ КОНСТРУКЦИИ
Плазмида 1027 (MUC1). Плазмиду 1027 получали с использованием методов генного синтеза и обмена рестрикционными фрагментами. Аминокислотную последовательность MUC1 человека с 5х тандемными повторами области VNTR подавали в GeneArt для оптимизации и синтеза генов. Ген, кодирующий полипептид, был оптимизирован для экспрессии, синтеза и клонирования. Открытую рамку считывания MUC-1 вырезали из вектора GeneArt путем расщепления NheI и BglII и встраивали в аналогично расщепленную плазмиду pPJV7563. Нуклеотидная последовательность открытой рамки (ORF) плазмиды 1027 представлена в SEQ ID NO:7. Аминокислотная последовательность, кодируемая плазмидой 1027, представлена в SEQ ID NO:8.
Плазмида 1103 (cMSLN). Плазмиду 1103 строили с использованием методов ПЦР и обмена рестрикционными фрагментами. Сначала, ген, кодирующий аминокислоты 37-597 предшественника мезотелина, амплифицировали с помощью ПЦР из плазмиды 1084 с праймерами MSLN34 и MSLN598, что приводило к добавлению сайтов рестрикции NheI и BglII на 5'- и 3'-концах ампликона, соответственно. Ампликон расщепляли NheI и Bgl II и встраивали в аналогично расщепленную плазмиду pPJV7563. Нуклеотидная последовательность открытой рамки плазмиды 1103 представлена в SEQ ID NO:5. Аминокислотная последовательность, кодируемая плазмидой 1103, представлена в SEQ ID NO:6.
Плазмида 1112 (TERT240). Плазмиду 1112 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 241-1132 белка TERT, амплифицировали с помощью ПЦР из плазмиды 1065 с праймерами а pmed TERT 241G и r TERT co# pMed. Ампликон клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой плазменной плазмы 1112 представлена в SEQ ID NO:9. Аминокислотная последовательность, кодируемая плазмидой 1112, представлена в SEQ ID NO:10.
Плазмида 1197 (цМUC1). Плазмиду 1197 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 22-225, 946-1255 белка MUC1, амплифицировали с помощью ПЦР из плазмиды 1027 с праймерами ID1197F и ID1197R. Ампликон клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1197 представлена в SEQ ID NO:15. Аминокислотная последовательность, кодируемая плазмидой 1197, представлена в SEQ ID NO:16.
Плазмида 1326 (TERT343). Плазмиду 1326 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 344-1132 белка TERT, амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами Tert343-F и Tert-R. Ампликон клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой плазменной плазмы 1326 представлена в SEQ ID NO:13. Аминокислотная последовательность, кодируемая плазмидой 1326, представлена в SEQ ID NO:14.
Плазмида 1330 (TERT541). Плазмиду 1330 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 542-1132 белка TERT амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами Tert541-F и Tert-R. Ампликон клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1330 представлена в SEQ ID NO:11. Аминокислотная последовательность, кодируемая плазмидой 1330, представлена в SEQ ID NO:12.
1B. ДВОЙНЫЕ АНТИГЕННЫЕ КОНСТРУКЦИИ
Плазмида 1158 (cMSLN-PT2A-Muc1). Плазмиду 1158 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 37-597 предшественника мезотелина, амплифицировали с помощью ПЦР из плазмиды 1103 с праймерами f pmed Nhe cMSLN и r PTV2A Bamh cMSLN. Ген, кодирующий аминокислоты 2-225, 946-1255 муцина 1 человека, амплифицировали ПЦР из плазмиды 1027 с праймерами f1 PTV2A Muc, f2 PTV2A и r pmed Bgl Muc. ПЦР приводило к добавлению перекрывающихся последовательностей PTV 2A на 3'-конец cMSLN и 5'-конец Muc1. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1158 представлена в SEQ ID NO:23. Аминокислотная последовательность, кодируемая плазмидой 1158, представлена в SEQ ID NO:24.
Плазмида 1159 (Muc1-PT2A-cMSLN). Плазмиду 1159 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 37-597 предшественника мезотелина, амплифицировали с помощью ПЦР из плазмиды 1103 с праймерами f1 PTV2A cMSLN, f2 PTV2A и r pmed Bgl cMSLN. Ген, кодирующий аминокислоты 2-225, 946-1255 муцина 1 человека, амплифицировали ПЦР из плазмиды 1027 с праймерами f pmed Nhe Muc и r PTV2A Bamh Muc. ПЦР приводило к добавлению перекрывающихся последовательностей PTV 2A на 5'-конец cMSLN и 3'-конец Muc1. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1159 представлена в SEQ ID NO:21. Аминокислотная последовательность, кодируемая плазмидой 1159, представлена в SEQ ID NO:22.
Плазмида 1269 (Muc1-Ter240). Плазмиду 1269 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 241-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами f tg link Ter240 и r pmed Bgl Ter240. Ген, кодирующий аминокислоты 2-225, 946-1255 муцина 1 человека амплифицировали ПЦР из плазмиды 1027 с праймерами f pmed Nhe Muc и r link Muc. ПЦР приводило к добавлению перекрывающегося линкера GGSGG на 5'-конец Tert и 3'-конец Muc1. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1269 представлена в SEQ ID NO:25. Аминокислотная последовательность, кодируемая плазмидой 1269, представлена в SEQ ID NO:26.
Плазмида 1270 (Muc1-ERB2A-Ter240). Плазмиду 1270 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 241-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами f2 ERBV2A, f1 ERBV2A Ter240 и r pmed Bgl Ter240. Ген, кодирующий аминокислоты 2-225, 946-1255 муцина 1 человека амплифицировали ПЦР из плазмиды 1027 с праймерами f pmed Nhe Muc и r ERB2A Bamh Muc. ПЦР приводило к добавлению перекрывающихся последовательностей ERBV 2A на 5'-конец Tert и 3'-конец Muc1. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1270 представлена в SEQ ID NO:27. Аминокислотная последовательность, кодируемая плазмидой 1270, представлена в SEQ ID NO:28.
Плазмида 1271 (Ter240-ERB2A-Muc1). Плазмиду 1271 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 241-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами f pmed Nhe Ter240 и r ERB2A Bamh Ter240. Ген, кодирующий аминокислоты 2-225, 946-1255 муцина 1 человека, амплифицировали ПЦР из плазмиды 1027 с праймерами f2 ERBV2A, f1 ERBV2A Muc и r pmed Bgl Muc. ПЦР приводило к добавлению перекрывающихся последовательностей ERBV 2A на 3'-конец Tert и 5'-конец Muc1. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1271 представлена в SEQ ID NO:29. Аминокислотная последовательность, кодируемая плазмидой 1271, представлена в SEQ ID NO:30.
Плазмида 1272 (Ter240-T2A-cMSLN). Плазмиду 1272 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 241-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами f pmed Nhe Ter240 и r T2A Tert240. Ген, кодирующий аминокислоты 37-597 предшественника мезотелина амплифицировали с помощью ПЦР из плазмиды 1103 с праймерами f2 T2A, f1 T2A cMSLN, and r pmed Bgl cMSLN. ПЦР приводило к добавлению перекрывающихся последовательностей TAV 2A на 3'-конец Tert и 5'-конец cMSLN. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1272 представлена в SEQ ID NO:35. Аминокислотная последовательность, кодируемая плазмидой 1272, представлена в SEQ ID NO:36.
Плазмида 1273 (Tert240-cMSLN). Плазмиду 1273 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 241-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами f pmed Nhe Ter240 и r link Tert240. Ген, кодирующий аминокислоты 37-597 предшественника мезотелина амплифицировали с помощью ПЦР из плазмиды 1103 с праймерами f tert ink cMSLN и r pmed Bgl cMSLN. ПЦР приводило к добавлению перекрывающегося линкера GGSGG на 3'-конце Tert и 5'-конце cMSLN. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1273 представлена в SEQ ID NO:37. Аминокислотная последовательность, кодируемая плазмидой 1273, представлена в SEQ ID NO:38.
Плазмида 1274 (cMSLN-T2A-Tert240). Плазмиду 1274 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 241-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами f2 T2A, f1 T2A Tert240 и r pmed Bgl Ter240. Ген, кодирующий аминокислоты 37-597 предшественника мезотелина амплифицировали с помощью ПЦР из плазмиды 1103 с праймерами f pmed Nhe cMSLN и r T2A Bamh cMSLN. ПЦР приводило к добавлению перекрывающихся последовательностей TAV 2A на 5'-конец Tert и 3'-конец cMSLN. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1274 представлена в SEQ ID NO:39. Аминокислотная последовательность, кодируемая плазмидой 1274, представлена в SEQ ID NO:40.
Плазмида 1275 (cMSLN-Tert240). Плазмиду 1275 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 241-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами f tg link Ter240 и r pmed Bgl Ter240. Ген, кодирующий аминокислоты 37-597 предшественника мезотелина амплифицировали с помощью ПЦР из плазмиды 1103 с праймерами f pmed Nhe cMSLN и r link cMSLN. ПЦР приводило к добавлению перекрывающегося линкера GGSGG на 5'-конец Tert и 3'-конец cMSLN. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1275 представлена в SEQ ID NO:41. Аминокислотная последовательность, кодируемая плазмидой 1275, представлена в SEQ ID NO:42.
Плазмида 1286 (cMuc1-ERB2A-Tert240). Плазмиду 1286 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 241-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами f2 ERBV2A, f1 ERBV2A Ter240 и r pmed Bgl Ter240. Ген, кодирующий аминокислоты 22-225, 946-1255 муцина 1 человека амплифицировали ПЦР из плазмиды 1197 с праймерами f pmed Nhe cytMuc и r ERB2A Bamh Muc. ПЦР приводило к добавлению перекрывающихся последовательностей ERBV 2A на 5'-конец Tert и 3'-конец Muc1. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1286 представлена в SEQ ID NO:31. Аминокислотная последовательность, кодируемая плазмидой 1286, представлена в SEQ ID NO:32.
Плазмида 1287 (Tert240-ERB2A-cMuc1). Плазмиду 1287 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 241-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами f pmed Nhe Ter240 и r ERB2A Bamh Ter240. Ген, кодирующий аминокислоты 22-225, 946-1255 муцина 1 человека амплифицировали ПЦР из плазмиды 1197 с праймерами f2 ERBV2A, f1 ERBV2A Muc и r pmed Bgl Muc. ПЦР приводило к добавлению перекрывающихся последовательностей ERBV 2A на 3'-конец Tert и 5'-конец Muc1. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1287 представлена в SEQ ID NO:33. Аминокислотная последовательность, кодируемая плазмидой 1287, представлена в SEQ ID NO:34.
Плазмида 1313 (Muc1-EMC2A-cMSLN). Плазмиду 1313 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 37-597 предшественника мезотелина, амплифицировали с помощью ПЦР из плазмиды 1103 с праймерами EMCV_cMSLN_F-33, EMCV2A_F-34 и pMED_cMSLN_R-37. Ген, кодирующий аминокислоты человека Mucin-1 2-225, 946-1255, амплифицировали с помощью ПЦР из плазмиды 1027 с праймерами pMED_MUC1_F-31, EMCV2A_R-36 и EMCV_Muc1_R-35. ПЦР приводило к добавлению перекрывающихся последовательностей EMCV 2A на 5'-конец cMSLN и 3'-конец Muc1. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1313 представлена в SEQ ID NO:19. Аминокислотная последовательность, кодируемая плазмидой 1313, представлена в SEQ ID NO:20.
Плазмида 1316 (cMSLN-EMC2A-Muc1). Плазмиду 1316 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 37-597 предшественника мезотелина человека амплифицировали с помощью ПЦР из плазмиды 1103 с праймерами f pmed Nhe cMSLN и r EM2A Bamh cMSLN. Ген, кодирующий аминокислоты 2-225, 946-1255, муцина 1 человека амплифицировали ПЦР из плазмиды 1027 с праймерами f1 EM2A Muc, f2 EMCV2A, and r pmed Bgl Muc. ПЦР приводило к добавлению перекрывающихся последовательностей EMCV 2A на 3'-конец cMSLN и 5'-конец Muc1. Ампликоны смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1316 представлена в SEQ ID NO:17. Аминокислотная последовательность, кодируемая плазмидой 1316, представлена в SEQ ID NO:18.
1C. ТРОЙНЫЕ АНТИГЕННЫЕ КОНСТРУКЦИИ
Плазмида 1317 (Muc1-EMC2A-cMSLN-T2A-Tert240). Плазмиду 1317 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, гены, кодирующие аминокислоты 2-225, 946-1255 муцина-1 человека, пептид EMCV 2A и аминоконцевую половину предшественника мезотелина, амплифицировали с помощью ПЦР из плазмиды 1313 с праймерами f pmed Nhe Muc and r MSLN 1051-1033. Гены, кодирующие карбоксильную концевую часть предшественника мезотелина, пептид TAV 2A и аминокислоты 241-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1274 с праймерами f MSLN 1028-1051 и r pmed Bgl Ter240. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1317 представлена в SEQ ID NO:43. Аминокислотная последовательность, кодируемая плазмидой 1317, представлена в SEQ ID NO:44.
Плазмиду 1318 (Muc1-ERB2A-Tert240-T2A-cMSLN). Плазмиду 1318 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, гены, кодирующие аминокислоты 2-225, 946-1255 муцина-1 человека, пептид ERBV 2A и аминоконцевую половину теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1270 с праймерами f pmed Nhe Muc и r tert 1602 -1579. Гены, кодирующие карбоксильную концевую половину теломеразы, пептид TAV 2A и аминокислоты 37-597 предшественника мезотелина человека, амплифицировали ПЦР из плазмиды 1272 с праймерами f tert 1584 -1607 и r pmed Bgl cMSLN. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1318 представлена в SEQ ID NO:45. Аминокислотная последовательность, кодируемая плазмидой 1318, представлена в SEQ ID NO:46.
Плазмида 1319 (cMSLN-EMC2A-Muc1-ERB2A-Tert240). Плазмиду 1319 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, гены, кодирующие аминокислоты 37-597 предшественники мезотелина человека, пептид EMCV 2A и аминоконцевую половину муцина-1 человека, амплифицировали с помощью ПЦР из плазмиды 1316 с праймерами f pmed Nhe cMSLN и r muc 986-963. Гены, кодирующие карбоксильную концевую часть муцина 1, пептид ERBV 2A и аминокислоты 241-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1270 с праймерами f Muc 960-983 и r pmed Bgl Ter240. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1319 представлена в SEQ ID NO:47. Аминокислотная последовательность, кодируемая плазмидой 1319, представлена в SEQ ID NO:48.
Плазмида 1320 (cMSLN-T2A-Tert240-ERB2A-Muc1). Плазмиду 1320 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, гены, кодирующие аминокислоты 37-597 предшественники мезотелина человека, пептид TAV 2A и аминоконцевую половину теломеразы человека амплифицировали с помощью ПЦР из плазмиды 1274 с праймерами f pmed Nhe cMSLN и r muc 1602-1579. Гены, кодирующие карбоксиконцевую половину теломеразы, пептид ERBV 2A и аминокислоты 2-225, 946-1255 муцина-1 человека, амплифицировали с помощью ПЦР из плазмиды 1271 с праймерами f tert 1584 -1607 и r pmed Bgl Muc. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1320 представлена в SEQ ID NO:49. Аминокислотная последовательность, кодируемая плазмидой 1320, представлена в SEQ ID NO:50.
Плазмида 1321 (Tert240-T2A-cMSLN-EMC2A-Muc1). Плазмиду 1321 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминоконцевую половину теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1112 с праймерами а pmed Nhe Ter240 и r tert 1602-1579. Гены, кодирующие карбоксильную концевую половину теломеразы, пептид TAV 2A и аминоконцевую часть предшественника мезотелина человека амплифицировали ПЦР из плазмиды 1272 с праймерами f tert 1584 -1607 и r MSLN 1051-1033. Гены, кодирующие карбоксиконцевую часть предшественника мезотелина человека, пептид EMCV 2A и аминокислоты 2-225, 946-1255 муцина-1 человека, амплифицировали с помощью ПЦР из плазмиды 1316 с праймерами f MSLN 1028-1051 и r pmed Bgl Muc. Три частично перекрывающихся ампликона смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1321 представлена в SEQ ID NO:51. Аминокислотная последовательность, кодируемая плазмидой 1321, представлена в SEQ ID NO:52.
Плазмида 1322 (Tert240-ERB2A-Muc1-EMC2A-cMSLN). Плазмиду 1322 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, гены, кодирующие аминокислоты 241-1132 теломеразы человека, пептид ERBV 2A и аминоконцевую половину муцина-1 человека, амплифицировали с помощью ПЦР из плазмиды 1271 с праймерами а pmed Nhe Ter240 и r muc 986-963. Гены, кодирующие карбоксиконцевую половину муцина-1, пептид EMCV 2A и аминокислоты 37-597 предшественника мезотелина человека амплифицировали ПЦР из плазмиды 1313 с праймерами f Muc 960-983 и r pmed Bgl cMSLN. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1322 представлена в SEQ ID NO:53. Аминокислотная последовательность, кодируемая плазмидой 1322, представлена в SEQ ID NO:54.
Плазмида 1351 (Muc1-EMC2A-cMSLN-T2A-Tert541). Плазмиду 1351 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, гены, кодирующие аминокислоты 2-225, 946-1255 муцина-1 человека, пептид EMCV 2A и предшественник мезотелина человека, амплифицировали с помощью ПЦР из плазмиды 1313 с праймерами f pmed Nhe Muc and T2A Bamh cMSLN. Гены, кодирующие пептид TAV 2A и аминокислоты 541-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1330 с праймерами f1 T2A Tert d541, f2 T2A и r pmed Bgl Ter240. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1351 представлена в SEQ ID NO:55. Аминокислотная последовательность, кодируемая плазмидой 1351, представлена в SEQ ID NO:56.
Плазмида 1352 (cMSLN-EMC2A-Muc1-ERB2A-Tert541). Плазмиду 1352 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, гены, кодирующие аминокислоты 37-597 предшественники мезотелина человека, пептид EMCV 2A и муцин-1 человека, амплифицировали с помощью ПЦР из плазмиды 1316 с праймерами f pmed Nhe cMSLN и r ERB2A Bamh Muc. Гены, кодирующие пептид ERBV 2A и аминокислоты 541-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1330 с праймерами f1 ERBV2A Tert d541, f2 ERBV2A, and r pmed Bgl Ter240. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1352 представлена в SEQ ID NO:57. Аминокислотная последовательность, кодируемая плазмидой 1352, представлена в SEQ ID NO:58.
Плазмида 1353 (cMSLN-T2A-Tert541-ERB2A-Muc1). Плазмиду 1353 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 37-597 предшественника мезотелина человека, амплифицировали с помощью ПЦР из плазмиды 1103 с праймерами f pmed Nhe cMSLN, r2 T2A, и r T2A Bamh cMSLN. Гены, кодирующие пептид TAV 2A, аминокислоты теломеразы человека 541-1132, пептид ERBV 2A и аминокислоты 2-225, 946-1255 муцина-1 человека, амплифицировали ПЦР из плазмиды 1271 с праймерами f1 T2A Tert d541 и r pmed Bgl Muc. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1353 представлена в SEQ ID NO:59. Аминокислотная последовательность, кодируемая плазмидой 1353, представлена в SEQ ID NO:60.
Плазмида 1354 (Muc1-EMC2A-cMSLN-T2A-Tert342). Плазмиду 1354 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, гены, кодирующие аминокислоты 2-225, 946-1255 муцина-1 человека, пептид EMCV 2A и предшественник мезотелина человека, амплифицировали с помощью ПЦР из плазмиды 1313 с праймерами f pmed Nhe Muc and T2A Bamh cMSLN. Гены, кодирующие пептид TAV 2A и аминокислоты 342-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1326 с праймерами f1 T2A Tert d342, f2 T2A и r pmed Bgl Ter240. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1354 представлена в SEQ ID NO:61. Аминокислотная последовательность, кодируемая плазмидой 1354, представлена в SEQ ID NO:62.
Плазмида 1355 (cMSLN-EMC2A-Muc1-ERB2A-Tert342). Плазмиду 1355 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, гены, кодирующие аминокислоты 37-597 предшественники мезотелина человека, пептид EMCV 2A и муцин-1 человека, амплифицировали с помощью ПЦР из плазмиды 1316 с праймерами f pmed Nhe cMSLN и r ERB2A Bamh Muc. Гены, кодирующие пептид ERBV 2A и аминокислоты 342-1132 теломеразы человека, амплифицировали с помощью ПЦР из плазмиды 1326 с праймерами f1 ERBV2A Ter d342, f2 ERBV2A, and r pmed Bgl Ter240. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1355 представлена в SEQ ID NO:63. Аминокислотная последовательность, кодируемая плазмидой 1355, представлена в SEQ ID NO:64.
Плазмида 1356 (cMSLN-T2A-Tert342-ERB2A-Muc1). Плазмиду 1356 строили с использованием методов ПЦР и бесшовного клонирования. Сначала, ген, кодирующий аминокислоты 37-597 предшественника мезотелина человека, амплифицировали с помощью ПЦР из плазмиды 1103 с праймерами f pmed Nhe cMSLN, r2 T2A, и r T2A Bamh cMSLN. Гены, кодирующие пептид TAV 2A, аминокислоты теломеразы человека 342-1132, пептид ERBV 2A и аминокислоты 2-225, 946-1255 муцина-1 человека, амплифицировали ПЦР из плазмиды 1271 с праймерами f1 T2A Tert d342 и r pmed Bgl Muc. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Полученный клон № 3 содержал непреднамеренную одиночную мутацию основания. Чтобы исправить мутацию, ПЦР и бесшовное клонирование повторяли, используя клона № 3 в качестве матрицы. Гены, кодирующие аминокислоты 37-597 предшественника мезотелина человека, пептид TAV 2A и аминоконцевую половину теломеразы человека, амплифицировали с помощью ПЦР из клона № 3 с праймерами f pmed Nhe cMSLN и r muc 1602-1579. Гены, кодирующие карбоксиконцевую половину теломеразы, пептид ERBV 2A и аминокислоты 2-225, 946-1255 муцина-1 человека, амплифицировали с помощью ПЦР из клона № 3 с праймерами f tert 1584 -1607 и r pmed Bgl Muc. Частично перекрывающиеся ампликоны расщепляли Dpn I, смешивали вместе и клонировали в сайты Nhe I/Bgl II pPJV7563 путем бесшовного клонирования. Нуклеотидная последовательность открытой рамки плазмиды 1356 представлена в SEQ ID NO:65. Аминокислотная последовательность, кодируемая плазмидой 1356, представлена в SEQ ID NO:66.
1D. КОНСТРУИРОВАНИЕ ВЕКТОРА
Векторы для экспрессии моно- или мультиантигенных конструкций конструировали из геномных последовательностей аденовируса шимпанзе Ad68. Были созданы три варианта скелета AdC68 без трансгенов (так называемые «пустые векторы») in silico. Векторы отличались только длиной делеций E1 и E3, которые были сконструированы в вирусах для того, чтобы сделать их репликацию несостоятельной и создать пространство для встраивания трансгена. Векторы AdC68W и AdC68X описаны в международной патентной заявке WO2015/063647A1. Вектор AdC68Y, несущий делеции оснований 456-3256 и 27476-31831, был сконструирован для улучшения свойств роста по сравнению с AdC68X и с большей пропускной способностью трансгена, чем AdC68W. Все три пустые вектора были биохимически синтезированы в многостадийном процессе, использующем in vitro олиго-синтез, и последующие промежуточные соединения, опосредованные рекомбинацией, собирались в Escherichia coli (E. coli) и дрожжах. Открытые рамки считывания, кодирующие различные иммуногенные полипептиды TAA, амплифицировали с помощью ПЦР из плазмид, описанных в примерах. Открытые рамки считывания затем встраивали в пустые векторные бакмиды. Рекомбинантные вирусные геномы вырезали из бакмид путем обработки ферментом PacI, а линеаризованные нуклеиновые кислоты трансфицировали в E1-комплементарную клеточную линию HEK293. При видимых цитопатических эффектах и образовании очагов аденовируса культуры собирали несколькими циклами замораживания/оттаивания для удаления вируса из клеток. Вирусы амплифицировали и очищали стандартными методиками.
ПРИМЕР 2. ИММУНОГЕННОСТЬ ИММУНОГЕННЫХ МОНОГЕННЫХ КОНСТРУКЦИЙ НА ОСНОВЕ MUC1
Исследование на мышах HLA-A2/DR1
План клинического исследования. Двенадцать мышей HLA-A2/DR1 разного пола праймировали в 0-ой день и стимулировали на 14-ый день с помощью ДНК-конструкции плазмиды 1027 (которая кодирует связанно-связанный полипептид MUC1 с SEQ ID NO:8) или плазмиды 1197 (которая кодирует цитозольный иммуногенный полипептид MUC1 с SEQ ID NO:16), используя способ PMED. На 21-ый день мышей умерщвляли и оценивали спленоциты на MUC1-специфическую клеточную иммуногенность в анализе ELISpot с интерфероном гамма (IFN-γ) и внутриклеточного цитокинового окрашивания (ICS).
Эпидермальная доставка, опосредованная частицами (PMED). PMED представляет собой безыгольчатый способ введения вакцин на основе нуклеиновых кислот животному или человеку. Система PMED включает осаждение ДНК на микроскопические частицы золота, которые затем выталкиваются газом гелия в эпидермис. В ND10, одноразовое устройство, используется спрессованный гелий из внутреннего цилиндра для доставки частиц золота, а в X15, устройстве средстве-повторителе, используется внешний гелиевый резервуар, который соединен с X15 через шланг высокого давления для доставки частиц золота. Оба эти устройства использовали в исследованиях доставки плазмид на основе ДНК MUC1. Частица золота обычно составляла 1-3 мкм в диаметре, и рецептура с частицами была составлена чтобы на 2 мкг антигенной ДНК плазмиды приходился 1 мг частиц золота. (Sharpe, M. et al.: P. Protection of mice from H5N1 influenza challenge by prophylactic DNA vaccination using particle mediated epidermal delivery. Vaccine, 2007, 25(34): 6392-98: Roberts LK, et al.: Clinical safety and efficacy of a powdered Hepatitis B nucleic acid vaccine delivered to the epidermis by a commercial prototype device. Vaccine, 2005; 23(40):4867-78).
Анализ ELISpot с IFN-γ. Спленоциты каждого животного совместно инкубировали в трех повторах с каждым Ag-специфическим пептидом (каждый пептид при 2-10 мкг/мл, 2,5-5e5 клеток на лунку) или объединяли с 15-мерными Ag-специфическими пептидами (перекрытие по 11 аминокислотам, покрывающее всю Ag-специфическую аминокислотную последовательность; каждый пептид при 2-5 мкг/мл, 1,25-5e5 клеток на лунку) в планшетах IFN-γ ELISPOT (см. также таблицу пептидных пулов (Таблица 18) и Таблицы 15-17). Планшеты инкубировали в течение ~16 ч при 37°C, 5% CO2, затем промывали и проявляли согласно инструкциям производителя. Количество клеток, образующих IFN-γ пятна (SFC), подсчитывали на ридере CTL. Вычисляли среднее значение трех повторов и отбирали отрицательные контрольные лунки, которые не содержали пептидов. Затем значения SFC нормировали для описания ответа на 1e6 спленоциты. Антиген-специфические ответы в таблицах представляют собой сумму ответов на Ag-специфические пептиды или пулы пептидов.
Анализ ICS. Спленоциты каждого животного совместно инкубировали с H-2b-, HLA-A2- или HLA-A24-ограниченными Ag-специфическими пептидами (каждый пептид при 5-10 мкг/мл, 1-2e6 спленоцитов на лунку) или пулы 15-мерных Ag-специфических пептидов (перекрытие по 11 аминокислотами, покрывающее всю Ag-специфическую аминокислотную последовательность; каждый пептид при 2-5 мкг/мл, 1-2e6 спленоцитов на лунку) в планшетах для культивирования ткани с U-образным дном и 96 лунками (см. также таблицу пептидных пулов (Таблица 18) и Таблицы 15-17). Планшеты инкубировали ~16 часов при 37°C, 5% CO2. Затем клетки окрашивали для детекции внутриклеточный экспрессии IFN-γ в CD8+ Т-клетках и фиксировали. Клетки обнаруживали на проточном цитометре. Данные представляли для каждого животного как частота пептида(ов) Ag- или пептидного пула Ag-специфичных IFN-γ+ CD8+ Т-клеток после вычитания ответов, полученных в отрицательных контрольных лунках, которые не содержали пептида.
Анализ сэндвич-ELISA. Стандартный сэндвич-анализ ELISA проводили с использованием инструментов автоматизации Tecan Evo, Biomek FxP и BioTek 405 Select TS. 384-луночные микропланшеты (плоскодонные, с высоким связыванием) покрывали 25 мкл/лунку 1,0 мкг/мл белком MUC1 человека или белком MSLN человека (антиген) в 1×PBS и инкубировали в течение ночи при 4°C. На следующее утро планшеты блокировали в течение часа при комнатной температуре с 5% FBS в PBS с 0,05% Tween 20 (PBS-T). Сыворотки мыши получали при начальном разбавлении 1/100 в PBS-T в 96-луночных планшетах с U-образным дном. Станция Tecan Evo осуществляла ½log серийные разведения в PBS-T по 9-и точкам с увеличением разведения, а затем штамповала по 25 мкл/лунка разведенной сыворотки из 96-луночных планшетов в 384-луночные планшеты. Планшеты из 384 лунок инкубировали в течение 1 часа при комнатной температуре на шейкере при 600 об/мин, затем, используя промыватель для планшетов BioTek EL 405 Select TS, планшеты промывали 4 раза в PBS-T. Второе мышиное анти-IgG-HRP антитело разводили до соответствующего разведения и штамповали с помощью Biomek FxP при 25 мкл/лунка в 384 луночные планшеты и инкубировали в течение 1 часа при комнатной температуре на шейкере при 600 об/мин, а затем промывку повторяли 5 раз. Используя Biomek FxP, планшеты штамповали при 25 мкл/лунка субстрата RT TMB и инкубировали в темноте при комнатной температуре в течение 30 минут, затем штамповали 25 мкл/лунка 1н кислоты H2SO4 для того, чтобы остановить ферментативную реакцию. Планшеты считывали на Molecular Devices, Spectramax 340PC/384 Plus при длине волны 450 нм. Данные представляли как рассчитанные титры при OD 1,0 с пределом обнаружения 99,0. Антиген-специфическое коммерческое моноклональное антитело использовали в каждом планшете в качестве положительного контроля для отслеживания различий в характеристиках от планшета к планшету; в качестве отрицательного контроля использовали нерелевантную вакцинированную сыворотку мыши, а для контроля фона неспецифического связывания использовали только лунки PBS-T. Титры в таблицах представляют собой антиген-специфические титры IgG, индуцированные у каждого животного.
Результаты. В таблице 1 приведены данные ELISpot и ICS спленоцитов HLA-A2/DR1, культивированных с пулами пептидов, полученных из библиотеки пептидов MUC1 (см. также Таблицы 15 и 18) или пептида MUC1 а.к.516-530, соответственно. Числа в столбце 3 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пулами пептидов MUC1 и вычитания фона. Числа в столбце 4 представляют собой число CD8+ Т-клеток, которые являются IFN-γ+ после рестимуляции пептидом MUC1 а.к.516-530 и вычитания фона. Положительный ответ определен как имеющий SFC > 100 и число IFN-γ+ CD8+ Т-клеток > 0,05%. Как показано в таблице 1, иммуногенные полипептиды MUC1, полученные с использованием полноразмерных мембранных (плазмида 1027) и цитозольных (плазмида 1197) MUC1 конструкций, описанных выше в примере 1А, способны индуцировать MUC1-специфические ответы Т-клеток, включая специфические CD8+ Т-клеточные ответы на HLA-A2 рестриктированный пептид MUC1 а.к.516-530. Цитозольный формат антигена MUC1 индуцировал наивысшую величину ответов Т-клеток. Важно отметить, что было показано, что ответы Т-клеток больных раком на пептид MUC1 а.к.516-530, коррелируют с противоопухолевой эффективностью in vitro (Jochems C et al., Cancer Immunol Immunother (2014) 63:161-174), демонстрируя важность повышения клеточных ответов на этот специфический эпитоп.
Исследование на мышах HLA-A24
План клинического исследования. Мышей HLA-A24 разного пола праймировали в 0-ой день и стимулировали на 14-ый, 28-ой и 42-ой дни ДНК-конструкцией плазмиды 1027 путем PMED введения. На 21-й день мышей умерщвляли и оценивали спленоциты на MUC1-специфическую клеточную иммуногенность (ELISpot).
Результаты. В таблице 2 приведены данные ELISpot спленоцитов HLA-A24, культивированных с пулами пептидов, полученных из библиотеки пептидов MUC1 (см. также таблицу пулов пептидов (Таблица 18) и Таблица 15). Числа в столбце 3 представляют # IFN-γ пятен/106 спленоцитов после рестимуляции пулами пептидов MUC1 и вычитания фона. Число, выделенное жирным шрифтом, указывает на то, что по крайней мере 1 исследованный пул пептидов был слишком большим для подсчета, поэтому истинной цифрой является по крайней мере указанное значение. Положительный ответ определен как имеющий SFC > 100. Как показано в таблице 2, конструкция на основе мембрано-связанного MUC1, способна индуцировать MUC1-специфические клеточные ответы.
Исследование на обезьянах
План клинического исследования. 14 китайских макак крабоедов праймировали аденовирусным вектором AdC68W, кодирующим цитозольный (плазмида 1197) или полноразмерный мембранно-связанный антиген MUC1 (плазмида 1027), в количестве 2e11 вирусных частиц путем двусторонней внутримышечной инъекции (всего-1 мкл). Через 29 дней животных стимулировали ДНК, кодирующей цитозольный или полноразмерный мембранно-связанный антиген MUC1, вводимым путем двусторонней внутримышечной электропорации (всего-2 мкл). Анти-CTLA-4 вводили подкожно на 1-й день (32 мг) и 29-ой день (50 мг). Через 14 дней после последней иммунизации у животных брали кровь, и РВМС и сыворотку выделяли для оценки MUC1-специфических клеточных (ELISpot, ICS) и гуморальных (ELISA) ответов, соответственно.
NHP-специфические иммунные анализы.
Анализ ELISpot. РВМС каждого животного совместно инкубировали в двух повторах с пулами 15-мерных Ag-специфических пептидов (перекрытие по 11 аминокислотам, охват всей Ag-специфической аминокислотной последовательности), каждый пептид в количестве 2 мкг/мл, 4e5 клеток на лунку, в планшетах IFN-y ELISPOT (см. также таблицу пептидных пулов (Таблица 18) и Таблицы 15-17). Планшеты инкубировали в течение ~16 ч при 37° C, 5% CO2, затем промывали и проявляли согласно инструкциям производителя. Количество клеток, образующих IFN-γ пятна (SFC), подсчитывали на ридере CTL. Вычисляли среднее значение двух повторов и вычитали отрицательные контрольные лунки, которые не содержали пептидов. Затем значения SFC нормировали для описания ответа на 1e6 PBMC. Антиген-специфические ответы в таблицах представляют собой сумму ответов на Ag-специфические пептидные пулы.
Анализ ICS. РВМС каждого животного совместно инкубировали с пулами 15-мерных пептидов MUC1 (перекрытие по 11 аминокислотам, охват всей нативной полноразмерной аминокислотной последовательности MUC1; см. Таблицу 15), каждый пептид в количестве 2 мкг/мл, 1,5-2e6 PBMC на лунку, в 96-луночных планшетах с U-образным дном для культур тканей. Планшеты инкубировали в течение ~16 часов при 37°C, 5% CO2, а затем окрашивали для детекции внутриклеточной экспрессии IFN-γ CD8 T-клеток. После фиксации клетки детектировали на проточном цитометре. Результаты представлены для каждого животного как количество MUC1, MSLN или TERT-специфических IFN-γ+ CD8+ Т-клеток после вычитания ответов, полученных в отрицательных контрольных лунках, которые не содержали пептида, и нормировали с 1е6 CD8+ Т-клетками.
Анализ сэндвич-ELISA. Стандартный сэндвич-анализ ELISA проводили с использованием инструментов автоматизации Tecan Evo, Biomek FxP и BioTek 405 Select TS. 384-луночные микропланшеты (плоскодонные, с высоким связыванием) покрывали 25 мкл/лунку 1,0 мкг/мл белком MUC1 человека или белком MSLN человека (антиген) в 1×PBS и инкубировали в течение ночи при 4°C. На следующее утро планшеты блокировали в течение часа при комнатной температуре с 5% FBS в PBS с 0,05% Tween 20 (PBS-T). Сыворотки китайских макак крабоедов получали при начальном разбавлении 1/100 в PBS-T в 96-луночных планшетах с U-образным дном. С помощью станции Tecan Evo осуществляли ½ log серийные разведения в PBS-T по 9-и точкам с увеличением разведения, а затем штамповали в количестве 25 мкл/лунка разведенную сыворотку из 96-луночных планшетов в 384-луночные планшеты. Планшеты с 384 лунками инкубировали в течение 1 часа при комнатной температуре на шейкере при 600 об/мин, затем, используя промыватель для планшетов BioTek EL 405 Select TS, планшеты промывали 4 раза в PBS-T. Второе резус анти-IgG-HRP антитело, которое перекрестно связывалось с Ig макак крабоедов, разводили до соответствующего разведения и штамповали с помощью Biomek FxP в количестве 25 мкл/лунка в 384 луночные планшеты и нкубировали в течение 1 часа при комнатной температуре на шейкере при 600 об/мин, а затем промывку повторяли 5 раз. Используя Biomek FxP, планшеты штамповали в количестве 25 мкл/лунка субстратом RT TMB и инкубировали в темноте при комнатной температуре в течение 30 минут, затем штамповали 25 мкл/лунка 1н кислоты H2SO4 для того, чтобы остановить ферментативную реакцию. Планшеты считывали на Molecular Devices, Spectramax 340PC/384 Plus при длине волны 450 нм. Данные представляли как рассчитанные титры при OD 1,0 с пределом обнаружения 99,0. Антиген-специфическое коммерческое моноклональное антитело использовали в каждом планшете в качестве положительного контроля для отслеживания различий в характеристиках от планшета к планшету; в качестве отрицательного контроля использовали нерелевантную вакцинированную сыворотку мыши, а для контроля фона неспецифического связывания использовали лунки только с PBS-T. Титры в таблицах представляют собой антиген-специфические титры IgG, индуцированные у каждого животного.
Результаты. В таблице 3 приведены данные ELISpot и ICS для PMBC китайских макак крабоедов, культивированных с пептидными пулами, полученными из библиотеки пептидов MUC1 (см. также таблицу пептидных пулов (Таблица 18) и Таблица 15) и данные ELISA сыворотки китайских макак крабоедов. Числа в столбце 3 представляют число IFN-γ пятен/106 PBMC после рестимуляции пептидными пулами MUC1 и вычитания фона. Числа в столбце 4 представляют число IFN-γ+ CD8+ Т-клетки/106 CD8+ Т-клеток после рестимуляции пептидными пулами MUC1 и вычитания фона. Числа в столбце 5 представляют собой IgG-титр антитела против MUC1 (оптическая плотность (OD)=1, предел детекции (LOD)=99,0). Положительный ответ определен как имеющий SFC > 50, IFN-γ+ CD8+ Т-клетки/1e6 CD8+ Т-клетки > 50 и IgG-титры > 99. Как показано в таблице 3, иммуногенные полипептиды MUC1, полученные с помощью конструкций на основе цитозольного (1197) и нативного полноразмерного мембранно-связанного (1027) MUC1, способны индуцировать MUC1-специфичные T- и B-клеточные ответы. Было показано, что конструкция на основе нативного полноразмерная мембранно-связанного MUC1 (1027) индуцирует общий наилучший MUC1-специфический клеточный и гуморальный ответ.
ПРИМЕР 3. ИММУНОГЕННОСТЬ MSLN МОНОАНТИГЕННЫХ КОНСТРУКЦИЙ
Исследование иммунного ответа у мышей Пастера (HLA-A2/DR1)
План клинического исследования. Двенадцать самок мышей HLA-A2/DR1 праймировали аденовирусным вектором AdC68W, кодирующим мембранно-связанный (плазмида 1084) или цитозольный антиген MSLN (плазмида 1103), в количестве 1e10 вирусных частиц путем внутримышечной инъекции (50 мкл). Через 28 дней животных стимулировали моноантигенной ДНК-конструкцией, кодирующей иммуногенный полипептид MSLN, используя способ PMED, как описано в примере 2. Антиген-специфический Т-клеточный ответ измеряли через семь дней IFN-γ ELISPOT и ICS.
Результаты. В таблице 4 приведены данные ELISpot и ICS для спленоцитов HLA-A2/DR1, культивированных с пептидными пулами, полученными из библиотеки пептидов MUC1 (см. также таблицу пептидных пулов (Таблица 18) и Таблица 16) или пептидов MSLN а.к.50-64, а.к.102-116 и а.к.542-556, соответственно. Числа в столбце 3 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пептидными пулами MSLN и вычитания фона. Числа в столбце 4 представляют собой число CD8+ Т-клеток, которые являются IFN-γ+, после рестимуляции пептидами MSLN а.к.50-64, а.к.102-116 и а.к.542-556 и вычитания фона. Положительный ответ определен как имеющий SFC > 100 и количество IFN-γ+ CD8+ Т-клеток > 0,05%. Как показано в таблице 4, иммуногенные полипептиды MSLN, полученные с помощью конструкций на основе мембранно-связанного (1084) и цитозольного (1103) MSLN, описанных выше в примере 1А, способны индуцировать MSLN-специфические Т-клеточные ответы. Антиген MSLN в цитозольном формате индуцировал наивысшую величину MSLN-специфических Т-клеточных ответов.
Исследование иммунного ответа у мышей HLA A24
План клинического исследования. Двенадцать мышей HLA-A24 смешанных гендерных групп иммунизировали ДНК-конструкциями на основе мембранно-связанного (1084) или цитозольного (1103) MSLN, используя способ PMED в режиме праймирования/стимуляции/стимуляции/стимуляции с перерывом в две недели между вакцинациями. MSLN-специфичные Т-клеточные ответы измеряли через 7 дней после последней иммунизации в анализе IFN-γ ELISpot и ICS.
Результаты. В таблице 5 приведены данные ELISpot и ICS для спленоцитов HLA-A24, культивированных с пептидными пулами, полученными из библиотеки пептидов MSLN (см. также таблицу пептидных пулов (Таблица 18) и Таблица 16) или пептидов MSLN а.к.130-144 и а.к.230-244, соответственно. Числа в столбце 3 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пептидными пулами MSLN и вычитания фона. Числа в столбце 4 представляют собой число CD8+ Т-клеток, которые являются IFN-γ+, после рестимуляции пептидами MSLN а.к.130-144 и а.к.230-244 и вычитания фона. Положительный ответ определен как имеющий SFC > 100 и количество IFN-γ+ CD8+ Т-клеток > 0,05%. Как показано в таблице 5, иммуногенные полипептиды MSLN, полученные с помощью конструкций на основе мембранно-связанного (1084) и цитозольного (1103) MSLN, способны индуцировать MSLN-специфичные Т-клеточные ответы. Антиген MSLN в цитозольном формате индуцировал наивысшую величину MSLN-специфических Т-клеточных ответов.
являющихся IFN-γ+
Исследование иммунного ответа у обезьян
План клинического исследования. 14 Китайских макак крабоедов праймировали аденовирусным вектором AdC68W, кодирующим мембрано-связанный (плазмида 1084) или цитозольный антиген MSLN (плазмида 1103), в количестве 2e11 вирусных частиц путем двусторонней внутримышечной инъекции (всего-1 мкл). Через 29 дней животных стимулировали ДНК, кодирующей мембранно-связанный (1084) или цитозольный антиген MSLN (1103), двухсторонней внутримышечной электропорацией (всего-2 мкл). Анти-CTLA-4 вводили подкожно на 1-й день (32 мг) и 29-ой день (50 мг). Через 14 дней после последней иммунизации у животных брали кровь, и РВМС и сыворотку выделяли для оценки MSLN-специфических клеточных (ELISpot, ICS) и гуморальных (ELISA) ответов, соответственно.
Результаты. В таблице 6 приведены данные ELISpot и ICS для PMBC китайских макак крабоедов, культивированных с пептидными пулами, полученными из библиотеки пептидов MSLN (см. также таблицу пептидных пулов (Таблица 18) и Таблица 16), и данные ELISA сыворотки китайского макака крабоеда. Числа в столбце 3 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пептидными пулами MSLN и вычитания фона. Числа в столбце 4 представляют число IFN-γ+ CD8+ Т-клеток/106 CD8+ Т-клеток после рестимуляции пептидными пулами MSLN и вычитания фона. Числа в столбце 5 представляют собой титр антитела против MSLN (оптическая плотность (OD)=1, предел детекции (LOD)=99,0). Положительный ответ определен как имеющий SFC > 50, IFN-γ+ CD8+ Т-клетки/1e6 CD8+ Т-клетки > 50 и титры IgG > 99. Как показано в таблице 6, иммуногенные полипептиды MSLN, полученные с помощью конструкций, на основе мембранно-связанного (1084) и цитозольного (1103) MSLN, способны индуцировать MSLN-специфические Т-и В-клеточные ответы. Было показано, что конструкция на основе цитоплазматического MSLN (плазмида 1103) индуцирует наиболее сильный MSLN-специфический клеточный ответ; напротив, было показано, что конструкция на основе мембранно-связанного MSLN (плазмида 1084) индуцирует самый сильный MSLN-специфический гуморальный ответ.
ПРИМЕР 4. ИММУНОГЕННОСТЬ TERT МОНОАНТИГЕННЫХ КОНСТРУКЦИЙ
Исследование иммунных ответов у мышей Пастера
План клинического исследования. Шесть мышей HLA-A2/DR1 смешанных гендерных групп праймировали аденовирусным вектором AdC68W, кодирующим усеченный (Δ240) цитозольный иммуногенный полипептид TERT (плазмида 1112), в количестве 1e10 вирусных частиц путем внутримышечной инъекции (50 мкл). Через 28 дней животных стимулировали внутримышечно 50 мкг ДНК, вводимой двухсторонней инъекцией с помощью электропорации (2×20 мкл), кодирующей усеченный (Δ240) цитозольный антиген TERT (плазмида 1112). Антиген-специфический Т-клеточный ответ измеряли через семь дней в анализе IFN-γ ELISPOT и ICS.
Результаты. В таблице 7 приведены данные ELISpot и ICS спленоцитов HLA-A2/DR1, культивированных с пептидными пулами, полученными из библиотеки пептидов TERT (см. также таблицу пулов пептидов (Таблица 18) и Таблица 17) или пептидов TERT а.к.861-875, соответственно. Числа в столбце 3 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пептидными пулами TERT и вычитания фона. Числа в столбце 4 представляют собой число CD8+ Т-клеток, которые являются IFN-γ+, после рестимуляции пептидом TERT а.к.861-875 и вычитания фона. Положительный ответ определен как имеющий SFC > 100 и количество IFN-γ+ CD8+ Т-клеток > 0,05%. Как показано в таблице 7, иммуногенный полипептид TERT, полученный из конструкции на основе усеченного (Δ240) цитозольного TERT, как описанной выше в примере 1А, способен индуцировать HLA-A2-рестриктированные TERT-специфические CD8 T-клеточные ответы.
Исследование иммунных ответов у мышей HLA A24
План клинического исследования. Восемь мышей HLA-A24 смешанных гендерных групп праймировали аденовирусным вектором AdC68W, кодирующим усеченный (Δ240) цитозольный антиген TERT (плазмида 1112), в общем количестве 1e10 вирусных частиц путем двусторонней внутримышечной инъекции (50 мкл в каждую переднюю большеберцовую мышцу). Через 14 дней животных стимулировали внутримышечно 50 мкг ДНК, вводимой двухсторонней инъекцией с помощью электропорации (2×20 мкл), кодирующей усеченный (Δ240) цитозольный антиген TERT (плазмида 1112). Антиген-специфический Т-клеточный ответ измеряли через семь дней в IFN-γ ELISPOT и ICS.
Результаты. В таблице 8 приведены IFN-γ данные ELISpot и ICS для спленоцитов HLA-A24, культивированных с пептидными пулами, полученными из библиотеки пептидов TERT (см. также таблицу пептидных пулов (Таблица 18) и Таблица 17) или пептидов TERT а.к.841-855), соответственно. Числа в столбце 3 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пептидными пулами TERT и вычитания фона. Числа в столбце 4 представляют собой число CD8+ Т-клеток, которые являются IFN-γ+, после рестимуляции пептидом TERT а.к.841-855 и вычитания фона. Число, выделенное жирным шрифтом, указывает на то, что по крайней мере 1 исследованный пептидный пул был слишком велик для подсчета, поэтому истинной цифрой является по крайней мере указанное значение. Положительный ответ определен как имеющий SFC > 100 и количество IFN-γ+ CD8+ Т-клеток > 0,1%. Как показано в таблице 8, иммуногенный полипептид TERT, полученный из конструкции на основе усеченного (Δ240) цитозольного TERT (1112), способен индуцировать HLA-A24-рестриктированные TERT-специфические CD8+ T-клеточные ответы.
Исследование иммунных ответов у обезьян
План клинического исследования. Восемь китайских макак крабоедов праймировали аденовирусным вектором AdC68W, кодирующим усеченный (Δ240) цитозольный антиген TERT (плазмида 1112), в количестве 2e11 вирусных частиц путем двусторонней внутримышечной инъекции (всего-1 мкл). Через 30 и 64 дня животных стимулировали ДНК (плазмида 1112), кодирующей усеченный (Δ240) цитозольный антиген TERT, путем двухсторонней внутримышечной электропорации (всего-2 мкл). Анти-CTLA-4 вводили подкожно на 1-й день (32 мг), 31 (50 мг) и 65 (75 мг). Через 14 дней после последней иммунизации у животных брали кровь, и РВМС выделяли для оценки TERT-специфических клеточных (ELISpot, ICS) ответов.
Результаты. В таблице 9 приведены данные ELISpot и ICS для PMBC китайского макак крабоеда, культивированных с пептидными пулами, полученными из библиотеки пептидов TERT (см. также таблицу пептидных пулов (Таблица 18) и Таблица 17). Числа в столбце 3 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пептидными пулами TERT и вычитания фона. Числа в столбце 4 представляют количества IFN-γ+ CD8+ Т-клеток/106 CD8+ Т-клеток после рестимуляции пептидными пулами TERT и вычитания фона. Положительный ответ определен как имеющий SFC > 50 и IFN-γ+ CD8+ Т-клетки/1e6 CD8+ Т-клетки > 50. Как показано в таблице 9, иммуногенный полипептид TERT, полученный с помощью конструкции на основе усеченного (Δ240) цитозольного TERT (1112), способен индуцировать TERT-специфические T-клеточные ответы.
ПРИМЕР 5. ИММУНОГЕННОСТЬ ДВОЙНЫХ АНТИГЕННЫХ КОНСТРУКЦИЙ
Исследование иммунного ответа у обезьян
План клинического исследования. 24 Китайских макак крабоедов праймировали двойными антигенными аденовирусными векторами AdC68W, кодирующими нативный полноразмерный мембранно-связанный MUC1 (MUC1) человека и усеченный (Δ240) цитозольный антиген TERT человека (TERTΔ240), в количестве 2e11 вирусных частиц путем двусторонней внутримышечной инъекции (всего 1 мкл). Через 30 и 64 дней животных стимулировали двойными антигенными ДНК-конструкциями (плазмиды 1270, 1271 и 1269), кодирующими те же два антигена, вводимыми двухсторонней внутримышечной электропорации (всего-2 мкл). Анти-CTLA-4 вводили подкожно на 1-й день (32 мг), 31 (50 мг) и 65 (75 мг). Через 14 дней после последней иммунизации у животных брали кровь, и РВМС и сыворотку выделяли для оценки MUC1- и TERT-специфических клеточных (ELISpot, ICS) и MUC1-специфических гуморальных (ELISA) ответов, соответственно. В целом оценивали три различные двойные антигенные вакцинные конструкции, которые соэкспрессировали оба антигена: a) MUC1-2A-TERTΔ240 (плазмида 1270), вектор AdC68W и ДНК-плазмида, кодирующая MUC1 и TERT, связанные с помощью пептида 2A; b) TERTΔ240-2A-MUC1 (плазмида 1271), вектор AdC68W и ДНК-плазмида, кодирующая TERT и MUC1, связанные 2А-пептидом; c) MUC1-TERTΔ240 (плазмида 1269), вектор AdC68W и DNA-плазмида, кодирующая слитый белок MUC1-TERT (см. также Таблицу Конструкций).
Результаты. В таблице 10 приведены данные ELISpot и ICS для PMBC китайского макака крабоеда, культивированных с пептидными пулами, полученными из библиотек пептидов MUC1 и TERT (см. также таблицу пептидных пулов (Таблица 18) и Таблица 15 и 17), и данные ELISA сыворотки китайского макака крабоеда. Положительный ответ определен как имеющий SFC > 50, IFN-γ+ CD8+ Т-клетки/1e6 CD8+ Т-клетки > 50 и титры IgG > 99. Числа в столбце 3 и 6 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пептидными пулами MUC1 и TERT и вычитания фона, соответственно. Числа, выделенные жирным шрифтом, указывают на то, что по крайней мере 1 исследованный пептидный пул был слишком велик для подсчета, поэтому истинной цифрой является по крайней мере указанное значение. Числа в столбцах 4 и 7 представляют число IFN-γ+ CD8+ Т-клеток/106 CD8+Т-клеток после рестимуляции пептидными пулами MUC1 и пептидными пулами TERT, соответственно, и вычитания фона. Числа в столбце 5 представляют собой IgG-титр антитела против MUC1 (оптическая плотность (OD)=1, предел детекции (LOD)=99,0). Как показано в таблице 10, иммуногенные полипептиды MUC1 и TERT, полученные с помощью двойных антигенных конструкций, экспрессирующих MUC1 и TERT (плазмиды 1270, 1271 и 1269), способны индуцировать MUC1- и TERT-специфические Т-клеточные ответы и MUC1-специфические В-клеточные ответы. Показано, что двойная антигенная конструкция 1269, кодирующая слитый белок MUC1-TERT, индуцирует наиболее сильный общий MUC1-специфический клеточный ответ; напротив, было показано, что двойная конструкция плазмиды 1271 (TERT-2A-MUC1) индуцирует наиболее сильный общий TERT-специфический клеточный ответ. Было показано, что все три двойные антигенные конструкции вызывают сравнимый MUC1-специфичный гуморальный ответ.
1e6 CD8+ T-клеток
ПРИМЕР 6. ИММУНОГЕННОСТЬ ТРОЙНЫХ АНТИГЕННЫХ КОНСТРУКЦИЙ
Пример 6 иллюстрирует способность тройных антигенных аденовирусных конструкций и вакцинных конструкций на основе нуклеиновых кислот, экспрессирующих нативный полноразмерный мембранно-связанный антиген MUC1 человека (MUC1), цитозольный антиген MSLN человека (cMSLN) и усеченный (Δ240) цитозольный антиген TERT человека (TERTΔ240 или TERTΔ541) индуцировать Ag-специфичные Т-и В-клеточные ответы на все три кодированных раковых антигена.
Исследование иммунного ответа у мышей C57BL/6J с использованием электропорации
План клинического исследования. 48 самок мышей C57BL/6J иммунизировали тройными антигенными ДНК-конструкциями, кодирующими MUC1, cMSLN и TERTΔ240 человека. Тройную антигенную ДНК-вакцину (100 мкг) вводили путем двусторонней внутримышечной инъекции (всего 20 мкл в каждую переднюю большеберцовую мышцу) сопутствующей электропорацией в режиме праймирования/стимуляции с интервалом две недели между вакцинациями. MUC1-, MSLN- и TERT-специфические клеточные ответы, и MUC1- и MSLN-специфические гуморальные ответы измеряли через 7 дней после последней иммунизации в анализе IFN-γ ELISpot и ELISA, соответственно. В общей сложности шесть различных тройных антигенных ДНК-конструкций, кодирующих все три антигена, связанных пептидами 2А, использовали следующим образом: MUC1-2A-cMSLN-2A-TERTΔ240 (плазмида 1317), MUC1-2A-TERTΔ240-2A-cMSLN (плазмида 1318), cMSLN-2A-MUC1-2A-TERTΔ240 (плазмида 1319), cMSLN-2A-TERTΔ240-2A-MUC1 (плазмида 1320), TERTΔ240-2A-cMSLN-2A-MUC1 (плазмида 1321), TERTΔ240-2A-MUC1-2A-cMSLN (плазмида 1322) (см. также Таблицу конструкций).
Результаты. В таблице 11 приведены данные ELISpot для спленоцитов C57BL/6J, культивированных с пептидными пулами, полученными из библиотек пептидов MUC1, MSLN и TERT (см. также таблицу пептидных пулов (Таблица 18) и Таблицы 15-17), и данные ELISA сыворотки C57BL/6J мышей. Положительный ответ определяли как имеющий SFC > 100 и IgG титры > 99. Числа в столбце 3, 5 и 7 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пептидными пулами MUC1, MSLN и TERT и вычитания фона, соответственно. Числа, выделенные жирным шрифтом, указывают на то, что по крайней мере 1 исследованный пептидный пул был слишком велик для подсчета, поэтому истинной цифрой является по крайней мере указанное значение. Числа в столбцах 4 и 6 представляют собой титр антитела IgG против MUC1 и MSLN (оптическая плотность (O.D)=1, предел детекции (L.O.D)=99,0). Как показано в таблице 11, иммуногенные полипептиды MUC1, MSLN и TERT, полученные с помощью тройных антигенных MUC1-, MSLN- и TERT-экспрессирующих конструкций, способны индуцировать Т-клеточные ответы против всех трех антигенов, и В-клеточные ответы против MUC1; напротив, только тройные антигенные конструкции плазмид 1317, 1318 и 1322 способны индуцировать В-клеточные ответы против MSLN.
Исследование иммунного ответа у мышей C57BL/6J с использованием аденовирусных векторов
План клинического исследования. 36 самок мышей C57BL/6J праймировали тройными антигенными аденовирусными векторами, кодирующими MUC1, цMSLN, и TERTΔ240 или TERTΔ541, в количестве 1е10 вирусных частиц путем внутримышечной инъекции (50 мкл). Через 28 дней животных праймировали тройными антигенными ДНК-конструкциями (50 мкг) двойной внутримышечной (всего 20 мкл в каждую переднюю большеберцовую мышцу) сопутствующей электропорацией. MUC1-, MSLN- и TERT-специфические клеточные ответы, и MUC1- и MSLN-специфические гуморальные ответы измеряли через 7 дней после последней иммунизации в анализе IFN-γ ELISpot и ICS, и в анализе ELISA, соответственно. В общей сложности три тройных антигенных конструкций на основе аденовируса и ДНК, кодирующей MUC1, cMSLN и TERTΔ240, связанные пептидами 2А, и три тройных антигенных конструкций на основе аденовируса и ДНК, кодирующей MUC1, cMSLN и TERTΔ541, связанные пептидами 2А, использовали следующим образом: MUC1-2A-cMSLN-2A-TERTΔ240 (плазмида 1317),cMSLN-2A-MUC1-2A-TERTΔ240 (плазмида 1319),cMSLN-2A-TERTΔ240-2A-MUC1 (плазмида 1320), и MUC1-2A-cMSLN-2A-TERTΔ541 (плазмида 1351), cMSLN-2A-MUC1-2A-TERTΔ541 (плазмида 1352),cMSLN-2A-TERTΔ541-2A-MUC1(плазмида 1353) (см. также Таблицу конструкций).
Результаты. В таблице 12 приведены данные ELISpot для спленоцитов C57BL/6J, культивированных с пептидными пулами, полученными из библиотек пептидов MUC1, MSLN и TERT (см. также таблицу пептидных пулов (Таблица 18) и Таблицы 15-17), данные ICS для спленоцитов C57BL/6J, культурированных с пептидом TERT а.к.1025-1039, и данные ELISA сыворотки C57BL/6J мышей. Положительный ответ определен как имеющий SFC > 100, количество IFN-γ+ CD8+ Т-клеток > 0,1% и IgG-титры > 99. Числа в столбце 3, 5 и 7 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пептидными пулами MUC1, MSLN и TERT и вычитания фона, соответственно. Числа, выделенные жирным шрифтом, указывают на то, что по крайней мере 1 исследованный пул пептидов был слишком велик для подсчета, поэтому истинной цифрой является по крайней мере указанное значение. Числа в столбце 8 представляют число IFN-γ+ CD8+ T клеток/106 CD8+ T клеток после рестимуляции TERT-специфическим пептидом TERT а.к.1025-1039 и вычитания фона. Числа в столбцах 4 и 6 представляют собой титр антитела IgG против MUC1 и MSLN (оптическая плотность (O.D)=1, предел детекции (L.O.D)=99,0). Как показано в таблице 12, иммуногенные полипептиды MUC1, MSLN и TERT, полученные с помощью тройных антигенных MUC1-, MSLN- и TERT-экспрессирующих конструкций, способны индуцировать Т-клеточные ответы против всех трех антигенов, и В-клеточные ответы против MUC1; напротив, только тройные антигенные конструкции 1317 и 1351 способны индуцировать В-клеточные ответы против MSLN.
Исследование иммунного ответа у мышей HLA-A24
План клинического исследования. Восемь мышей HLA-A24 смешанных гендерных групп праймировали тройной антигенной аденовирусной конструкцией AdC68Y (плазмида 1317; MUC1-2A-cMSLN-2A-TERTΔ240), кодирующей MUC1, cMSLN и TERTΔ240 человека, в количестве 1е10 вирусных частиц путем внутримышечной инъекции (50 мкл в каждую переднюю большеберцовую мышцу). Через 14 дней животных праймировали тройными антигенными ДНК-конструкциями, 50 мкг (плазмида 1317), кодирующими те же три антигена (20 мкл в каждую переднюю большеберцовую мышцу сопутствующей электропорацией). HLA-A24-рестриктированные MUC1-специфические клеточные ответы измеряли через 7 дней после последней иммунизации в анализе IFN-γ ELISpot.
Результаты. В таблице 13 приведены данные ELISpot для спленоцитов HLA-A24, культивированных с пептидом MUC1 а.к.524-532. Положительный ответ определен как имеющий SFC > 50. Числа в столбце 3 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пулами пептидов MUC1 а.к.524-532 и вычитания фона. Как показано в таблице 13, иммуногенные полипептиды MUC1, полученные из тройной антигенной конструкции 1317, экспрессирующей MUC1, MSLN и TERT, способны индуцировать HLA-A24-рестриктированный MUC1 а.к.524-532-специфические CD8+ Т-клеточные ответы. Важно отметить, что было показано, что Т-клеточные ответы больных раком на пептид MUC1 коррелируют с противоопухолевой эффективностью in vitro(Jochems C et al., Cancer Immunol Immunother (2014) 63:161-174), демонстрируя важность повышения клеточных ответов на этот специфический эпитоп.
Исследование иммунного ответа у обезьян
План клинического исследования. 24 китайских макак крабоедов праймировали аденовирусными векторами AdC68Y, кодирующими нативный полноразмерный мембранно-связанный антиген MUC1 (MUC1) человека, цитоплазматический антиген MSLN (цMSLN) человека и усеченный (Δ240) цитозольный антиген TERT человека (TERTΔ240), в количестве 2e11 вирусных частиц путем двусторонней внутримышечной инъекции (всего 1 мкл). Через 28 и 56 дней животных праймировали ДНК, кодирующей те же три антигена, внутримышечно посредством электропорации (всего 2 мкл). Анти-CTLA-4 вводили подкожно на 1-й день (32 мг), 29 (50 мг) и 57 (75 мг). Через 21 дней после последней иммунизации у животных брали кровь, и РВМС и сыворотку выделяли для оценки MUC1-, MSLN- и TERT-специфических клеточных (ELISpot, ICS) и MUC1- и MSLN-специфических гуморальных (ELISA) ответов, соответственно. В общей сложности оценивали три тройных антигенных конструкций на основе аденовируса и ДНК, кодирующей MUC1, cMSLN и TERTΔ240, связанных пептидами 2А: MUC1-2A-cMSLN-2A-TERTΔ240 (плазмида 1317), цMSLN-2A-MUC1-2A-TERTΔ240 (плазмида 1319), и cMSLN-2A-TERTΔ240-2A-MUC1 (плазмида 1320).
Результаты. В таблицах 14А, 14В и 14С приведены данные ELISpot и ICS для PMBC китайского макака крабоеда, культивированных с пептидными пулами, полученными из библиотек пептидов MUC1, MSLN и TERT (см. также таблицу пептидных пулов (Таблица 18) и Таблица 15-17) и данные ELISA сыворотки китайского макака крабоеда. Положительный ответ определен как имеющий SFC > 50, IFN-γ+ CD8+ Т-клетки/1e6 CD8+ Т-клетки > 50 и титры IgG > 99. Числа в столбце 3, 6 и 9 представляют число IFN-γ пятен/106 спленоцитов после рестимуляции пептидными пулами MUC1, MSLN и TERT и вычитания фона. Числа, выделенные жирным шрифтом, указывают на то, что по крайней мере 1 исследованный пул пептидов был слишком велик для подсчета, поэтому истинной цифрой является по крайней мере указанное значение. Числа в столбцах 4, 7 и 10 представляют число IFN-γ+ CD8+ T клеток/106 CD8+ T клеток после рестимуляции пептидными пулами MUC1, MSLN, и TERT, соответственно, и вычитая фона. Числа в столбцах 5 и 8 представляют собой Ig-титр антител против MUC1 и антител против MSLN (оптическая плотность (O.D)=1, предел детекции (L.O.D)=99,0), соответственно. Как показано в таблице 14, иммуногенные полипептиды MUC1, MSLN и TERT, полученные с помощью тройных антигенных MUC1-, MSLN- и TERT-экспрессирующих конструкций, способны индуцировать клеточные ответы против всех трех антигенов, и гуморальные ответы против MUC1. Однако только тройная антигенная конструкция 1317 способна индуцировать значительные MSLN-специфичные В-клеточные ответы.
спленоцитов
T-клеток/1e6 CD8+ T-клеток
1320
спленоцитов
ПРИМЕР 7. КОМБИНАЦИЯ ВАКЦИН С ИММУННЫМИ МОДУЛЯТОРАМИ
Следующий пример приведен для иллюстрации усиленных эффектов ингибирования роста опухоли, когда противораковая вакцина вводилась в комбинации с антителом против антигена цитотоксического Т-лимфоцита (CTLA4) и/или с ингибитором индоламин 2,3-диоксигеназы 1 (IDO1).
Методики исследования.
Мышам BALB-neuT имплантировали в 0-ой день опухолевые клетками TUBO путем подкожной инъекции. Мышам вводили 200 мг/кг 3-(5-фтор-1Н-индол-3-ил) пирролидин-2,5-диона (ингибитор IDO1) или носитель два раза в день на 7-ой день с использованием перорального желудочного зоба. Группам сравнения вводили ложные дозы носителя, начиная с 7-го дня. Определенных мышей иммунизировали на 10-й день исследования аденовирусным вектором, созданным для экспрессии крысиного HER2 (rHER2) (вакцина rHER2), или вектором, лишенным трансгена rHER2 (контрольная вакцина), в количестве 1е10 вирусных частиц внутримышечной инъекцией. Затем, подкожно вводили 250 мкг антитела против CTLA4 (мышиное моноклонального антитела против CTLA-4, клон 9D9) или IgG2-изотип контрольного моноклонального антитела в непосредственной близости от лимфатических узлов, дренирующих место инъекции аденовирусного вектора. Через каждые две недели мышей иммунизировали 100 мкг ДНК-плазмиды, кодирующей rHER2 (вакцина rHER2), или ДНК-плазмиды, лишенной трансгена rHER2 (контрольная вакцина), путем электропорации. После введения ДНК-плазмиды, 250 мкг анти-CTLA4-антитела вводили подкожно в непосредственной близости от лимфатических узлов, дренирующих место инъекции ДНК-плазмиды. Чтобы отслеживать прогрессирование опухоли, объемы подкожной опухоли измеряли два раза в неделю на протяжении всего исследования. Животные с объемами подкожной опухоли, достигающих 2000 мм3 или проявляющие необратимые симптомы заболевания, подвергали эвтаназии.
Результаты.
Объемы подкожных опухолей каждого животного в каждой группе лечения представлены в Таблицах 20-A-20-H.
У мышей, получавших только антитела против CTLA4 или только с ингибитором IDO1, не было эффекта на рост опухоли. Тем не менее, более медленные темпы роста наблюдали у некоторых животных, получавших только вакцину rHER2. У мышей, получавшие вакцину rHER2 в комбинации с антителом против CTLA4, и мыши, получавшие вакцину rHER2 в комбинации с ингибитором IDO1, уменьшалась скорость роста опухоли по сравнению с соответствующими контрольными животными. Ингибирование роста опухолей было наиболее выраженным у мышей, получавших вакцину rHER2, антитело против CTLA4 и ингибитор IDO1.
Таблица 20-A. Объемы подкожных опухолей мышей BALB-neuT, которым вводили вакцину rHER2, изотипичное контрольное антитело и носитель
Иссл.
Таблица 20-В. Объемы подкожных опухолей мышей BALB-neuT, которым вводили вакцину rHER2, анти-CTL4 антитело и носитель
Таблица 20-С. Объемы подкожных опухолей мышей BALB-neuT, которым вводили вакцину rHER2, изотипичное моноклональное антитело и ингибитор IDO1
Таблица 20-D. Объемы подкожных опухолей мышей BALB-neuT, которым вводили вакцину rHER2, антитело против CTL4 и ингибитор IDO1
Таблица 20-E. Объемы подкожных опухолей мышей BALB-neuT, которым вводили контрольную вакцину, изотипичное моноклональное антитело и носитель
Таблица 20-F Объемы подкожных опухолей мышей BALB-neuT, которым вводили контрольную вакцину, анти-CTLA4 антитело и носитель
Таблица 20-G. Объемы подкожных опухолей мышей BALB-neuT, которым вводили контрольную вакцину, изотипичное моноклональное антитело и ингибитор IDO1
Таблица 20-H. Объемы подкожных опухолей мышей BALB-neuT, которым вводили контрольную вакцину, анти-CTLA4 антитело и ингибитор IDO1
ПРЕДВАРИТЕЛЬНЫЙ ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
SEQ ID NO:1. Белок MUC1 изоформа 1 (ссылочный полипептид; Uniprot P15941-1) (человек)
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDNRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAATSANL
SEQ ID NO:2. Белок-предшественника мезотелина изоформа 2 (ссылочный полипептид; Uniprot Q13421-3) (человек)
MALPTARPLLGSCGTPALGSLLFLLFSLGWVQPSRTLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALSGTPCLLGPGPVLTVLALLLASTLA
SEQ ID NO:3. Белок TERT изоформа 1 (ссылочный полипептид; Genbank AAD30037, Uniprot O14746-1) (человек)
MPRAPRCRAVRSLLRSHYREVLPLATFVRRLGPQGWRLVQRGDPAAFRALVAQCLVCVPWDARPPPAAPSFRQVSCLKELVARVLQRLCERGAKNVLAFGFALLDGARGGPPEAFTTSVRSYLPNTVTDALRGSGAWGLLLRRVGDDVLVHLLARCALFVLVAPSCAYQVCGPPLYQLGAATQARPPPHASGPRRRLGCERAWNHSVREAGVPLGLPAPGARRRGGSASRSLPLPKRPRRGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVDVTGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:4. AdC68Y пустой
ccatcttcaataatatacctcaaactttttgtgcgcgttaatatgcaaatgaggcgtttgaatttggggaggaagggcggtgattggtcgagggatgagcgaccgttaggggcggggcgagtgacgttttgatgacgtggttgcgaggaggagccagtttgcaagttctcgtgggaaaagtgacgtcaaacgaggtgtggtttgaacacggaaatactcaattttcccgcgctctctgacaggaaatgaggtgtttctgggcggatgcaagtgaaaacgggccattttcgcgcgaaaactgaatgaggaagtgaaaatctgagtaatttcgcgtttatggcagggaggagtatttgccgagggccgagtagactttgaccgattacgtgggggtttcgattaccgtgtttttcacctaaatttccgcgtacggtgtcaaagtccggtgtttttactactgtaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctgtccctatcagtgatagagatctccctatcagtgatagagagtttagtgaaccgtcagatccgctagggtaccgcgatcgcaCctcgagctgatcataatcagccataccacatttgtagaggttttacttgctttaaaaaacctcccacacctccccctgaacctgaaacataaaatgaatgcaattgttgttgttaacttgtttattgcagcttataatggttacaaataaagcaatagcatcacaaatttcacaaataaagcatttttttcactgcattctagttgtggtttgtccaaactcatcaatgtatcttaccaggtgccgagcctgcgagtgcggagggaagcatgccaggttccagcccgtgtgtgtggatgtgacggaggacctgcgacccgatcatttggtgttgccctgcaccgggacggagttcggttccagcggggaagaatctgactagagtgagtagtgttctggggcgggggaggacctgcatgagggccagaataactgaaatctgtgcttttctgtgtgttgcagcagcatgagcggaagcggctcctttgagggaggggtattcagcccttatctgacggggcgtctcccctcctgggcgggagtgcgtcagaatgtgatgggatccacggtggacggccggcccgtgcagcccgcgaactcttcaaccctgacctatgcaaccctgagctcttcgtcgttggacgcagctgccgccgcagctgctgcatctgccgccagcgccgtgcgcggaatggccatgggcgccggctactacggcactctggtggccaactcgagttccaccaataatcccgccagcctgaacgaggagaagctgttgctgctgatggcccagctcgaggccttgacccagcgcctgggcgagctgacccagcaggtggctcagctgcaggagcagacgcgggccgcggttgccacggtgaaatccaaataaaaaatgaatcaataaataaacggagacggttgttgattttaacacagagtctgaatctttatttgatttttcgcgcgcggtaggccctggaccaccggtctcgatcattgagcacccggtggatcttttccaggacccggtagaggtgggcttggatgttgaggtacatgggcatgagcccgtcccgggggtggaggtagctccattgcagggcctcgtgctcgggggtggtgttgtaaatcacccagtcatagcaggggcgcagggcatggtgttgcacaatatctttgaggaggagactgatggccacgggcagccctttggtgtaggtgtttacaaatctgttgagctgggagggatgcatgcggggggagatgaggtgcatcttggcctggatcttgagattggcgatgttaccgcccagatcccgcctggggttcatgttgtgcaggaccaccagcacggtgtatccggtgcacttggggaatttatcatgcaacttggaagggaaggcgtgaaagaatttggcgacgcctttgtgcccgcccaggttttccatgcactcatccatgatgatggcgatgggcccgtgggcggcggcctgggcaaagacgtttcgggggtcggacacatcatagttgtggtcctgggtgaggtcatcataggccattttaatgaatttggggcggagggtgccggactgggggacaaaggtaccctcgatcccgggggcgtagttcccctcacagatctgcatctcccaggctttgagctcggagggggggatcatgtccacctgcggggcgataaagaacacggtttccggggcgggggagatgagctgggccgaaagcaagttccggagcagctgggacttgccgcagccggtggggccgtagatgaccccgatgaccggctgcaggtggtagttgagggagagacagctgccgtcctcccggaggaggggggccacctcgttcatcatctcgcgcacgtgcatgttctcgcgcaccagttccgccaggaggcgctctccccccagggataggagctcctggagcgaggcgaagtttttcagcggcttgagtccgtcggccatgggcattttggagagggtttgttgcaagagttccaggcggtcccagagctcggtgatgtgctctacggcatctcgatccagcagacctcctcgtttcgcgggttgggacggctgcgggagtagggcaccagacgatgggcgtccagcgcagccagggtccggtccttccagggtcgcagcgtccgcgtcagggtggtctccgtcacggtgaaggggtgcgcgccgggctgggcgcttgcgagggtgcgcttcaggctcatccggctggtcgaaaaccgctcccgatcggcgccctgcgcgtcggccaggtagcaattgaccatgagttcgtagttgagcgcctcggccgcgtggcctttggcgcggagcttacctttggaagtctgcccgcaggcgggacagaggagggacttgagggcgtagagcttgggggcgaggaagacggactcgggggcgtaggcgtccgcgccgcagtgggcgcagacggtctcgcactccacgagccaggtgaggtcgggctggtcggggtcaaaaaccagtttcccgccgttctttttgatgcgtttcttacctttggtctccatgagctcgtgtccccgctgggtgacaaagaggctgtccgtgtccccgtagaccgactttatgggccggtcctcgagcggtgtgccgcggtcctcctcgtagaggaaccccgcccactccgagacgaaagcccgggtccaggccagcacgaaggaggccacgtgggacgggtagcggtcgttgtccaccagcgggtccaccttttccagggtatgcaaacacatgtccccctcgtccacatccaggaaggtgattggcttgtaagtgtaggccacgtgaccgggggtcccggccgggggggtataaaagggtgcgggtccctgctcgtcctcactgtcttccggatcgctgtccaggagcgccagctgttggggtaggtattccctctcgaaggcgggcatgacctcggcactcaggttgtcagtttctagaaacgaggaggatttgatattgacggtgccggcggagatgcctttcaagagcccctcgtccatctggtcagaaaagacgatctttttgttgtcgagcttggtggcgaaggagccgtagagggcgttggagaggagcttggcgatggagcgcatggtctggtttttttccttgtcggcgcgctccttggcggcgatgttgagctgcacgtactcgcgcgccacgcacttccattcggggaagacggtggtcagctcgtcgggcacgattctgacctgccagccccgattatgcagggtgatgaggtccacactggtggccacctcgccgcgcaggggctcattagtccagcagaggcgtccgcccttgcgcgagcagaaggggggcagggggtccagcatgacctcgtcgggggggtcggcatcgatggtgaagatgccgggcaggaggtcggggtcaaagtagctgatggaagtggccagatcgtccagggcagcttgccattcgcgcacggccagcgcgcgctcgtagggactgaggggcgtgccccagggcatgggatgggtaagcgcggaggcgtacatgccgcagatgtcgtagacgtagaggggctcctcgaggatgccgatgtaggtggggtagcagcgccccccgcggatgctggcgcgcacgtagtcatacagctcgtgcgagggggcgaggagccccgggcccaggttggtgcgactgggcttttcggcgcggtagacgatctggcggaaaatggcatgcgagttggaggagatggtgggcctttggaagatgttgaagtgggcgtggggcagtccgaccgagtcgcggatgaagtgggcgtaggagtcttgcagcttggcgacgagctcggcggtgactaggacgtccagagcgcagtagtcgagggtctcctggatgatgtcatacttgagctgtcccttttgtttccacagctcgcggttgagaaggaactcttcgcggtccttccagtactcttcgagggggaacccgtcctgatctgcacggtaagagcctagcatgtagaactggttgacggccttgtaggcgcagcagcccttctccacggggagggcgtaggcctgggcggccttgcgcagggaggtgtgcgtgagggcgaaagtgtccctgaccatgaccttgaggaactggtgcttgaagtcgatatcgtcgcagcccccctgctcccagagctggaagtccgtgcgcttcttgtaggcggggttgggcaaagcgaaagtaacatcgttgaagaggatcttgcccgcgcggggcataaagttgcgagtgatgcggaaaggttggggcacctcggcccggttgttgatgacctgggcggcgagcacgatctcgtcgaagccgttgatgttgtggcccacgatgtagagttccacgaatcgcggacggcccttgacgtggggcagtttcttgagctcctcgtaggtgagctcgtcggggtcgctgagcccgtgctgctcgagcgcccagtcggcgagatgggggttggcgcggaggaaggaagtccagagatccacggccagggcggtttgcagacggtcccggtactgacggaactgctgcccgacggccattttttcgggggtgacgcagtagaaggtgcgggggtccccgtgccagcgatcccatttgagctggagggcgagatcgagggcgagctcgacgagccggtcgtccccggagagtttcatgaccagcatgaaggggacgagctgcttgccgaaggaccccatccaggtgtaggtttccacatcgtaggtgaggaagagcctttcggtgcgaggatgcgagccgatggggaagaactggatctcctgccaccaattggaggaatggctgttgatgtgatggaagtagaaatgccgacggcgcgccgaacactcgtgcttgtgtttatacaagcggccacagtgctcgcaacgctgcacgggatgcacgtgctgcacgagctgtacctgagttcctttgacgaggaatttcagtgggaagtggagtcgtggcgcctgcatctcgtgctgtactacgtcgtggtggtcggcctggccctcttctgcctcgatggtggtcatgctgacgagcccgcgcgggaggcaggtccagacctcggcgcgagcgggtcggagagcgaggacgagggcgcgcaggccggagctgtccagggtcctgagacgctgcggagtcaggtcagtgggcagcggcggcgcgcggttgacttgcaggagtttttccagggcgcgcgggaggtccagatggtacttgatctccaccgcgccattggtggcgacgtcgatggcttgcagggtcccgtgcccctggggtgtgaccaccgtcccccgtttcttcttgggcggctggggcgacgggggcggtgcctcttccatggttagaagcggcggcgaggacgcgcgccgggcggcaggggcggctcggggcccggaggcaggggcggcaggggcacgtcggcgccgcgcgcgggtaggttctggtactgcgcccggagaagactggcgtgagcgacgacgcgacggttgacgtcctggatctgacgcctctgggtgaaggccacgggacccgtgagtttgaacctgaaagagagttcgacagaatcaatctcggtatcgttgacggcggcctgccgcaggatctcttgcacgtcgcccgagttgtcctggtaggcgatctcggtcatgaactgctcgatctcctcctcttgaaggtctccgcggccggcgcgctccacggtggccgcgaggtcgttggagatgcggcccatgagctgcgagaaggcgttcatgcccgcctcgttccagacgcggctgtagaccacgacgccctcgggatcgcGggcgcgcatgaccacctgggcgaggttgagctccacgtggcgcgtgaagaccgcgtagttgcagaggcgctggtagaggtagttgagcgtggtggcgatgtgctcggtgacgaagaaatacatgatccagcggcggagcggcatctcgctgacgtcgcccagcgcctccaaacgttccatggcctcgtaaaagtccacggcgaagttgaaaaactgggagttgcgcgccgagacggtcaactcctcctccagaagacggatgagctcggcgatggtggcgcgcacctcgcgctcgaaggcccccgggagttcctccacttcctcttcttcctcctccactaacatctcttctacttcctcctcaggcggcagtggtggcgggggagggggcctgcgtcgccggcggcgcacgggcagacggtcgatgaagcgctcgatggtctcgccgcgccggcgtcgcatggtctcggtgacggcgcgcccgtcctcgcggggccgcagcgtgaagacgccgccgcgcatctccaggtggccgggggggtccccgttgggcagggagagggcgctgacgatgcatcttatcaattgccccgtagggactccgcgcaaggacctgagcgtctcgagatccacgggatctgaaaaccgctgaacgaaggcttcgagccagtcgcagtcgcaaggtaggctgagcacggtttcttctggcgggtcatgttggttgggagcggggcgggcgatgctgctggtgatgaagttgaaataggcggttctgagacggcggatggtggcgaggagcaccaggtctttgggcccggcttgctggatgcgcagacggtcggccatgccccaggcgtggtcctgacacctggccaggtccttgtagtagtcctgcatgagccgctccacgggcacctcctcctcgcccgcgcggccgtgcatgcgcgtgagcccgaagccgcgctggggctggacgagcgccaggtcggcgacgacgcgctcggcgaggatggcttgctggatctgggtgagggtggtctggaagtcatcaaagtcgacgaagcggtggtaggctccggtgttgatggtgtaggagcagttggccatgacggaccagttgacggtctggtggcccggacgcacgagctcgtggtacttgaggcgcgagtaggcgcgcgtgtcgaagatgtagtcgttgcaggtgcgcaccaggtactggtagccgatgaggaagtgcggcggcggctggcggtagagcggccatcgctcggtggcgggggcgccgggcgcgaggtcctcgagcatggtgcggtggtagccgtagatgtacctggacatccaggtgatgccggcggcggtggtggaggcgcgcgggaactcgcggacgcggttccagatgttgcgcagcggcaggaagtagttcatggtgggcacggtctggcccgtgaggcgcgcgcagtcgtggatgctctatacgggcaaaaacgaaagcggtcagcggctcgactccgtggcctggaggctaagcgaacgggttgggctgcgcgtgtaccccggttcgaatctcgaatcaggctggagccgcagctaacgtggtattggcactcccgtctcgacccaagcctgcaccaaccctccaggatacggaggcgggtcgttttgcaacttttttttggaggccggatgagactagtaagcgcggaaagcggccgaccgcgatggctcgctgccgtagtctggagaagaatcgccagggttgcgttgcggtgtgccccggttcgaggccggccggattccgcggctaacgagggcgtggctgccccgtcgtttccaagaccccatagccagccgacttctccagttacggagcgagcccctcttttgttttgtttgtttttgccagatgcatcccgtactgcggcagatgcgcccccaccaccctccaccgcaacaacagccccctccacagccggcgcttctgcccccgccccagcagcaacttccagccacgaccgccgcggccgccgtgagcggggctggacagagttatgatcaccagctggccttggaagagggcgaggggctggcgcgcctgggggcgtcgtcgccggagcggcacccgcgcgtgcagatgaaaagggacgctcgcgaggcctacgtgcccaagcagaacctgttcagagacaggagcggcgaggagcccgaggagatgcgcgcggcccggttccacgcggggcgggagctgcggcgcggcctggaccgaaagagggtgctgagggacgaggatttcgaggcggacgagctgacggggatcagccccgcgcgcgcgcacgtggccgcggccaacctggtcacggcgtacgagcagaccgtgaaggaggagagcaacttccaaaaatccttcaacaaccacgtgcgcaccctgatcgcgcgcgaggaggtgaccctgggcctgatgcacctgtgggacctgctggaggccatcgtgcagaaccccaccagcaagccgctgacggcgcagctgttcctggtggtgcagcatagtcgggacaacgaagcgttcagggaggcgctgctgaatatcaccgagcccgagggccgctggctcctggacctggtgaacattctgcagagcatcgtggtgcaggagcgcgggctgccgctgtccgagaagctggcggccatcaacttctcggtgctgagtttgggcaagtactacgctaggaagatctacaagaccccgtacgtgcccatagacaaggaggtgaagatcgacgggttttacatgcgcatgaccctgaaagtgctgaccctgagcgacgatctgggggtgtaccgcaacgacaggatgcaccgtgcggtgagcgccagcaggcggcgcgagctgagcgaccaggagctgatgcatagtctgcagcgggccctgaccggggccgggaccgagggggagagctactttgacatgggcgcggacctgcactggcagcccagccgccgggccttggaggcggcggcaggaccctacgtagaagaggtggacgatgaggtggacgaggagggcgagtacctggaagactgatggcgcgaccgtatttttgctagatgcaacaacaacagccacctcctgatcccgcgatgcgggcggcgctgcagagccagccgtccggcattaactcctcggacgattggacccaggccatgcaacgcatcatggcgctgacgacccgcaaccccgaagcctttagacagcagccccaggccaaccggctctcggccatcctggaggccgtggtgccctcgcgctccaaccccacgcacgagaaggtcctggccatcgtgaacgcgctggtggagaacaaggccatccgcggcgacgaggccggcctggtgtacaacgcgctgctggagcgcgtggcccgctacaacagcaccaacgtgcagaccaacctggaccgcatggtgaccgacgtgcgcgaggccgtggcccagcgcgagcggttccaccgcgagtccaacctgggatccatggtggcgctgaacgccttcctcagcacccagcccgccaacgtgccccggggccaggaggactacaccaacttcatcagcgccctgcgcctgatggtgaccgaggtgccccagagcgaggtgtaccagtccgggccggactacttcttccagaccagtcgccagggcttgcagaccgtgaacctgagccaggctttcaagaacttgcagggcctgtggggcgtgcaggccccggtcggggaccgcgcgacggtgtcgagcctgctgacgccgaactcgcgcctgctgctgctgctggtggcccccttcacggacagcggcagcatcaaccgcaactcgtacctgggctacctgattaacctgtaccgcgaggccatcggccaggcgcacgtggacgagcagacctaccaggagatcacccacgtgagccgcgccctgggccaggacgacccgggcaacctggaagccaccctgaactttttgctgaccaaccggtcgcagaagatcccgccccagtacgcgctcagcaccgaggaggagcgcatcctgcgttacgtgcagcagagcgtgggcctgttcctgatgcaggagggggccacccccagcgccgcgctcgacatgaccgcgcgcaacatggagcccagcatgtacgccagcaaccgcccgttcatcaataaactgatggactacttgcatcgggcggccgccatgaactctgactatttcaccaacgccatcctgaatccccactggctcccgccgccggggttctacacgggcgagtacgacatgcccgaccccaatgacgggttcctgtgggacgatgtggacagcagcgtgttctccccccgaccgggtgctaacgagcgccccttgtggaagaaggaaggcagcgaccgacgcccgtcctcggcgctgtccggccgcgagggtgctgccgcggcggtgcccgaggccgccagtcctttcccgagcttgcccttctcgctgaacagtatccgcagcagcgagctgggcaggatcacgcgcccgcgcttgctgggcgaagaggagtacttgaatgactcgctgttgagacccgagcgggagaagaacttccccaataacgggatagaaagcctggtggacaagatgagccgctggaagacgtatgcgcaggagcacagggacgatccccgggcgtcgcagggggccacgagccggggcagcgccgcccgtaaacgccggtggcacgacaggcagcggggacagatgtgggacgatgaggactccgccgacgacagcagcgtgttggacttgggtgggagtggtaacccgttcgctcacctgcgcccccgtatcgggcgcatgatgtaagagaaaccgaaaataaatgatactcaccaaggccatggcgaccagcgtgcgttcgtttcttctctgttgttgttgtatctagtatgatgaggcgtgcgtacccggagggtcctcctccctcgtacgagagcgtgatgcagcaggcgatggcggcggcggcgatgcagcccccgctggaggctccttacgtgcccccgcggtacctggcgcctacggaggggcggaacagcattcgttactcggagctggcacccttgtacgataccacccggttgtacctggtggacaacaagtcggcggacatcgcctcgctgaactaccagaacgaccacagcaacttcctgaccaccgtggtgcagaacaatgacttcacccccacggaggccagcacccagaccatcaactttgacgagcgctcgcggtggggcggccagctgaaaaccatcatgcacaccaacatgcccaacgtgaacgagttcatgtacagcaacaagttcaaggcgcgggtgatggtctcccgcaagacccccaatggggtgacagtgacagaggattatgatggtagtcaggatgagctgaagtatgaatgggtggaatttgagctgcccgaaggcaacttctcggtgaccatgaccatcgacctgatgaacaacgccatcatcgacaattacttggcggtggggcggcagaacggggtgctggagagcgacatcggcgtgaagttcgacactaggaacttcaggctgggctgggaccccgtgaccgagctggtcatgcccggggtgtacaccaacgaggctttccatcccgatattgtcttgctgcccggctgcggggtggacttcaccgagagccgcctcagcaacctgctgggcattcgcaagaggcagcccttccaggaaggcttccagatcatgtacgaggatctggaggggggcaacatccccgcgctcctggatgtcgacgcctatgagaaaagcaaggaggatgcagcagctgaagcaactgcagccgtagctaccgcctctaccgaggtcaggggcgataattttgcaagcgccgcagcagtggcagcggccgaggcggctgaaaccgaaagtaagatagtcattcagccggtggagaaggatagcaagaacaggagctacaacgtactaccggacaagataaacaccgcctaccgcagctggtacctagcctacaactatggcgaccccgagaagggcgtgcgctcctggacgctgctcaccacctcggacgtcacctgcggcgtggagcaagtctactggtcgctgcccgacatgatgcaagacccggtcaccttccgctccacgcgtcaagttagcaactacccggtggtgggcgccgagctcctgcccgtctactccaagagcttcttcaacgagcaggccgtctactcgcagcagctgcgcgccttcacctcgcttacgcacgtcttcaaccgcttccccgagaaccagatcctcgtccgcccgcccgcgcccaccattaccaccgtcagtgaaaacgttcctgctctcacagatcacgggaccctgccgctgcgcagcagtatccggggagtccagcgcgtgaccgttactgacgccagacgccgcacctgcccctacgtctacaaggccctgggcatagtcgcgccgcgcgtcctctcgagccgcaccttctaaatgtccattctcatctcgcccagtaataacaccggttggggcctgcgcgcgcccagcaagatgtacggaggcgctcgccaacgctccacgcaacaccccgtgcgcgtgcgcgggcacttccgcgctccctggggcgccctcaagggccgcgtgcggtcgcgcaccaccgtcgacgacgtgatcgaccaggtggtggccgacgcgcgcaactacacccccgccgccgcgcccgtctccaccgtggacgccgtcatcgacagcgtggtggcCgacgcgcgccggtacgcccgcgccaagagccggcggcggcgcatcgcccggcggcaccggagcacccccgccatgcgcgcggcgcgagccttgctgcgcagggccaggcgcacgggacgcagggccatgctcagggcggccagacgcgcggcttcaggcgccagcgccggcaggacccggagacgcgcggccacggcggcggcagcggccatcgccagcatgtcccgcccgcggcgagggaacgtgtactgggtgcgcgacgccgccaccggtgtgcgcgtgcccgtgcgcacccgcccccctcgcacttgaagatgttcacttcgcgatgttgatgtgtcccagcggcgaggaggatgtccaagcgcaaattcaaggaagagatgctccaggtcatcgcgcctgagatctacggccctgcggtggtgaaggaggaaagaaagccccgcaaaatcaagcgggtcaaaaaggacaaaaaggaagaagaaagtgatgtggacggattggtggagtttgtgcgcgagttcgccccccggcggcgcgtgcagtggcgcgggcggaaggtgcaaccggtgctgagacccggcaccaccgtggtcttcacgcccggcgagcgctccggcaccgcttccaagcgctcctacgacgaggtgtacggggatgatgatattctggagcaggcggccgagcgcctgggcgagtttgcttacggcaagcgcagccgttccgcaccgaaggaagaggcggtgtccatcccgctggaccacggcaaccccacgccgagcctcaagcccgtgaccttgcagcaggtgctgccgaccgcggcgccgcgccgggggttcaagcgcgagggcgaggatctgtaccccaccatgcagctgatggtgcccaagcgccagaagctggaagacgtgctggagaccatgaaggtggacccggacgtgcagcccgaggtcaaggtgcggcccatcaagcaggtggccccgggcctgggcgtgcagaccgtggacatcaagattcccacggagcccatggaaacgcagaccgagcccatgatcaagcccagcaccagcaccatggaggtgcagacggatccctggatgccatcggctcctagtcgaagaccccggcgcaagtacggcgcggccagcctgctgatgcccaactacgcgctgcatccttccatcatccccacgccgggctaccgcggcacgcgcttctaccgcggtcataccagcagccgccgccgcaagaccaccactcgccgccgccgtcgccgcaccgccgctgcaaccacccctgccgccctggtgcggagagtgtaccgccgcggccgcgcacctctgaccctgccgcgcgcgcgctaccacccgagcatcgccatttaaactttcgccTgctttgcagatcaatggccctcacatgccgccttcgcgttcccattacgggctaccgaggaagaaaaccgcgccgtagaaggctggcggggaacgggatgcgtcgccaccaccaccggcggcggcgcgccatcagcaagcggttggggggaggcttcctgcccgcgctgatccccatcatcgccgcggcgatcggggcgatccccggcattgcttccgtggcggtgcaggcctctcagcgccactgagacacacttggaaacatcttgtaataaaccAatggactctgacgctcctggtcctgtgatgtgttttcgtagacagatggaagacatcaatttttcgtccctggctccgcgacacggcacgcggccgttcatgggcacctggagcgacatcggcaccagccaactgaacgggggcgccttcaattggagcagtctctggagcgggcttaagaatttcgggtccacgcttaaaacctatggcagcaaggcgtggaacagcaccacagggcaggcgctgagggataagctgaaagagcagaacttccagcagaaggtggtcgatgggctcgcctcgggcatcaacggggtggtggacctggccaaccaggccgtgcagcggcagatcaacagccgcctggacccggtgccgcccgccggctccgtggagatgccgcaggtggaggaggagctgcctcccctggacaagcggggcgagaagcgaccccgccccgatgcggaggagacgctgctgacgcacacggacgagccgcccccgtacgaggaggcggtgaaactgggtctgcccaccacgcggcccatcgcgcccctggccaccggggtgctgaaacccgaaaagcccgcgaccctggacttgcctcctccccagccttcccgcccctctacagtggctaagcccctgccgccggtggccgtggcccgcgcgcgacccgggggcaccgcccgccctcatgcgaactggcagagcactctgaacagcatcgtgggtctgggagtgcagagtgtgaagcgccgccgctgctattaaacctaccgtagcgcttaacttgcttgtctgtgtgtgtatgtattatgtcgccgccgccgctgtccaccagaaggaggagtgaagaggcgcgtcgccgagttgcaagatggccaccccatcgatgctgccccagtgggcgtacatgcacatcgccggacaggacgcttcggagtacctgagtccgggtctggtgcagtttgcccgcgccacagacacctacttcagtctggggaacaagtttaggaaccccacggtggcgcccacgcacgatgtgaccaccgaccgcagccagcggctgacgctgcgcttcgtgcccgtggaccgcgaggacaacacctactcgtacaaagtgcgctacacgctggccgtgggcgacaaccgcgtgctggacatggccagcacctactttgacatccgcggcgtgctggatcggggccctagcttcaaaccctactccggcaccgcctacaacagtctggcccccaagggagcacccaacacttgtcagtggacatataaagccgatggtgaaactgccacagaaaaaacctatacatatggaaatgcacccgtgcagggcattaacatcacaaaagatggtattcaacttggaactgacaccgatgatcagccaatctacgcagataaaacctatcagcctgaacctcaagtgggtgatgctgaatggcatgacatcactggtactgatgaaaagtatggaggcagagctcttaagcctgataccaaaatgaagccttgttatggttcttttgccaagcctactaataaagaaggaggtcaggcaaatgtgaaaacaggaacaggcactactaaagaatatgacatagacatggctttctttgacaacagaagtgcggctgctgctggcctagctccagaaattgttttgtatactgaaaatgtggatttggaaactccagatacccatattgtatacaaagcaggcacagatgacagcagctcttctattaatttgggtcagcaagccatgcccaacagacctaactacattggtttcagagacaactttatcgggctcatgtactacaacagcactggcaatatgggggtgctggccggtcaggcttctcagctgaatgctgtggttgacttgcaagacagaaacaccgagctgtcctaccagctcttgcttgactctctgggtgacagaacccggtatttcagtatgtggaatcaggcggtggacagctatgatcctgatgtgcgcattattgaaaatcatggtgtggaggatgaacttcccaactattgtttccctctggatgctgttggcagaacagatacttatcagggaattaaggctaatggaactgatcaaaccacatggaccaaagatgacagtgtcaatgatgctaatgagataggcaagggtaatccattcgccatggaaatcaacatccaagccaacctgtggaggaacttcctctacgccaacgtggccctgtacctgcccgactcttacaagtacacgccggccaatgttaccctgcccaccaacaccaacacctacgattacatgaacggccgggtggtggcgccctcgctggtggactcctacatcaacatcggggcgcgctggtcgctggatcccatggacaacgtgaaccccttcaaccaccaccgcaatgcggggctgcgctaccgctccatgctcctgggcaacgggcgctacgtgcccttccacatccaggtgccccagaaatttttcgccatcaagagcctcctgctcctgcccgggtcctacacctacgagtggaacttccgcaaggacgtcaacatgatcctgcagagctccctcggcaacgacctgcgcacggacggggcctccatctccttcaccagcatcaacctctacgccaccttcttccccatggcgcacaacacggcctccacgctcgaggccatgctgcgcaacgacaccaacgaccagtccttcaacgactacctctcggcggccaacatgctctaccccatcccggccaacgccaccaacgtgcccatctccatcccctcgcgcaactgggccgccttccgcggctggtccttcacgcgtctcaagaccaaggagacgccctcgctgggctccgggttcgacccctacttcgtctactcgggctccatcccctacctcgacggcaccttctacctcaaccacaccttcaagaaggtctccatcaccttcgactcctccgtcagctggcccggcaacgaccggctcctgacgcccaacgagttcgaaatcaagcgcaccgtcgacggcgagggctacaacgtggcccagtgcaacatgaccaaggactggttcctggtccagatgctggcccactacaacatcggctaccagggcttctacgtgcccgagggctacaaggaccgcatgtactccttcttccgcaacttccagcccatgagccgccaggtggtggacgaggtcaactacaaggactaccaggccgtcaccctggcctaccagcacaacaactcgggcttcgtcggctacctcgcgcccaccatgcgccagggccagccctaccccgccaactacccctacccgctcatcggcaagagcgccgtcaccagcgtcacccagaaaaagttcctctgcgacagggtcatgtggcgcatccccttctccagcaacttcatgtccatgggcgcgctcaccgacctcggccagaacatgctctatgccaactccgcccacgcgctagacatgaatttcgaagtcgaccccatggatgagtccacccttctctatgttgtcttcgaagtcttcgacgtcgtccgagtgcaccagccccaccgcggcgtcatcgaggccgtctacctgcgcacccccttctcggccggtaacgccaccacctaagctcttgcttcttgcaagccatggccgcgggctccggcgagcaggagctcagggccatcatccgcgacctgggctgcgggccctacttcctgggcaccttcgataagcgcttcccgggattcatggccccgcacaagctggcctgcgccatcgtcaacacggccggccgcgagaccgggggcgagcactggctggccttcgcctggaacccgcgctcgaacacctgctacctcttcgaccccttcgggttctcggacgagcgcctcaagcagatctaccagttcgagtacgagggcctgctgcgccgcagcgccctggccaccgaggaccgctgcgtcaccctggaaaagtccacccagaccgtgcagggtccgcgctcggccgcctgcgggctcttctgctgcatgttcctgcacgccttcgtgcactggcccgaccgccccatggacaagaaccccaccatgaacttgctgacgggggtgcccaacggcatgctccagtcgccccaggtggaacccaccctgcgccgcaaccaggaggcgctctaccgcttcctcaactcccactccgcctactttcgctcccaccgcgcgcgcatcgagaaggccaccgccttcgaccgcatgaatcaagacatgtaaaccgtgtgtgtatgttaaatgtctttaataaacagcactttcatgttacacatgcatctgagatgatttatttagaaatcgaaagggttctgccgggtctcggcatggcccgcgggcagggacacgttgcggaactggtacttggccagccacttgaactcggggatcagcagtttgggcagcggggtgtcggggaaggagtcggtccacagcttccgcgtcagttgcagggcgcccagcaggtcgggcgcggagatcttgaaatcgcagttgggacccgcgttctgcgcgcgggagttgcggtacacggggttgcagcactggaacaccatcagggccgggtgcttcacgctcgccagcaccgtcgcgtcggtgatgctctccacgtcgaggtcctcggcgttggccatcccgaagggggtcatcttgcaggtctgccttcccatggtgggcacgcacccgggcttgtggttgcaatcgcagtgcagggggatcagcatcatctgggcctggtcggcgttcatccccgggtacatggccttcatgaaagcctccaattgcctgaacgcctgctgggccttggctccctcggtgaagaagaccccgcaggacttgctagagaactggttggtggcgcacccggcgtcgtgcacgcagcagcgcgcgtcgttgttggccagctgcaccacgctgcgcccccagcggttctgggtgatcttggcccggtcggggttctccttcagcgcgcgctgcccgttctcgctcgccacatccatctcgatcatgtgctccttctggatcatggtggtcccgtgcaggcaccgcagcttgccctcggcctcggtgcacccgtgcagccacagcgcgcacccggtgcactcccagttcttgtgggcgatctgggaatgcgcgtgcacgaagccctgcaggaagcggcccatcatggtggtcagggtcttgttgctagtgaaggtcagcggaatgccgcggtgctcctcgttgatgtacaggtggcagatgcggcggtacacctcgccctgctcgggcatcagctggaagttggctttcaggtcggtctccacgcggtagcggtccatcagcatagtcatgatttccatacccttctcccaggccgagacgatgggcaggctcatagggttcttcaccatcatcttagcgctagcagccgcggccagggggtcgctctcgtccagggtctcaaagctccgcttgccgtccttctcggtgatccgcaccggggggtagctgaagcccacggccgccagctcctcctcggcctgtctttcgtcctcgctgtcctggctgacgtcctgcaggaccacatgcttggtcttgcggggtttcttcttgggcggcagcggcggcggagatgttggagatggcgagggggagcgcgagttctcgctcaccactactatctcttcctcttcttggtccgaggccacgcggcggtaggtatgtctcttcgggggcagaggcggaggcgacgggctctcgccgccgcgacttggcggatggctggcagagccccttccgcgttcgggggtgcgctcccggcggcgctctgactgacttcctccgcggccggccattgtgttctcctagggaggaacaacaagcatggagactcagccatcgccaacctcgccatctgcccccaccgccgacgagaagcagcagcagcagaatgaaagcttaaccgccccgccgcccagccccgccacctccgacgcggccgtcccagacatgcaagagatggaggaatccatcgagattgacctgggctatgtgacgcccgcggagcacgaggaggagctggcagtgcgcttttcacaagaagagatacaccaagaacagccagagcaggaagcagagaatgagcagagtcaggctgggctcgagcatgacggcgactacctccacctgagcgggggggaggacgcgctcatcaagcatctggcccggcaggccaccatcgtcaaggatgcgctgctcgaccgcaccgaggtgcccctcagcgtggaggagctcagccgcgcctacgagttgaacctcttctcgccgcgcgtgccccccaagcgccagcccaatggcacctgcgagcccaacccgcgcctcaacttctacccggtcttcgcggtgcccgaggccctggccacctaccacatctttttcaagaaccaaaagatccccgtctcctgccgcgccaaccgcacccgcgccgacgcccttttcaacctgggtcccggcgcccgcctacctgatatcgcctccttggaagaggttcccaagatcttcgagggtctgggcagcgacgagactcgggccgcgaacgctctgcaaggagaaggaggagagcatgagcaccacagcgccctggtcgagttggaaggcgacaacgcgcggctggcggtgctcaaacgcacggtcgagctgacccatttcgcctacccggctctgaacctgccccccaaagtcatgagcgcggtcatggaccaggtgctcatcaagcgcgcgtcgcccatctccgaggacgagggcatgcaagactccgaggagggcaagcccgtggtcagcgacgagcagctggcccggtggctgggtcctaatgctagtccccagagtttggaagagcggcgcaaactcatgatggccgtggtcctggtgaccgtggagctggagtgcctgcgccgcttcttcgccgacgcggagaccctgcgcaaggtcgaggagaacctgcactacctcttcaggcacgggttcgtgcgccaggcctgcaagatctccaacgtggagctgaccaacctggtctcctacatgggcatcttgcacgagaaccgcctggggcagaacgtgctgcacaccaccctgcgcggggaggcccggcgcgactacatccgcgactgcgtctacctctacctctgccacacctggcagacgggcatgggcgtgtggcagcagtgtctggaggagcagaacctgaaagagctctgcaagctcctgcagaagaacctcaagggtctgtggaccgggttcgacgagcgcaccaccgcctcggacctggccgacctcattttccccgagcgcctcaggctgacgctgcgcaacggcctgcccgactttatgagccaaagcatgttgcaaaactttcgctctttcatcctcgaacgctccggaatcctgcccgccacctgctccgcgctgccctcggacttcgtgccgctgaccttccgcgagtgccccccgccgctgtggagccactgctacctgctgcgcctggccaactacctggcctaccactcggacgtgatcgaggacgtcagcggcgagggcctgctcgagtgccactgccgctgcaacctctgcacgccgcaccgctccctggcctgcaacccccagctgctgagcgagacccagatcatcggcaccttcgagttgcaagggcccagcgaaggcgagggttcagccgccaaggggggtctgaaactcaccccggggctgtggacctcggcctacttgcgcaagttcgtgcccgaggactaccatcccttcgagatcaggttctacgaggaccaatcccatccgcccaaggccgagctgtcggcctgcgtcatcacccagggggcgatcctggcccaattgcaagccatccagaaatcccgccaagaattcttgctgaaaaagggccgcggggtctacctcgacccccagaccggtgaggagctcaaccccggcttcccccaggatgccccgaggaaacaagaagctgaaagtggagctgccgcccgtggaggatttggaggaagactgggagaacagcagtcaggcagaggaggaggagatggaggaagactgggacagcactcaggcagaggaggacagcctgcaagacagtctggaggaagacgaggaggaggcagaggaggaggtggaagaagcagccgccgccagaccgtcgtcctcggcgggggagaaagcaagcagcacggataccatctccgctccgggtcggggtcccgctcgaccacacagtagatgggacgagaccggacgattcccgaaccccaccacccagaccggtaagaaggagcggcagggatacaagtcctggcgggggcacaaaaacgccatcgtctcctgcttgcaggcctgcgggggcaacatctccttcacccggcgctacctgctcttccaccgcggggtgaactttccccgcaacatcttgcattactaccgtcacctccacagcccctactacttccaagaagaggcagcagcagcagaaaaagaccagcagaaaaccagcagctagaaaatccacagcggcggcagcaggtggactgaggatcgcggcgaacgagccggcgcaaacccgggagctgaggaaccggatctttcccaccctctatgccatcttccagcagagtcgggggcaggagcaggaactgaaagtcaagaaccgttctctgcgctcgctcacccgcagttgtctgtatcacaagagcgaagaccaacttcagcgcactctcgaggacgccgaggctctcttcaacaagtactgcgcgctcactcttaaagagtagcccgcgcccgcccagtcgcagaaaaaggcgggaattacgtcacctgtgcccttcgccctagccgcctccacccatcatcatgagcaaagagattcccacgccttacatgtggagctaccagccccagatgggcctggccgccggtgccgcccaggactactccacccgcatgaattggctcagcgccgggcccgcgatgatctcacgggtgaatgacatccgcgcccaccgaaaccagatactcctagaacagtcagcgctcaccgccacgccccgcaatcacctcaatccgcgtaattggcccgccgccctggtgtaccaggaaattccccagcccacgaccgtactacttccgcgagacgcccaggccgaagtccagctgactaactcaggtgtccagctggcgggcggcgccaccctgtgtcgtcaccgccccgctcagggtataaagcggctggtgatccggggcagaggcacacagctcaacgacgaggtggtgagctcttcgctgggtctgcgacctgacggagtcttccaactcgccggatcggggagatcttccttcacgcctcgtcaggccgtcctgactttggagagttcgtcctcgcagccccgctcgggtggcatcggcactctccagttcgtggaggagttcactccctcggtctacttcaaccccttctccggctcccccggccactacccggacgagttcatcccgaacttcgacgccatcagcgagtcggtggacggctacgattgaatgtcccatggtggcgcagctgacctagctcggcttcgacacctggaccactgccgccgcttccgctgcttcgctcgggatctcgccgagtttgcctactttgagctgcccgaggagcaccctcagggcccggcccacggagtgcggatcgtcgtcgaagggggcctcgactcccacctgcttcggatcttcagccagcgtccgatcctggtcgagcgcgagcaaggacagacccttctgactctgtactgcatctgcaaccaccccggcctgcatgaaagtctttgttgtctgctgtgtactgagtataataaaagctgagatcagcgactactccggacttccgtgtgtTTAAACtcacccccttatccagtgaaataaagatcatattgatgatgattttacagaaataaaaaataatcatttgatttgaaataaagatacaatcatattgatgatttgagtttaacaaaaaaataaagaatcacttacttgaaatctgataccaggtctctgtccatgttttctgccaacaccacttcactcccctcttcccagctctggtactgcaggccccggcgggctgcaaacttcctccacacgctgaaggggatgtcaaattcctcctgtccctcaatcttcattttatcttctatcagatgtccaaaaagcgcgtccgggtggatgatgacttcgaccccgtctacccctacgatgcagacaacgcaccgaccgtgcccttcatcaacccccccttcgtctcttcagatggattccaagagaagcccctgggggtgttgtccctgcgactggccgaccccgtcaccaccaagaacggggaaatcaccctcaagctgggagagggggtggacctcgattcctcgggaaaactcatctccaacacggccaccaaggccgccgcccctctcagtttttccaacaacaccatttcccttaacatggatcaccccttttacactaaagatggaaaattatccttacaagtttctccaccattaaatatactgagaacaagcattctaaacacactagctttaggttttggatcaggtttaggactccgtggctctgccttggcagtacagttagtctctccacttacatttgatactgatggaaacataaagcttaccttagacagaggtttgcatgttacaacaggagatgcaattgaaagcaacataagctgggctaaaggtttaaaatttgaagatggagccatagcaaccaacattggaaatgggttagagtttggaagcagtagtacagaaacaggtgttgatgatgcttacccaatccaagttaaacttggatctggccttagctttgacagtacaggagccataatggctggtaacaaagaagacgataaactcactttgtggacaacacctgatccatcaccaaactgtcaaatactcgcagaaaatgatgcaaaactaacactttgcttgactaaatgtggtagtcaaatactggccactgtgtcagtcttagttgtaggaagtggaaacctaaaccccattactggcaccgtaagcagtgctcaggtgtttctacgttttgatgcaaacggtgttcttttaacagaacattctacactaaaaaaatactgggggtataggcagggagatagcatagatggcactccatataccaatgctgtaggattcatgcccaatttaaaagcttatccaaagtcacaaagttctactactaaaaataatatagtagggcaagtatacatgaatggagatgtttcaaaacctatgcttctcactataaccctcaatggtactgatgacagcaacagtacatattcaatgtcattttcatacacctggactaatggaagctatgttggagcaacatttggggctaactcttataccttctcatacatcgcccaagaatgaacactgtatcccaccctgcatgccaacccttcccaccccactctgtggaacaaactctgaaacacaaaataaaataaagttcaagtgttttattgattcaacagttttacaggattcgagcagttatttttcctccaccctcccaggacatggaatacaccaccctctccccccgcacagccttgaacatctgaatgccattggtgatggacatgcttttggtctccacgttccacacagtttcagagcgagccagtctcgggtcggtcagggagatgaaaccctccgggcactcccgcatctgcacctcacagctcaacagctgaggattgtcctcggtggtcgggatcacggttatctggaagaagcagaagagcggcggtgggaatcatagtccgcgaacgggatcggccggtggtgtcgcatcaggccccgcagcagtcgctgccgccgccgctccgtcaagctgctgctcagggggtccgggtccagggactccctcagcatgatgcccacggccctcagcatcagtcgtctggtgcggcgggcgcagcagcgcatgcggatctcgctcaggtcgctgcagtacgtgcaacacagaaccaccaggttgttcaacagtccatagttcaacacgctccagccgaaactcatcgcgggaaggatgctacccacgtggccgtcgtaccagatcctcaggtaaatcaagtggtgccccctccagaacacgctgcccacgtacatgatctccttgggcatgtggcggttcaccacctcccggtaccacatcaccctctggttgaacatgcagccccggatgatcctgcggaaccacagggccagcaccgccccgcccgccatgcagcgaagagaccccgggtcccggcaatggcaatggaggacccaccgctcgtacccgtggatcatctgggagctgaacaagtctatgttggcacagcacaggcatatgctcatgcatctcttcagcactctcaactcctcgggggtcaaaaccatatcccagggcacggggaactcttgcaggacagcgaaccccgcagaacagggcaatcctcgcacagaacttacattgtgcatggacagggtatcgcaatcaggcagcaccgggtgatcctccaccagagaagcgcgggtctcggtctcctcacagcgtggtaagggggccggccgatacgggtgatggcgggacgcggctgatcgtgttcgcgaccgtgtcatgatgcagttgctttcggacattttcgtacttgctgtagcagaacctggtccgggcgctgcacaccgatcgccggcggcggtctcggcgcttggaacgctcggtgttgaaattgtaaaacagccactctctcagaccgtgcagcagatctagggcctcaggagtgatgaagatcccatcatgcctgatggctctgatcacatcgaccaccgtggaatgggccagacccagccagatgatgcaattttgttgggtttcggtgacggcgggggagggaagaacaggaagaaccatgattaacttttaatccaaacggtctcggagtacttcaaaatgaagatcgcggagatggcacctctcgcccccgctgtgttggtggaaaataacagccaggtcaaaggtgatacggttctcgagatgttccacggtggcttccagcaaagcctccacgcgcacatccagaaacaagacaatagcgaaagcgggagggttctctaattcctcaatcatcatgttacactcctgcaccatccccagataattttcatttttccagccttgaatgattcgaactagttcCtgaggtaaatccaagccagccatgataaagagctcgcgcagagcgccctccaccggcattcttaagcacaccctcataattccaagatattctgctcctggttcacctgcagcagattgacaagcggaatatcaaaatctctgccgcgatccctgagctcctccctcagcaataactgtaagtactctttcatatcctctccgaaatttttagccataggaccaccaggaataagattagggcaagccacagtacagataaaccgaagtcctccccagtgagcattgccaaatgcaagactgctataagcatgctggctagacccggtgatatcttccagataactggacagaaaatcgcccaggcaatttttaagaaaatcaacaaaagaaaaatcctccaggtggacgtttagagcctcgggaacaacgatgaagtaaatgcaagcggtgcgttccagcatggttagttagctgatctgtagaaaaaacaaaaatgaacattaaaccatgctagcctggcgaacaggtgggtaaatcgttctctccagcaccaggcaggccacggggtctccggcgcgaccctcgtaaaaattgtcgctatgattgaaaaccatcacagagagacgttcccggtggccggcgtgaatgattcgacaagatgaatacacccccggaacattggcgtccgcgagtgaaaaaaagcgcccgaggaagcaataaggcactacaatgctcagtctcaagtccagcaaagcgatgccatgcggatgaagcacaaaattctcaggtgcgtacaaaatgtaattactcccctcctgcacaggcagcaaagcccccgatccctccaggtacacatacaaagcctcagcgtccatagcttaccgagcagcagcacacaacaggcgcaagagtcagagaaaggctgagctctaacctgtccacccgctctctgctcaatatatagcccagatctacactgacgtaaaggccaaagtctaaaaatacccgccaaataatcacacacgcccagcacacgcccagaaaccggtgacacactcaaaaaaatacgcgcacttcctcaaacgcccaaaactgccgtcatttccgggttcccacgctacgtcatcaaaacacgactttcaaattccgtcgaccgttaaaaacgtcacccgccccgcccctaacggtcgcccgtctctcagccaatcagcgccccgcatccccaaattcaaacacctcatttgcatattaacgcgcacaaaaagtttgaggtatattattgatgatgg
SEQ ID NO:5. Плазмида 1103 ORF (цMSLN)
atggctagcctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctg
SEQ ID NO:6. Плазмида 1103, полипептид (цMSLN)
MASLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEAL
SEQ ID NO:7. Плазмида 1027 ORF (MUC1)
atggctagcacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctg
SEQ ID NO:8. Плазмида 1027, полипептид (537 а.к.) (MUC1)
MASTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL
SEQ ID NO:9. Плазмида 1112 ORF (TERT240)
atgggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:10. Плазмида 1112, полипептид (TERT240)
MGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:11. Плазмида 1330 ORF (TERT541)
atggctagcgccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:12. Плазмида 1330, полипептид (TERT541)
MASAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:13. Плазмида 1326 ORF (TERT343)
atggctagcttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:14. Плазмида 1326, полипептид (TERT343)
MASFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:15. Плазмид 1197 ORF (цМUC1)
atggctagcacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctg
SEQ ID NO:16. Плазмида 1197, полипептид) (цМUC1)
MASTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL
SEQ ID NO:17. Плазмида 1316 ORF
atggctagcctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcagaatcttcaacgcccactacgccggctacttcgccgacctgctgatccacgacatcgagacaaaccctggccccacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctg
SEQ ID NO:18. Плазмида 1316, полипептид
MASLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGRIFNAHYAGYFADLLIHDIETNPGPTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL
SEQ ID NO:19. Плазмида 1313 ORF
atggctagcacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcagaatcttcaacgcccactacgccggctacttcgccgacctgctgatccacgacatcgagacaaaccctggccccctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctg
SEQ ID NO:20. Плазмида 1313, полипептид
MASTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGRIFNAHYAGYFADLLIHDIETNPGPLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEAL
SEQ ID NO:21. Плазмида 1159 ORF
atggctagcacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcgccaccaatttcagcctgctgaaacaggccggcgacgtggaagagaaccctggccctctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctg
SEQ ID NO:22. Плазмида 1159, полипептид
MASTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGATNFSLLKQAGDVEENPGPLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEAL
SEQ ID NO:23. Плазмида 1158 ORF
atggctagcctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcgccaccaatttcagcctgctgaaacaggccggcgacgtggaagagaaccctggccctacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctg
SEQ ID NO:24. Плазмида 1158, полипептид
MASLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGATNFSLLKQAGDVEENPGPTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL
SEQ ID NO:25. Плазмида 1269 ORF
atggctagcacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggaggctccggcggaggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:26. Плазмида 1269, полипептид
MASTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGGSGGGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:27. Плазмида 1270 ORF
atggctagcacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:28. Плазмида 1270, полипептид
MASTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGTILSEGATNFSLLKLAGDVELNPGPGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:29. Плазмида 1271 ORF
atggctagcggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggacggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctg
SEQ ID NO:30. Плазмида 1271, полипептид
MASGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILDGSGTILSEGATNFSLLKLAGDVELNPGPTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL
SEQ ID NO:31. Плазмида 1286 ORF
atggctagcacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:32. Плазмида 1286, полипептид
MASTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGTILSEGATNFSLLKLAGDVELNPGPGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:33. Плазмида 1287 ORF
atggctagcggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggacggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctg
SEQ ID NO:34. Плазмида 1287, полипептид
MASGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILDGSGTILSEGATNFSLLKLAGDVELNPGPTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL
SEQ ID NO:35. Плазмида 1272 ORF
atggctagcggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggacggatccggcgagggcagaggcagcctgctgacatgtggcgacgtggaagagaaccctggccccctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctg
SEQ ID NO:36. Плазмида 1272, полипептид
MASGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILDGSGEGRGSLLTCGDVEENPGPLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEAL
SEQ ID NO:37. Плазмида 1273 ORF
atggctagcggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggacggaggctccggcggactggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctg
SEQ ID NO:38. Плазмида 1273, полипептид
MASGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILDGGSGGLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEAL
SEQ ID NO:39. Плазмида 1274 ORF
atggctagcctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcgagggcagaggcagcctgctgacatgtggcgacgtggaagagaaccctggccccggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:40. Плазмида 1274, полипептид
MASLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGEGRGSLLTCGDVEENPGPGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:41. Плазмида 1275 ORF
atggctagcctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggaggctccggcggaggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:42. Плазмида 1275, полипептид
MASLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGGSGGGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO 43. Плазмида 1317 ORF
atggctagcacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcagaatcttcaacgcccactacgccggctacttcgccgacctgctgatccacgacatcgagacaaaccctggccccctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcgagggcagaggcagcctgctgacatgtggcgacgtggaagagaaccctggccccggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO: 44. Плазмида 1317, полипептид
MASTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGRIFNAHYAGYFADLLIHDIETNPGPLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGEGRGSLLTCGDVEENPGPGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:45. Плазмида 1318 ORF
atggctagcacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggacggatccggcgagggcagaggcagcctgctgacatgtggcgacgtggaagagaaccctggccccctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctg
SEQ ID NO:46. Плазмида 1318, полипептид
MASTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGTILSEGATNFSLLKLAGDVELNPGPGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILDGSGEGRGSLLTCGDVEENPGPLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEAL
SEQ ID NO:47. Плазмида 1319 ORF
atggctagcctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcagaatcttcaacgcccactacgccggctacttcgccgacctgctgatccacgacatcgagacaaaccctggccccacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:48. Плазмида 1319, полипептид
MASLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGRIFNAHYAGYFADLLIHDIETNPGPTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGTILSEGATNFSLLKLAGDVELNPGPGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:49. Плазмида 1320 ORF
atggctagcctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcgagggcagaggcagcctgctgacatgtggcgacgtggaagagaaccctggccccggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggacggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctg
SEQ ID NO:50. Плазмида 1320, полипептид
MASLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGEGRGSLLTCGDVEENPGPGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILDGSGTILSEGATNFSLLKLAGDVELNPGPTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL
SEQ ID NO:51. Плазмида 1321 ORF
atggctagcggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggacggatccggcgagggcagaggcagcctgctgacatgtggcgacgtggaagagaaccctggccccctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcagaatcttcaacgcccactacgccggctacttcgccgacctgctgatccacgacatcgagacaaaccctggccccacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctg
SEQ ID NO:52. Плазмида 1321, полипептид
MASGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILDGSGEGRGSLLTCGDVEENPGPLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGRIFNAHYAGYFADLLIHDIETNPGPTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL
SEQ ID NO:53. Плазмида 1322 ORF
atggctagcggagctgccccggagccggagaggacccccgttggccagggatcgtgggcccatccgggacgcaccaggggaccatccgacaggggattctgtgtggtgtcaccggccaggccagcagaagaggcaaccagcctcgagggagcgttgtctggaaccagacattcccacccgtcggtgggccggcagcaccacgcgggaccaccgtccacttccagaccgccacggccatgggacaccccttgcccgcctgtgtatgccgagactaaacacttcctgtactcatccggagacaaggaacagcttcggccgtccttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggacggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcagaatcttcaacgcccactacgccggctacttcgccgacctgctgatccacgacatcgagacaaaccctggccccctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctg
SEQ ID NO:54. Плазмида 1322, полипептид
MASGAAPEPERTPVGQGSWAHPGRTRGPSDRGFCVVSPARPAEEATSLEGALSGTRHSHPSVGRQHHAGPPSTSRPPRPWDTPCPPVYAETKHFLYSSGDKEQLRPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILDGSGTILSEGATNFSLLKLAGDVELNPGPTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGRIFNAHYAGYFADLLIHDIETNPGPLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEAL
SEQ ID NO:55. Плазмида 1351 ORF
atggctagcacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcagaatcttcaacgcccactacgccggctacttcgccgacctgctgatccacgacatcgagacaaaccctggccccctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcgagggcagaggcagcctgctgacatgtggcgacgtggaagagaaccctggccccgccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:56. Плазмида 1351, полипептид
MASTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGRIFNAHYAGYFADLLIHDIETNPGPLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGEGRGSLLTCGDVEENPGPAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:57. Плазмида 1352 ORF
atggctagcctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcagaatcttcaacgcccactacgccggctacttcgccgacctgctgatccacgacatcgagacaaaccctggccccacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctgccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:58. Плазмида 1352, полипептид
MASLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGRIFNAHYAGYFADLLIHDIETNPGPTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGTILSEGATNFSLLKLAGDVELNPGPAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:59. Плазмида 1353 ORF
atggctagcctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcgagggcagaggcagcctgctgacatgtggcgacgtggaagagaaccctggccccgccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggacggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctg
SEQ ID NO:60. Плазмида 1353, полипептид
MASLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGEGRGSLLTCGDVEENPGPAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILDGSGTILSEGATNFSLLKLAGDVELNPGPTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL
SEQ ID NO:61. Плазмида 1354 ORF
atggctagcacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcagaatcttcaacgcccactacgccggctacttcgccgacctgctgatccacgacatcgagacaaaccctggccccctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcgagggcagaggcagcctgctgacatgtggcgacgtggaagagaaccctggccccagcttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:62. Плазмида 1354, полипептид
MASTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGRIFNAHYAGYFADLLIHDIETNPGPLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGEGRGSLLTCGDVEENPGPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:63. Плазмида 1355 ORF
atggctagcctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcagaatcttcaacgcccactacgccggctacttcgccgacctgctgatccacgacatcgagacaaaccctggccccacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctgggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctagcttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggac
SEQ ID NO:64. Плазмида 1355, полипептид
MASLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGRIFNAHYAGYFADLLIHDIETNPGPTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANLGSGTILSEGATNFSLLKLAGDVELNPGPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILD
SEQ ID NO:65. Плазмида 1356 ORF
atggctagcctggctggcgagacaggacaggaagccgctcctctggacggcgtgctggccaaccctcccaatatcagcagcctgagccccagacagctgctgggattcccttgtgccgaggtgtccggcctgagcacagagagagtgcgggaactggctgtggccctggcccagaaaaacgtgaagctgagcaccgagcagctgcggtgcctggcccacagactgtctgagcctcccgaggatctggacgccctgcctctggatctgctgctgttcctgaaccccgacgccttcagcggacctcaggcctgcacccggttcttcagcagaatcaccaaggccaacgtggacctgctgcccagaggcgcccctgagagacagagactgctgcctgctgctctggcctgttggggagtgcggggctctctgctgtctgaagctgatgtgcgggccctgggaggcctggcttgtgatctgcctggaagattcgtggccgagagcgccgaagtgctgctgcctagactggtgtcctgtcccggccctctggaccaggatcagcaggaagctgccagagctgctctgcagggcggaggccctccttatggacctcctagcacttggagcgtgtccaccatggatgccctgaggggcctgctgccagtgctgggccagcctatcatcagatccatcccacagggcatcgtggccgcctggcggcagagaagctctagagatccctcttggcggcagcccgagcggacaatcctgcggcccaggtttcggagagaggtggaaaagaccgcctgcccctctggcaagaaggccagagagatcgacgagagcctgatcttctacaagaagtgggagctggaagcctgcgtggacgccgctctgctggccacccagatggacagagtgaacgccatccccttcacctatgagcagctggacgtgctgaagcacaagctggatgagctgtacccccagggctaccccgagagcgtgatccagcacctgggctacctgtttctgaagatgagccccgaggacatccggaagtggaacgtgaccagcctggaaaccctgaaggccctgctggaagtgaacaagggccacgagatgtccccccaggtggccacactgatcgacagattcgtgaagggcagaggccagctggacaaggacaccctggatacactgaccgccttctaccccggctatctgtgcagcctgtcccccgaggaactgagcagcgtgccacctagctctatctgggctgtgcggccccaggacctggatacctgcgatcctagacagctggatgtgctgtatcccaaggcccggctggccttccagaacatgaacggcagcgagtacttcgtgaagatccagtccttcctgggcggagcccctaccgaggacctgaaagctctgagccagcagaacgtgtccatggatctggccacctttatgaagctgcggaccgacgccgtgctgcctctgacagtggctgaggtgcagaaactgctgggcccccatgtggaagggctgaaggccgaagaacggcacagacccgtgcgcgactggatcctgaggcagagacaggatgacctggacacactgggcctgggactgcaggggggcatccctaatggctacctggtgctggacctgagcatgcaggaagccctgggatccggcgagggcagaggcagcctgctgacatgtggcgacgtggaagagaaccctggccccagcttcctcctgtcgtcgctcagaccgagcctgaccggagcacgcagattggtggaaactatcttccttgggtcacgtccgtggatgccaggtaccccacggcgcctcccgcgcctcccacagagatactggcagatgcggcctctgttcctggaattgctgggaaaccacgctcagtgcccgtacggagtcctgctcaagactcactgccctctgagggcggcggtcactccggcggccggagtgtgcgcacgggagaagccccagggaagcgtggcagctccggaagaggaggacaccgatccgcgccgcctcgtgcaacttctgcgccagcactcctcgccctggcaagtctacgggttcgtccgcgcctgcctgcgccgcctggtgccgcctgggctctggggttcccggcataacgagcgccgcttcctgagaaatactaagaagtttatctcacttggaaaacatgccaagttgtcgctgcaagaactcacgtggaagatgtcagtccgcgattgcgcctggctgcgccgctcgccgggcgtcgggtgtgttccagctgcagaacaccgcctgagagaagaaattctggccaaatttctgcattggctgatgtcagtgtacgtggtcgagctgctgcgctcctttttctacgtcactgagactacctttcaaaagaaccgcctgttcttctaccgcaaatctgtgtggagcaagctgcagtcaatcggcattcgccagcatctgaagagggtgcagctgcgggaactttccgaggcagaagtccgccagcaccgggaggcccggccggcgcttctcacgtcgcgtctgagattcatcccaaagcccgacgggctgaggcctatcgtcaacatggattacgtcgtgggcgctcgcacctttcgccgtgaaaagcgggccgaacgcttgacctcacgggtgaaggccctcttctccgtgctgaactacgagagagcaagacggcctggcctgctgggagcttcggtgctgggactggacgatatccaccgggcttggcggacctttgttctccgggtgagagcccaagaccctccgccggaactgtacttcgtgaaggtggcgatcaccggagcctatgatactattccgcaagatcgactcaccgaagtcatcgcctcgatcatcaaaccgcagaacacttactgcgtcaggcggtacgccgtggtccagaaggccgcgcatggccacgtgagaaaggcgttcaagtcgcacgtgtccactctcaccgacctccagccttacatgaggcaattcgttgcgcatttgcaagagacttcgcccctgagagatgcggtggtcatcgagcagagctccagcctgaacgaagcgagcagcggtctgtttgacgtgttcctccgcttcatgtgtcatcacgcggtgcgaatcaggggaaaatcatacgtgcagtgccagggaatcccacaaggcagcattctgtcgactctcttgtgttccctttgctacggcgatatggaaaacaagctgttcgctgggatcagacgggacgggttgctgctcagactggtggacgacttcctgctggtgactccgcacctcactcacgccaaaacctttctccgcactctggtgaggggagtgccagaatacggctgtgtggtcaatctccggaaaactgtggtgaatttccctgtcgaggatgaggcactcggaggaaccgcatttgtccaaatgccagcacatggcctgttcccatggtgcggtctgctgctggacacccgaactcttgaagtgcagtccgactactccagctatgcccggacgagcatccgcgccagcctcactttcaatcgcggctttaaggccggacgaaacatgcgcagaaagcttttcggagtcctccggcttaaatgccattcgctctttctcgatctccaagtcaattcgctgcagaccgtgtgcacgaacatctacaagatcctgctgctccaagcctaccggttccacgcttgcgtgcttcagctgccgtttcaccaacaggtgtggaagaacccgaccttctttctgcgggtcattagcgatactgcctccctgtgttactcaatcctcaaggcaaagaacgccggaatgtcgctgggtgcgaaaggagccgcgggacctcttcctagcgaagcggtgcagtggctctgccaccaggctttcctcctgaagctgaccaggcacagagtgacctacgtcccgctgctgggctcgctgcgcactgcacagacccagctgtctagaaaactccccggcaccaccctgaccgctctggaagccgccgccaacccagcattgccgtcagatttcaagaccatcttggacggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccctacccctggaacccagagccccttcttccttctgctgctgctgaccgtgctgactgtcgtgacaggctctggccacgccagctctacacctggcggcgagaaagagacaagcgccacccagagaagcagcgtgccaagcagcaccgagaagaacgccgtgtccatgaccagctccgtgctgagcagccactctcctggcagcggcagcagcacaacacagggccaggatgtgacactggcccctgccacagaacctgcctctggatctgccgccacctggggacaggacgtgacaagcgtgccagtgaccagacctgccctgggctctacaacaccccctgcccacgatgtgaccagcgcccctgataacaagcctgcccctggaagcacagcccctccagctcatggcgtgacctctgccccagataccagaccagccccaggatctacagccccacccgcacacggcgtgacaagtgcccctgacacaagacccgctccaggctctactgctcctcctgcccatggcgtgacaagcgctcccgatacaaggccagctcctggctccacagcaccaccagcacatggcgtgacatcagctcccgacactagacctgctcccggatcaaccgctccaccagctcacggcgtgaccagcgcacctgataccagacctgctctgggaagcaccgcccctcccgtgcacaatgtgacatctgcttccggcagcgccagcggctctgcctctacactggtgcacaacggcaccagcgccagagccacaacaaccccagccagcaagagcacccccttcagcatccctagccaccacagcgacacccctaccacactggccagccactccaccaagaccgatgcctctagcacccaccactccagcgtgccccctctgaccagcagcaaccacagcacaagcccccagctgtctaccggcgtctcattcttctttctgtccttccacatcagcaacctgcagttcaacagcagcctggaagatcccagcaccgactactaccaggaactgcagcgggatatcagcgagatgttcctgcaaatctacaagcagggcggcttcctgggcctgagcaacatcaagttcagacccggcagcgtggtggtgcagctgaccctggctttccgggaaggcaccatcaacgtgcacgacgtggaaacccagttcaaccagtacaagaccgaggccgccagccggtacaacctgaccatctccgatgtgtccgtgtccgacgtgcccttcccattctctgcccagtctggcgcaggcgtgccaggatggggaattgctctgctggtgctcgtgtgcgtgctggtggccctggccatcgtgtatctgattgccctggccgtgtgccagtgccggcggaagaattacggccagctggacatcttccccgccagagacacctaccaccccatgagcgagtaccccacataccacacccacggcagatacgtgccacccagctccaccgacagatccccctacgagaaagtgtctgccggcaacggcggcagctccctgagctacacaaatcctgccgtggccgctgcctccgccaacctg
SEQ ID NO:66. Плазмида 1356, полипептид
MASLAGETGQEAAPLDGVLANPPNISSLSPRQLLGFPCAEVSGLSTERVRELAVALAQKNVKLSTEQLRCLAHRLSEPPEDLDALPLDLLLFLNPDAFSGPQACTRFFSRITKANVDLLPRGAPERQRLLPAALACWGVRGSLLSEADVRALGGLACDLPGRFVAESAEVLLPRLVSCPGPLDQDQQEAARAALQGGGPPYGPPSTWSVSTMDALRGLLPVLGQPIIRSIPQGIVAAWRQRSSRDPSWRQPERTILRPRFRREVEKTACPSGKKAREIDESLIFYKKWELEACVDAALLATQMDRVNAIPFTYEQLDVLKHKLDELYPQGYPESVIQHLGYLFLKMSPEDIRKWNVTSLETLKALLEVNKGHEMSPQVATLIDRFVKGRGQLDKDTLDTLTAFYPGYLCSLSPEELSSVPPSSIWAVRPQDLDTCDPRQLDVLYPKARLAFQNMNGSEYFVKIQSFLGGAPTEDLKALSQQNVSMDLATFMKLRTDAVLPLTVAEVQKLLGPHVEGLKAEERHRPVRDWILRQRQDDLDTLGLGLQGGIPNGYLVLDLSMQEALGSGEGRGSLLTCGDVEENPGPSFLLSSLRPSLTGARRLVETIFLGSRPWMPGTPRRLPRLPQRYWQMRPLFLELLGNHAQCPYGVLLKTHCPLRAAVTPAAGVCAREKPQGSVAAPEEEDTDPRRLVQLLRQHSSPWQVYGFVRACLRRLVPPGLWGSRHNERRFLRNTKKFISLGKHAKLSLQELTWKMSVRDCAWLRRSPGVGCVPAAEHRLREEILAKFLHWLMSVYVVELLRSFFYVTETTFQKNRLFFYRKSVWSKLQSIGIRQHLKRVQLRELSEAEVRQHREARPALLTSRLRFIPKPDGLRPIVNMDYVVGARTFRREKRAERLTSRVKALFSVLNYERARRPGLLGASVLGLDDIHRAWRTFVLRVRAQDPPPELYFVKVAITGAYDTIPQDRLTEVIASIIKPQNTYCVRRYAVVQKAAHGHVRKAFKSHVSTLTDLQPYMRQFVAHLQETSPLRDAVVIEQSSSLNEASSGLFDVFLRFMCHHAVRIRGKSYVQCQGIPQGSILSTLLCSLCYGDMENKLFAGIRRDGLLLRLVDDFLLVTPHLTHAKTFLRTLVRGVPEYGCVVNLRKTVVNFPVEDEALGGTAFVQMPAHGLFPWCGLLLDTRTLEVQSDYSSYARTSIRASLTFNRGFKAGRNMRRKLFGVLRLKCHSLFLDLQVNSLQTVCTNIYKILLLQAYRFHACVLQLPFHQQVWKNPTFFLRVISDTASLCYSILKAKNAGMSLGAKGAAGPLPSEAVQWLCHQAFLLKLTRHRVTYVPLLGSLRTAQTQLSRKLPGTTLTALEAAANPALPSDFKTILDGSGTILSEGATNFSLLKLAGDVELNPGPTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPVTRPALGSTTPPAHDVTSAPDNKPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPALGSTAPPVHNVTSASGSASGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL
ПЕПТИДЫ 2A (SEQ ID NO:67-74):
Все пептиды 2A начинаются с глицин-серин-глицин (GSG) линкера, кодирующимся последовательностью нуклеиновой кислоты GGATCCGGC.
SEQ ID NO:67. Вирус энцефаломиокардита (EMCV) 2А, нуклеотидная последовательность:
ggatccggcagaatcttcaacgcccactacgccggctacttcgccgacctgctgatccacgacatcgagacaaaccctggcccc
SEQ ID NO:68. Вирус энцефаломиокардита (EMCV) 2A, аминокислотная последовательность:
GSGRIFNAHYAGYFADLLIHDIETNPGP
SEQ ID NO:69. Вирус Thosea Asigna (TAV) 2A, нуклеотидная последовательность:
ggatccggcgagggcagaggcagcctgctgacatgtggcgacgtggaagagaaccctggcccc
SEQ ID NO:70. Вирус Thosea Asigna (TAV) 2A, аминокислотная последовательность:
GSGEGRGSLLTCGDVEENPGP
SEQ ID NO:71. Вирус В ринита лошадей (ERBV) 2A, нуклеотидная последовательность:
ggatccggcacaatcctgtctgagggcgccaccaacttcagcctgctgaaactggccggcgacgtggaactgaaccctggccct
SEQ ID NO:72. Вирус В ринита лошадей (ERBV) 2A, аминокислотная последовательность:
GSGTILSEGATNFSLLKLAGDVELNPGP
SEQ ID NO:73. Свиной тошевирус (PTV) 2A, нуклеотидная последовательность:
ggatccggcgccaccaatttcagcctgctgaaacaggccggcgacgtggaagagaaccctggccct
SEQ ID NO:74. Свиной тошевирус (PTV) 2A, аминокислотная последовательность:
GSGATNFSLLKQAGDVEENPGP
Праймеры, использованные для конструирования плазмид, описанных в Примерах
--->
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> Pfizer Inc
<120> Противораковые вакцины
<130> PC71855A
<150> US 62/280,636
<151> 2016-01-19
<150> US 62/419,190
<151> 2016-11-08
<160> 621
<170> PatentIn version 3.5
<210> 1
<211> 1255
<212> Белок
<213> Homo sapiens
<400> 1
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His
50 55 60
Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu
65 70 75 80
Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln
85 90 95
Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr
100 105 110
Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro
115 120 125
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
130 135 140
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
145 150 155 160
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
165 170 175
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
180 185 190
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
195 200 205
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
210 215 220
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
225 230 235 240
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
245 250 255
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
260 265 270
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
275 280 285
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
290 295 300
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
305 310 315 320
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
325 330 335
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
340 345 350
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
355 360 365
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
370 375 380
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
385 390 395 400
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
405 410 415
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
420 425 430
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
435 440 445
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
450 455 460
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
465 470 475 480
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
485 490 495
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
500 505 510
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
515 520 525
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
530 535 540
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
545 550 555 560
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
565 570 575
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
580 585 590
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
595 600 605
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
610 615 620
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
625 630 635 640
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
645 650 655
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
660 665 670
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
675 680 685
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
690 695 700
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
705 710 715 720
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
725 730 735
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
740 745 750
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
755 760 765
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
770 775 780
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
785 790 795 800
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
805 810 815
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
820 825 830
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
835 840 845
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
850 855 860
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
865 870 875 880
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
885 890 895
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
900 905 910
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
915 920 925
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Asn
930 935 940
Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser
945 950 955 960
Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly
965 970 975
Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe
980 985 990
Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His
995 1000 1005
Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro
1010 1015 1020
Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr
1025 1030 1035
Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln
1040 1045 1050
Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu
1055 1060 1065
Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln
1070 1075 1080
Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser
1085 1090 1095
Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn
1100 1105 1110
Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala
1115 1120 1125
Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp
1130 1135 1140
Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly
1145 1150 1155
Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu
1160 1165 1170
Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg
1175 1180 1185
Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg Asp Thr Tyr
1190 1195 1200
His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg Tyr
1205 1210 1215
Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val Ser
1220 1225 1230
Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val
1235 1240 1245
Ala Ala Thr Ser Ala Asn Leu
1250 1255
<210> 2
<211> 622
<212> Белок
<213> Homo sapiens
<400> 2
Met Ala Leu Pro Thr Ala Arg Pro Leu Leu Gly Ser Cys Gly Thr Pro
1 5 10 15
Ala Leu Gly Ser Leu Leu Phe Leu Leu Phe Ser Leu Gly Trp Val Gln
20 25 30
Pro Ser Arg Thr Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu
35 40 45
Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg
50 55 60
Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu
65 70 75 80
Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu
85 90 95
Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro
100 105 110
Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro
115 120 125
Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile
130 135 140
Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln
145 150 155 160
Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu
165 170 175
Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu
180 185 190
Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu
195 200 205
Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg
210 215 220
Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp
225 230 235 240
Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly
245 250 255
Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg
260 265 270
Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile
275 280 285
Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser
290 295 300
Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys
305 310 315 320
Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met
325 330 335
Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu
340 345 350
Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val
355 360 365
Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile
370 375 380
Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu
385 390 395 400
Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp
405 410 415
Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr
420 425 430
Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu
435 440 445
Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp
450 455 460
Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala
465 470 475 480
Arg Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile
485 490 495
Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser
500 505 510
Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr
515 520 525
Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly
530 535 540
Pro His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg
545 550 555 560
Asp Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu
565 570 575
Gly Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser
580 585 590
Met Gln Glu Ala Leu Ser Gly Thr Pro Cys Leu Leu Gly Pro Gly Pro
595 600 605
Val Leu Thr Val Leu Ala Leu Leu Leu Ala Ser Thr Leu Ala
610 615 620
<210> 3
<211> 1132
<212> Белок
<213> Homo sapiens
<400> 3
Met Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser Leu Leu Arg Ser
1 5 10 15
His Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val Arg Arg Leu Gly
20 25 30
Pro Gln Gly Trp Arg Leu Val Gln Arg Gly Asp Pro Ala Ala Phe Arg
35 40 45
Ala Leu Val Ala Gln Cys Leu Val Cys Val Pro Trp Asp Ala Arg Pro
50 55 60
Pro Pro Ala Ala Pro Ser Phe Arg Gln Val Ser Cys Leu Lys Glu Leu
65 70 75 80
Val Ala Arg Val Leu Gln Arg Leu Cys Glu Arg Gly Ala Lys Asn Val
85 90 95
Leu Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg Gly Gly Pro Pro
100 105 110
Glu Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro Asn Thr Val Thr
115 120 125
Asp Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu Leu Arg Arg Val
130 135 140
Gly Asp Asp Val Leu Val His Leu Leu Ala Arg Cys Ala Leu Phe Val
145 150 155 160
Leu Val Ala Pro Ser Cys Ala Tyr Gln Val Cys Gly Pro Pro Leu Tyr
165 170 175
Gln Leu Gly Ala Ala Thr Gln Ala Arg Pro Pro Pro His Ala Ser Gly
180 185 190
Pro Arg Arg Arg Leu Gly Cys Glu Arg Ala Trp Asn His Ser Val Arg
195 200 205
Glu Ala Gly Val Pro Leu Gly Leu Pro Ala Pro Gly Ala Arg Arg Arg
210 215 220
Gly Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys Arg Pro Arg Arg
225 230 235 240
Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser Trp
245 250 255
Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val
260 265 270
Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala
275 280 285
Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His His
290 295 300
Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro
305 310 315 320
Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser Gly
325 330 335
Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro
340 345 350
Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser
355 360 365
Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln
370 375 380
Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His
385 390 395 400
Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg
405 410 415
Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gln
420 425 430
Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu
435 440 445
Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe
450 455 460
Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser
465 470 475 480
Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser
485 490 495
Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met
500 505 510
Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys
515 520 525
Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe
530 535 540
Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe
545 550 555 560
Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr
565 570 575
Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His
580 585 590
Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln
595 600 605
His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile
610 615 620
Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val
625 630 635 640
Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser
645 650 655
Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg
660 665 670
Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg
675 680 685
Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro
690 695 700
Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile
705 710 715 720
Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln
725 730 735
Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His
740 745 750
Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp
755 760 765
Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser
770 775 780
Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu
785 790 795 800
Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His
805 810 815
Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro
820 825 830
Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp
835 840 845
Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu
850 855 860
Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala
865 870 875 880
Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys
885 890 895
Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu
900 905 910
Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe
915 920 925
Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser
930 935 940
Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe
945 950 955 960
Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly
965 970 975
Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn
980 985 990
Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln
995 1000 1005
Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln
1010 1015 1020
Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp
1025 1030 1035
Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly
1040 1045 1050
Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu
1055 1060 1065
Ala Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr
1070 1075 1080
Arg His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr
1085 1090 1095
Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr
1100 1105 1110
Ala Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys
1115 1120 1125
Thr Ile Leu Asp
1130
<210> 4
<211> 30252
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 4
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttactactg taatagtaat caattacggg 480
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 540
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 600
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 660
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 720
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 780
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 840
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 900
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 960
cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1020
tgtccctatc agtgatagag atctccctat cagtgataga gagtttagtg aaccgtcaga 1080
tccgctaggg taccgcgatc gcacctcgag ctgatcataa tcagccatac cacatttgta 1140
gaggttttac ttgctttaaa aaacctccca cacctccccc tgaacctgaa acataaaatg 1200
aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa ataaagcaat 1260
agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc 1320
aaactcatca atgtatctta ccaggtgccg agcctgcgag tgcggaggga agcatgccag 1380
gttccagccc gtgtgtgtgg atgtgacgga ggacctgcga cccgatcatt tggtgttgcc 1440
ctgcaccggg acggagttcg gttccagcgg ggaagaatct gactagagtg agtagtgttc 1500
tggggcgggg gaggacctgc atgagggcca gaataactga aatctgtgct tttctgtgtg 1560
ttgcagcagc atgagcggaa gcggctcctt tgagggaggg gtattcagcc cttatctgac 1620
ggggcgtctc ccctcctggg cgggagtgcg tcagaatgtg atgggatcca cggtggacgg 1680
ccggcccgtg cagcccgcga actcttcaac cctgacctat gcaaccctga gctcttcgtc 1740
gttggacgca gctgccgccg cagctgctgc atctgccgcc agcgccgtgc gcggaatggc 1800
catgggcgcc ggctactacg gcactctggt ggccaactcg agttccacca ataatcccgc 1860
cagcctgaac gaggagaagc tgttgctgct gatggcccag ctcgaggcct tgacccagcg 1920
cctgggcgag ctgacccagc aggtggctca gctgcaggag cagacgcggg ccgcggttgc 1980
cacggtgaaa tccaaataaa aaatgaatca ataaataaac ggagacggtt gttgatttta 2040
acacagagtc tgaatcttta tttgattttt cgcgcgcggt aggccctgga ccaccggtct 2100
cgatcattga gcacccggtg gatcttttcc aggacccggt agaggtgggc ttggatgttg 2160
aggtacatgg gcatgagccc gtcccggggg tggaggtagc tccattgcag ggcctcgtgc 2220
tcgggggtgg tgttgtaaat cacccagtca tagcaggggc gcagggcatg gtgttgcaca 2280
atatctttga ggaggagact gatggccacg ggcagccctt tggtgtaggt gtttacaaat 2340
ctgttgagct gggagggatg catgcggggg gagatgaggt gcatcttggc ctggatcttg 2400
agattggcga tgttaccgcc cagatcccgc ctggggttca tgttgtgcag gaccaccagc 2460
acggtgtatc cggtgcactt ggggaattta tcatgcaact tggaagggaa ggcgtgaaag 2520
aatttggcga cgcctttgtg cccgcccagg ttttccatgc actcatccat gatgatggcg 2580
atgggcccgt gggcggcggc ctgggcaaag acgtttcggg ggtcggacac atcatagttg 2640
tggtcctggg tgaggtcatc ataggccatt ttaatgaatt tggggcggag ggtgccggac 2700
tgggggacaa aggtaccctc gatcccgggg gcgtagttcc cctcacagat ctgcatctcc 2760
caggctttga gctcggaggg ggggatcatg tccacctgcg gggcgataaa gaacacggtt 2820
tccggggcgg gggagatgag ctgggccgaa agcaagttcc ggagcagctg ggacttgccg 2880
cagccggtgg ggccgtagat gaccccgatg accggctgca ggtggtagtt gagggagaga 2940
cagctgccgt cctcccggag gaggggggcc acctcgttca tcatctcgcg cacgtgcatg 3000
ttctcgcgca ccagttccgc caggaggcgc tctcccccca gggataggag ctcctggagc 3060
gaggcgaagt ttttcagcgg cttgagtccg tcggccatgg gcattttgga gagggtttgt 3120
tgcaagagtt ccaggcggtc ccagagctcg gtgatgtgct ctacggcatc tcgatccagc 3180
agacctcctc gtttcgcggg ttgggacggc tgcgggagta gggcaccaga cgatgggcgt 3240
ccagcgcagc cagggtccgg tccttccagg gtcgcagcgt ccgcgtcagg gtggtctccg 3300
tcacggtgaa ggggtgcgcg ccgggctggg cgcttgcgag ggtgcgcttc aggctcatcc 3360
ggctggtcga aaaccgctcc cgatcggcgc cctgcgcgtc ggccaggtag caattgacca 3420
tgagttcgta gttgagcgcc tcggccgcgt ggcctttggc gcggagctta cctttggaag 3480
tctgcccgca ggcgggacag aggagggact tgagggcgta gagcttgggg gcgaggaaga 3540
cggactcggg ggcgtaggcg tccgcgccgc agtgggcgca gacggtctcg cactccacga 3600
gccaggtgag gtcgggctgg tcggggtcaa aaaccagttt cccgccgttc tttttgatgc 3660
gtttcttacc tttggtctcc atgagctcgt gtccccgctg ggtgacaaag aggctgtccg 3720
tgtccccgta gaccgacttt atgggccggt cctcgagcgg tgtgccgcgg tcctcctcgt 3780
agaggaaccc cgcccactcc gagacgaaag cccgggtcca ggccagcacg aaggaggcca 3840
cgtgggacgg gtagcggtcg ttgtccacca gcgggtccac cttttccagg gtatgcaaac 3900
acatgtcccc ctcgtccaca tccaggaagg tgattggctt gtaagtgtag gccacgtgac 3960
cgggggtccc ggccgggggg gtataaaagg gtgcgggtcc ctgctcgtcc tcactgtctt 4020
ccggatcgct gtccaggagc gccagctgtt ggggtaggta ttccctctcg aaggcgggca 4080
tgacctcggc actcaggttg tcagtttcta gaaacgagga ggatttgata ttgacggtgc 4140
cggcggagat gcctttcaag agcccctcgt ccatctggtc agaaaagacg atctttttgt 4200
tgtcgagctt ggtggcgaag gagccgtaga gggcgttgga gaggagcttg gcgatggagc 4260
gcatggtctg gtttttttcc ttgtcggcgc gctccttggc ggcgatgttg agctgcacgt 4320
actcgcgcgc cacgcacttc cattcgggga agacggtggt cagctcgtcg ggcacgattc 4380
tgacctgcca gccccgatta tgcagggtga tgaggtccac actggtggcc acctcgccgc 4440
gcaggggctc attagtccag cagaggcgtc cgcccttgcg cgagcagaag gggggcaggg 4500
ggtccagcat gacctcgtcg ggggggtcgg catcgatggt gaagatgccg ggcaggaggt 4560
cggggtcaaa gtagctgatg gaagtggcca gatcgtccag ggcagcttgc cattcgcgca 4620
cggccagcgc gcgctcgtag ggactgaggg gcgtgcccca gggcatggga tgggtaagcg 4680
cggaggcgta catgccgcag atgtcgtaga cgtagagggg ctcctcgagg atgccgatgt 4740
aggtggggta gcagcgcccc ccgcggatgc tggcgcgcac gtagtcatac agctcgtgcg 4800
agggggcgag gagccccggg cccaggttgg tgcgactggg cttttcggcg cggtagacga 4860
tctggcggaa aatggcatgc gagttggagg agatggtggg cctttggaag atgttgaagt 4920
gggcgtgggg cagtccgacc gagtcgcgga tgaagtgggc gtaggagtct tgcagcttgg 4980
cgacgagctc ggcggtgact aggacgtcca gagcgcagta gtcgagggtc tcctggatga 5040
tgtcatactt gagctgtccc ttttgtttcc acagctcgcg gttgagaagg aactcttcgc 5100
ggtccttcca gtactcttcg agggggaacc cgtcctgatc tgcacggtaa gagcctagca 5160
tgtagaactg gttgacggcc ttgtaggcgc agcagccctt ctccacgggg agggcgtagg 5220
cctgggcggc cttgcgcagg gaggtgtgcg tgagggcgaa agtgtccctg accatgacct 5280
tgaggaactg gtgcttgaag tcgatatcgt cgcagccccc ctgctcccag agctggaagt 5340
ccgtgcgctt cttgtaggcg gggttgggca aagcgaaagt aacatcgttg aagaggatct 5400
tgcccgcgcg gggcataaag ttgcgagtga tgcggaaagg ttggggcacc tcggcccggt 5460
tgttgatgac ctgggcggcg agcacgatct cgtcgaagcc gttgatgttg tggcccacga 5520
tgtagagttc cacgaatcgc ggacggccct tgacgtgggg cagtttcttg agctcctcgt 5580
aggtgagctc gtcggggtcg ctgagcccgt gctgctcgag cgcccagtcg gcgagatggg 5640
ggttggcgcg gaggaaggaa gtccagagat ccacggccag ggcggtttgc agacggtccc 5700
ggtactgacg gaactgctgc ccgacggcca ttttttcggg ggtgacgcag tagaaggtgc 5760
gggggtcccc gtgccagcga tcccatttga gctggagggc gagatcgagg gcgagctcga 5820
cgagccggtc gtccccggag agtttcatga ccagcatgaa ggggacgagc tgcttgccga 5880
aggaccccat ccaggtgtag gtttccacat cgtaggtgag gaagagcctt tcggtgcgag 5940
gatgcgagcc gatggggaag aactggatct cctgccacca attggaggaa tggctgttga 6000
tgtgatggaa gtagaaatgc cgacggcgcg ccgaacactc gtgcttgtgt ttatacaagc 6060
ggccacagtg ctcgcaacgc tgcacgggat gcacgtgctg cacgagctgt acctgagttc 6120
ctttgacgag gaatttcagt gggaagtgga gtcgtggcgc ctgcatctcg tgctgtacta 6180
cgtcgtggtg gtcggcctgg ccctcttctg cctcgatggt ggtcatgctg acgagcccgc 6240
gcgggaggca ggtccagacc tcggcgcgag cgggtcggag agcgaggacg agggcgcgca 6300
ggccggagct gtccagggtc ctgagacgct gcggagtcag gtcagtgggc agcggcggcg 6360
cgcggttgac ttgcaggagt ttttccaggg cgcgcgggag gtccagatgg tacttgatct 6420
ccaccgcgcc attggtggcg acgtcgatgg cttgcagggt cccgtgcccc tggggtgtga 6480
ccaccgtccc ccgtttcttc ttgggcggct ggggcgacgg gggcggtgcc tcttccatgg 6540
ttagaagcgg cggcgaggac gcgcgccggg cggcaggggc ggctcggggc ccggaggcag 6600
gggcggcagg ggcacgtcgg cgccgcgcgc gggtaggttc tggtactgcg cccggagaag 6660
actggcgtga gcgacgacgc gacggttgac gtcctggatc tgacgcctct gggtgaaggc 6720
cacgggaccc gtgagtttga acctgaaaga gagttcgaca gaatcaatct cggtatcgtt 6780
gacggcggcc tgccgcagga tctcttgcac gtcgcccgag ttgtcctggt aggcgatctc 6840
ggtcatgaac tgctcgatct cctcctcttg aaggtctccg cggccggcgc gctccacggt 6900
ggccgcgagg tcgttggaga tgcggcccat gagctgcgag aaggcgttca tgcccgcctc 6960
gttccagacg cggctgtaga ccacgacgcc ctcgggatcg cgggcgcgca tgaccacctg 7020
ggcgaggttg agctccacgt ggcgcgtgaa gaccgcgtag ttgcagaggc gctggtagag 7080
gtagttgagc gtggtggcga tgtgctcggt gacgaagaaa tacatgatcc agcggcggag 7140
cggcatctcg ctgacgtcgc ccagcgcctc caaacgttcc atggcctcgt aaaagtccac 7200
ggcgaagttg aaaaactggg agttgcgcgc cgagacggtc aactcctcct ccagaagacg 7260
gatgagctcg gcgatggtgg cgcgcacctc gcgctcgaag gcccccggga gttcctccac 7320
ttcctcttct tcctcctcca ctaacatctc ttctacttcc tcctcaggcg gcagtggtgg 7380
cgggggaggg ggcctgcgtc gccggcggcg cacgggcaga cggtcgatga agcgctcgat 7440
ggtctcgccg cgccggcgtc gcatggtctc ggtgacggcg cgcccgtcct cgcggggccg 7500
cagcgtgaag acgccgccgc gcatctccag gtggccgggg gggtccccgt tgggcaggga 7560
gagggcgctg acgatgcatc ttatcaattg ccccgtaggg actccgcgca aggacctgag 7620
cgtctcgaga tccacgggat ctgaaaaccg ctgaacgaag gcttcgagcc agtcgcagtc 7680
gcaaggtagg ctgagcacgg tttcttctgg cgggtcatgt tggttgggag cggggcgggc 7740
gatgctgctg gtgatgaagt tgaaataggc ggttctgaga cggcggatgg tggcgaggag 7800
caccaggtct ttgggcccgg cttgctggat gcgcagacgg tcggccatgc cccaggcgtg 7860
gtcctgacac ctggccaggt ccttgtagta gtcctgcatg agccgctcca cgggcacctc 7920
ctcctcgccc gcgcggccgt gcatgcgcgt gagcccgaag ccgcgctggg gctggacgag 7980
cgccaggtcg gcgacgacgc gctcggcgag gatggcttgc tggatctggg tgagggtggt 8040
ctggaagtca tcaaagtcga cgaagcggtg gtaggctccg gtgttgatgg tgtaggagca 8100
gttggccatg acggaccagt tgacggtctg gtggcccgga cgcacgagct cgtggtactt 8160
gaggcgcgag taggcgcgcg tgtcgaagat gtagtcgttg caggtgcgca ccaggtactg 8220
gtagccgatg aggaagtgcg gcggcggctg gcggtagagc ggccatcgct cggtggcggg 8280
ggcgccgggc gcgaggtcct cgagcatggt gcggtggtag ccgtagatgt acctggacat 8340
ccaggtgatg ccggcggcgg tggtggaggc gcgcgggaac tcgcggacgc ggttccagat 8400
gttgcgcagc ggcaggaagt agttcatggt gggcacggtc tggcccgtga ggcgcgcgca 8460
gtcgtggatg ctctatacgg gcaaaaacga aagcggtcag cggctcgact ccgtggcctg 8520
gaggctaagc gaacgggttg ggctgcgcgt gtaccccggt tcgaatctcg aatcaggctg 8580
gagccgcagc taacgtggta ttggcactcc cgtctcgacc caagcctgca ccaaccctcc 8640
aggatacgga ggcgggtcgt tttgcaactt ttttttggag gccggatgag actagtaagc 8700
gcggaaagcg gccgaccgcg atggctcgct gccgtagtct ggagaagaat cgccagggtt 8760
gcgttgcggt gtgccccggt tcgaggccgg ccggattccg cggctaacga gggcgtggct 8820
gccccgtcgt ttccaagacc ccatagccag ccgacttctc cagttacgga gcgagcccct 8880
cttttgtttt gtttgttttt gccagatgca tcccgtactg cggcagatgc gcccccacca 8940
ccctccaccg caacaacagc cccctccaca gccggcgctt ctgcccccgc cccagcagca 9000
acttccagcc acgaccgccg cggccgccgt gagcggggct ggacagagtt atgatcacca 9060
gctggccttg gaagagggcg aggggctggc gcgcctgggg gcgtcgtcgc cggagcggca 9120
cccgcgcgtg cagatgaaaa gggacgctcg cgaggcctac gtgcccaagc agaacctgtt 9180
cagagacagg agcggcgagg agcccgagga gatgcgcgcg gcccggttcc acgcggggcg 9240
ggagctgcgg cgcggcctgg accgaaagag ggtgctgagg gacgaggatt tcgaggcgga 9300
cgagctgacg gggatcagcc ccgcgcgcgc gcacgtggcc gcggccaacc tggtcacggc 9360
gtacgagcag accgtgaagg aggagagcaa cttccaaaaa tccttcaaca accacgtgcg 9420
caccctgatc gcgcgcgagg aggtgaccct gggcctgatg cacctgtggg acctgctgga 9480
ggccatcgtg cagaacccca ccagcaagcc gctgacggcg cagctgttcc tggtggtgca 9540
gcatagtcgg gacaacgaag cgttcaggga ggcgctgctg aatatcaccg agcccgaggg 9600
ccgctggctc ctggacctgg tgaacattct gcagagcatc gtggtgcagg agcgcgggct 9660
gccgctgtcc gagaagctgg cggccatcaa cttctcggtg ctgagtttgg gcaagtacta 9720
cgctaggaag atctacaaga ccccgtacgt gcccatagac aaggaggtga agatcgacgg 9780
gttttacatg cgcatgaccc tgaaagtgct gaccctgagc gacgatctgg gggtgtaccg 9840
caacgacagg atgcaccgtg cggtgagcgc cagcaggcgg cgcgagctga gcgaccagga 9900
gctgatgcat agtctgcagc gggccctgac cggggccggg accgaggggg agagctactt 9960
tgacatgggc gcggacctgc actggcagcc cagccgccgg gccttggagg cggcggcagg 10020
accctacgta gaagaggtgg acgatgaggt ggacgaggag ggcgagtacc tggaagactg 10080
atggcgcgac cgtatttttg ctagatgcaa caacaacagc cacctcctga tcccgcgatg 10140
cgggcggcgc tgcagagcca gccgtccggc attaactcct cggacgattg gacccaggcc 10200
atgcaacgca tcatggcgct gacgacccgc aaccccgaag cctttagaca gcagccccag 10260
gccaaccggc tctcggccat cctggaggcc gtggtgccct cgcgctccaa ccccacgcac 10320
gagaaggtcc tggccatcgt gaacgcgctg gtggagaaca aggccatccg cggcgacgag 10380
gccggcctgg tgtacaacgc gctgctggag cgcgtggccc gctacaacag caccaacgtg 10440
cagaccaacc tggaccgcat ggtgaccgac gtgcgcgagg ccgtggccca gcgcgagcgg 10500
ttccaccgcg agtccaacct gggatccatg gtggcgctga acgccttcct cagcacccag 10560
cccgccaacg tgccccgggg ccaggaggac tacaccaact tcatcagcgc cctgcgcctg 10620
atggtgaccg aggtgcccca gagcgaggtg taccagtccg ggccggacta cttcttccag 10680
accagtcgcc agggcttgca gaccgtgaac ctgagccagg ctttcaagaa cttgcagggc 10740
ctgtggggcg tgcaggcccc ggtcggggac cgcgcgacgg tgtcgagcct gctgacgccg 10800
aactcgcgcc tgctgctgct gctggtggcc cccttcacgg acagcggcag catcaaccgc 10860
aactcgtacc tgggctacct gattaacctg taccgcgagg ccatcggcca ggcgcacgtg 10920
gacgagcaga cctaccagga gatcacccac gtgagccgcg ccctgggcca ggacgacccg 10980
ggcaacctgg aagccaccct gaactttttg ctgaccaacc ggtcgcagaa gatcccgccc 11040
cagtacgcgc tcagcaccga ggaggagcgc atcctgcgtt acgtgcagca gagcgtgggc 11100
ctgttcctga tgcaggaggg ggccaccccc agcgccgcgc tcgacatgac cgcgcgcaac 11160
atggagccca gcatgtacgc cagcaaccgc ccgttcatca ataaactgat ggactacttg 11220
catcgggcgg ccgccatgaa ctctgactat ttcaccaacg ccatcctgaa tccccactgg 11280
ctcccgccgc cggggttcta cacgggcgag tacgacatgc ccgaccccaa tgacgggttc 11340
ctgtgggacg atgtggacag cagcgtgttc tccccccgac cgggtgctaa cgagcgcccc 11400
ttgtggaaga aggaaggcag cgaccgacgc ccgtcctcgg cgctgtccgg ccgcgagggt 11460
gctgccgcgg cggtgcccga ggccgccagt cctttcccga gcttgccctt ctcgctgaac 11520
agtatccgca gcagcgagct gggcaggatc acgcgcccgc gcttgctggg cgaagaggag 11580
tacttgaatg actcgctgtt gagacccgag cgggagaaga acttccccaa taacgggata 11640
gaaagcctgg tggacaagat gagccgctgg aagacgtatg cgcaggagca cagggacgat 11700
ccccgggcgt cgcagggggc cacgagccgg ggcagcgccg cccgtaaacg ccggtggcac 11760
gacaggcagc ggggacagat gtgggacgat gaggactccg ccgacgacag cagcgtgttg 11820
gacttgggtg ggagtggtaa cccgttcgct cacctgcgcc cccgtatcgg gcgcatgatg 11880
taagagaaac cgaaaataaa tgatactcac caaggccatg gcgaccagcg tgcgttcgtt 11940
tcttctctgt tgttgttgta tctagtatga tgaggcgtgc gtacccggag ggtcctcctc 12000
cctcgtacga gagcgtgatg cagcaggcga tggcggcggc ggcgatgcag cccccgctgg 12060
aggctcctta cgtgcccccg cggtacctgg cgcctacgga ggggcggaac agcattcgtt 12120
actcggagct ggcacccttg tacgatacca cccggttgta cctggtggac aacaagtcgg 12180
cggacatcgc ctcgctgaac taccagaacg accacagcaa cttcctgacc accgtggtgc 12240
agaacaatga cttcaccccc acggaggcca gcacccagac catcaacttt gacgagcgct 12300
cgcggtgggg cggccagctg aaaaccatca tgcacaccaa catgcccaac gtgaacgagt 12360
tcatgtacag caacaagttc aaggcgcggg tgatggtctc ccgcaagacc cccaatgggg 12420
tgacagtgac agaggattat gatggtagtc aggatgagct gaagtatgaa tgggtggaat 12480
ttgagctgcc cgaaggcaac ttctcggtga ccatgaccat cgacctgatg aacaacgcca 12540
tcatcgacaa ttacttggcg gtggggcggc agaacggggt gctggagagc gacatcggcg 12600
tgaagttcga cactaggaac ttcaggctgg gctgggaccc cgtgaccgag ctggtcatgc 12660
ccggggtgta caccaacgag gctttccatc ccgatattgt cttgctgccc ggctgcgggg 12720
tggacttcac cgagagccgc ctcagcaacc tgctgggcat tcgcaagagg cagcccttcc 12780
aggaaggctt ccagatcatg tacgaggatc tggagggggg caacatcccc gcgctcctgg 12840
atgtcgacgc ctatgagaaa agcaaggagg atgcagcagc tgaagcaact gcagccgtag 12900
ctaccgcctc taccgaggtc aggggcgata attttgcaag cgccgcagca gtggcagcgg 12960
ccgaggcggc tgaaaccgaa agtaagatag tcattcagcc ggtggagaag gatagcaaga 13020
acaggagcta caacgtacta ccggacaaga taaacaccgc ctaccgcagc tggtacctag 13080
cctacaacta tggcgacccc gagaagggcg tgcgctcctg gacgctgctc accacctcgg 13140
acgtcacctg cggcgtggag caagtctact ggtcgctgcc cgacatgatg caagacccgg 13200
tcaccttccg ctccacgcgt caagttagca actacccggt ggtgggcgcc gagctcctgc 13260
ccgtctactc caagagcttc ttcaacgagc aggccgtcta ctcgcagcag ctgcgcgcct 13320
tcacctcgct tacgcacgtc ttcaaccgct tccccgagaa ccagatcctc gtccgcccgc 13380
ccgcgcccac cattaccacc gtcagtgaaa acgttcctgc tctcacagat cacgggaccc 13440
tgccgctgcg cagcagtatc cggggagtcc agcgcgtgac cgttactgac gccagacgcc 13500
gcacctgccc ctacgtctac aaggccctgg gcatagtcgc gccgcgcgtc ctctcgagcc 13560
gcaccttcta aatgtccatt ctcatctcgc ccagtaataa caccggttgg ggcctgcgcg 13620
cgcccagcaa gatgtacgga ggcgctcgcc aacgctccac gcaacacccc gtgcgcgtgc 13680
gcgggcactt ccgcgctccc tggggcgccc tcaagggccg cgtgcggtcg cgcaccaccg 13740
tcgacgacgt gatcgaccag gtggtggccg acgcgcgcaa ctacaccccc gccgccgcgc 13800
ccgtctccac cgtggacgcc gtcatcgaca gcgtggtggc cgacgcgcgc cggtacgccc 13860
gcgccaagag ccggcggcgg cgcatcgccc ggcggcaccg gagcaccccc gccatgcgcg 13920
cggcgcgagc cttgctgcgc agggccaggc gcacgggacg cagggccatg ctcagggcgg 13980
ccagacgcgc ggcttcaggc gccagcgccg gcaggacccg gagacgcgcg gccacggcgg 14040
cggcagcggc catcgccagc atgtcccgcc cgcggcgagg gaacgtgtac tgggtgcgcg 14100
acgccgccac cggtgtgcgc gtgcccgtgc gcacccgccc ccctcgcact tgaagatgtt 14160
cacttcgcga tgttgatgtg tcccagcggc gaggaggatg tccaagcgca aattcaagga 14220
agagatgctc caggtcatcg cgcctgagat ctacggccct gcggtggtga aggaggaaag 14280
aaagccccgc aaaatcaagc gggtcaaaaa ggacaaaaag gaagaagaaa gtgatgtgga 14340
cggattggtg gagtttgtgc gcgagttcgc cccccggcgg cgcgtgcagt ggcgcgggcg 14400
gaaggtgcaa ccggtgctga gacccggcac caccgtggtc ttcacgcccg gcgagcgctc 14460
cggcaccgct tccaagcgct cctacgacga ggtgtacggg gatgatgata ttctggagca 14520
ggcggccgag cgcctgggcg agtttgctta cggcaagcgc agccgttccg caccgaagga 14580
agaggcggtg tccatcccgc tggaccacgg caaccccacg ccgagcctca agcccgtgac 14640
cttgcagcag gtgctgccga ccgcggcgcc gcgccggggg ttcaagcgcg agggcgagga 14700
tctgtacccc accatgcagc tgatggtgcc caagcgccag aagctggaag acgtgctgga 14760
gaccatgaag gtggacccgg acgtgcagcc cgaggtcaag gtgcggccca tcaagcaggt 14820
ggccccgggc ctgggcgtgc agaccgtgga catcaagatt cccacggagc ccatggaaac 14880
gcagaccgag cccatgatca agcccagcac cagcaccatg gaggtgcaga cggatccctg 14940
gatgccatcg gctcctagtc gaagaccccg gcgcaagtac ggcgcggcca gcctgctgat 15000
gcccaactac gcgctgcatc cttccatcat ccccacgccg ggctaccgcg gcacgcgctt 15060
ctaccgcggt cataccagca gccgccgccg caagaccacc actcgccgcc gccgtcgccg 15120
caccgccgct gcaaccaccc ctgccgccct ggtgcggaga gtgtaccgcc gcggccgcgc 15180
acctctgacc ctgccgcgcg cgcgctacca cccgagcatc gccatttaaa ctttcgcctg 15240
ctttgcagat caatggccct cacatgccgc cttcgcgttc ccattacggg ctaccgagga 15300
agaaaaccgc gccgtagaag gctggcgggg aacgggatgc gtcgccacca ccaccggcgg 15360
cggcgcgcca tcagcaagcg gttgggggga ggcttcctgc ccgcgctgat ccccatcatc 15420
gccgcggcga tcggggcgat ccccggcatt gcttccgtgg cggtgcaggc ctctcagcgc 15480
cactgagaca cacttggaaa catcttgtaa taaaccaatg gactctgacg ctcctggtcc 15540
tgtgatgtgt tttcgtagac agatggaaga catcaatttt tcgtccctgg ctccgcgaca 15600
cggcacgcgg ccgttcatgg gcacctggag cgacatcggc accagccaac tgaacggggg 15660
cgccttcaat tggagcagtc tctggagcgg gcttaagaat ttcgggtcca cgcttaaaac 15720
ctatggcagc aaggcgtgga acagcaccac agggcaggcg ctgagggata agctgaaaga 15780
gcagaacttc cagcagaagg tggtcgatgg gctcgcctcg ggcatcaacg gggtggtgga 15840
cctggccaac caggccgtgc agcggcagat caacagccgc ctggacccgg tgccgcccgc 15900
cggctccgtg gagatgccgc aggtggagga ggagctgcct cccctggaca agcggggcga 15960
gaagcgaccc cgccccgatg cggaggagac gctgctgacg cacacggacg agccgccccc 16020
gtacgaggag gcggtgaaac tgggtctgcc caccacgcgg cccatcgcgc ccctggccac 16080
cggggtgctg aaacccgaaa agcccgcgac cctggacttg cctcctcccc agccttcccg 16140
cccctctaca gtggctaagc ccctgccgcc ggtggccgtg gcccgcgcgc gacccggggg 16200
caccgcccgc cctcatgcga actggcagag cactctgaac agcatcgtgg gtctgggagt 16260
gcagagtgtg aagcgccgcc gctgctatta aacctaccgt agcgcttaac ttgcttgtct 16320
gtgtgtgtat gtattatgtc gccgccgccg ctgtccacca gaaggaggag tgaagaggcg 16380
cgtcgccgag ttgcaagatg gccaccccat cgatgctgcc ccagtgggcg tacatgcaca 16440
tcgccggaca ggacgcttcg gagtacctga gtccgggtct ggtgcagttt gcccgcgcca 16500
cagacaccta cttcagtctg gggaacaagt ttaggaaccc cacggtggcg cccacgcacg 16560
atgtgaccac cgaccgcagc cagcggctga cgctgcgctt cgtgcccgtg gaccgcgagg 16620
acaacaccta ctcgtacaaa gtgcgctaca cgctggccgt gggcgacaac cgcgtgctgg 16680
acatggccag cacctacttt gacatccgcg gcgtgctgga tcggggccct agcttcaaac 16740
cctactccgg caccgcctac aacagtctgg cccccaaggg agcacccaac acttgtcagt 16800
ggacatataa agccgatggt gaaactgcca cagaaaaaac ctatacatat ggaaatgcac 16860
ccgtgcaggg cattaacatc acaaaagatg gtattcaact tggaactgac accgatgatc 16920
agccaatcta cgcagataaa acctatcagc ctgaacctca agtgggtgat gctgaatggc 16980
atgacatcac tggtactgat gaaaagtatg gaggcagagc tcttaagcct gataccaaaa 17040
tgaagccttg ttatggttct tttgccaagc ctactaataa agaaggaggt caggcaaatg 17100
tgaaaacagg aacaggcact actaaagaat atgacataga catggctttc tttgacaaca 17160
gaagtgcggc tgctgctggc ctagctccag aaattgtttt gtatactgaa aatgtggatt 17220
tggaaactcc agatacccat attgtataca aagcaggcac agatgacagc agctcttcta 17280
ttaatttggg tcagcaagcc atgcccaaca gacctaacta cattggtttc agagacaact 17340
ttatcgggct catgtactac aacagcactg gcaatatggg ggtgctggcc ggtcaggctt 17400
ctcagctgaa tgctgtggtt gacttgcaag acagaaacac cgagctgtcc taccagctct 17460
tgcttgactc tctgggtgac agaacccggt atttcagtat gtggaatcag gcggtggaca 17520
gctatgatcc tgatgtgcgc attattgaaa atcatggtgt ggaggatgaa cttcccaact 17580
attgtttccc tctggatgct gttggcagaa cagatactta tcagggaatt aaggctaatg 17640
gaactgatca aaccacatgg accaaagatg acagtgtcaa tgatgctaat gagataggca 17700
agggtaatcc attcgccatg gaaatcaaca tccaagccaa cctgtggagg aacttcctct 17760
acgccaacgt ggccctgtac ctgcccgact cttacaagta cacgccggcc aatgttaccc 17820
tgcccaccaa caccaacacc tacgattaca tgaacggccg ggtggtggcg ccctcgctgg 17880
tggactccta catcaacatc ggggcgcgct ggtcgctgga tcccatggac aacgtgaacc 17940
ccttcaacca ccaccgcaat gcggggctgc gctaccgctc catgctcctg ggcaacgggc 18000
gctacgtgcc cttccacatc caggtgcccc agaaattttt cgccatcaag agcctcctgc 18060
tcctgcccgg gtcctacacc tacgagtgga acttccgcaa ggacgtcaac atgatcctgc 18120
agagctccct cggcaacgac ctgcgcacgg acggggcctc catctccttc accagcatca 18180
acctctacgc caccttcttc cccatggcgc acaacacggc ctccacgctc gaggccatgc 18240
tgcgcaacga caccaacgac cagtccttca acgactacct ctcggcggcc aacatgctct 18300
accccatccc ggccaacgcc accaacgtgc ccatctccat cccctcgcgc aactgggccg 18360
ccttccgcgg ctggtccttc acgcgtctca agaccaagga gacgccctcg ctgggctccg 18420
ggttcgaccc ctacttcgtc tactcgggct ccatccccta cctcgacggc accttctacc 18480
tcaaccacac cttcaagaag gtctccatca ccttcgactc ctccgtcagc tggcccggca 18540
acgaccggct cctgacgccc aacgagttcg aaatcaagcg caccgtcgac ggcgagggct 18600
acaacgtggc ccagtgcaac atgaccaagg actggttcct ggtccagatg ctggcccact 18660
acaacatcgg ctaccagggc ttctacgtgc ccgagggcta caaggaccgc atgtactcct 18720
tcttccgcaa cttccagccc atgagccgcc aggtggtgga cgaggtcaac tacaaggact 18780
accaggccgt caccctggcc taccagcaca acaactcggg cttcgtcggc tacctcgcgc 18840
ccaccatgcg ccagggccag ccctaccccg ccaactaccc ctacccgctc atcggcaaga 18900
gcgccgtcac cagcgtcacc cagaaaaagt tcctctgcga cagggtcatg tggcgcatcc 18960
ccttctccag caacttcatg tccatgggcg cgctcaccga cctcggccag aacatgctct 19020
atgccaactc cgcccacgcg ctagacatga atttcgaagt cgaccccatg gatgagtcca 19080
cccttctcta tgttgtcttc gaagtcttcg acgtcgtccg agtgcaccag ccccaccgcg 19140
gcgtcatcga ggccgtctac ctgcgcaccc ccttctcggc cggtaacgcc accacctaag 19200
ctcttgcttc ttgcaagcca tggccgcggg ctccggcgag caggagctca gggccatcat 19260
ccgcgacctg ggctgcgggc cctacttcct gggcaccttc gataagcgct tcccgggatt 19320
catggccccg cacaagctgg cctgcgccat cgtcaacacg gccggccgcg agaccggggg 19380
cgagcactgg ctggccttcg cctggaaccc gcgctcgaac acctgctacc tcttcgaccc 19440
cttcgggttc tcggacgagc gcctcaagca gatctaccag ttcgagtacg agggcctgct 19500
gcgccgcagc gccctggcca ccgaggaccg ctgcgtcacc ctggaaaagt ccacccagac 19560
cgtgcagggt ccgcgctcgg ccgcctgcgg gctcttctgc tgcatgttcc tgcacgcctt 19620
cgtgcactgg cccgaccgcc ccatggacaa gaaccccacc atgaacttgc tgacgggggt 19680
gcccaacggc atgctccagt cgccccaggt ggaacccacc ctgcgccgca accaggaggc 19740
gctctaccgc ttcctcaact cccactccgc ctactttcgc tcccaccgcg cgcgcatcga 19800
gaaggccacc gccttcgacc gcatgaatca agacatgtaa accgtgtgtg tatgttaaat 19860
gtctttaata aacagcactt tcatgttaca catgcatctg agatgattta tttagaaatc 19920
gaaagggttc tgccgggtct cggcatggcc cgcgggcagg gacacgttgc ggaactggta 19980
cttggccagc cacttgaact cggggatcag cagtttgggc agcggggtgt cggggaagga 20040
gtcggtccac agcttccgcg tcagttgcag ggcgcccagc aggtcgggcg cggagatctt 20100
gaaatcgcag ttgggacccg cgttctgcgc gcgggagttg cggtacacgg ggttgcagca 20160
ctggaacacc atcagggccg ggtgcttcac gctcgccagc accgtcgcgt cggtgatgct 20220
ctccacgtcg aggtcctcgg cgttggccat cccgaagggg gtcatcttgc aggtctgcct 20280
tcccatggtg ggcacgcacc cgggcttgtg gttgcaatcg cagtgcaggg ggatcagcat 20340
catctgggcc tggtcggcgt tcatccccgg gtacatggcc ttcatgaaag cctccaattg 20400
cctgaacgcc tgctgggcct tggctccctc ggtgaagaag accccgcagg acttgctaga 20460
gaactggttg gtggcgcacc cggcgtcgtg cacgcagcag cgcgcgtcgt tgttggccag 20520
ctgcaccacg ctgcgccccc agcggttctg ggtgatcttg gcccggtcgg ggttctcctt 20580
cagcgcgcgc tgcccgttct cgctcgccac atccatctcg atcatgtgct ccttctggat 20640
catggtggtc ccgtgcaggc accgcagctt gccctcggcc tcggtgcacc cgtgcagcca 20700
cagcgcgcac ccggtgcact cccagttctt gtgggcgatc tgggaatgcg cgtgcacgaa 20760
gccctgcagg aagcggccca tcatggtggt cagggtcttg ttgctagtga aggtcagcgg 20820
aatgccgcgg tgctcctcgt tgatgtacag gtggcagatg cggcggtaca cctcgccctg 20880
ctcgggcatc agctggaagt tggctttcag gtcggtctcc acgcggtagc ggtccatcag 20940
catagtcatg atttccatac ccttctccca ggccgagacg atgggcaggc tcatagggtt 21000
cttcaccatc atcttagcgc tagcagccgc ggccaggggg tcgctctcgt ccagggtctc 21060
aaagctccgc ttgccgtcct tctcggtgat ccgcaccggg gggtagctga agcccacggc 21120
cgccagctcc tcctcggcct gtctttcgtc ctcgctgtcc tggctgacgt cctgcaggac 21180
cacatgcttg gtcttgcggg gtttcttctt gggcggcagc ggcggcggag atgttggaga 21240
tggcgagggg gagcgcgagt tctcgctcac cactactatc tcttcctctt cttggtccga 21300
ggccacgcgg cggtaggtat gtctcttcgg gggcagaggc ggaggcgacg ggctctcgcc 21360
gccgcgactt ggcggatggc tggcagagcc ccttccgcgt tcgggggtgc gctcccggcg 21420
gcgctctgac tgacttcctc cgcggccggc cattgtgttc tcctagggag gaacaacaag 21480
catggagact cagccatcgc caacctcgcc atctgccccc accgccgacg agaagcagca 21540
gcagcagaat gaaagcttaa ccgccccgcc gcccagcccc gccacctccg acgcggccgt 21600
cccagacatg caagagatgg aggaatccat cgagattgac ctgggctatg tgacgcccgc 21660
ggagcacgag gaggagctgg cagtgcgctt ttcacaagaa gagatacacc aagaacagcc 21720
agagcaggaa gcagagaatg agcagagtca ggctgggctc gagcatgacg gcgactacct 21780
ccacctgagc gggggggagg acgcgctcat caagcatctg gcccggcagg ccaccatcgt 21840
caaggatgcg ctgctcgacc gcaccgaggt gcccctcagc gtggaggagc tcagccgcgc 21900
ctacgagttg aacctcttct cgccgcgcgt gccccccaag cgccagccca atggcacctg 21960
cgagcccaac ccgcgcctca acttctaccc ggtcttcgcg gtgcccgagg ccctggccac 22020
ctaccacatc tttttcaaga accaaaagat ccccgtctcc tgccgcgcca accgcacccg 22080
cgccgacgcc cttttcaacc tgggtcccgg cgcccgccta cctgatatcg cctccttgga 22140
agaggttccc aagatcttcg agggtctggg cagcgacgag actcgggccg cgaacgctct 22200
gcaaggagaa ggaggagagc atgagcacca cagcgccctg gtcgagttgg aaggcgacaa 22260
cgcgcggctg gcggtgctca aacgcacggt cgagctgacc catttcgcct acccggctct 22320
gaacctgccc cccaaagtca tgagcgcggt catggaccag gtgctcatca agcgcgcgtc 22380
gcccatctcc gaggacgagg gcatgcaaga ctccgaggag ggcaagcccg tggtcagcga 22440
cgagcagctg gcccggtggc tgggtcctaa tgctagtccc cagagtttgg aagagcggcg 22500
caaactcatg atggccgtgg tcctggtgac cgtggagctg gagtgcctgc gccgcttctt 22560
cgccgacgcg gagaccctgc gcaaggtcga ggagaacctg cactacctct tcaggcacgg 22620
gttcgtgcgc caggcctgca agatctccaa cgtggagctg accaacctgg tctcctacat 22680
gggcatcttg cacgagaacc gcctggggca gaacgtgctg cacaccaccc tgcgcgggga 22740
ggcccggcgc gactacatcc gcgactgcgt ctacctctac ctctgccaca cctggcagac 22800
gggcatgggc gtgtggcagc agtgtctgga ggagcagaac ctgaaagagc tctgcaagct 22860
cctgcagaag aacctcaagg gtctgtggac cgggttcgac gagcgcacca ccgcctcgga 22920
cctggccgac ctcattttcc ccgagcgcct caggctgacg ctgcgcaacg gcctgcccga 22980
ctttatgagc caaagcatgt tgcaaaactt tcgctctttc atcctcgaac gctccggaat 23040
cctgcccgcc acctgctccg cgctgccctc ggacttcgtg ccgctgacct tccgcgagtg 23100
ccccccgccg ctgtggagcc actgctacct gctgcgcctg gccaactacc tggcctacca 23160
ctcggacgtg atcgaggacg tcagcggcga gggcctgctc gagtgccact gccgctgcaa 23220
cctctgcacg ccgcaccgct ccctggcctg caacccccag ctgctgagcg agacccagat 23280
catcggcacc ttcgagttgc aagggcccag cgaaggcgag ggttcagccg ccaagggggg 23340
tctgaaactc accccggggc tgtggacctc ggcctacttg cgcaagttcg tgcccgagga 23400
ctaccatccc ttcgagatca ggttctacga ggaccaatcc catccgccca aggccgagct 23460
gtcggcctgc gtcatcaccc agggggcgat cctggcccaa ttgcaagcca tccagaaatc 23520
ccgccaagaa ttcttgctga aaaagggccg cggggtctac ctcgaccccc agaccggtga 23580
ggagctcaac cccggcttcc cccaggatgc cccgaggaaa caagaagctg aaagtggagc 23640
tgccgcccgt ggaggatttg gaggaagact gggagaacag cagtcaggca gaggaggagg 23700
agatggagga agactgggac agcactcagg cagaggagga cagcctgcaa gacagtctgg 23760
aggaagacga ggaggaggca gaggaggagg tggaagaagc agccgccgcc agaccgtcgt 23820
cctcggcggg ggagaaagca agcagcacgg ataccatctc cgctccgggt cggggtcccg 23880
ctcgaccaca cagtagatgg gacgagaccg gacgattccc gaaccccacc acccagaccg 23940
gtaagaagga gcggcaggga tacaagtcct ggcgggggca caaaaacgcc atcgtctcct 24000
gcttgcaggc ctgcgggggc aacatctcct tcacccggcg ctacctgctc ttccaccgcg 24060
gggtgaactt tccccgcaac atcttgcatt actaccgtca cctccacagc ccctactact 24120
tccaagaaga ggcagcagca gcagaaaaag accagcagaa aaccagcagc tagaaaatcc 24180
acagcggcgg cagcaggtgg actgaggatc gcggcgaacg agccggcgca aacccgggag 24240
ctgaggaacc ggatctttcc caccctctat gccatcttcc agcagagtcg ggggcaggag 24300
caggaactga aagtcaagaa ccgttctctg cgctcgctca cccgcagttg tctgtatcac 24360
aagagcgaag accaacttca gcgcactctc gaggacgccg aggctctctt caacaagtac 24420
tgcgcgctca ctcttaaaga gtagcccgcg cccgcccagt cgcagaaaaa ggcgggaatt 24480
acgtcacctg tgcccttcgc cctagccgcc tccacccatc atcatgagca aagagattcc 24540
cacgccttac atgtggagct accagcccca gatgggcctg gccgccggtg ccgcccagga 24600
ctactccacc cgcatgaatt ggctcagcgc cgggcccgcg atgatctcac gggtgaatga 24660
catccgcgcc caccgaaacc agatactcct agaacagtca gcgctcaccg ccacgccccg 24720
caatcacctc aatccgcgta attggcccgc cgccctggtg taccaggaaa ttccccagcc 24780
cacgaccgta ctacttccgc gagacgccca ggccgaagtc cagctgacta actcaggtgt 24840
ccagctggcg ggcggcgcca ccctgtgtcg tcaccgcccc gctcagggta taaagcggct 24900
ggtgatccgg ggcagaggca cacagctcaa cgacgaggtg gtgagctctt cgctgggtct 24960
gcgacctgac ggagtcttcc aactcgccgg atcggggaga tcttccttca cgcctcgtca 25020
ggccgtcctg actttggaga gttcgtcctc gcagccccgc tcgggtggca tcggcactct 25080
ccagttcgtg gaggagttca ctccctcggt ctacttcaac cccttctccg gctcccccgg 25140
ccactacccg gacgagttca tcccgaactt cgacgccatc agcgagtcgg tggacggcta 25200
cgattgaatg tcccatggtg gcgcagctga cctagctcgg cttcgacacc tggaccactg 25260
ccgccgcttc cgctgcttcg ctcgggatct cgccgagttt gcctactttg agctgcccga 25320
ggagcaccct cagggcccgg cccacggagt gcggatcgtc gtcgaagggg gcctcgactc 25380
ccacctgctt cggatcttca gccagcgtcc gatcctggtc gagcgcgagc aaggacagac 25440
ccttctgact ctgtactgca tctgcaacca ccccggcctg catgaaagtc tttgttgtct 25500
gctgtgtact gagtataata aaagctgaga tcagcgacta ctccggactt ccgtgtgttt 25560
aaactcaccc ccttatccag tgaaataaag atcatattga tgatgatttt acagaaataa 25620
aaaataatca tttgatttga aataaagata caatcatatt gatgatttga gtttaacaaa 25680
aaaataaaga atcacttact tgaaatctga taccaggtct ctgtccatgt tttctgccaa 25740
caccacttca ctcccctctt cccagctctg gtactgcagg ccccggcggg ctgcaaactt 25800
cctccacacg ctgaagggga tgtcaaattc ctcctgtccc tcaatcttca ttttatcttc 25860
tatcagatgt ccaaaaagcg cgtccgggtg gatgatgact tcgaccccgt ctacccctac 25920
gatgcagaca acgcaccgac cgtgcccttc atcaaccccc ccttcgtctc ttcagatgga 25980
ttccaagaga agcccctggg ggtgttgtcc ctgcgactgg ccgaccccgt caccaccaag 26040
aacggggaaa tcaccctcaa gctgggagag ggggtggacc tcgattcctc gggaaaactc 26100
atctccaaca cggccaccaa ggccgccgcc cctctcagtt tttccaacaa caccatttcc 26160
cttaacatgg atcacccctt ttacactaaa gatggaaaat tatccttaca agtttctcca 26220
ccattaaata tactgagaac aagcattcta aacacactag ctttaggttt tggatcaggt 26280
ttaggactcc gtggctctgc cttggcagta cagttagtct ctccacttac atttgatact 26340
gatggaaaca taaagcttac cttagacaga ggtttgcatg ttacaacagg agatgcaatt 26400
gaaagcaaca taagctgggc taaaggttta aaatttgaag atggagccat agcaaccaac 26460
attggaaatg ggttagagtt tggaagcagt agtacagaaa caggtgttga tgatgcttac 26520
ccaatccaag ttaaacttgg atctggcctt agctttgaca gtacaggagc cataatggct 26580
ggtaacaaag aagacgataa actcactttg tggacaacac ctgatccatc accaaactgt 26640
caaatactcg cagaaaatga tgcaaaacta acactttgct tgactaaatg tggtagtcaa 26700
atactggcca ctgtgtcagt cttagttgta ggaagtggaa acctaaaccc cattactggc 26760
accgtaagca gtgctcaggt gtttctacgt tttgatgcaa acggtgttct tttaacagaa 26820
cattctacac taaaaaaata ctgggggtat aggcagggag atagcataga tggcactcca 26880
tataccaatg ctgtaggatt catgcccaat ttaaaagctt atccaaagtc acaaagttct 26940
actactaaaa ataatatagt agggcaagta tacatgaatg gagatgtttc aaaacctatg 27000
cttctcacta taaccctcaa tggtactgat gacagcaaca gtacatattc aatgtcattt 27060
tcatacacct ggactaatgg aagctatgtt ggagcaacat ttggggctaa ctcttatacc 27120
ttctcataca tcgcccaaga atgaacactg tatcccaccc tgcatgccaa cccttcccac 27180
cccactctgt ggaacaaact ctgaaacaca aaataaaata aagttcaagt gttttattga 27240
ttcaacagtt ttacaggatt cgagcagtta tttttcctcc accctcccag gacatggaat 27300
acaccaccct ctccccccgc acagccttga acatctgaat gccattggtg atggacatgc 27360
ttttggtctc cacgttccac acagtttcag agcgagccag tctcgggtcg gtcagggaga 27420
tgaaaccctc cgggcactcc cgcatctgca cctcacagct caacagctga ggattgtcct 27480
cggtggtcgg gatcacggtt atctggaaga agcagaagag cggcggtggg aatcatagtc 27540
cgcgaacggg atcggccggt ggtgtcgcat caggccccgc agcagtcgct gccgccgccg 27600
ctccgtcaag ctgctgctca gggggtccgg gtccagggac tccctcagca tgatgcccac 27660
ggccctcagc atcagtcgtc tggtgcggcg ggcgcagcag cgcatgcgga tctcgctcag 27720
gtcgctgcag tacgtgcaac acagaaccac caggttgttc aacagtccat agttcaacac 27780
gctccagccg aaactcatcg cgggaaggat gctacccacg tggccgtcgt accagatcct 27840
caggtaaatc aagtggtgcc ccctccagaa cacgctgccc acgtacatga tctccttggg 27900
catgtggcgg ttcaccacct cccggtacca catcaccctc tggttgaaca tgcagccccg 27960
gatgatcctg cggaaccaca gggccagcac cgccccgccc gccatgcagc gaagagaccc 28020
cgggtcccgg caatggcaat ggaggaccca ccgctcgtac ccgtggatca tctgggagct 28080
gaacaagtct atgttggcac agcacaggca tatgctcatg catctcttca gcactctcaa 28140
ctcctcgggg gtcaaaacca tatcccaggg cacggggaac tcttgcagga cagcgaaccc 28200
cgcagaacag ggcaatcctc gcacagaact tacattgtgc atggacaggg tatcgcaatc 28260
aggcagcacc gggtgatcct ccaccagaga agcgcgggtc tcggtctcct cacagcgtgg 28320
taagggggcc ggccgatacg ggtgatggcg ggacgcggct gatcgtgttc gcgaccgtgt 28380
catgatgcag ttgctttcgg acattttcgt acttgctgta gcagaacctg gtccgggcgc 28440
tgcacaccga tcgccggcgg cggtctcggc gcttggaacg ctcggtgttg aaattgtaaa 28500
acagccactc tctcagaccg tgcagcagat ctagggcctc aggagtgatg aagatcccat 28560
catgcctgat ggctctgatc acatcgacca ccgtggaatg ggccagaccc agccagatga 28620
tgcaattttg ttgggtttcg gtgacggcgg gggagggaag aacaggaaga accatgatta 28680
acttttaatc caaacggtct cggagtactt caaaatgaag atcgcggaga tggcacctct 28740
cgcccccgct gtgttggtgg aaaataacag ccaggtcaaa ggtgatacgg ttctcgagat 28800
gttccacggt ggcttccagc aaagcctcca cgcgcacatc cagaaacaag acaatagcga 28860
aagcgggagg gttctctaat tcctcaatca tcatgttaca ctcctgcacc atccccagat 28920
aattttcatt tttccagcct tgaatgattc gaactagttc ctgaggtaaa tccaagccag 28980
ccatgataaa gagctcgcgc agagcgccct ccaccggcat tcttaagcac accctcataa 29040
ttccaagata ttctgctcct ggttcacctg cagcagattg acaagcggaa tatcaaaatc 29100
tctgccgcga tccctgagct cctccctcag caataactgt aagtactctt tcatatcctc 29160
tccgaaattt ttagccatag gaccaccagg aataagatta gggcaagcca cagtacagat 29220
aaaccgaagt cctccccagt gagcattgcc aaatgcaaga ctgctataag catgctggct 29280
agacccggtg atatcttcca gataactgga cagaaaatcg cccaggcaat ttttaagaaa 29340
atcaacaaaa gaaaaatcct ccaggtggac gtttagagcc tcgggaacaa cgatgaagta 29400
aatgcaagcg gtgcgttcca gcatggttag ttagctgatc tgtagaaaaa acaaaaatga 29460
acattaaacc atgctagcct ggcgaacagg tgggtaaatc gttctctcca gcaccaggca 29520
ggccacgggg tctccggcgc gaccctcgta aaaattgtcg ctatgattga aaaccatcac 29580
agagagacgt tcccggtggc cggcgtgaat gattcgacaa gatgaataca cccccggaac 29640
attggcgtcc gcgagtgaaa aaaagcgccc gaggaagcaa taaggcacta caatgctcag 29700
tctcaagtcc agcaaagcga tgccatgcgg atgaagcaca aaattctcag gtgcgtacaa 29760
aatgtaatta ctcccctcct gcacaggcag caaagccccc gatccctcca ggtacacata 29820
caaagcctca gcgtccatag cttaccgagc agcagcacac aacaggcgca agagtcagag 29880
aaaggctgag ctctaacctg tccacccgct ctctgctcaa tatatagccc agatctacac 29940
tgacgtaaag gccaaagtct aaaaataccc gccaaataat cacacacgcc cagcacacgc 30000
ccagaaaccg gtgacacact caaaaaaata cgcgcacttc ctcaaacgcc caaaactgcc 30060
gtcatttccg ggttcccacg ctacgtcatc aaaacacgac tttcaaattc cgtcgaccgt 30120
taaaaacgtc acccgccccg cccctaacgg tcgcccgtct ctcagccaat cagcgccccg 30180
catccccaaa ttcaaacacc tcatttgcat attaacgcgc acaaaaagtt tgaggtatat 30240
tattgatgat gg 30252
<210> 5
<211> 1692
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 5
atggctagcc tggctggcga gacaggacag gaagccgctc ctctggacgg cgtgctggcc 60
aaccctccca atatcagcag cctgagcccc agacagctgc tgggattccc ttgtgccgag 120
gtgtccggcc tgagcacaga gagagtgcgg gaactggctg tggccctggc ccagaaaaac 180
gtgaagctga gcaccgagca gctgcggtgc ctggcccaca gactgtctga gcctcccgag 240
gatctggacg ccctgcctct ggatctgctg ctgttcctga accccgacgc cttcagcgga 300
cctcaggcct gcacccggtt cttcagcaga atcaccaagg ccaacgtgga cctgctgccc 360
agaggcgccc ctgagagaca gagactgctg cctgctgctc tggcctgttg gggagtgcgg 420
ggctctctgc tgtctgaagc tgatgtgcgg gccctgggag gcctggcttg tgatctgcct 480
ggaagattcg tggccgagag cgccgaagtg ctgctgccta gactggtgtc ctgtcccggc 540
cctctggacc aggatcagca ggaagctgcc agagctgctc tgcagggcgg aggccctcct 600
tatggacctc ctagcacttg gagcgtgtcc accatggatg ccctgagggg cctgctgcca 660
gtgctgggcc agcctatcat cagatccatc ccacagggca tcgtggccgc ctggcggcag 720
agaagctcta gagatccctc ttggcggcag cccgagcgga caatcctgcg gcccaggttt 780
cggagagagg tggaaaagac cgcctgcccc tctggcaaga aggccagaga gatcgacgag 840
agcctgatct tctacaagaa gtgggagctg gaagcctgcg tggacgccgc tctgctggcc 900
acccagatgg acagagtgaa cgccatcccc ttcacctatg agcagctgga cgtgctgaag 960
cacaagctgg atgagctgta cccccagggc taccccgaga gcgtgatcca gcacctgggc 1020
tacctgtttc tgaagatgag ccccgaggac atccggaagt ggaacgtgac cagcctggaa 1080
accctgaagg ccctgctgga agtgaacaag ggccacgaga tgtcccccca ggtggccaca 1140
ctgatcgaca gattcgtgaa gggcagaggc cagctggaca aggacaccct ggatacactg 1200
accgccttct accccggcta tctgtgcagc ctgtcccccg aggaactgag cagcgtgcca 1260
cctagctcta tctgggctgt gcggccccag gacctggata cctgcgatcc tagacagctg 1320
gatgtgctgt atcccaaggc ccggctggcc ttccagaaca tgaacggcag cgagtacttc 1380
gtgaagatcc agtccttcct gggcggagcc cctaccgagg acctgaaagc tctgagccag 1440
cagaacgtgt ccatggatct ggccaccttt atgaagctgc ggaccgacgc cgtgctgcct 1500
ctgacagtgg ctgaggtgca gaaactgctg ggcccccatg tggaagggct gaaggccgaa 1560
gaacggcaca gacccgtgcg cgactggatc ctgaggcaga gacaggatga cctggacaca 1620
ctgggcctgg gactgcaggg gggcatccct aatggctacc tggtgctgga cctgagcatg 1680
caggaagccc tg 1692
<210> 6
<211> 564
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 6
Met Ala Ser Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp
1 5 10 15
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
20 25 30
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
35 40 45
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
50 55 60
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
65 70 75 80
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
85 90 95
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
100 105 110
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
115 120 125
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
130 135 140
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
145 150 155 160
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
165 170 175
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
180 185 190
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
195 200 205
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
210 215 220
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
225 230 235 240
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
245 250 255
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
260 265 270
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
275 280 285
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
290 295 300
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
305 310 315 320
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
325 330 335
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
340 345 350
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
355 360 365
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
370 375 380
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
385 390 395 400
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
405 410 415
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
420 425 430
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
435 440 445
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
450 455 460
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
465 470 475 480
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
485 490 495
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
500 505 510
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
515 520 525
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
530 535 540
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
545 550 555 560
Gln Glu Ala Leu
<210> 7
<211> 1611
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 7
atggctagca cccctggaac ccagagcccc ttcttccttc tgctgctgct gaccgtgctg 60
actgtcgtga caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 120
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 180
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 240
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 300
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 360
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 420
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 480
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 540
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 600
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 660
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 720
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 780
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 840
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 900
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 960
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 1020
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 1080
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 1140
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 1200
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 1260
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 1320
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 1380
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 1440
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 1500
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 1560
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct g 1611
<210> 8
<211> 536
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 8
Met Ala Ser Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu
1 5 10 15
Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr
20 25 30
Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro
35 40 45
Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser
50 55 60
Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val
65 70 75 80
Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp
85 90 95
Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser
100 105 110
Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro
115 120 125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
130 135 140
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
145 150 155 160
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
165 170 175
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
180 185 190
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
195 200 205
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
210 215 220
Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val
225 230 235 240
Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His
245 250 255
Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr
260 265 270
Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala
275 280 285
Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val
290 295 300
Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr
305 310 315 320
Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe
325 330 335
Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln
340 345 350
Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe
355 360 365
Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln
370 375 380
Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu
385 390 395 400
Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu
405 410 415
Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala
420 425 430
Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
435 440 445
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
450 455 460
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro
465 470 475 480
Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr
485 490 495
His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu
500 505 510
Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro
515 520 525
Ala Val Ala Ala Ala Ser Ala Asn
530 535
<210> 9
<211> 2679
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 9
atgggagctg ccccggagcc ggagaggacc cccgttggcc agggatcgtg ggcccatccg 60
ggacgcacca ggggaccatc cgacagggga ttctgtgtgg tgtcaccggc caggccagca 120
gaagaggcaa ccagcctcga gggagcgttg tctggaacca gacattccca cccgtcggtg 180
ggccggcagc accacgcggg accaccgtcc acttccagac cgccacggcc atgggacacc 240
ccttgcccgc ctgtgtatgc cgagactaaa cacttcctgt actcatccgg agacaaggaa 300
cagcttcggc cgtccttcct cctgtcgtcg ctcagaccga gcctgaccgg agcacgcaga 360
ttggtggaaa ctatcttcct tgggtcacgt ccgtggatgc caggtacccc acggcgcctc 420
ccgcgcctcc cacagagata ctggcagatg cggcctctgt tcctggaatt gctgggaaac 480
cacgctcagt gcccgtacgg agtcctgctc aagactcact gccctctgag ggcggcggtc 540
actccggcgg ccggagtgtg cgcacgggag aagccccagg gaagcgtggc agctccggaa 600
gaggaggaca ccgatccgcg ccgcctcgtg caacttctgc gccagcactc ctcgccctgg 660
caagtctacg ggttcgtccg cgcctgcctg cgccgcctgg tgccgcctgg gctctggggt 720
tcccggcata acgagcgccg cttcctgaga aatactaaga agtttatctc acttggaaaa 780
catgccaagt tgtcgctgca agaactcacg tggaagatgt cagtccgcga ttgcgcctgg 840
ctgcgccgct cgccgggcgt cgggtgtgtt ccagctgcag aacaccgcct gagagaagaa 900
attctggcca aatttctgca ttggctgatg tcagtgtacg tggtcgagct gctgcgctcc 960
tttttctacg tcactgagac tacctttcaa aagaaccgcc tgttcttcta ccgcaaatct 1020
gtgtggagca agctgcagtc aatcggcatt cgccagcatc tgaagagggt gcagctgcgg 1080
gaactttccg aggcagaagt ccgccagcac cgggaggccc ggccggcgct tctcacgtcg 1140
cgtctgagat tcatcccaaa gcccgacggg ctgaggccta tcgtcaacat ggattacgtc 1200
gtgggcgctc gcacctttcg ccgtgaaaag cgggccgaac gcttgacctc acgggtgaag 1260
gccctcttct ccgtgctgaa ctacgagaga gcaagacggc ctggcctgct gggagcttcg 1320
gtgctgggac tggacgatat ccaccgggct tggcggacct ttgttctccg ggtgagagcc 1380
caagaccctc cgccggaact gtacttcgtg aaggtggcga tcaccggagc ctatgatact 1440
attccgcaag atcgactcac cgaagtcatc gcctcgatca tcaaaccgca gaacacttac 1500
tgcgtcaggc ggtacgccgt ggtccagaag gccgcgcatg gccacgtgag aaaggcgttc 1560
aagtcgcacg tgtccactct caccgacctc cagccttaca tgaggcaatt cgttgcgcat 1620
ttgcaagaga cttcgcccct gagagatgcg gtggtcatcg agcagagctc cagcctgaac 1680
gaagcgagca gcggtctgtt tgacgtgttc ctccgcttca tgtgtcatca cgcggtgcga 1740
atcaggggaa aatcatacgt gcagtgccag ggaatcccac aaggcagcat tctgtcgact 1800
ctcttgtgtt ccctttgcta cggcgatatg gaaaacaagc tgttcgctgg gatcagacgg 1860
gacgggttgc tgctcagact ggtggacgac ttcctgctgg tgactccgca cctcactcac 1920
gccaaaacct ttctccgcac tctggtgagg ggagtgccag aatacggctg tgtggtcaat 1980
ctccggaaaa ctgtggtgaa tttccctgtc gaggatgagg cactcggagg aaccgcattt 2040
gtccaaatgc cagcacatgg cctgttccca tggtgcggtc tgctgctgga cacccgaact 2100
cttgaagtgc agtccgacta ctccagctat gcccggacga gcatccgcgc cagcctcact 2160
ttcaatcgcg gctttaaggc cggacgaaac atgcgcagaa agcttttcgg agtcctccgg 2220
cttaaatgcc attcgctctt tctcgatctc caagtcaatt cgctgcagac cgtgtgcacg 2280
aacatctaca agatcctgct gctccaagcc taccggttcc acgcttgcgt gcttcagctg 2340
ccgtttcacc aacaggtgtg gaagaacccg accttctttc tgcgggtcat tagcgatact 2400
gcctccctgt gttactcaat cctcaaggca aagaacgccg gaatgtcgct gggtgcgaaa 2460
ggagccgcgg gacctcttcc tagcgaagcg gtgcagtggc tctgccacca ggctttcctc 2520
ctgaagctga ccaggcacag agtgacctac gtcccgctgc tgggctcgct gcgcactgca 2580
cagacccagc tgtctagaaa actccccggc accaccctga ccgctctgga agccgccgcc 2640
aacccagcat tgccgtcaga tttcaagacc atcttggac 2679
<210> 10
<211> 893
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 10
Met Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser
1 5 10 15
Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys
20 25 30
Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly
35 40 45
Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His
50 55 60
His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr
65 70 75 80
Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser
85 90 95
Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg
100 105 110
Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly
115 120 125
Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro
130 135 140
Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn
145 150 155 160
His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu
165 170 175
Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro
180 185 190
Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg
195 200 205
Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly
210 215 220
Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly
225 230 235 240
Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile
245 250 255
Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys
260 265 270
Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly
275 280 285
Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys
290 295 300
Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser
305 310 315 320
Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe
325 330 335
Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln
340 345 350
His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg
355 360 365
Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe
370 375 380
Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val
385 390 395 400
Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr
405 410 415
Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg
420 425 430
Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His
435 440 445
Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro
450 455 460
Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr Gly Ala Tyr Asp Thr
465 470 475 480
Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro
485 490 495
Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala
500 505 510
His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr
515 520 525
Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr
530 535 540
Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn
545 550 555 560
Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His
565 570 575
His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile
580 585 590
Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly
595 600 605
Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu
610 615 620
Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His
625 630 635 640
Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly
645 650 655
Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp
660 665 670
Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu
675 680 685
Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln
690 695 700
Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr
705 710 715 720
Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe
725 730 735
Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val
740 745 750
Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu
755 760 765
Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln
770 775 780
Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr
785 790 795 800
Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser
805 810 815
Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln
820 825 830
Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val
835 840 845
Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu
850 855 860
Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala
865 870 875 880
Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
885 890
<210> 11
<211> 1782
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 11
atggctagcg ccaaatttct gcattggctg atgtcagtgt acgtggtcga gctgctgcgc 60
tcctttttct acgtcactga gactaccttt caaaagaacc gcctgttctt ctaccgcaaa 120
tctgtgtgga gcaagctgca gtcaatcggc attcgccagc atctgaagag ggtgcagctg 180
cgggaacttt ccgaggcaga agtccgccag caccgggagg cccggccggc gcttctcacg 240
tcgcgtctga gattcatccc aaagcccgac gggctgaggc ctatcgtcaa catggattac 300
gtcgtgggcg ctcgcacctt tcgccgtgaa aagcgggccg aacgcttgac ctcacgggtg 360
aaggccctct tctccgtgct gaactacgag agagcaagac ggcctggcct gctgggagct 420
tcggtgctgg gactggacga tatccaccgg gcttggcgga cctttgttct ccgggtgaga 480
gcccaagacc ctccgccgga actgtacttc gtgaaggtgg cgatcaccgg agcctatgat 540
actattccgc aagatcgact caccgaagtc atcgcctcga tcatcaaacc gcagaacact 600
tactgcgtca ggcggtacgc cgtggtccag aaggccgcgc atggccacgt gagaaaggcg 660
ttcaagtcgc acgtgtccac tctcaccgac ctccagcctt acatgaggca attcgttgcg 720
catttgcaag agacttcgcc cctgagagat gcggtggtca tcgagcagag ctccagcctg 780
aacgaagcga gcagcggtct gtttgacgtg ttcctccgct tcatgtgtca tcacgcggtg 840
cgaatcaggg gaaaatcata cgtgcagtgc cagggaatcc cacaaggcag cattctgtcg 900
actctcttgt gttccctttg ctacggcgat atggaaaaca agctgttcgc tgggatcaga 960
cgggacgggt tgctgctcag actggtggac gacttcctgc tggtgactcc gcacctcact 1020
cacgccaaaa cctttctccg cactctggtg aggggagtgc cagaatacgg ctgtgtggtc 1080
aatctccgga aaactgtggt gaatttccct gtcgaggatg aggcactcgg aggaaccgca 1140
tttgtccaaa tgccagcaca tggcctgttc ccatggtgcg gtctgctgct ggacacccga 1200
actcttgaag tgcagtccga ctactccagc tatgcccgga cgagcatccg cgccagcctc 1260
actttcaatc gcggctttaa ggccggacga aacatgcgca gaaagctttt cggagtcctc 1320
cggcttaaat gccattcgct ctttctcgat ctccaagtca attcgctgca gaccgtgtgc 1380
acgaacatct acaagatcct gctgctccaa gcctaccggt tccacgcttg cgtgcttcag 1440
ctgccgtttc accaacaggt gtggaagaac ccgaccttct ttctgcgggt cattagcgat 1500
actgcctccc tgtgttactc aatcctcaag gcaaagaacg ccggaatgtc gctgggtgcg 1560
aaaggagccg cgggacctct tcctagcgaa gcggtgcagt ggctctgcca ccaggctttc 1620
ctcctgaagc tgaccaggca cagagtgacc tacgtcccgc tgctgggctc gctgcgcact 1680
gcacagaccc agctgtctag aaaactcccc ggcaccaccc tgaccgctct ggaagccgcc 1740
gccaacccag cattgccgtc agatttcaag accatcttgg ac 1782
<210> 12
<211> 594
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 12
Met Ala Ser Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val
1 5 10 15
Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys
20 25 30
Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser
35 40 45
Ile Gly Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser
50 55 60
Glu Ala Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr
65 70 75 80
Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val
85 90 95
Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg
100 105 110
Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn
115 120 125
Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly
130 135 140
Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg
145 150 155 160
Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr
165 170 175
Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala
180 185 190
Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val
195 200 205
Val Gln Lys Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His
210 215 220
Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala
225 230 235 240
His Leu Gln Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln
245 250 255
Ser Ser Ser Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu
260 265 270
Arg Phe Met Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val
275 280 285
Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys
290 295 300
Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg
305 310 315 320
Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr
325 330 335
Pro His Leu Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly
340 345 350
Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn
355 360 365
Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met
370 375 380
Pro Ala His Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg
385 390 395 400
Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile
405 410 415
Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met
420 425 430
Arg Arg Lys Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe
435 440 445
Leu Asp Leu Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr
450 455 460
Lys Ile Leu Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln
465 470 475 480
Leu Pro Phe His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg
485 490 495
Val Ile Ser Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys
500 505 510
Asn Ala Gly Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro
515 520 525
Ser Glu Ala Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu
530 535 540
Thr Arg His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr
545 550 555 560
Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala
565 570 575
Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile
580 585 590
Leu Asp
<210> 13
<211> 2373
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 13
atggctagct tcctcctgtc gtcgctcaga ccgagcctga ccggagcacg cagattggtg 60
gaaactatct tccttgggtc acgtccgtgg atgccaggta ccccacggcg cctcccgcgc 120
ctcccacaga gatactggca gatgcggcct ctgttcctgg aattgctggg aaaccacgct 180
cagtgcccgt acggagtcct gctcaagact cactgccctc tgagggcggc ggtcactccg 240
gcggccggag tgtgcgcacg ggagaagccc cagggaagcg tggcagctcc ggaagaggag 300
gacaccgatc cgcgccgcct cgtgcaactt ctgcgccagc actcctcgcc ctggcaagtc 360
tacgggttcg tccgcgcctg cctgcgccgc ctggtgccgc ctgggctctg gggttcccgg 420
cataacgagc gccgcttcct gagaaatact aagaagttta tctcacttgg aaaacatgcc 480
aagttgtcgc tgcaagaact cacgtggaag atgtcagtcc gcgattgcgc ctggctgcgc 540
cgctcgccgg gcgtcgggtg tgttccagct gcagaacacc gcctgagaga agaaattctg 600
gccaaatttc tgcattggct gatgtcagtg tacgtggtcg agctgctgcg ctcctttttc 660
tacgtcactg agactacctt tcaaaagaac cgcctgttct tctaccgcaa atctgtgtgg 720
agcaagctgc agtcaatcgg cattcgccag catctgaaga gggtgcagct gcgggaactt 780
tccgaggcag aagtccgcca gcaccgggag gcccggccgg cgcttctcac gtcgcgtctg 840
agattcatcc caaagcccga cgggctgagg cctatcgtca acatggatta cgtcgtgggc 900
gctcgcacct ttcgccgtga aaagcgggcc gaacgcttga cctcacgggt gaaggccctc 960
ttctccgtgc tgaactacga gagagcaaga cggcctggcc tgctgggagc ttcggtgctg 1020
ggactggacg atatccaccg ggcttggcgg acctttgttc tccgggtgag agcccaagac 1080
cctccgccgg aactgtactt cgtgaaggtg gcgatcaccg gagcctatga tactattccg 1140
caagatcgac tcaccgaagt catcgcctcg atcatcaaac cgcagaacac ttactgcgtc 1200
aggcggtacg ccgtggtcca gaaggccgcg catggccacg tgagaaaggc gttcaagtcg 1260
cacgtgtcca ctctcaccga cctccagcct tacatgaggc aattcgttgc gcatttgcaa 1320
gagacttcgc ccctgagaga tgcggtggtc atcgagcaga gctccagcct gaacgaagcg 1380
agcagcggtc tgtttgacgt gttcctccgc ttcatgtgtc atcacgcggt gcgaatcagg 1440
ggaaaatcat acgtgcagtg ccagggaatc ccacaaggca gcattctgtc gactctcttg 1500
tgttcccttt gctacggcga tatggaaaac aagctgttcg ctgggatcag acgggacggg 1560
ttgctgctca gactggtgga cgacttcctg ctggtgactc cgcacctcac tcacgccaaa 1620
acctttctcc gcactctggt gaggggagtg ccagaatacg gctgtgtggt caatctccgg 1680
aaaactgtgg tgaatttccc tgtcgaggat gaggcactcg gaggaaccgc atttgtccaa 1740
atgccagcac atggcctgtt cccatggtgc ggtctgctgc tggacacccg aactcttgaa 1800
gtgcagtccg actactccag ctatgcccgg acgagcatcc gcgccagcct cactttcaat 1860
cgcggcttta aggccggacg aaacatgcgc agaaagcttt tcggagtcct ccggcttaaa 1920
tgccattcgc tctttctcga tctccaagtc aattcgctgc agaccgtgtg cacgaacatc 1980
tacaagatcc tgctgctcca agcctaccgg ttccacgctt gcgtgcttca gctgccgttt 2040
caccaacagg tgtggaagaa cccgaccttc tttctgcggg tcattagcga tactgcctcc 2100
ctgtgttact caatcctcaa ggcaaagaac gccggaatgt cgctgggtgc gaaaggagcc 2160
gcgggacctc ttcctagcga agcggtgcag tggctctgcc accaggcttt cctcctgaag 2220
ctgaccaggc acagagtgac ctacgtcccg ctgctgggct cgctgcgcac tgcacagacc 2280
cagctgtcta gaaaactccc cggcaccacc ctgaccgctc tggaagccgc cgccaaccca 2340
gcattgccgt cagatttcaa gaccatcttg gac 2373
<210> 14
<211> 791
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 14
Met Ala Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser Leu Thr Gly Ala
1 5 10 15
Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser Arg Pro Trp Met Pro
20 25 30
Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met
35 40 45
Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His Ala Gln Cys Pro Tyr
50 55 60
Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg Ala Ala Val Thr Pro
65 70 75 80
Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gln Gly Ser Val Ala Ala
85 90 95
Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu Val Gln Leu Leu Arg
100 105 110
Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe Val Arg Ala Cys Leu
115 120 125
Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser Arg His Asn Glu Arg
130 135 140
Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu Gly Lys His Ala
145 150 155 160
Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met Ser Val Arg Asp Cys
165 170 175
Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys Val Pro Ala Ala Glu
180 185 190
His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu His Trp Leu Met
195 200 205
Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu
210 215 220
Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp
225 230 235 240
Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val Gln
245 250 255
Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala Arg
260 265 270
Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly
275 280 285
Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe
290 295 300
Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu
305 310 315 320
Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly
325 330 335
Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe
340 345 350
Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val
355 360 365
Lys Val Ala Ile Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg Leu
370 375 380
Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys Val
385 390 395 400
Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly His Val Arg Lys
405 410 415
Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met
420 425 430
Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser Pro Leu Arg Asp Ala
435 440 445
Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala Ser Ser Gly Leu
450 455 460
Phe Asp Val Phe Leu Arg Phe Met Cys His His Ala Val Arg Ile Arg
465 470 475 480
Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu
485 490 495
Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu
500 505 510
Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp
515 520 525
Phe Leu Leu Val Thr Pro His Leu Thr His Ala Lys Thr Phe Leu Arg
530 535 540
Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg
545 550 555 560
Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr
565 570 575
Ala Phe Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys Gly Leu
580 585 590
Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr
595 600 605
Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe Lys
610 615 620
Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val Leu Arg Leu Lys
625 630 635 640
Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser Leu Gln Thr Val
645 650 655
Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala Tyr Arg Phe His
660 665 670
Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln Val Trp Lys Asn Pro
675 680 685
Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala Ser Leu Cys Tyr Ser
690 695 700
Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu Gly Ala Lys Gly Ala
705 710 715 720
Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu Cys His Gln Ala
725 730 735
Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr Tyr Val Pro Leu Leu
740 745 750
Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly
755 760 765
Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser
770 775 780
Asp Phe Lys Thr Ile Leu Asp
785 790
<210> 15
<211> 1551
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 15
atggctagca caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 60
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 120
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 180
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 240
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 300
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 360
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 420
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 480
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 540
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 600
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 660
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 720
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 780
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 840
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 900
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 960
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 1020
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 1080
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 1140
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 1200
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 1260
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 1320
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 1380
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 1440
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 1500
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct g 1551
<210> 16
<211> 517
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 16
Met Ala Ser Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly Glu
1 5 10 15
Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr Glu
20 25 30
Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
35 40 45
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
50 55 60
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
65 70 75 80
Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro
85 90 95
Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser
100 105 110
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
115 120 125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
130 135 140
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
145 150 155 160
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
165 170 175
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
180 185 190
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
195 200 205
Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala Ser
210 215 220
Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser
225 230 235 240
Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile
245 250 255
Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr
260 265 270
Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro Leu Thr
275 280 285
Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe
290 295 300
Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu
305 310 315 320
Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser
325 330 335
Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser
340 345 350
Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala
355 360 365
Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn
370 375 380
Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp
385 390 395 400
Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala
405 410 415
Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu
420 425 430
Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys
435 440 445
Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg Asp Thr
450 455 460
Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg Tyr
465 470 475 480
Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val Ser Ala
485 490 495
Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val Ala Ala
500 505 510
Ala Ser Ala Asn Leu
515
<210> 17
<211> 3378
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 17
atggctagcc tggctggcga gacaggacag gaagccgctc ctctggacgg cgtgctggcc 60
aaccctccca atatcagcag cctgagcccc agacagctgc tgggattccc ttgtgccgag 120
gtgtccggcc tgagcacaga gagagtgcgg gaactggctg tggccctggc ccagaaaaac 180
gtgaagctga gcaccgagca gctgcggtgc ctggcccaca gactgtctga gcctcccgag 240
gatctggacg ccctgcctct ggatctgctg ctgttcctga accccgacgc cttcagcgga 300
cctcaggcct gcacccggtt cttcagcaga atcaccaagg ccaacgtgga cctgctgccc 360
agaggcgccc ctgagagaca gagactgctg cctgctgctc tggcctgttg gggagtgcgg 420
ggctctctgc tgtctgaagc tgatgtgcgg gccctgggag gcctggcttg tgatctgcct 480
ggaagattcg tggccgagag cgccgaagtg ctgctgccta gactggtgtc ctgtcccggc 540
cctctggacc aggatcagca ggaagctgcc agagctgctc tgcagggcgg aggccctcct 600
tatggacctc ctagcacttg gagcgtgtcc accatggatg ccctgagggg cctgctgcca 660
gtgctgggcc agcctatcat cagatccatc ccacagggca tcgtggccgc ctggcggcag 720
agaagctcta gagatccctc ttggcggcag cccgagcgga caatcctgcg gcccaggttt 780
cggagagagg tggaaaagac cgcctgcccc tctggcaaga aggccagaga gatcgacgag 840
agcctgatct tctacaagaa gtgggagctg gaagcctgcg tggacgccgc tctgctggcc 900
acccagatgg acagagtgaa cgccatcccc ttcacctatg agcagctgga cgtgctgaag 960
cacaagctgg atgagctgta cccccagggc taccccgaga gcgtgatcca gcacctgggc 1020
tacctgtttc tgaagatgag ccccgaggac atccggaagt ggaacgtgac cagcctggaa 1080
accctgaagg ccctgctgga agtgaacaag ggccacgaga tgtcccccca ggtggccaca 1140
ctgatcgaca gattcgtgaa gggcagaggc cagctggaca aggacaccct ggatacactg 1200
accgccttct accccggcta tctgtgcagc ctgtcccccg aggaactgag cagcgtgcca 1260
cctagctcta tctgggctgt gcggccccag gacctggata cctgcgatcc tagacagctg 1320
gatgtgctgt atcccaaggc ccggctggcc ttccagaaca tgaacggcag cgagtacttc 1380
gtgaagatcc agtccttcct gggcggagcc cctaccgagg acctgaaagc tctgagccag 1440
cagaacgtgt ccatggatct ggccaccttt atgaagctgc ggaccgacgc cgtgctgcct 1500
ctgacagtgg ctgaggtgca gaaactgctg ggcccccatg tggaagggct gaaggccgaa 1560
gaacggcaca gacccgtgcg cgactggatc ctgaggcaga gacaggatga cctggacaca 1620
ctgggcctgg gactgcaggg gggcatccct aatggctacc tggtgctgga cctgagcatg 1680
caggaagccc tgggatccgg cagaatcttc aacgcccact acgccggcta cttcgccgac 1740
ctgctgatcc acgacatcga gacaaaccct ggccccaccc ctggaaccca gagccccttc 1800
ttccttctgc tgctgctgac cgtgctgact gtcgtgacag gctctggcca cgccagctct 1860
acacctggcg gcgagaaaga gacaagcgcc acccagagaa gcagcgtgcc aagcagcacc 1920
gagaagaacg ccgtgtccat gaccagctcc gtgctgagca gccactctcc tggcagcggc 1980
agcagcacaa cacagggcca ggatgtgaca ctggcccctg ccacagaacc tgcctctgga 2040
tctgccgcca cctggggaca ggacgtgaca agcgtgccag tgaccagacc tgccctgggc 2100
tctacaacac cccctgccca cgatgtgacc agcgcccctg ataacaagcc tgcccctgga 2160
agcacagccc ctccagctca tggcgtgacc tctgccccag ataccagacc agccccagga 2220
tctacagccc cacccgcaca cggcgtgaca agtgcccctg acacaagacc cgctccaggc 2280
tctactgctc ctcctgccca tggcgtgaca agcgctcccg atacaaggcc agctcctggc 2340
tccacagcac caccagcaca tggcgtgaca tcagctcccg acactagacc tgctcccgga 2400
tcaaccgctc caccagctca cggcgtgacc agcgcacctg ataccagacc tgctctggga 2460
agcaccgccc ctcccgtgca caatgtgaca tctgcttccg gcagcgccag cggctctgcc 2520
tctacactgg tgcacaacgg caccagcgcc agagccacaa caaccccagc cagcaagagc 2580
acccccttca gcatccctag ccaccacagc gacaccccta ccacactggc cagccactcc 2640
accaagaccg atgcctctag cacccaccac tccagcgtgc cccctctgac cagcagcaac 2700
cacagcacaa gcccccagct gtctaccggc gtctcattct tctttctgtc cttccacatc 2760
agcaacctgc agttcaacag cagcctggaa gatcccagca ccgactacta ccaggaactg 2820
cagcgggata tcagcgagat gttcctgcaa atctacaagc agggcggctt cctgggcctg 2880
agcaacatca agttcagacc cggcagcgtg gtggtgcagc tgaccctggc tttccgggaa 2940
ggcaccatca acgtgcacga cgtggaaacc cagttcaacc agtacaagac cgaggccgcc 3000
agccggtaca acctgaccat ctccgatgtg tccgtgtccg acgtgccctt cccattctct 3060
gcccagtctg gcgcaggcgt gccaggatgg ggaattgctc tgctggtgct cgtgtgcgtg 3120
ctggtggccc tggccatcgt gtatctgatt gccctggccg tgtgccagtg ccggcggaag 3180
aattacggcc agctggacat cttccccgcc agagacacct accaccccat gagcgagtac 3240
cccacatacc acacccacgg cagatacgtg ccacccagct ccaccgacag atccccctac 3300
gagaaagtgt ctgccggcaa cggcggcagc tccctgagct acacaaatcc tgccgtggcc 3360
gctgcctccg ccaacctg 3378
<210> 18
<211> 1126
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 18
Met Ala Ser Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp
1 5 10 15
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
20 25 30
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
35 40 45
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
50 55 60
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
65 70 75 80
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
85 90 95
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
100 105 110
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
115 120 125
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
130 135 140
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
145 150 155 160
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
165 170 175
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
180 185 190
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
195 200 205
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
210 215 220
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
225 230 235 240
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
245 250 255
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
260 265 270
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
275 280 285
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
290 295 300
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
305 310 315 320
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
325 330 335
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
340 345 350
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
355 360 365
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
370 375 380
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
385 390 395 400
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
405 410 415
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
420 425 430
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
435 440 445
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
450 455 460
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
465 470 475 480
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
485 490 495
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
500 505 510
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
515 520 525
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
530 535 540
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
545 550 555 560
Gln Glu Ala Leu Gly Ser Gly Arg Ile Phe Asn Ala His Tyr Ala Gly
565 570 575
Tyr Phe Ala Asp Leu Leu Ile His Asp Ile Glu Thr Asn Pro Gly Pro
580 585 590
Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr Val
595 600 605
Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly
610 615 620
Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr
625 630 635 640
Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser
645 650 655
Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala
660 665 670
Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp
675 680 685
Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro
690 695 700
Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly
705 710 715 720
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg
725 730 735
Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala
740 745 750
Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly
755 760 765
Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro
770 775 780
Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly
785 790 795 800
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg
805 810 815
Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala
820 825 830
Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr
835 840 845
Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser
850 855 860
Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser
865 870 875 880
Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro Leu
885 890 895
Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser
900 905 910
Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser
915 920 925
Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile
930 935 940
Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu
945 950 955 960
Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu
965 970 975
Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe
980 985 990
Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser
995 1000 1005
Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser
1010 1015 1020
Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val
1025 1030 1035
Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
1040 1045 1050
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe
1055 1060 1065
Pro Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr
1070 1075 1080
His Thr His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser
1085 1090 1095
Pro Tyr Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser
1100 1105 1110
Tyr Thr Asn Pro Ala Val Ala Ala Ala Ser Ala Asn Leu
1115 1120 1125
<210> 19
<211> 3378
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 19
atggctagca cccctggaac ccagagcccc ttcttccttc tgctgctgct gaccgtgctg 60
actgtcgtga caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 120
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 180
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 240
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 300
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 360
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 420
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 480
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 540
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 600
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 660
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 720
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 780
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 840
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 900
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 960
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 1020
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 1080
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 1140
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 1200
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 1260
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 1320
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 1380
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 1440
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 1500
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 1560
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct gggatccggc 1620
agaatcttca acgcccacta cgccggctac ttcgccgacc tgctgatcca cgacatcgag 1680
acaaaccctg gccccctggc tggcgagaca ggacaggaag ccgctcctct ggacggcgtg 1740
ctggccaacc ctcccaatat cagcagcctg agccccagac agctgctggg attcccttgt 1800
gccgaggtgt ccggcctgag cacagagaga gtgcgggaac tggctgtggc cctggcccag 1860
aaaaacgtga agctgagcac cgagcagctg cggtgcctgg cccacagact gtctgagcct 1920
cccgaggatc tggacgccct gcctctggat ctgctgctgt tcctgaaccc cgacgccttc 1980
agcggacctc aggcctgcac ccggttcttc agcagaatca ccaaggccaa cgtggacctg 2040
ctgcccagag gcgcccctga gagacagaga ctgctgcctg ctgctctggc ctgttgggga 2100
gtgcggggct ctctgctgtc tgaagctgat gtgcgggccc tgggaggcct ggcttgtgat 2160
ctgcctggaa gattcgtggc cgagagcgcc gaagtgctgc tgcctagact ggtgtcctgt 2220
cccggccctc tggaccagga tcagcaggaa gctgccagag ctgctctgca gggcggaggc 2280
cctccttatg gacctcctag cacttggagc gtgtccacca tggatgccct gaggggcctg 2340
ctgccagtgc tgggccagcc tatcatcaga tccatcccac agggcatcgt ggccgcctgg 2400
cggcagagaa gctctagaga tccctcttgg cggcagcccg agcggacaat cctgcggccc 2460
aggtttcgga gagaggtgga aaagaccgcc tgcccctctg gcaagaaggc cagagagatc 2520
gacgagagcc tgatcttcta caagaagtgg gagctggaag cctgcgtgga cgccgctctg 2580
ctggccaccc agatggacag agtgaacgcc atccccttca cctatgagca gctggacgtg 2640
ctgaagcaca agctggatga gctgtacccc cagggctacc ccgagagcgt gatccagcac 2700
ctgggctacc tgtttctgaa gatgagcccc gaggacatcc ggaagtggaa cgtgaccagc 2760
ctggaaaccc tgaaggccct gctggaagtg aacaagggcc acgagatgtc cccccaggtg 2820
gccacactga tcgacagatt cgtgaagggc agaggccagc tggacaagga caccctggat 2880
acactgaccg ccttctaccc cggctatctg tgcagcctgt cccccgagga actgagcagc 2940
gtgccaccta gctctatctg ggctgtgcgg ccccaggacc tggatacctg cgatcctaga 3000
cagctggatg tgctgtatcc caaggcccgg ctggccttcc agaacatgaa cggcagcgag 3060
tacttcgtga agatccagtc cttcctgggc ggagccccta ccgaggacct gaaagctctg 3120
agccagcaga acgtgtccat ggatctggcc acctttatga agctgcggac cgacgccgtg 3180
ctgcctctga cagtggctga ggtgcagaaa ctgctgggcc cccatgtgga agggctgaag 3240
gccgaagaac ggcacagacc cgtgcgcgac tggatcctga ggcagagaca ggatgacctg 3300
gacacactgg gcctgggact gcaggggggc atccctaatg gctacctggt gctggacctg 3360
agcatgcagg aagccctg 3378
<210> 20
<211> 1126
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 20
Met Ala Ser Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu
1 5 10 15
Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr
20 25 30
Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro
35 40 45
Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser
50 55 60
Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val
65 70 75 80
Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp
85 90 95
Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser
100 105 110
Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro
115 120 125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
130 135 140
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
145 150 155 160
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
165 170 175
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
180 185 190
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
195 200 205
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
210 215 220
Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val
225 230 235 240
Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His
245 250 255
Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr
260 265 270
Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala
275 280 285
Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val
290 295 300
Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr
305 310 315 320
Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe
325 330 335
Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln
340 345 350
Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe
355 360 365
Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln
370 375 380
Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu
385 390 395 400
Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu
405 410 415
Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala
420 425 430
Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
435 440 445
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
450 455 460
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro
465 470 475 480
Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr
485 490 495
His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu
500 505 510
Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro
515 520 525
Ala Val Ala Ala Ala Ser Ala Asn Leu Gly Ser Gly Arg Ile Phe Asn
530 535 540
Ala His Tyr Ala Gly Tyr Phe Ala Asp Leu Leu Ile His Asp Ile Glu
545 550 555 560
Thr Asn Pro Gly Pro Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro
565 570 575
Leu Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro
580 585 590
Arg Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr
595 600 605
Glu Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys
610 615 620
Leu Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro
625 630 635 640
Pro Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn
645 650 655
Pro Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg
660 665 670
Ile Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg
675 680 685
Gln Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser
690 695 700
Leu Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp
705 710 715 720
Leu Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg
725 730 735
Leu Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala
740 745 750
Arg Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr
755 760 765
Trp Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu
770 775 780
Gly Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp
785 790 795 800
Arg Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr
805 810 815
Ile Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro
820 825 830
Ser Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys
835 840 845
Lys Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln
850 855 860
Met Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val
865 870 875 880
Leu Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser
885 890 895
Val Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp
900 905 910
Ile Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu
915 920 925
Glu Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile
930 935 940
Asp Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp
945 950 955 960
Thr Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu
965 970 975
Glu Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln
980 985 990
Asp Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys
995 1000 1005
Ala Arg Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val
1010 1015 1020
Lys Ile Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys
1025 1030 1035
Ala Leu Ser Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met
1040 1045 1050
Lys Leu Arg Thr Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val
1055 1060 1065
Gln Lys Leu Leu Gly Pro His Val Glu Gly Leu Lys Ala Glu Glu
1070 1075 1080
Arg His Arg Pro Val Arg Asp Trp Ile Leu Arg Gln Arg Gln Asp
1085 1090 1095
Asp Leu Asp Thr Leu Gly Leu Gly Leu Gln Gly Gly Ile Pro Asn
1100 1105 1110
Gly Tyr Leu Val Leu Asp Leu Ser Met Gln Glu Ala Leu
1115 1120 1125
<210> 21
<211> 3360
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 21
atggctagca cccctggaac ccagagcccc ttcttccttc tgctgctgct gaccgtgctg 60
actgtcgtga caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 120
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 180
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 240
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 300
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 360
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 420
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 480
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 540
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 600
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 660
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 720
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 780
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 840
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 900
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 960
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 1020
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 1080
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 1140
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 1200
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 1260
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 1320
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 1380
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 1440
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 1500
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 1560
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct gggatccggc 1620
gccaccaatt tcagcctgct gaaacaggcc ggcgacgtgg aagagaaccc tggccctctg 1680
gctggcgaga caggacagga agccgctcct ctggacggcg tgctggccaa ccctcccaat 1740
atcagcagcc tgagccccag acagctgctg ggattccctt gtgccgaggt gtccggcctg 1800
agcacagaga gagtgcggga actggctgtg gccctggccc agaaaaacgt gaagctgagc 1860
accgagcagc tgcggtgcct ggcccacaga ctgtctgagc ctcccgagga tctggacgcc 1920
ctgcctctgg atctgctgct gttcctgaac cccgacgcct tcagcggacc tcaggcctgc 1980
acccggttct tcagcagaat caccaaggcc aacgtggacc tgctgcccag aggcgcccct 2040
gagagacaga gactgctgcc tgctgctctg gcctgttggg gagtgcgggg ctctctgctg 2100
tctgaagctg atgtgcgggc cctgggaggc ctggcttgtg atctgcctgg aagattcgtg 2160
gccgagagcg ccgaagtgct gctgcctaga ctggtgtcct gtcccggccc tctggaccag 2220
gatcagcagg aagctgccag agctgctctg cagggcggag gccctcctta tggacctcct 2280
agcacttgga gcgtgtccac catggatgcc ctgaggggcc tgctgccagt gctgggccag 2340
cctatcatca gatccatccc acagggcatc gtggccgcct ggcggcagag aagctctaga 2400
gatccctctt ggcggcagcc cgagcggaca atcctgcggc ccaggtttcg gagagaggtg 2460
gaaaagaccg cctgcccctc tggcaagaag gccagagaga tcgacgagag cctgatcttc 2520
tacaagaagt gggagctgga agcctgcgtg gacgccgctc tgctggccac ccagatggac 2580
agagtgaacg ccatcccctt cacctatgag cagctggacg tgctgaagca caagctggat 2640
gagctgtacc cccagggcta ccccgagagc gtgatccagc acctgggcta cctgtttctg 2700
aagatgagcc ccgaggacat ccggaagtgg aacgtgacca gcctggaaac cctgaaggcc 2760
ctgctggaag tgaacaaggg ccacgagatg tccccccagg tggccacact gatcgacaga 2820
ttcgtgaagg gcagaggcca gctggacaag gacaccctgg atacactgac cgccttctac 2880
cccggctatc tgtgcagcct gtcccccgag gaactgagca gcgtgccacc tagctctatc 2940
tgggctgtgc ggccccagga cctggatacc tgcgatccta gacagctgga tgtgctgtat 3000
cccaaggccc ggctggcctt ccagaacatg aacggcagcg agtacttcgt gaagatccag 3060
tccttcctgg gcggagcccc taccgaggac ctgaaagctc tgagccagca gaacgtgtcc 3120
atggatctgg ccacctttat gaagctgcgg accgacgccg tgctgcctct gacagtggct 3180
gaggtgcaga aactgctggg cccccatgtg gaagggctga aggccgaaga acggcacaga 3240
cccgtgcgcg actggatcct gaggcagaga caggatgacc tggacacact gggcctggga 3300
ctgcaggggg gcatccctaa tggctacctg gtgctggacc tgagcatgca ggaagccctg 3360
<210> 22
<211> 1120
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 22
Met Ala Ser Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu
1 5 10 15
Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr
20 25 30
Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro
35 40 45
Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser
50 55 60
Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val
65 70 75 80
Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp
85 90 95
Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser
100 105 110
Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro
115 120 125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
130 135 140
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
145 150 155 160
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
165 170 175
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
180 185 190
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
195 200 205
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
210 215 220
Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val
225 230 235 240
Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His
245 250 255
Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr
260 265 270
Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala
275 280 285
Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val
290 295 300
Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr
305 310 315 320
Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe
325 330 335
Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln
340 345 350
Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe
355 360 365
Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln
370 375 380
Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu
385 390 395 400
Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu
405 410 415
Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala
420 425 430
Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
435 440 445
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
450 455 460
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro
465 470 475 480
Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr
485 490 495
His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu
500 505 510
Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro
515 520 525
Ala Val Ala Ala Ala Ser Ala Asn Leu Gly Ser Gly Ala Thr Asn Phe
530 535 540
Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Leu
545 550 555 560
Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp Gly Val Leu Ala
565 570 575
Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln Leu Leu Gly Phe
580 585 590
Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg Val Arg Glu Leu
595 600 605
Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser Thr Glu Gln Leu
610 615 620
Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu Asp Leu Asp Ala
625 630 635 640
Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp Ala Phe Ser Gly
645 650 655
Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr Lys Ala Asn Val
660 665 670
Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg Leu Leu Pro Ala
675 680 685
Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu Ser Glu Ala Asp
690 695 700
Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro Gly Arg Phe Val
705 710 715 720
Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val Ser Cys Pro Gly
725 730 735
Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala Ala Leu Gln Gly
740 745 750
Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser Val Ser Thr Met
755 760 765
Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln Pro Ile Ile Arg
770 775 780
Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln Arg Ser Ser Arg
785 790 795 800
Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu Arg Pro Arg Phe
805 810 815
Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly Lys Lys Ala Arg
820 825 830
Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp Glu Leu Glu Ala
835 840 845
Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp Arg Val Asn Ala
850 855 860
Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys His Lys Leu Asp
865 870 875 880
Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile Gln His Leu Gly
885 890 895
Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg Lys Trp Asn Val
900 905 910
Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val Asn Lys Gly His
915 920 925
Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg Phe Val Lys Gly
930 935 940
Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu Thr Ala Phe Tyr
945 950 955 960
Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu Ser Ser Val Pro
965 970 975
Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu Asp Thr Cys Asp
980 985 990
Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg Leu Ala Phe Gln
995 1000 1005
Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln Ser Phe Leu
1010 1015 1020
Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln Gln Asn
1025 1030 1035
Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp Ala
1040 1045 1050
Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
1055 1060 1065
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg
1070 1075 1080
Asp Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly
1085 1090 1095
Leu Gly Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp
1100 1105 1110
Leu Ser Met Gln Glu Ala Leu
1115 1120
<210> 23
<211> 3360
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 23
atggctagcc tggctggcga gacaggacag gaagccgctc ctctggacgg cgtgctggcc 60
aaccctccca atatcagcag cctgagcccc agacagctgc tgggattccc ttgtgccgag 120
gtgtccggcc tgagcacaga gagagtgcgg gaactggctg tggccctggc ccagaaaaac 180
gtgaagctga gcaccgagca gctgcggtgc ctggcccaca gactgtctga gcctcccgag 240
gatctggacg ccctgcctct ggatctgctg ctgttcctga accccgacgc cttcagcgga 300
cctcaggcct gcacccggtt cttcagcaga atcaccaagg ccaacgtgga cctgctgccc 360
agaggcgccc ctgagagaca gagactgctg cctgctgctc tggcctgttg gggagtgcgg 420
ggctctctgc tgtctgaagc tgatgtgcgg gccctgggag gcctggcttg tgatctgcct 480
ggaagattcg tggccgagag cgccgaagtg ctgctgccta gactggtgtc ctgtcccggc 540
cctctggacc aggatcagca ggaagctgcc agagctgctc tgcagggcgg aggccctcct 600
tatggacctc ctagcacttg gagcgtgtcc accatggatg ccctgagggg cctgctgcca 660
gtgctgggcc agcctatcat cagatccatc ccacagggca tcgtggccgc ctggcggcag 720
agaagctcta gagatccctc ttggcggcag cccgagcgga caatcctgcg gcccaggttt 780
cggagagagg tggaaaagac cgcctgcccc tctggcaaga aggccagaga gatcgacgag 840
agcctgatct tctacaagaa gtgggagctg gaagcctgcg tggacgccgc tctgctggcc 900
acccagatgg acagagtgaa cgccatcccc ttcacctatg agcagctgga cgtgctgaag 960
cacaagctgg atgagctgta cccccagggc taccccgaga gcgtgatcca gcacctgggc 1020
tacctgtttc tgaagatgag ccccgaggac atccggaagt ggaacgtgac cagcctggaa 1080
accctgaagg ccctgctgga agtgaacaag ggccacgaga tgtcccccca ggtggccaca 1140
ctgatcgaca gattcgtgaa gggcagaggc cagctggaca aggacaccct ggatacactg 1200
accgccttct accccggcta tctgtgcagc ctgtcccccg aggaactgag cagcgtgcca 1260
cctagctcta tctgggctgt gcggccccag gacctggata cctgcgatcc tagacagctg 1320
gatgtgctgt atcccaaggc ccggctggcc ttccagaaca tgaacggcag cgagtacttc 1380
gtgaagatcc agtccttcct gggcggagcc cctaccgagg acctgaaagc tctgagccag 1440
cagaacgtgt ccatggatct ggccaccttt atgaagctgc ggaccgacgc cgtgctgcct 1500
ctgacagtgg ctgaggtgca gaaactgctg ggcccccatg tggaagggct gaaggccgaa 1560
gaacggcaca gacccgtgcg cgactggatc ctgaggcaga gacaggatga cctggacaca 1620
ctgggcctgg gactgcaggg gggcatccct aatggctacc tggtgctgga cctgagcatg 1680
caggaagccc tgggatccgg cgccaccaat ttcagcctgc tgaaacaggc cggcgacgtg 1740
gaagagaacc ctggccctac ccctggaacc cagagcccct tcttccttct gctgctgctg 1800
accgtgctga ctgtcgtgac aggctctggc cacgccagct ctacacctgg cggcgagaaa 1860
gagacaagcg ccacccagag aagcagcgtg ccaagcagca ccgagaagaa cgccgtgtcc 1920
atgaccagct ccgtgctgag cagccactct cctggcagcg gcagcagcac aacacagggc 1980
caggatgtga cactggcccc tgccacagaa cctgcctctg gatctgccgc cacctgggga 2040
caggacgtga caagcgtgcc agtgaccaga cctgccctgg gctctacaac accccctgcc 2100
cacgatgtga ccagcgcccc tgataacaag cctgcccctg gaagcacagc ccctccagct 2160
catggcgtga cctctgcccc agataccaga ccagccccag gatctacagc cccacccgca 2220
cacggcgtga caagtgcccc tgacacaaga cccgctccag gctctactgc tcctcctgcc 2280
catggcgtga caagcgctcc cgatacaagg ccagctcctg gctccacagc accaccagca 2340
catggcgtga catcagctcc cgacactaga cctgctcccg gatcaaccgc tccaccagct 2400
cacggcgtga ccagcgcacc tgataccaga cctgctctgg gaagcaccgc ccctcccgtg 2460
cacaatgtga catctgcttc cggcagcgcc agcggctctg cctctacact ggtgcacaac 2520
ggcaccagcg ccagagccac aacaacccca gccagcaaga gcaccccctt cagcatccct 2580
agccaccaca gcgacacccc taccacactg gccagccact ccaccaagac cgatgcctct 2640
agcacccacc actccagcgt gccccctctg accagcagca accacagcac aagcccccag 2700
ctgtctaccg gcgtctcatt cttctttctg tccttccaca tcagcaacct gcagttcaac 2760
agcagcctgg aagatcccag caccgactac taccaggaac tgcagcggga tatcagcgag 2820
atgttcctgc aaatctacaa gcagggcggc ttcctgggcc tgagcaacat caagttcaga 2880
cccggcagcg tggtggtgca gctgaccctg gctttccggg aaggcaccat caacgtgcac 2940
gacgtggaaa cccagttcaa ccagtacaag accgaggccg ccagccggta caacctgacc 3000
atctccgatg tgtccgtgtc cgacgtgccc ttcccattct ctgcccagtc tggcgcaggc 3060
gtgccaggat ggggaattgc tctgctggtg ctcgtgtgcg tgctggtggc cctggccatc 3120
gtgtatctga ttgccctggc cgtgtgccag tgccggcgga agaattacgg ccagctggac 3180
atcttccccg ccagagacac ctaccacccc atgagcgagt accccacata ccacacccac 3240
ggcagatacg tgccacccag ctccaccgac agatccccct acgagaaagt gtctgccggc 3300
aacggcggca gctccctgag ctacacaaat cctgccgtgg ccgctgcctc cgccaacctg 3360
<210> 24
<211> 1120
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 24
Met Ala Ser Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp
1 5 10 15
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
20 25 30
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
35 40 45
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
50 55 60
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
65 70 75 80
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
85 90 95
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
100 105 110
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
115 120 125
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
130 135 140
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
145 150 155 160
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
165 170 175
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
180 185 190
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
195 200 205
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
210 215 220
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
225 230 235 240
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
245 250 255
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
260 265 270
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
275 280 285
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
290 295 300
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
305 310 315 320
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
325 330 335
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
340 345 350
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
355 360 365
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
370 375 380
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
385 390 395 400
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
405 410 415
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
420 425 430
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
435 440 445
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
450 455 460
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
465 470 475 480
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
485 490 495
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
500 505 510
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
515 520 525
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
530 535 540
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
545 550 555 560
Gln Glu Ala Leu Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln
565 570 575
Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Pro Gly Thr Gln Ser
580 585 590
Pro Phe Phe Leu Leu Leu Leu Leu Thr Val Leu Thr Val Val Thr Gly
595 600 605
Ser Gly His Ala Ser Ser Thr Pro Gly Gly Glu Lys Glu Thr Ser Ala
610 615 620
Thr Gln Arg Ser Ser Val Pro Ser Ser Thr Glu Lys Asn Ala Val Ser
625 630 635 640
Met Thr Ser Ser Val Leu Ser Ser His Ser Pro Gly Ser Gly Ser Ser
645 650 655
Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro Ala Thr Glu Pro Ala
660 665 670
Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val Thr Ser Val Pro Val
675 680 685
Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala His Asp Val Thr
690 695 700
Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala
705 710 715 720
His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr
725 730 735
Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala
740 745 750
Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp
755 760 765
Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr
770 775 780
Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala
785 790 795 800
His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Leu Gly Ser Thr
805 810 815
Ala Pro Pro Val His Asn Val Thr Ser Ala Ser Gly Ser Ala Ser Gly
820 825 830
Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr
835 840 845
Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser
850 855 860
Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser
865 870 875 880
Ser Thr His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser
885 890 895
Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe
900 905 910
His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr
915 920 925
Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln
930 935 940
Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg
945 950 955 960
Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr
965 970 975
Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu
980 985 990
Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp
995 1000 1005
Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly
1010 1015 1020
Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu
1025 1030 1035
Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg
1040 1045 1050
Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg Asp Thr Tyr
1055 1060 1065
His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg Tyr
1070 1075 1080
Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val Ser
1085 1090 1095
Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val
1100 1105 1110
Ala Ala Ala Ser Ala Asn Leu
1115 1120
<210> 25
<211> 4302
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 25
atggctagca cccctggaac ccagagcccc ttcttccttc tgctgctgct gaccgtgctg 60
actgtcgtga caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 120
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 180
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 240
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 300
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 360
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 420
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 480
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 540
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 600
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 660
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 720
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 780
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 840
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 900
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 960
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 1020
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 1080
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 1140
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 1200
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 1260
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 1320
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 1380
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 1440
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 1500
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 1560
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct gggaggctcc 1620
ggcggaggag ctgccccgga gccggagagg acccccgttg gccagggatc gtgggcccat 1680
ccgggacgca ccaggggacc atccgacagg ggattctgtg tggtgtcacc ggccaggcca 1740
gcagaagagg caaccagcct cgagggagcg ttgtctggaa ccagacattc ccacccgtcg 1800
gtgggccggc agcaccacgc gggaccaccg tccacttcca gaccgccacg gccatgggac 1860
accccttgcc cgcctgtgta tgccgagact aaacacttcc tgtactcatc cggagacaag 1920
gaacagcttc ggccgtcctt cctcctgtcg tcgctcagac cgagcctgac cggagcacgc 1980
agattggtgg aaactatctt ccttgggtca cgtccgtgga tgccaggtac cccacggcgc 2040
ctcccgcgcc tcccacagag atactggcag atgcggcctc tgttcctgga attgctggga 2100
aaccacgctc agtgcccgta cggagtcctg ctcaagactc actgccctct gagggcggcg 2160
gtcactccgg cggccggagt gtgcgcacgg gagaagcccc agggaagcgt ggcagctccg 2220
gaagaggagg acaccgatcc gcgccgcctc gtgcaacttc tgcgccagca ctcctcgccc 2280
tggcaagtct acgggttcgt ccgcgcctgc ctgcgccgcc tggtgccgcc tgggctctgg 2340
ggttcccggc ataacgagcg ccgcttcctg agaaatacta agaagtttat ctcacttgga 2400
aaacatgcca agttgtcgct gcaagaactc acgtggaaga tgtcagtccg cgattgcgcc 2460
tggctgcgcc gctcgccggg cgtcgggtgt gttccagctg cagaacaccg cctgagagaa 2520
gaaattctgg ccaaatttct gcattggctg atgtcagtgt acgtggtcga gctgctgcgc 2580
tcctttttct acgtcactga gactaccttt caaaagaacc gcctgttctt ctaccgcaaa 2640
tctgtgtgga gcaagctgca gtcaatcggc attcgccagc atctgaagag ggtgcagctg 2700
cgggaacttt ccgaggcaga agtccgccag caccgggagg cccggccggc gcttctcacg 2760
tcgcgtctga gattcatccc aaagcccgac gggctgaggc ctatcgtcaa catggattac 2820
gtcgtgggcg ctcgcacctt tcgccgtgaa aagcgggccg aacgcttgac ctcacgggtg 2880
aaggccctct tctccgtgct gaactacgag agagcaagac ggcctggcct gctgggagct 2940
tcggtgctgg gactggacga tatccaccgg gcttggcgga cctttgttct ccgggtgaga 3000
gcccaagacc ctccgccgga actgtacttc gtgaaggtgg cgatcaccgg agcctatgat 3060
actattccgc aagatcgact caccgaagtc atcgcctcga tcatcaaacc gcagaacact 3120
tactgcgtca ggcggtacgc cgtggtccag aaggccgcgc atggccacgt gagaaaggcg 3180
ttcaagtcgc acgtgtccac tctcaccgac ctccagcctt acatgaggca attcgttgcg 3240
catttgcaag agacttcgcc cctgagagat gcggtggtca tcgagcagag ctccagcctg 3300
aacgaagcga gcagcggtct gtttgacgtg ttcctccgct tcatgtgtca tcacgcggtg 3360
cgaatcaggg gaaaatcata cgtgcagtgc cagggaatcc cacaaggcag cattctgtcg 3420
actctcttgt gttccctttg ctacggcgat atggaaaaca agctgttcgc tgggatcaga 3480
cgggacgggt tgctgctcag actggtggac gacttcctgc tggtgactcc gcacctcact 3540
cacgccaaaa cctttctccg cactctggtg aggggagtgc cagaatacgg ctgtgtggtc 3600
aatctccgga aaactgtggt gaatttccct gtcgaggatg aggcactcgg aggaaccgca 3660
tttgtccaaa tgccagcaca tggcctgttc ccatggtgcg gtctgctgct ggacacccga 3720
actcttgaag tgcagtccga ctactccagc tatgcccgga cgagcatccg cgccagcctc 3780
actttcaatc gcggctttaa ggccggacga aacatgcgca gaaagctttt cggagtcctc 3840
cggcttaaat gccattcgct ctttctcgat ctccaagtca attcgctgca gaccgtgtgc 3900
acgaacatct acaagatcct gctgctccaa gcctaccggt tccacgcttg cgtgcttcag 3960
ctgccgtttc accaacaggt gtggaagaac ccgaccttct ttctgcgggt cattagcgat 4020
actgcctccc tgtgttactc aatcctcaag gcaaagaacg ccggaatgtc gctgggtgcg 4080
aaaggagccg cgggacctct tcctagcgaa gcggtgcagt ggctctgcca ccaggctttc 4140
ctcctgaagc tgaccaggca cagagtgacc tacgtcccgc tgctgggctc gctgcgcact 4200
gcacagaccc agctgtctag aaaactcccc ggcaccaccc tgaccgctct ggaagccgcc 4260
gccaacccag cattgccgtc agatttcaag accatcttgg ac 4302
<210> 26
<211> 1434
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 26
Met Ala Ser Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu
1 5 10 15
Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr
20 25 30
Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro
35 40 45
Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser
50 55 60
Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val
65 70 75 80
Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp
85 90 95
Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser
100 105 110
Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro
115 120 125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
130 135 140
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
145 150 155 160
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
165 170 175
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
180 185 190
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
195 200 205
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
210 215 220
Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val
225 230 235 240
Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His
245 250 255
Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr
260 265 270
Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala
275 280 285
Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val
290 295 300
Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr
305 310 315 320
Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe
325 330 335
Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln
340 345 350
Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe
355 360 365
Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln
370 375 380
Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu
385 390 395 400
Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu
405 410 415
Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala
420 425 430
Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
435 440 445
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
450 455 460
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro
465 470 475 480
Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr
485 490 495
His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu
500 505 510
Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro
515 520 525
Ala Val Ala Ala Ala Ser Ala Asn Leu Gly Gly Ser Gly Gly Gly Ala
530 535 540
Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser Trp Ala His
545 550 555 560
Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val Val Ser
565 570 575
Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu Ser
580 585 590
Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His His Ala Gly
595 600 605
Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys Pro
610 615 620
Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser Gly Asp Lys
625 630 635 640
Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser Leu
645 650 655
Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser Arg Pro
660 665 670
Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg Tyr
675 680 685
Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His Ala Gln
690 695 700
Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg Ala Ala
705 710 715 720
Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gln Gly Ser
725 730 735
Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu Val Gln
740 745 750
Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe Val Arg
755 760 765
Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser Arg His
770 775 780
Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu Gly
785 790 795 800
Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met Ser Val
805 810 815
Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys Val Pro
820 825 830
Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu His
835 840 845
Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr
850 855 860
Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys
865 870 875 880
Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys
885 890 895
Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg
900 905 910
Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys
915 920 925
Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala
930 935 940
Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg Val
945 950 955 960
Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly
965 970 975
Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp
980 985 990
Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu
995 1000 1005
Tyr Phe Val Lys Val Ala Ile Thr Gly Ala Tyr Asp Thr Ile Pro
1010 1015 1020
Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln
1025 1030 1035
Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala
1040 1045 1050
His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu
1055 1060 1065
Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln
1070 1075 1080
Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser
1085 1090 1095
Ser Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg
1100 1105 1110
Phe Met Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val
1115 1120 1125
Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu
1130 1135 1140
Cys Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly
1145 1150 1155
Ile Arg Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu
1160 1165 1170
Leu Val Thr Pro His Leu Thr His Ala Lys Thr Phe Leu Arg Thr
1175 1180 1185
Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg
1190 1195 1200
Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly
1205 1210 1215
Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys
1220 1225 1230
Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr
1235 1240 1245
Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn
1250 1255 1260
Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly
1265 1270 1275
Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val
1280 1285 1290
Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu
1295 1300 1305
Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe
1310 1315 1320
His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile
1325 1330 1335
Ser Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn
1340 1345 1350
Ala Gly Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro
1355 1360 1365
Ser Glu Ala Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys
1370 1375 1380
Leu Thr Arg His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu
1385 1390 1395
Arg Thr Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr
1400 1405 1410
Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp
1415 1420 1425
Phe Lys Thr Ile Leu Asp
1430
<210> 27
<211> 4371
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 27
atggctagca cccctggaac ccagagcccc ttcttccttc tgctgctgct gaccgtgctg 60
actgtcgtga caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 120
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 180
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 240
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 300
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 360
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 420
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 480
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 540
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 600
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 660
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 720
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 780
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 840
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 900
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 960
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 1020
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 1080
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 1140
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 1200
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 1260
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 1320
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 1380
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 1440
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 1500
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 1560
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct gggatccggc 1620
acaatcctgt ctgagggcgc caccaacttc agcctgctga aactggccgg cgacgtggaa 1680
ctgaaccctg gccctggagc tgccccggag ccggagagga cccccgttgg ccagggatcg 1740
tgggcccatc cgggacgcac caggggacca tccgacaggg gattctgtgt ggtgtcaccg 1800
gccaggccag cagaagaggc aaccagcctc gagggagcgt tgtctggaac cagacattcc 1860
cacccgtcgg tgggccggca gcaccacgcg ggaccaccgt ccacttccag accgccacgg 1920
ccatgggaca ccccttgccc gcctgtgtat gccgagacta aacacttcct gtactcatcc 1980
ggagacaagg aacagcttcg gccgtccttc ctcctgtcgt cgctcagacc gagcctgacc 2040
ggagcacgca gattggtgga aactatcttc cttgggtcac gtccgtggat gccaggtacc 2100
ccacggcgcc tcccgcgcct cccacagaga tactggcaga tgcggcctct gttcctggaa 2160
ttgctgggaa accacgctca gtgcccgtac ggagtcctgc tcaagactca ctgccctctg 2220
agggcggcgg tcactccggc ggccggagtg tgcgcacggg agaagcccca gggaagcgtg 2280
gcagctccgg aagaggagga caccgatccg cgccgcctcg tgcaacttct gcgccagcac 2340
tcctcgccct ggcaagtcta cgggttcgtc cgcgcctgcc tgcgccgcct ggtgccgcct 2400
gggctctggg gttcccggca taacgagcgc cgcttcctga gaaatactaa gaagtttatc 2460
tcacttggaa aacatgccaa gttgtcgctg caagaactca cgtggaagat gtcagtccgc 2520
gattgcgcct ggctgcgccg ctcgccgggc gtcgggtgtg ttccagctgc agaacaccgc 2580
ctgagagaag aaattctggc caaatttctg cattggctga tgtcagtgta cgtggtcgag 2640
ctgctgcgct cctttttcta cgtcactgag actacctttc aaaagaaccg cctgttcttc 2700
taccgcaaat ctgtgtggag caagctgcag tcaatcggca ttcgccagca tctgaagagg 2760
gtgcagctgc gggaactttc cgaggcagaa gtccgccagc accgggaggc ccggccggcg 2820
cttctcacgt cgcgtctgag attcatccca aagcccgacg ggctgaggcc tatcgtcaac 2880
atggattacg tcgtgggcgc tcgcaccttt cgccgtgaaa agcgggccga acgcttgacc 2940
tcacgggtga aggccctctt ctccgtgctg aactacgaga gagcaagacg gcctggcctg 3000
ctgggagctt cggtgctggg actggacgat atccaccggg cttggcggac ctttgttctc 3060
cgggtgagag cccaagaccc tccgccggaa ctgtacttcg tgaaggtggc gatcaccgga 3120
gcctatgata ctattccgca agatcgactc accgaagtca tcgcctcgat catcaaaccg 3180
cagaacactt actgcgtcag gcggtacgcc gtggtccaga aggccgcgca tggccacgtg 3240
agaaaggcgt tcaagtcgca cgtgtccact ctcaccgacc tccagcctta catgaggcaa 3300
ttcgttgcgc atttgcaaga gacttcgccc ctgagagatg cggtggtcat cgagcagagc 3360
tccagcctga acgaagcgag cagcggtctg tttgacgtgt tcctccgctt catgtgtcat 3420
cacgcggtgc gaatcagggg aaaatcatac gtgcagtgcc agggaatccc acaaggcagc 3480
attctgtcga ctctcttgtg ttccctttgc tacggcgata tggaaaacaa gctgttcgct 3540
gggatcagac gggacgggtt gctgctcaga ctggtggacg acttcctgct ggtgactccg 3600
cacctcactc acgccaaaac ctttctccgc actctggtga ggggagtgcc agaatacggc 3660
tgtgtggtca atctccggaa aactgtggtg aatttccctg tcgaggatga ggcactcgga 3720
ggaaccgcat ttgtccaaat gccagcacat ggcctgttcc catggtgcgg tctgctgctg 3780
gacacccgaa ctcttgaagt gcagtccgac tactccagct atgcccggac gagcatccgc 3840
gccagcctca ctttcaatcg cggctttaag gccggacgaa acatgcgcag aaagcttttc 3900
ggagtcctcc ggcttaaatg ccattcgctc tttctcgatc tccaagtcaa ttcgctgcag 3960
accgtgtgca cgaacatcta caagatcctg ctgctccaag cctaccggtt ccacgcttgc 4020
gtgcttcagc tgccgtttca ccaacaggtg tggaagaacc cgaccttctt tctgcgggtc 4080
attagcgata ctgcctccct gtgttactca atcctcaagg caaagaacgc cggaatgtcg 4140
ctgggtgcga aaggagccgc gggacctctt cctagcgaag cggtgcagtg gctctgccac 4200
caggctttcc tcctgaagct gaccaggcac agagtgacct acgtcccgct gctgggctcg 4260
ctgcgcactg cacagaccca gctgtctaga aaactccccg gcaccaccct gaccgctctg 4320
gaagccgccg ccaacccagc attgccgtca gatttcaaga ccatcttgga c 4371
<210> 28
<211> 1457
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 28
Met Ala Ser Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu
1 5 10 15
Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr
20 25 30
Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro
35 40 45
Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser
50 55 60
Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val
65 70 75 80
Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp
85 90 95
Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser
100 105 110
Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro
115 120 125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
130 135 140
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
145 150 155 160
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
165 170 175
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
180 185 190
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
195 200 205
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
210 215 220
Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val
225 230 235 240
Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His
245 250 255
Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr
260 265 270
Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala
275 280 285
Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val
290 295 300
Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr
305 310 315 320
Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe
325 330 335
Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln
340 345 350
Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe
355 360 365
Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln
370 375 380
Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu
385 390 395 400
Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu
405 410 415
Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala
420 425 430
Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
435 440 445
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
450 455 460
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro
465 470 475 480
Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr
485 490 495
His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu
500 505 510
Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro
515 520 525
Ala Val Ala Ala Ala Ser Ala Asn Leu Gly Ser Gly Thr Ile Leu Ser
530 535 540
Glu Gly Ala Thr Asn Phe Ser Leu Leu Lys Leu Ala Gly Asp Val Glu
545 550 555 560
Leu Asn Pro Gly Pro Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val
565 570 575
Gly Gln Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp
580 585 590
Arg Gly Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr
595 600 605
Ser Leu Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val
610 615 620
Gly Arg Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg
625 630 635 640
Pro Trp Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe
645 650 655
Leu Tyr Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu
660 665 670
Ser Ser Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr
675 680 685
Ile Phe Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu
690 695 700
Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu
705 710 715 720
Leu Leu Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr
725 730 735
His Cys Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala
740 745 750
Arg Glu Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr
755 760 765
Asp Pro Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp
770 775 780
Gln Val Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro
785 790 795 800
Gly Leu Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr
805 810 815
Lys Lys Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu
820 825 830
Leu Thr Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser
835 840 845
Pro Gly Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu
850 855 860
Ile Leu Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu
865 870 875 880
Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn
885 890 895
Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile
900 905 910
Gly Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu
915 920 925
Ala Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser
930 935 940
Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn
945 950 955 960
Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala
965 970 975
Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr
980 985 990
Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu
995 1000 1005
Asp Asp Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg
1010 1015 1020
Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile
1025 1030 1035
Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val
1040 1045 1050
Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg
1055 1060 1065
Tyr Ala Val Val Gln Lys Ala Ala His Gly His Val Arg Lys Ala
1070 1075 1080
Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met
1085 1090 1095
Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser Pro Leu Arg Asp
1100 1105 1110
Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala Ser Ser
1115 1120 1125
Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His Ala Val
1130 1135 1140
Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln
1145 1150 1155
Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp
1160 1165 1170
Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu
1175 1180 1185
Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr
1190 1195 1200
His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu
1205 1210 1215
Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro
1220 1225 1230
Val Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro
1235 1240 1245
Ala His Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg
1250 1255 1260
Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser
1265 1270 1275
Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg
1280 1285 1290
Asn Met Arg Arg Lys Leu Phe Gly Val Leu Arg Leu Lys Cys His
1295 1300 1305
Ser Leu Phe Leu Asp Leu Gln Val Asn Ser Leu Gln Thr Val Cys
1310 1315 1320
Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala Tyr Arg Phe His
1325 1330 1335
Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln Val Trp Lys Asn
1340 1345 1350
Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala Ser Leu Cys
1355 1360 1365
Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu Gly Ala
1370 1375 1380
Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu
1385 1390 1395
Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr
1400 1405 1410
Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu
1415 1420 1425
Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala
1430 1435 1440
Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
1445 1450 1455
<210> 29
<211> 4371
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 29
atggctagcg gagctgcccc ggagccggag aggacccccg ttggccaggg atcgtgggcc 60
catccgggac gcaccagggg accatccgac aggggattct gtgtggtgtc accggccagg 120
ccagcagaag aggcaaccag cctcgaggga gcgttgtctg gaaccagaca ttcccacccg 180
tcggtgggcc ggcagcacca cgcgggacca ccgtccactt ccagaccgcc acggccatgg 240
gacacccctt gcccgcctgt gtatgccgag actaaacact tcctgtactc atccggagac 300
aaggaacagc ttcggccgtc cttcctcctg tcgtcgctca gaccgagcct gaccggagca 360
cgcagattgg tggaaactat cttccttggg tcacgtccgt ggatgccagg taccccacgg 420
cgcctcccgc gcctcccaca gagatactgg cagatgcggc ctctgttcct ggaattgctg 480
ggaaaccacg ctcagtgccc gtacggagtc ctgctcaaga ctcactgccc tctgagggcg 540
gcggtcactc cggcggccgg agtgtgcgca cgggagaagc cccagggaag cgtggcagct 600
ccggaagagg aggacaccga tccgcgccgc ctcgtgcaac ttctgcgcca gcactcctcg 660
ccctggcaag tctacgggtt cgtccgcgcc tgcctgcgcc gcctggtgcc gcctgggctc 720
tggggttccc ggcataacga gcgccgcttc ctgagaaata ctaagaagtt tatctcactt 780
ggaaaacatg ccaagttgtc gctgcaagaa ctcacgtgga agatgtcagt ccgcgattgc 840
gcctggctgc gccgctcgcc gggcgtcggg tgtgttccag ctgcagaaca ccgcctgaga 900
gaagaaattc tggccaaatt tctgcattgg ctgatgtcag tgtacgtggt cgagctgctg 960
cgctcctttt tctacgtcac tgagactacc tttcaaaaga accgcctgtt cttctaccgc 1020
aaatctgtgt ggagcaagct gcagtcaatc ggcattcgcc agcatctgaa gagggtgcag 1080
ctgcgggaac tttccgaggc agaagtccgc cagcaccggg aggcccggcc ggcgcttctc 1140
acgtcgcgtc tgagattcat cccaaagccc gacgggctga ggcctatcgt caacatggat 1200
tacgtcgtgg gcgctcgcac ctttcgccgt gaaaagcggg ccgaacgctt gacctcacgg 1260
gtgaaggccc tcttctccgt gctgaactac gagagagcaa gacggcctgg cctgctggga 1320
gcttcggtgc tgggactgga cgatatccac cgggcttggc ggacctttgt tctccgggtg 1380
agagcccaag accctccgcc ggaactgtac ttcgtgaagg tggcgatcac cggagcctat 1440
gatactattc cgcaagatcg actcaccgaa gtcatcgcct cgatcatcaa accgcagaac 1500
acttactgcg tcaggcggta cgccgtggtc cagaaggccg cgcatggcca cgtgagaaag 1560
gcgttcaagt cgcacgtgtc cactctcacc gacctccagc cttacatgag gcaattcgtt 1620
gcgcatttgc aagagacttc gcccctgaga gatgcggtgg tcatcgagca gagctccagc 1680
ctgaacgaag cgagcagcgg tctgtttgac gtgttcctcc gcttcatgtg tcatcacgcg 1740
gtgcgaatca ggggaaaatc atacgtgcag tgccagggaa tcccacaagg cagcattctg 1800
tcgactctct tgtgttccct ttgctacggc gatatggaaa acaagctgtt cgctgggatc 1860
agacgggacg ggttgctgct cagactggtg gacgacttcc tgctggtgac tccgcacctc 1920
actcacgcca aaacctttct ccgcactctg gtgaggggag tgccagaata cggctgtgtg 1980
gtcaatctcc ggaaaactgt ggtgaatttc cctgtcgagg atgaggcact cggaggaacc 2040
gcatttgtcc aaatgccagc acatggcctg ttcccatggt gcggtctgct gctggacacc 2100
cgaactcttg aagtgcagtc cgactactcc agctatgccc ggacgagcat ccgcgccagc 2160
ctcactttca atcgcggctt taaggccgga cgaaacatgc gcagaaagct tttcggagtc 2220
ctccggctta aatgccattc gctctttctc gatctccaag tcaattcgct gcagaccgtg 2280
tgcacgaaca tctacaagat cctgctgctc caagcctacc ggttccacgc ttgcgtgctt 2340
cagctgccgt ttcaccaaca ggtgtggaag aacccgacct tctttctgcg ggtcattagc 2400
gatactgcct ccctgtgtta ctcaatcctc aaggcaaaga acgccggaat gtcgctgggt 2460
gcgaaaggag ccgcgggacc tcttcctagc gaagcggtgc agtggctctg ccaccaggct 2520
ttcctcctga agctgaccag gcacagagtg acctacgtcc cgctgctggg ctcgctgcgc 2580
actgcacaga cccagctgtc tagaaaactc cccggcacca ccctgaccgc tctggaagcc 2640
gccgccaacc cagcattgcc gtcagatttc aagaccatct tggacggatc cggcacaatc 2700
ctgtctgagg gcgccaccaa cttcagcctg ctgaaactgg ccggcgacgt ggaactgaac 2760
cctggcccta cccctggaac ccagagcccc ttcttccttc tgctgctgct gaccgtgctg 2820
actgtcgtga caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 2880
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 2940
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 3000
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 3060
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 3120
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 3180
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 3240
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 3300
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 3360
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 3420
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 3480
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 3540
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 3600
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 3660
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 3720
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 3780
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 3840
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 3900
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 3960
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 4020
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 4080
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 4140
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 4200
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 4260
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 4320
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct g 4371
<210> 30
<211> 1457
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 30
Met Ala Ser Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln
1 5 10 15
Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly
20 25 30
Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu
35 40 45
Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg
50 55 60
Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp
65 70 75 80
Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr
85 90 95
Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser
100 105 110
Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe
115 120 125
Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg
130 135 140
Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu
145 150 155 160
Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys
165 170 175
Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu
180 185 190
Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro
195 200 205
Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val
210 215 220
Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu
225 230 235 240
Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys
245 250 255
Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr
260 265 270
Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly
275 280 285
Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu
290 295 300
Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
305 310 315 320
Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu
325 330 335
Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
340 345 350
Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu
355 360 365
Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu
370 375 380
Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp
385 390 395 400
Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg
405 410 415
Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg
420 425 430
Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp
435 440 445
Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp
450 455 460
Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr Gly Ala Tyr
465 470 475 480
Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile
485 490 495
Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys
500 505 510
Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr
515 520 525
Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln
530 535 540
Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser
545 550 555 560
Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met
565 570 575
Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln
580 585 590
Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys
595 600 605
Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly
610 615 620
Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu
625 630 635 640
Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu
645 650 655
Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val
660 665 670
Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His
675 680 685
Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu
690 695 700
Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser
705 710 715 720
Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys
725 730 735
Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu
740 745 750
Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu
755 760 765
Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe
770 775 780
His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser
785 790 795 800
Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly
805 810 815
Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala
820 825 830
Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His
835 840 845
Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr
850 855 860
Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala
865 870 875 880
Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp Gly
885 890 895
Ser Gly Thr Ile Leu Ser Glu Gly Ala Thr Asn Phe Ser Leu Leu Lys
900 905 910
Leu Ala Gly Asp Val Glu Leu Asn Pro Gly Pro Thr Pro Gly Thr Gln
915 920 925
Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr Val Leu Thr Val Val Thr
930 935 940
Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly Glu Lys Glu Thr Ser
945 950 955 960
Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr Glu Lys Asn Ala Val
965 970 975
Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro Gly Ser Gly Ser
980 985 990
Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro Ala Thr Glu Pro
995 1000 1005
Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val Thr Ser Val
1010 1015 1020
Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala His
1025 1030 1035
Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr
1040 1045 1050
Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
1055 1060 1065
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala
1070 1075 1080
Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
1085 1090 1095
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr
1100 1105 1110
Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
1115 1120 1125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala
1130 1135 1140
Pro Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His
1145 1150 1155
Asn Val Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr
1160 1165 1170
Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala
1175 1180 1185
Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser Asp Thr
1190 1195 1200
Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser
1205 1210 1215
Thr His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser
1220 1225 1230
Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser
1235 1240 1245
Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro
1250 1255 1260
Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met
1265 1270 1275
Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn
1280 1285 1290
Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala
1295 1300 1305
Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe
1310 1315 1320
Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile
1325 1330 1335
Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln
1340 1345 1350
Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
1355 1360 1365
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu
1370 1375 1380
Ala Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile
1385 1390 1395
Phe Pro Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr
1400 1405 1410
Tyr His Thr His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg
1415 1420 1425
Ser Pro Tyr Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu
1430 1435 1440
Ser Tyr Thr Asn Pro Ala Val Ala Ala Ala Ser Ala Asn Leu
1445 1450 1455
<210> 31
<211> 4311
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 31
atggctagca caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 60
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 120
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 180
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 240
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 300
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 360
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 420
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 480
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 540
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 600
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 660
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 720
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 780
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 840
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 900
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 960
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 1020
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 1080
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 1140
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 1200
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 1260
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 1320
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 1380
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 1440
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 1500
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct gggatccggc 1560
acaatcctgt ctgagggcgc caccaacttc agcctgctga aactggccgg cgacgtggaa 1620
ctgaaccctg gccctggagc tgccccggag ccggagagga cccccgttgg ccagggatcg 1680
tgggcccatc cgggacgcac caggggacca tccgacaggg gattctgtgt ggtgtcaccg 1740
gccaggccag cagaagaggc aaccagcctc gagggagcgt tgtctggaac cagacattcc 1800
cacccgtcgg tgggccggca gcaccacgcg ggaccaccgt ccacttccag accgccacgg 1860
ccatgggaca ccccttgccc gcctgtgtat gccgagacta aacacttcct gtactcatcc 1920
ggagacaagg aacagcttcg gccgtccttc ctcctgtcgt cgctcagacc gagcctgacc 1980
ggagcacgca gattggtgga aactatcttc cttgggtcac gtccgtggat gccaggtacc 2040
ccacggcgcc tcccgcgcct cccacagaga tactggcaga tgcggcctct gttcctggaa 2100
ttgctgggaa accacgctca gtgcccgtac ggagtcctgc tcaagactca ctgccctctg 2160
agggcggcgg tcactccggc ggccggagtg tgcgcacggg agaagcccca gggaagcgtg 2220
gcagctccgg aagaggagga caccgatccg cgccgcctcg tgcaacttct gcgccagcac 2280
tcctcgccct ggcaagtcta cgggttcgtc cgcgcctgcc tgcgccgcct ggtgccgcct 2340
gggctctggg gttcccggca taacgagcgc cgcttcctga gaaatactaa gaagtttatc 2400
tcacttggaa aacatgccaa gttgtcgctg caagaactca cgtggaagat gtcagtccgc 2460
gattgcgcct ggctgcgccg ctcgccgggc gtcgggtgtg ttccagctgc agaacaccgc 2520
ctgagagaag aaattctggc caaatttctg cattggctga tgtcagtgta cgtggtcgag 2580
ctgctgcgct cctttttcta cgtcactgag actacctttc aaaagaaccg cctgttcttc 2640
taccgcaaat ctgtgtggag caagctgcag tcaatcggca ttcgccagca tctgaagagg 2700
gtgcagctgc gggaactttc cgaggcagaa gtccgccagc accgggaggc ccggccggcg 2760
cttctcacgt cgcgtctgag attcatccca aagcccgacg ggctgaggcc tatcgtcaac 2820
atggattacg tcgtgggcgc tcgcaccttt cgccgtgaaa agcgggccga acgcttgacc 2880
tcacgggtga aggccctctt ctccgtgctg aactacgaga gagcaagacg gcctggcctg 2940
ctgggagctt cggtgctggg actggacgat atccaccggg cttggcggac ctttgttctc 3000
cgggtgagag cccaagaccc tccgccggaa ctgtacttcg tgaaggtggc gatcaccgga 3060
gcctatgata ctattccgca agatcgactc accgaagtca tcgcctcgat catcaaaccg 3120
cagaacactt actgcgtcag gcggtacgcc gtggtccaga aggccgcgca tggccacgtg 3180
agaaaggcgt tcaagtcgca cgtgtccact ctcaccgacc tccagcctta catgaggcaa 3240
ttcgttgcgc atttgcaaga gacttcgccc ctgagagatg cggtggtcat cgagcagagc 3300
tccagcctga acgaagcgag cagcggtctg tttgacgtgt tcctccgctt catgtgtcat 3360
cacgcggtgc gaatcagggg aaaatcatac gtgcagtgcc agggaatccc acaaggcagc 3420
attctgtcga ctctcttgtg ttccctttgc tacggcgata tggaaaacaa gctgttcgct 3480
gggatcagac gggacgggtt gctgctcaga ctggtggacg acttcctgct ggtgactccg 3540
cacctcactc acgccaaaac ctttctccgc actctggtga ggggagtgcc agaatacggc 3600
tgtgtggtca atctccggaa aactgtggtg aatttccctg tcgaggatga ggcactcgga 3660
ggaaccgcat ttgtccaaat gccagcacat ggcctgttcc catggtgcgg tctgctgctg 3720
gacacccgaa ctcttgaagt gcagtccgac tactccagct atgcccggac gagcatccgc 3780
gccagcctca ctttcaatcg cggctttaag gccggacgaa acatgcgcag aaagcttttc 3840
ggagtcctcc ggcttaaatg ccattcgctc tttctcgatc tccaagtcaa ttcgctgcag 3900
accgtgtgca cgaacatcta caagatcctg ctgctccaag cctaccggtt ccacgcttgc 3960
gtgcttcagc tgccgtttca ccaacaggtg tggaagaacc cgaccttctt tctgcgggtc 4020
attagcgata ctgcctccct gtgttactca atcctcaagg caaagaacgc cggaatgtcg 4080
ctgggtgcga aaggagccgc gggacctctt cctagcgaag cggtgcagtg gctctgccac 4140
caggctttcc tcctgaagct gaccaggcac agagtgacct acgtcccgct gctgggctcg 4200
ctgcgcactg cacagaccca gctgtctaga aaactccccg gcaccaccct gaccgctctg 4260
gaagccgccg ccaacccagc attgccgtca gatttcaaga ccatcttgga c 4311
<210> 32
<211> 1437
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 32
Met Ala Ser Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly Glu
1 5 10 15
Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr Glu
20 25 30
Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
35 40 45
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
50 55 60
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
65 70 75 80
Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro
85 90 95
Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser
100 105 110
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
115 120 125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
130 135 140
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
145 150 155 160
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
165 170 175
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
180 185 190
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
195 200 205
Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala Ser
210 215 220
Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser
225 230 235 240
Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile
245 250 255
Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr
260 265 270
Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro Leu Thr
275 280 285
Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe
290 295 300
Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu
305 310 315 320
Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser
325 330 335
Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser
340 345 350
Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala
355 360 365
Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn
370 375 380
Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp
385 390 395 400
Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala
405 410 415
Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu
420 425 430
Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys
435 440 445
Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg Asp Thr
450 455 460
Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg Tyr
465 470 475 480
Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val Ser Ala
485 490 495
Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val Ala Ala
500 505 510
Ala Ser Ala Asn Leu Gly Ser Gly Thr Ile Leu Ser Glu Gly Ala Thr
515 520 525
Asn Phe Ser Leu Leu Lys Leu Ala Gly Asp Val Glu Leu Asn Pro Gly
530 535 540
Pro Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser
545 550 555 560
Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys
565 570 575
Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly
580 585 590
Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His
595 600 605
His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr
610 615 620
Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser
625 630 635 640
Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg
645 650 655
Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly
660 665 670
Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro
675 680 685
Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn
690 695 700
His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu
705 710 715 720
Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro
725 730 735
Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg
740 745 750
Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly
755 760 765
Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly
770 775 780
Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile
785 790 795 800
Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys
805 810 815
Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly
820 825 830
Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys
835 840 845
Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser
850 855 860
Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe
865 870 875 880
Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln
885 890 895
His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg
900 905 910
Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe
915 920 925
Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val
930 935 940
Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr
945 950 955 960
Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg
965 970 975
Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His
980 985 990
Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro
995 1000 1005
Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr Gly Ala Tyr Asp
1010 1015 1020
Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile
1025 1030 1035
Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln
1040 1045 1050
Lys Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val
1055 1060 1065
Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala
1070 1075 1080
His Leu Gln Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu
1085 1090 1095
Gln Ser Ser Ser Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val
1100 1105 1110
Phe Leu Arg Phe Met Cys His His Ala Val Arg Ile Arg Gly Lys
1115 1120 1125
Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser
1130 1135 1140
Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu
1145 1150 1155
Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg Leu Val Asp
1160 1165 1170
Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala Lys Thr Phe
1175 1180 1185
Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val Val
1190 1195 1200
Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala
1205 1210 1215
Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe
1220 1225 1230
Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln
1235 1240 1245
Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu
1250 1255 1260
Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys
1265 1270 1275
Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp
1280 1285 1290
Leu Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys
1295 1300 1305
Ile Leu Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln
1310 1315 1320
Leu Pro Phe His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu
1325 1330 1335
Arg Val Ile Ser Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys
1340 1345 1350
Ala Lys Asn Ala Gly Met Ser Leu Gly Ala Lys Gly Ala Ala Gly
1355 1360 1365
Pro Leu Pro Ser Glu Ala Val Gln Trp Leu Cys His Gln Ala Phe
1370 1375 1380
Leu Leu Lys Leu Thr Arg His Arg Val Thr Tyr Val Pro Leu Leu
1385 1390 1395
Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro
1400 1405 1410
Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro Ala Leu
1415 1420 1425
Pro Ser Asp Phe Lys Thr Ile Leu Asp
1430 1435
<210> 33
<211> 4311
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 33
atggctagcg gagctgcccc ggagccggag aggacccccg ttggccaggg atcgtgggcc 60
catccgggac gcaccagggg accatccgac aggggattct gtgtggtgtc accggccagg 120
ccagcagaag aggcaaccag cctcgaggga gcgttgtctg gaaccagaca ttcccacccg 180
tcggtgggcc ggcagcacca cgcgggacca ccgtccactt ccagaccgcc acggccatgg 240
gacacccctt gcccgcctgt gtatgccgag actaaacact tcctgtactc atccggagac 300
aaggaacagc ttcggccgtc cttcctcctg tcgtcgctca gaccgagcct gaccggagca 360
cgcagattgg tggaaactat cttccttggg tcacgtccgt ggatgccagg taccccacgg 420
cgcctcccgc gcctcccaca gagatactgg cagatgcggc ctctgttcct ggaattgctg 480
ggaaaccacg ctcagtgccc gtacggagtc ctgctcaaga ctcactgccc tctgagggcg 540
gcggtcactc cggcggccgg agtgtgcgca cgggagaagc cccagggaag cgtggcagct 600
ccggaagagg aggacaccga tccgcgccgc ctcgtgcaac ttctgcgcca gcactcctcg 660
ccctggcaag tctacgggtt cgtccgcgcc tgcctgcgcc gcctggtgcc gcctgggctc 720
tggggttccc ggcataacga gcgccgcttc ctgagaaata ctaagaagtt tatctcactt 780
ggaaaacatg ccaagttgtc gctgcaagaa ctcacgtgga agatgtcagt ccgcgattgc 840
gcctggctgc gccgctcgcc gggcgtcggg tgtgttccag ctgcagaaca ccgcctgaga 900
gaagaaattc tggccaaatt tctgcattgg ctgatgtcag tgtacgtggt cgagctgctg 960
cgctcctttt tctacgtcac tgagactacc tttcaaaaga accgcctgtt cttctaccgc 1020
aaatctgtgt ggagcaagct gcagtcaatc ggcattcgcc agcatctgaa gagggtgcag 1080
ctgcgggaac tttccgaggc agaagtccgc cagcaccggg aggcccggcc ggcgcttctc 1140
acgtcgcgtc tgagattcat cccaaagccc gacgggctga ggcctatcgt caacatggat 1200
tacgtcgtgg gcgctcgcac ctttcgccgt gaaaagcggg ccgaacgctt gacctcacgg 1260
gtgaaggccc tcttctccgt gctgaactac gagagagcaa gacggcctgg cctgctggga 1320
gcttcggtgc tgggactgga cgatatccac cgggcttggc ggacctttgt tctccgggtg 1380
agagcccaag accctccgcc ggaactgtac ttcgtgaagg tggcgatcac cggagcctat 1440
gatactattc cgcaagatcg actcaccgaa gtcatcgcct cgatcatcaa accgcagaac 1500
acttactgcg tcaggcggta cgccgtggtc cagaaggccg cgcatggcca cgtgagaaag 1560
gcgttcaagt cgcacgtgtc cactctcacc gacctccagc cttacatgag gcaattcgtt 1620
gcgcatttgc aagagacttc gcccctgaga gatgcggtgg tcatcgagca gagctccagc 1680
ctgaacgaag cgagcagcgg tctgtttgac gtgttcctcc gcttcatgtg tcatcacgcg 1740
gtgcgaatca ggggaaaatc atacgtgcag tgccagggaa tcccacaagg cagcattctg 1800
tcgactctct tgtgttccct ttgctacggc gatatggaaa acaagctgtt cgctgggatc 1860
agacgggacg ggttgctgct cagactggtg gacgacttcc tgctggtgac tccgcacctc 1920
actcacgcca aaacctttct ccgcactctg gtgaggggag tgccagaata cggctgtgtg 1980
gtcaatctcc ggaaaactgt ggtgaatttc cctgtcgagg atgaggcact cggaggaacc 2040
gcatttgtcc aaatgccagc acatggcctg ttcccatggt gcggtctgct gctggacacc 2100
cgaactcttg aagtgcagtc cgactactcc agctatgccc ggacgagcat ccgcgccagc 2160
ctcactttca atcgcggctt taaggccgga cgaaacatgc gcagaaagct tttcggagtc 2220
ctccggctta aatgccattc gctctttctc gatctccaag tcaattcgct gcagaccgtg 2280
tgcacgaaca tctacaagat cctgctgctc caagcctacc ggttccacgc ttgcgtgctt 2340
cagctgccgt ttcaccaaca ggtgtggaag aacccgacct tctttctgcg ggtcattagc 2400
gatactgcct ccctgtgtta ctcaatcctc aaggcaaaga acgccggaat gtcgctgggt 2460
gcgaaaggag ccgcgggacc tcttcctagc gaagcggtgc agtggctctg ccaccaggct 2520
ttcctcctga agctgaccag gcacagagtg acctacgtcc cgctgctggg ctcgctgcgc 2580
actgcacaga cccagctgtc tagaaaactc cccggcacca ccctgaccgc tctggaagcc 2640
gccgccaacc cagcattgcc gtcagatttc aagaccatct tggacggatc cggcacaatc 2700
ctgtctgagg gcgccaccaa cttcagcctg ctgaaactgg ccggcgacgt ggaactgaac 2760
cctggcccta caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 2820
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 2880
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 2940
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 3000
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 3060
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 3120
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 3180
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 3240
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 3300
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 3360
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 3420
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 3480
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 3540
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 3600
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 3660
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 3720
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 3780
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 3840
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 3900
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 3960
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 4020
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 4080
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 4140
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 4200
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 4260
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct g 4311
<210> 34
<211> 1437
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 34
Met Ala Ser Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln
1 5 10 15
Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly
20 25 30
Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu
35 40 45
Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg
50 55 60
Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp
65 70 75 80
Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr
85 90 95
Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser
100 105 110
Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe
115 120 125
Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg
130 135 140
Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu
145 150 155 160
Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys
165 170 175
Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu
180 185 190
Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro
195 200 205
Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val
210 215 220
Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu
225 230 235 240
Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys
245 250 255
Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr
260 265 270
Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly
275 280 285
Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu
290 295 300
Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
305 310 315 320
Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu
325 330 335
Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
340 345 350
Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu
355 360 365
Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu
370 375 380
Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp
385 390 395 400
Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg
405 410 415
Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg
420 425 430
Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp
435 440 445
Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp
450 455 460
Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr Gly Ala Tyr
465 470 475 480
Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile
485 490 495
Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys
500 505 510
Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr
515 520 525
Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln
530 535 540
Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser
545 550 555 560
Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met
565 570 575
Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln
580 585 590
Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys
595 600 605
Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly
610 615 620
Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu
625 630 635 640
Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu
645 650 655
Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val
660 665 670
Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His
675 680 685
Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu
690 695 700
Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser
705 710 715 720
Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys
725 730 735
Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu
740 745 750
Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu
755 760 765
Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe
770 775 780
His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser
785 790 795 800
Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly
805 810 815
Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala
820 825 830
Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His
835 840 845
Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr
850 855 860
Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala
865 870 875 880
Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp Gly
885 890 895
Ser Gly Thr Ile Leu Ser Glu Gly Ala Thr Asn Phe Ser Leu Leu Lys
900 905 910
Leu Ala Gly Asp Val Glu Leu Asn Pro Gly Pro Thr Gly Ser Gly His
915 920 925
Ala Ser Ser Thr Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg
930 935 940
Ser Ser Val Pro Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser
945 950 955 960
Ser Val Leu Ser Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln
965 970 975
Gly Gln Asp Val Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser
980 985 990
Ala Ala Thr Trp Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro
995 1000 1005
Ala Leu Gly Ser Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala
1010 1015 1020
Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
1025 1030 1035
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr
1040 1045 1050
Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
1055 1060 1065
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala
1070 1075 1080
Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
1085 1090 1095
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr
1100 1105 1110
Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
1115 1120 1125
Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala
1130 1135 1140
Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly
1145 1150 1155
Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro
1160 1165 1170
Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala
1175 1180 1185
Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser
1190 1195 1200
Val Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu
1205 1210 1215
Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn
1220 1225 1230
Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr
1235 1240 1245
Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr
1250 1255 1260
Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro
1265 1270 1275
Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr
1280 1285 1290
Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr
1295 1300 1305
Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val
1310 1315 1320
Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val
1325 1330 1335
Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val
1340 1345 1350
Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys
1355 1360 1365
Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg Asp
1370 1375 1380
Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly
1385 1390 1395
Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys
1400 1405 1410
Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro
1415 1420 1425
Ala Val Ala Ala Ala Ser Ala Asn Leu
1430 1435
<210> 35
<211> 4431
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 35
atggctagcg gagctgcccc ggagccggag aggacccccg ttggccaggg atcgtgggcc 60
catccgggac gcaccagggg accatccgac aggggattct gtgtggtgtc accggccagg 120
ccagcagaag aggcaaccag cctcgaggga gcgttgtctg gaaccagaca ttcccacccg 180
tcggtgggcc ggcagcacca cgcgggacca ccgtccactt ccagaccgcc acggccatgg 240
gacacccctt gcccgcctgt gtatgccgag actaaacact tcctgtactc atccggagac 300
aaggaacagc ttcggccgtc cttcctcctg tcgtcgctca gaccgagcct gaccggagca 360
cgcagattgg tggaaactat cttccttggg tcacgtccgt ggatgccagg taccccacgg 420
cgcctcccgc gcctcccaca gagatactgg cagatgcggc ctctgttcct ggaattgctg 480
ggaaaccacg ctcagtgccc gtacggagtc ctgctcaaga ctcactgccc tctgagggcg 540
gcggtcactc cggcggccgg agtgtgcgca cgggagaagc cccagggaag cgtggcagct 600
ccggaagagg aggacaccga tccgcgccgc ctcgtgcaac ttctgcgcca gcactcctcg 660
ccctggcaag tctacgggtt cgtccgcgcc tgcctgcgcc gcctggtgcc gcctgggctc 720
tggggttccc ggcataacga gcgccgcttc ctgagaaata ctaagaagtt tatctcactt 780
ggaaaacatg ccaagttgtc gctgcaagaa ctcacgtgga agatgtcagt ccgcgattgc 840
gcctggctgc gccgctcgcc gggcgtcggg tgtgttccag ctgcagaaca ccgcctgaga 900
gaagaaattc tggccaaatt tctgcattgg ctgatgtcag tgtacgtggt cgagctgctg 960
cgctcctttt tctacgtcac tgagactacc tttcaaaaga accgcctgtt cttctaccgc 1020
aaatctgtgt ggagcaagct gcagtcaatc ggcattcgcc agcatctgaa gagggtgcag 1080
ctgcgggaac tttccgaggc agaagtccgc cagcaccggg aggcccggcc ggcgcttctc 1140
acgtcgcgtc tgagattcat cccaaagccc gacgggctga ggcctatcgt caacatggat 1200
tacgtcgtgg gcgctcgcac ctttcgccgt gaaaagcggg ccgaacgctt gacctcacgg 1260
gtgaaggccc tcttctccgt gctgaactac gagagagcaa gacggcctgg cctgctggga 1320
gcttcggtgc tgggactgga cgatatccac cgggcttggc ggacctttgt tctccgggtg 1380
agagcccaag accctccgcc ggaactgtac ttcgtgaagg tggcgatcac cggagcctat 1440
gatactattc cgcaagatcg actcaccgaa gtcatcgcct cgatcatcaa accgcagaac 1500
acttactgcg tcaggcggta cgccgtggtc cagaaggccg cgcatggcca cgtgagaaag 1560
gcgttcaagt cgcacgtgtc cactctcacc gacctccagc cttacatgag gcaattcgtt 1620
gcgcatttgc aagagacttc gcccctgaga gatgcggtgg tcatcgagca gagctccagc 1680
ctgaacgaag cgagcagcgg tctgtttgac gtgttcctcc gcttcatgtg tcatcacgcg 1740
gtgcgaatca ggggaaaatc atacgtgcag tgccagggaa tcccacaagg cagcattctg 1800
tcgactctct tgtgttccct ttgctacggc gatatggaaa acaagctgtt cgctgggatc 1860
agacgggacg ggttgctgct cagactggtg gacgacttcc tgctggtgac tccgcacctc 1920
actcacgcca aaacctttct ccgcactctg gtgaggggag tgccagaata cggctgtgtg 1980
gtcaatctcc ggaaaactgt ggtgaatttc cctgtcgagg atgaggcact cggaggaacc 2040
gcatttgtcc aaatgccagc acatggcctg ttcccatggt gcggtctgct gctggacacc 2100
cgaactcttg aagtgcagtc cgactactcc agctatgccc ggacgagcat ccgcgccagc 2160
ctcactttca atcgcggctt taaggccgga cgaaacatgc gcagaaagct tttcggagtc 2220
ctccggctta aatgccattc gctctttctc gatctccaag tcaattcgct gcagaccgtg 2280
tgcacgaaca tctacaagat cctgctgctc caagcctacc ggttccacgc ttgcgtgctt 2340
cagctgccgt ttcaccaaca ggtgtggaag aacccgacct tctttctgcg ggtcattagc 2400
gatactgcct ccctgtgtta ctcaatcctc aaggcaaaga acgccggaat gtcgctgggt 2460
gcgaaaggag ccgcgggacc tcttcctagc gaagcggtgc agtggctctg ccaccaggct 2520
ttcctcctga agctgaccag gcacagagtg acctacgtcc cgctgctggg ctcgctgcgc 2580
actgcacaga cccagctgtc tagaaaactc cccggcacca ccctgaccgc tctggaagcc 2640
gccgccaacc cagcattgcc gtcagatttc aagaccatct tggacggatc cggcgagggc 2700
agaggcagcc tgctgacatg tggcgacgtg gaagagaacc ctggccccct ggctggcgag 2760
acaggacagg aagccgctcc tctggacggc gtgctggcca accctcccaa tatcagcagc 2820
ctgagcccca gacagctgct gggattccct tgtgccgagg tgtccggcct gagcacagag 2880
agagtgcggg aactggctgt ggccctggcc cagaaaaacg tgaagctgag caccgagcag 2940
ctgcggtgcc tggcccacag actgtctgag cctcccgagg atctggacgc cctgcctctg 3000
gatctgctgc tgttcctgaa ccccgacgcc ttcagcggac ctcaggcctg cacccggttc 3060
ttcagcagaa tcaccaaggc caacgtggac ctgctgccca gaggcgcccc tgagagacag 3120
agactgctgc ctgctgctct ggcctgttgg ggagtgcggg gctctctgct gtctgaagct 3180
gatgtgcggg ccctgggagg cctggcttgt gatctgcctg gaagattcgt ggccgagagc 3240
gccgaagtgc tgctgcctag actggtgtcc tgtcccggcc ctctggacca ggatcagcag 3300
gaagctgcca gagctgctct gcagggcgga ggccctcctt atggacctcc tagcacttgg 3360
agcgtgtcca ccatggatgc cctgaggggc ctgctgccag tgctgggcca gcctatcatc 3420
agatccatcc cacagggcat cgtggccgcc tggcggcaga gaagctctag agatccctct 3480
tggcggcagc ccgagcggac aatcctgcgg cccaggtttc ggagagaggt ggaaaagacc 3540
gcctgcccct ctggcaagaa ggccagagag atcgacgaga gcctgatctt ctacaagaag 3600
tgggagctgg aagcctgcgt ggacgccgct ctgctggcca cccagatgga cagagtgaac 3660
gccatcccct tcacctatga gcagctggac gtgctgaagc acaagctgga tgagctgtac 3720
ccccagggct accccgagag cgtgatccag cacctgggct acctgtttct gaagatgagc 3780
cccgaggaca tccggaagtg gaacgtgacc agcctggaaa ccctgaaggc cctgctggaa 3840
gtgaacaagg gccacgagat gtccccccag gtggccacac tgatcgacag attcgtgaag 3900
ggcagaggcc agctggacaa ggacaccctg gatacactga ccgccttcta ccccggctat 3960
ctgtgcagcc tgtcccccga ggaactgagc agcgtgccac ctagctctat ctgggctgtg 4020
cggccccagg acctggatac ctgcgatcct agacagctgg atgtgctgta tcccaaggcc 4080
cggctggcct tccagaacat gaacggcagc gagtacttcg tgaagatcca gtccttcctg 4140
ggcggagccc ctaccgagga cctgaaagct ctgagccagc agaacgtgtc catggatctg 4200
gccaccttta tgaagctgcg gaccgacgcc gtgctgcctc tgacagtggc tgaggtgcag 4260
aaactgctgg gcccccatgt ggaagggctg aaggccgaag aacggcacag acccgtgcgc 4320
gactggatcc tgaggcagag acaggatgac ctggacacac tgggcctggg actgcagggg 4380
ggcatcccta atggctacct ggtgctggac ctgagcatgc aggaagccct g 4431
<210> 36
<211> 1477
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 36
Met Ala Ser Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln
1 5 10 15
Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly
20 25 30
Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu
35 40 45
Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg
50 55 60
Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp
65 70 75 80
Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr
85 90 95
Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser
100 105 110
Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe
115 120 125
Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg
130 135 140
Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu
145 150 155 160
Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys
165 170 175
Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu
180 185 190
Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro
195 200 205
Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val
210 215 220
Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu
225 230 235 240
Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys
245 250 255
Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr
260 265 270
Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly
275 280 285
Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu
290 295 300
Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
305 310 315 320
Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu
325 330 335
Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
340 345 350
Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu
355 360 365
Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu
370 375 380
Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp
385 390 395 400
Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg
405 410 415
Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg
420 425 430
Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp
435 440 445
Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp
450 455 460
Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr Gly Ala Tyr
465 470 475 480
Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile
485 490 495
Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys
500 505 510
Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr
515 520 525
Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln
530 535 540
Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser
545 550 555 560
Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met
565 570 575
Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln
580 585 590
Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys
595 600 605
Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly
610 615 620
Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu
625 630 635 640
Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu
645 650 655
Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val
660 665 670
Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His
675 680 685
Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu
690 695 700
Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser
705 710 715 720
Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys
725 730 735
Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu
740 745 750
Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu
755 760 765
Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe
770 775 780
His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser
785 790 795 800
Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly
805 810 815
Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala
820 825 830
Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His
835 840 845
Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr
850 855 860
Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala
865 870 875 880
Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp Gly
885 890 895
Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
900 905 910
Asn Pro Gly Pro Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu
915 920 925
Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg
930 935 940
Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu
945 950 955 960
Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu
965 970 975
Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro
980 985 990
Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro
995 1000 1005
Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg
1010 1015 1020
Ile Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu
1025 1030 1035
Arg Gln Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg
1040 1045 1050
Gly Ser Leu Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu
1055 1060 1065
Ala Cys Asp Leu Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val
1070 1075 1080
Leu Leu Pro Arg Leu Val Ser Cys Pro Gly Pro Leu Asp Gln Asp
1085 1090 1095
Gln Gln Glu Ala Ala Arg Ala Ala Leu Gln Gly Gly Gly Pro Pro
1100 1105 1110
Tyr Gly Pro Pro Ser Thr Trp Ser Val Ser Thr Met Asp Ala Leu
1115 1120 1125
Arg Gly Leu Leu Pro Val Leu Gly Gln Pro Ile Ile Arg Ser Ile
1130 1135 1140
Pro Gln Gly Ile Val Ala Ala Trp Arg Gln Arg Ser Ser Arg Asp
1145 1150 1155
Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu Arg Pro Arg Phe
1160 1165 1170
Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly Lys Lys Ala
1175 1180 1185
Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp Glu Leu
1190 1195 1200
Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp Arg
1205 1210 1215
Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
1220 1225 1230
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val
1235 1240 1245
Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp
1250 1255 1260
Ile Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu
1265 1270 1275
Leu Glu Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr
1280 1285 1290
Leu Ile Asp Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp
1295 1300 1305
Thr Leu Asp Thr Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser
1310 1315 1320
Leu Ser Pro Glu Glu Leu Ser Ser Val Pro Pro Ser Ser Ile Trp
1325 1330 1335
Ala Val Arg Pro Gln Asp Leu Asp Thr Cys Asp Pro Arg Gln Leu
1340 1345 1350
Asp Val Leu Tyr Pro Lys Ala Arg Leu Ala Phe Gln Asn Met Asn
1355 1360 1365
Gly Ser Glu Tyr Phe Val Lys Ile Gln Ser Phe Leu Gly Gly Ala
1370 1375 1380
Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln Gln Asn Val Ser Met
1385 1390 1395
Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp Ala Val Leu Pro
1400 1405 1410
Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro His Val Glu
1415 1420 1425
Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp Trp Ile
1430 1435 1440
Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly Leu
1445 1450 1455
Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
1460 1465 1470
Gln Glu Ala Leu
1475
<210> 37
<211> 4383
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 37
atggctagcg gagctgcccc ggagccggag aggacccccg ttggccaggg atcgtgggcc 60
catccgggac gcaccagggg accatccgac aggggattct gtgtggtgtc accggccagg 120
ccagcagaag aggcaaccag cctcgaggga gcgttgtctg gaaccagaca ttcccacccg 180
tcggtgggcc ggcagcacca cgcgggacca ccgtccactt ccagaccgcc acggccatgg 240
gacacccctt gcccgcctgt gtatgccgag actaaacact tcctgtactc atccggagac 300
aaggaacagc ttcggccgtc cttcctcctg tcgtcgctca gaccgagcct gaccggagca 360
cgcagattgg tggaaactat cttccttggg tcacgtccgt ggatgccagg taccccacgg 420
cgcctcccgc gcctcccaca gagatactgg cagatgcggc ctctgttcct ggaattgctg 480
ggaaaccacg ctcagtgccc gtacggagtc ctgctcaaga ctcactgccc tctgagggcg 540
gcggtcactc cggcggccgg agtgtgcgca cgggagaagc cccagggaag cgtggcagct 600
ccggaagagg aggacaccga tccgcgccgc ctcgtgcaac ttctgcgcca gcactcctcg 660
ccctggcaag tctacgggtt cgtccgcgcc tgcctgcgcc gcctggtgcc gcctgggctc 720
tggggttccc ggcataacga gcgccgcttc ctgagaaata ctaagaagtt tatctcactt 780
ggaaaacatg ccaagttgtc gctgcaagaa ctcacgtgga agatgtcagt ccgcgattgc 840
gcctggctgc gccgctcgcc gggcgtcggg tgtgttccag ctgcagaaca ccgcctgaga 900
gaagaaattc tggccaaatt tctgcattgg ctgatgtcag tgtacgtggt cgagctgctg 960
cgctcctttt tctacgtcac tgagactacc tttcaaaaga accgcctgtt cttctaccgc 1020
aaatctgtgt ggagcaagct gcagtcaatc ggcattcgcc agcatctgaa gagggtgcag 1080
ctgcgggaac tttccgaggc agaagtccgc cagcaccggg aggcccggcc ggcgcttctc 1140
acgtcgcgtc tgagattcat cccaaagccc gacgggctga ggcctatcgt caacatggat 1200
tacgtcgtgg gcgctcgcac ctttcgccgt gaaaagcggg ccgaacgctt gacctcacgg 1260
gtgaaggccc tcttctccgt gctgaactac gagagagcaa gacggcctgg cctgctggga 1320
gcttcggtgc tgggactgga cgatatccac cgggcttggc ggacctttgt tctccgggtg 1380
agagcccaag accctccgcc ggaactgtac ttcgtgaagg tggcgatcac cggagcctat 1440
gatactattc cgcaagatcg actcaccgaa gtcatcgcct cgatcatcaa accgcagaac 1500
acttactgcg tcaggcggta cgccgtggtc cagaaggccg cgcatggcca cgtgagaaag 1560
gcgttcaagt cgcacgtgtc cactctcacc gacctccagc cttacatgag gcaattcgtt 1620
gcgcatttgc aagagacttc gcccctgaga gatgcggtgg tcatcgagca gagctccagc 1680
ctgaacgaag cgagcagcgg tctgtttgac gtgttcctcc gcttcatgtg tcatcacgcg 1740
gtgcgaatca ggggaaaatc atacgtgcag tgccagggaa tcccacaagg cagcattctg 1800
tcgactctct tgtgttccct ttgctacggc gatatggaaa acaagctgtt cgctgggatc 1860
agacgggacg ggttgctgct cagactggtg gacgacttcc tgctggtgac tccgcacctc 1920
actcacgcca aaacctttct ccgcactctg gtgaggggag tgccagaata cggctgtgtg 1980
gtcaatctcc ggaaaactgt ggtgaatttc cctgtcgagg atgaggcact cggaggaacc 2040
gcatttgtcc aaatgccagc acatggcctg ttcccatggt gcggtctgct gctggacacc 2100
cgaactcttg aagtgcagtc cgactactcc agctatgccc ggacgagcat ccgcgccagc 2160
ctcactttca atcgcggctt taaggccgga cgaaacatgc gcagaaagct tttcggagtc 2220
ctccggctta aatgccattc gctctttctc gatctccaag tcaattcgct gcagaccgtg 2280
tgcacgaaca tctacaagat cctgctgctc caagcctacc ggttccacgc ttgcgtgctt 2340
cagctgccgt ttcaccaaca ggtgtggaag aacccgacct tctttctgcg ggtcattagc 2400
gatactgcct ccctgtgtta ctcaatcctc aaggcaaaga acgccggaat gtcgctgggt 2460
gcgaaaggag ccgcgggacc tcttcctagc gaagcggtgc agtggctctg ccaccaggct 2520
ttcctcctga agctgaccag gcacagagtg acctacgtcc cgctgctggg ctcgctgcgc 2580
actgcacaga cccagctgtc tagaaaactc cccggcacca ccctgaccgc tctggaagcc 2640
gccgccaacc cagcattgcc gtcagatttc aagaccatct tggacggagg ctccggcgga 2700
ctggctggcg agacaggaca ggaagccgct cctctggacg gcgtgctggc caaccctccc 2760
aatatcagca gcctgagccc cagacagctg ctgggattcc cttgtgccga ggtgtccggc 2820
ctgagcacag agagagtgcg ggaactggct gtggccctgg cccagaaaaa cgtgaagctg 2880
agcaccgagc agctgcggtg cctggcccac agactgtctg agcctcccga ggatctggac 2940
gccctgcctc tggatctgct gctgttcctg aaccccgacg ccttcagcgg acctcaggcc 3000
tgcacccggt tcttcagcag aatcaccaag gccaacgtgg acctgctgcc cagaggcgcc 3060
cctgagagac agagactgct gcctgctgct ctggcctgtt ggggagtgcg gggctctctg 3120
ctgtctgaag ctgatgtgcg ggccctggga ggcctggctt gtgatctgcc tggaagattc 3180
gtggccgaga gcgccgaagt gctgctgcct agactggtgt cctgtcccgg ccctctggac 3240
caggatcagc aggaagctgc cagagctgct ctgcagggcg gaggccctcc ttatggacct 3300
cctagcactt ggagcgtgtc caccatggat gccctgaggg gcctgctgcc agtgctgggc 3360
cagcctatca tcagatccat cccacagggc atcgtggccg cctggcggca gagaagctct 3420
agagatccct cttggcggca gcccgagcgg acaatcctgc ggcccaggtt tcggagagag 3480
gtggaaaaga ccgcctgccc ctctggcaag aaggccagag agatcgacga gagcctgatc 3540
ttctacaaga agtgggagct ggaagcctgc gtggacgccg ctctgctggc cacccagatg 3600
gacagagtga acgccatccc cttcacctat gagcagctgg acgtgctgaa gcacaagctg 3660
gatgagctgt acccccaggg ctaccccgag agcgtgatcc agcacctggg ctacctgttt 3720
ctgaagatga gccccgagga catccggaag tggaacgtga ccagcctgga aaccctgaag 3780
gccctgctgg aagtgaacaa gggccacgag atgtcccccc aggtggccac actgatcgac 3840
agattcgtga agggcagagg ccagctggac aaggacaccc tggatacact gaccgccttc 3900
taccccggct atctgtgcag cctgtccccc gaggaactga gcagcgtgcc acctagctct 3960
atctgggctg tgcggcccca ggacctggat acctgcgatc ctagacagct ggatgtgctg 4020
tatcccaagg cccggctggc cttccagaac atgaacggca gcgagtactt cgtgaagatc 4080
cagtccttcc tgggcggagc ccctaccgag gacctgaaag ctctgagcca gcagaacgtg 4140
tccatggatc tggccacctt tatgaagctg cggaccgacg ccgtgctgcc tctgacagtg 4200
gctgaggtgc agaaactgct gggcccccat gtggaagggc tgaaggccga agaacggcac 4260
agacccgtgc gcgactggat cctgaggcag agacaggatg acctggacac actgggcctg 4320
ggactgcagg ggggcatccc taatggctac ctggtgctgg acctgagcat gcaggaagcc 4380
ctg 4383
<210> 38
<211> 1461
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 38
Met Ala Ser Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln
1 5 10 15
Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly
20 25 30
Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu
35 40 45
Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg
50 55 60
Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp
65 70 75 80
Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr
85 90 95
Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser
100 105 110
Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe
115 120 125
Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg
130 135 140
Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu
145 150 155 160
Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys
165 170 175
Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu
180 185 190
Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro
195 200 205
Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val
210 215 220
Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu
225 230 235 240
Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys
245 250 255
Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr
260 265 270
Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly
275 280 285
Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu
290 295 300
Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
305 310 315 320
Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu
325 330 335
Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
340 345 350
Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu
355 360 365
Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu
370 375 380
Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp
385 390 395 400
Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg
405 410 415
Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg
420 425 430
Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp
435 440 445
Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp
450 455 460
Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr Gly Ala Tyr
465 470 475 480
Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile
485 490 495
Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys
500 505 510
Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr
515 520 525
Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln
530 535 540
Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser
545 550 555 560
Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met
565 570 575
Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln
580 585 590
Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys
595 600 605
Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly
610 615 620
Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu
625 630 635 640
Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu
645 650 655
Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val
660 665 670
Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His
675 680 685
Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu
690 695 700
Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser
705 710 715 720
Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys
725 730 735
Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu
740 745 750
Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu
755 760 765
Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe
770 775 780
His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser
785 790 795 800
Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly
805 810 815
Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala
820 825 830
Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His
835 840 845
Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr
850 855 860
Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala
865 870 875 880
Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp Gly
885 890 895
Gly Ser Gly Gly Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu
900 905 910
Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg
915 920 925
Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu
930 935 940
Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu
945 950 955 960
Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro
965 970 975
Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro
980 985 990
Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile
995 1000 1005
Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg
1010 1015 1020
Gln Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly
1025 1030 1035
Ser Leu Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala
1040 1045 1050
Cys Asp Leu Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu
1055 1060 1065
Leu Pro Arg Leu Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln
1070 1075 1080
Gln Glu Ala Ala Arg Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr
1085 1090 1095
Gly Pro Pro Ser Thr Trp Ser Val Ser Thr Met Asp Ala Leu Arg
1100 1105 1110
Gly Leu Leu Pro Val Leu Gly Gln Pro Ile Ile Arg Ser Ile Pro
1115 1120 1125
Gln Gly Ile Val Ala Ala Trp Arg Gln Arg Ser Ser Arg Asp Pro
1130 1135 1140
Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu Arg Pro Arg Phe Arg
1145 1150 1155
Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly Lys Lys Ala Arg
1160 1165 1170
Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp Glu Leu Glu
1175 1180 1185
Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp Arg Val
1190 1195 1200
Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys His
1205 1210 1215
Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
1220 1225 1230
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile
1235 1240 1245
Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu
1250 1255 1260
Glu Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu
1265 1270 1275
Ile Asp Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr
1280 1285 1290
Leu Asp Thr Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu
1295 1300 1305
Ser Pro Glu Glu Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala
1310 1315 1320
Val Arg Pro Gln Asp Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp
1325 1330 1335
Val Leu Tyr Pro Lys Ala Arg Leu Ala Phe Gln Asn Met Asn Gly
1340 1345 1350
Ser Glu Tyr Phe Val Lys Ile Gln Ser Phe Leu Gly Gly Ala Pro
1355 1360 1365
Thr Glu Asp Leu Lys Ala Leu Ser Gln Gln Asn Val Ser Met Asp
1370 1375 1380
Leu Ala Thr Phe Met Lys Leu Arg Thr Asp Ala Val Leu Pro Leu
1385 1390 1395
Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro His Val Glu Gly
1400 1405 1410
Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp Trp Ile Leu
1415 1420 1425
Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly Leu Gln
1430 1435 1440
Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met Gln
1445 1450 1455
Glu Ala Leu
1460
<210> 39
<211> 4431
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 39
atggctagcc tggctggcga gacaggacag gaagccgctc ctctggacgg cgtgctggcc 60
aaccctccca atatcagcag cctgagcccc agacagctgc tgggattccc ttgtgccgag 120
gtgtccggcc tgagcacaga gagagtgcgg gaactggctg tggccctggc ccagaaaaac 180
gtgaagctga gcaccgagca gctgcggtgc ctggcccaca gactgtctga gcctcccgag 240
gatctggacg ccctgcctct ggatctgctg ctgttcctga accccgacgc cttcagcgga 300
cctcaggcct gcacccggtt cttcagcaga atcaccaagg ccaacgtgga cctgctgccc 360
agaggcgccc ctgagagaca gagactgctg cctgctgctc tggcctgttg gggagtgcgg 420
ggctctctgc tgtctgaagc tgatgtgcgg gccctgggag gcctggcttg tgatctgcct 480
ggaagattcg tggccgagag cgccgaagtg ctgctgccta gactggtgtc ctgtcccggc 540
cctctggacc aggatcagca ggaagctgcc agagctgctc tgcagggcgg aggccctcct 600
tatggacctc ctagcacttg gagcgtgtcc accatggatg ccctgagggg cctgctgcca 660
gtgctgggcc agcctatcat cagatccatc ccacagggca tcgtggccgc ctggcggcag 720
agaagctcta gagatccctc ttggcggcag cccgagcgga caatcctgcg gcccaggttt 780
cggagagagg tggaaaagac cgcctgcccc tctggcaaga aggccagaga gatcgacgag 840
agcctgatct tctacaagaa gtgggagctg gaagcctgcg tggacgccgc tctgctggcc 900
acccagatgg acagagtgaa cgccatcccc ttcacctatg agcagctgga cgtgctgaag 960
cacaagctgg atgagctgta cccccagggc taccccgaga gcgtgatcca gcacctgggc 1020
tacctgtttc tgaagatgag ccccgaggac atccggaagt ggaacgtgac cagcctggaa 1080
accctgaagg ccctgctgga agtgaacaag ggccacgaga tgtcccccca ggtggccaca 1140
ctgatcgaca gattcgtgaa gggcagaggc cagctggaca aggacaccct ggatacactg 1200
accgccttct accccggcta tctgtgcagc ctgtcccccg aggaactgag cagcgtgcca 1260
cctagctcta tctgggctgt gcggccccag gacctggata cctgcgatcc tagacagctg 1320
gatgtgctgt atcccaaggc ccggctggcc ttccagaaca tgaacggcag cgagtacttc 1380
gtgaagatcc agtccttcct gggcggagcc cctaccgagg acctgaaagc tctgagccag 1440
cagaacgtgt ccatggatct ggccaccttt atgaagctgc ggaccgacgc cgtgctgcct 1500
ctgacagtgg ctgaggtgca gaaactgctg ggcccccatg tggaagggct gaaggccgaa 1560
gaacggcaca gacccgtgcg cgactggatc ctgaggcaga gacaggatga cctggacaca 1620
ctgggcctgg gactgcaggg gggcatccct aatggctacc tggtgctgga cctgagcatg 1680
caggaagccc tgggatccgg cgagggcaga ggcagcctgc tgacatgtgg cgacgtggaa 1740
gagaaccctg gccccggagc tgccccggag ccggagagga cccccgttgg ccagggatcg 1800
tgggcccatc cgggacgcac caggggacca tccgacaggg gattctgtgt ggtgtcaccg 1860
gccaggccag cagaagaggc aaccagcctc gagggagcgt tgtctggaac cagacattcc 1920
cacccgtcgg tgggccggca gcaccacgcg ggaccaccgt ccacttccag accgccacgg 1980
ccatgggaca ccccttgccc gcctgtgtat gccgagacta aacacttcct gtactcatcc 2040
ggagacaagg aacagcttcg gccgtccttc ctcctgtcgt cgctcagacc gagcctgacc 2100
ggagcacgca gattggtgga aactatcttc cttgggtcac gtccgtggat gccaggtacc 2160
ccacggcgcc tcccgcgcct cccacagaga tactggcaga tgcggcctct gttcctggaa 2220
ttgctgggaa accacgctca gtgcccgtac ggagtcctgc tcaagactca ctgccctctg 2280
agggcggcgg tcactccggc ggccggagtg tgcgcacggg agaagcccca gggaagcgtg 2340
gcagctccgg aagaggagga caccgatccg cgccgcctcg tgcaacttct gcgccagcac 2400
tcctcgccct ggcaagtcta cgggttcgtc cgcgcctgcc tgcgccgcct ggtgccgcct 2460
gggctctggg gttcccggca taacgagcgc cgcttcctga gaaatactaa gaagtttatc 2520
tcacttggaa aacatgccaa gttgtcgctg caagaactca cgtggaagat gtcagtccgc 2580
gattgcgcct ggctgcgccg ctcgccgggc gtcgggtgtg ttccagctgc agaacaccgc 2640
ctgagagaag aaattctggc caaatttctg cattggctga tgtcagtgta cgtggtcgag 2700
ctgctgcgct cctttttcta cgtcactgag actacctttc aaaagaaccg cctgttcttc 2760
taccgcaaat ctgtgtggag caagctgcag tcaatcggca ttcgccagca tctgaagagg 2820
gtgcagctgc gggaactttc cgaggcagaa gtccgccagc accgggaggc ccggccggcg 2880
cttctcacgt cgcgtctgag attcatccca aagcccgacg ggctgaggcc tatcgtcaac 2940
atggattacg tcgtgggcgc tcgcaccttt cgccgtgaaa agcgggccga acgcttgacc 3000
tcacgggtga aggccctctt ctccgtgctg aactacgaga gagcaagacg gcctggcctg 3060
ctgggagctt cggtgctggg actggacgat atccaccggg cttggcggac ctttgttctc 3120
cgggtgagag cccaagaccc tccgccggaa ctgtacttcg tgaaggtggc gatcaccgga 3180
gcctatgata ctattccgca agatcgactc accgaagtca tcgcctcgat catcaaaccg 3240
cagaacactt actgcgtcag gcggtacgcc gtggtccaga aggccgcgca tggccacgtg 3300
agaaaggcgt tcaagtcgca cgtgtccact ctcaccgacc tccagcctta catgaggcaa 3360
ttcgttgcgc atttgcaaga gacttcgccc ctgagagatg cggtggtcat cgagcagagc 3420
tccagcctga acgaagcgag cagcggtctg tttgacgtgt tcctccgctt catgtgtcat 3480
cacgcggtgc gaatcagggg aaaatcatac gtgcagtgcc agggaatccc acaaggcagc 3540
attctgtcga ctctcttgtg ttccctttgc tacggcgata tggaaaacaa gctgttcgct 3600
gggatcagac gggacgggtt gctgctcaga ctggtggacg acttcctgct ggtgactccg 3660
cacctcactc acgccaaaac ctttctccgc actctggtga ggggagtgcc agaatacggc 3720
tgtgtggtca atctccggaa aactgtggtg aatttccctg tcgaggatga ggcactcgga 3780
ggaaccgcat ttgtccaaat gccagcacat ggcctgttcc catggtgcgg tctgctgctg 3840
gacacccgaa ctcttgaagt gcagtccgac tactccagct atgcccggac gagcatccgc 3900
gccagcctca ctttcaatcg cggctttaag gccggacgaa acatgcgcag aaagcttttc 3960
ggagtcctcc ggcttaaatg ccattcgctc tttctcgatc tccaagtcaa ttcgctgcag 4020
accgtgtgca cgaacatcta caagatcctg ctgctccaag cctaccggtt ccacgcttgc 4080
gtgcttcagc tgccgtttca ccaacaggtg tggaagaacc cgaccttctt tctgcgggtc 4140
attagcgata ctgcctccct gtgttactca atcctcaagg caaagaacgc cggaatgtcg 4200
ctgggtgcga aaggagccgc gggacctctt cctagcgaag cggtgcagtg gctctgccac 4260
caggctttcc tcctgaagct gaccaggcac agagtgacct acgtcccgct gctgggctcg 4320
ctgcgcactg cacagaccca gctgtctaga aaactccccg gcaccaccct gaccgctctg 4380
gaagccgccg ccaacccagc attgccgtca gatttcaaga ccatcttgga c 4431
<210> 40
<211> 1477
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 40
Met Ala Ser Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp
1 5 10 15
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
20 25 30
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
35 40 45
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
50 55 60
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
65 70 75 80
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
85 90 95
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
100 105 110
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
115 120 125
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
130 135 140
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
145 150 155 160
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
165 170 175
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
180 185 190
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
195 200 205
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
210 215 220
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
225 230 235 240
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
245 250 255
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
260 265 270
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
275 280 285
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
290 295 300
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
305 310 315 320
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
325 330 335
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
340 345 350
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
355 360 365
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
370 375 380
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
385 390 395 400
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
405 410 415
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
420 425 430
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
435 440 445
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
450 455 460
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
465 470 475 480
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
485 490 495
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
500 505 510
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
515 520 525
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
530 535 540
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
545 550 555 560
Gln Glu Ala Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
565 570 575
Gly Asp Val Glu Glu Asn Pro Gly Pro Gly Ala Ala Pro Glu Pro Glu
580 585 590
Arg Thr Pro Val Gly Gln Gly Ser Trp Ala His Pro Gly Arg Thr Arg
595 600 605
Gly Pro Ser Asp Arg Gly Phe Cys Val Val Ser Pro Ala Arg Pro Ala
610 615 620
Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu Ser Gly Thr Arg His Ser
625 630 635 640
His Pro Ser Val Gly Arg Gln His His Ala Gly Pro Pro Ser Thr Ser
645 650 655
Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu
660 665 670
Thr Lys His Phe Leu Tyr Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro
675 680 685
Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg
690 695 700
Leu Val Glu Thr Ile Phe Leu Gly Ser Arg Pro Trp Met Pro Gly Thr
705 710 715 720
Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro
725 730 735
Leu Phe Leu Glu Leu Leu Gly Asn His Ala Gln Cys Pro Tyr Gly Val
740 745 750
Leu Leu Lys Thr His Cys Pro Leu Arg Ala Ala Val Thr Pro Ala Ala
755 760 765
Gly Val Cys Ala Arg Glu Lys Pro Gln Gly Ser Val Ala Ala Pro Glu
770 775 780
Glu Glu Asp Thr Asp Pro Arg Arg Leu Val Gln Leu Leu Arg Gln His
785 790 795 800
Ser Ser Pro Trp Gln Val Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg
805 810 815
Leu Val Pro Pro Gly Leu Trp Gly Ser Arg His Asn Glu Arg Arg Phe
820 825 830
Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu Gly Lys His Ala Lys Leu
835 840 845
Ser Leu Gln Glu Leu Thr Trp Lys Met Ser Val Arg Asp Cys Ala Trp
850 855 860
Leu Arg Arg Ser Pro Gly Val Gly Cys Val Pro Ala Ala Glu His Arg
865 870 875 880
Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu His Trp Leu Met Ser Val
885 890 895
Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr
900 905 910
Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys
915 920 925
Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg
930 935 940
Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala
945 950 955 960
Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg
965 970 975
Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg
980 985 990
Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser
995 1000 1005
Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala
1010 1015 1020
Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe
1025 1030 1035
Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe
1040 1045 1050
Val Lys Val Ala Ile Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp
1055 1060 1065
Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr
1070 1075 1080
Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly
1085 1090 1095
His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp
1100 1105 1110
Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr
1115 1120 1125
Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu
1130 1135 1140
Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met
1145 1150 1155
Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys
1160 1165 1170
Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser
1175 1180 1185
Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg
1190 1195 1200
Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val
1205 1210 1215
Thr Pro His Leu Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val
1220 1225 1230
Arg Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg Lys Thr
1235 1240 1245
Val Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr Ala
1250 1255 1260
Phe Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys Gly Leu
1265 1270 1275
Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser
1280 1285 1290
Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly
1295 1300 1305
Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val Leu
1310 1315 1320
Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser
1325 1330 1335
Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln
1340 1345 1350
Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln
1355 1360 1365
Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp
1370 1375 1380
Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly
1385 1390 1395
Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu
1400 1405 1410
Ala Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr
1415 1420 1425
Arg His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr
1430 1435 1440
Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr
1445 1450 1455
Ala Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys
1460 1465 1470
Thr Ile Leu Asp
1475
<210> 41
<211> 4383
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 41
atggctagcc tggctggcga gacaggacag gaagccgctc ctctggacgg cgtgctggcc 60
aaccctccca atatcagcag cctgagcccc agacagctgc tgggattccc ttgtgccgag 120
gtgtccggcc tgagcacaga gagagtgcgg gaactggctg tggccctggc ccagaaaaac 180
gtgaagctga gcaccgagca gctgcggtgc ctggcccaca gactgtctga gcctcccgag 240
gatctggacg ccctgcctct ggatctgctg ctgttcctga accccgacgc cttcagcgga 300
cctcaggcct gcacccggtt cttcagcaga atcaccaagg ccaacgtgga cctgctgccc 360
agaggcgccc ctgagagaca gagactgctg cctgctgctc tggcctgttg gggagtgcgg 420
ggctctctgc tgtctgaagc tgatgtgcgg gccctgggag gcctggcttg tgatctgcct 480
ggaagattcg tggccgagag cgccgaagtg ctgctgccta gactggtgtc ctgtcccggc 540
cctctggacc aggatcagca ggaagctgcc agagctgctc tgcagggcgg aggccctcct 600
tatggacctc ctagcacttg gagcgtgtcc accatggatg ccctgagggg cctgctgcca 660
gtgctgggcc agcctatcat cagatccatc ccacagggca tcgtggccgc ctggcggcag 720
agaagctcta gagatccctc ttggcggcag cccgagcgga caatcctgcg gcccaggttt 780
cggagagagg tggaaaagac cgcctgcccc tctggcaaga aggccagaga gatcgacgag 840
agcctgatct tctacaagaa gtgggagctg gaagcctgcg tggacgccgc tctgctggcc 900
acccagatgg acagagtgaa cgccatcccc ttcacctatg agcagctgga cgtgctgaag 960
cacaagctgg atgagctgta cccccagggc taccccgaga gcgtgatcca gcacctgggc 1020
tacctgtttc tgaagatgag ccccgaggac atccggaagt ggaacgtgac cagcctggaa 1080
accctgaagg ccctgctgga agtgaacaag ggccacgaga tgtcccccca ggtggccaca 1140
ctgatcgaca gattcgtgaa gggcagaggc cagctggaca aggacaccct ggatacactg 1200
accgccttct accccggcta tctgtgcagc ctgtcccccg aggaactgag cagcgtgcca 1260
cctagctcta tctgggctgt gcggccccag gacctggata cctgcgatcc tagacagctg 1320
gatgtgctgt atcccaaggc ccggctggcc ttccagaaca tgaacggcag cgagtacttc 1380
gtgaagatcc agtccttcct gggcggagcc cctaccgagg acctgaaagc tctgagccag 1440
cagaacgtgt ccatggatct ggccaccttt atgaagctgc ggaccgacgc cgtgctgcct 1500
ctgacagtgg ctgaggtgca gaaactgctg ggcccccatg tggaagggct gaaggccgaa 1560
gaacggcaca gacccgtgcg cgactggatc ctgaggcaga gacaggatga cctggacaca 1620
ctgggcctgg gactgcaggg gggcatccct aatggctacc tggtgctgga cctgagcatg 1680
caggaagccc tgggaggctc cggcggagga gctgccccgg agccggagag gacccccgtt 1740
ggccagggat cgtgggccca tccgggacgc accaggggac catccgacag gggattctgt 1800
gtggtgtcac cggccaggcc agcagaagag gcaaccagcc tcgagggagc gttgtctgga 1860
accagacatt cccacccgtc ggtgggccgg cagcaccacg cgggaccacc gtccacttcc 1920
agaccgccac ggccatggga caccccttgc ccgcctgtgt atgccgagac taaacacttc 1980
ctgtactcat ccggagacaa ggaacagctt cggccgtcct tcctcctgtc gtcgctcaga 2040
ccgagcctga ccggagcacg cagattggtg gaaactatct tccttgggtc acgtccgtgg 2100
atgccaggta ccccacggcg cctcccgcgc ctcccacaga gatactggca gatgcggcct 2160
ctgttcctgg aattgctggg aaaccacgct cagtgcccgt acggagtcct gctcaagact 2220
cactgccctc tgagggcggc ggtcactccg gcggccggag tgtgcgcacg ggagaagccc 2280
cagggaagcg tggcagctcc ggaagaggag gacaccgatc cgcgccgcct cgtgcaactt 2340
ctgcgccagc actcctcgcc ctggcaagtc tacgggttcg tccgcgcctg cctgcgccgc 2400
ctggtgccgc ctgggctctg gggttcccgg cataacgagc gccgcttcct gagaaatact 2460
aagaagttta tctcacttgg aaaacatgcc aagttgtcgc tgcaagaact cacgtggaag 2520
atgtcagtcc gcgattgcgc ctggctgcgc cgctcgccgg gcgtcgggtg tgttccagct 2580
gcagaacacc gcctgagaga agaaattctg gccaaatttc tgcattggct gatgtcagtg 2640
tacgtggtcg agctgctgcg ctcctttttc tacgtcactg agactacctt tcaaaagaac 2700
cgcctgttct tctaccgcaa atctgtgtgg agcaagctgc agtcaatcgg cattcgccag 2760
catctgaaga gggtgcagct gcgggaactt tccgaggcag aagtccgcca gcaccgggag 2820
gcccggccgg cgcttctcac gtcgcgtctg agattcatcc caaagcccga cgggctgagg 2880
cctatcgtca acatggatta cgtcgtgggc gctcgcacct ttcgccgtga aaagcgggcc 2940
gaacgcttga cctcacgggt gaaggccctc ttctccgtgc tgaactacga gagagcaaga 3000
cggcctggcc tgctgggagc ttcggtgctg ggactggacg atatccaccg ggcttggcgg 3060
acctttgttc tccgggtgag agcccaagac cctccgccgg aactgtactt cgtgaaggtg 3120
gcgatcaccg gagcctatga tactattccg caagatcgac tcaccgaagt catcgcctcg 3180
atcatcaaac cgcagaacac ttactgcgtc aggcggtacg ccgtggtcca gaaggccgcg 3240
catggccacg tgagaaaggc gttcaagtcg cacgtgtcca ctctcaccga cctccagcct 3300
tacatgaggc aattcgttgc gcatttgcaa gagacttcgc ccctgagaga tgcggtggtc 3360
atcgagcaga gctccagcct gaacgaagcg agcagcggtc tgtttgacgt gttcctccgc 3420
ttcatgtgtc atcacgcggt gcgaatcagg ggaaaatcat acgtgcagtg ccagggaatc 3480
ccacaaggca gcattctgtc gactctcttg tgttcccttt gctacggcga tatggaaaac 3540
aagctgttcg ctgggatcag acgggacggg ttgctgctca gactggtgga cgacttcctg 3600
ctggtgactc cgcacctcac tcacgccaaa acctttctcc gcactctggt gaggggagtg 3660
ccagaatacg gctgtgtggt caatctccgg aaaactgtgg tgaatttccc tgtcgaggat 3720
gaggcactcg gaggaaccgc atttgtccaa atgccagcac atggcctgtt cccatggtgc 3780
ggtctgctgc tggacacccg aactcttgaa gtgcagtccg actactccag ctatgcccgg 3840
acgagcatcc gcgccagcct cactttcaat cgcggcttta aggccggacg aaacatgcgc 3900
agaaagcttt tcggagtcct ccggcttaaa tgccattcgc tctttctcga tctccaagtc 3960
aattcgctgc agaccgtgtg cacgaacatc tacaagatcc tgctgctcca agcctaccgg 4020
ttccacgctt gcgtgcttca gctgccgttt caccaacagg tgtggaagaa cccgaccttc 4080
tttctgcggg tcattagcga tactgcctcc ctgtgttact caatcctcaa ggcaaagaac 4140
gccggaatgt cgctgggtgc gaaaggagcc gcgggacctc ttcctagcga agcggtgcag 4200
tggctctgcc accaggcttt cctcctgaag ctgaccaggc acagagtgac ctacgtcccg 4260
ctgctgggct cgctgcgcac tgcacagacc cagctgtcta gaaaactccc cggcaccacc 4320
ctgaccgctc tggaagccgc cgccaaccca gcattgccgt cagatttcaa gaccatcttg 4380
gac 4383
<210> 42
<211> 1461
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 42
Met Ala Ser Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp
1 5 10 15
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
20 25 30
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
35 40 45
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
50 55 60
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
65 70 75 80
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
85 90 95
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
100 105 110
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
115 120 125
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
130 135 140
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
145 150 155 160
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
165 170 175
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
180 185 190
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
195 200 205
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
210 215 220
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
225 230 235 240
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
245 250 255
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
260 265 270
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
275 280 285
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
290 295 300
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
305 310 315 320
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
325 330 335
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
340 345 350
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
355 360 365
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
370 375 380
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
385 390 395 400
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
405 410 415
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
420 425 430
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
435 440 445
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
450 455 460
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
465 470 475 480
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
485 490 495
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
500 505 510
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
515 520 525
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
530 535 540
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
545 550 555 560
Gln Glu Ala Leu Gly Gly Ser Gly Gly Gly Ala Ala Pro Glu Pro Glu
565 570 575
Arg Thr Pro Val Gly Gln Gly Ser Trp Ala His Pro Gly Arg Thr Arg
580 585 590
Gly Pro Ser Asp Arg Gly Phe Cys Val Val Ser Pro Ala Arg Pro Ala
595 600 605
Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu Ser Gly Thr Arg His Ser
610 615 620
His Pro Ser Val Gly Arg Gln His His Ala Gly Pro Pro Ser Thr Ser
625 630 635 640
Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu
645 650 655
Thr Lys His Phe Leu Tyr Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro
660 665 670
Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg
675 680 685
Leu Val Glu Thr Ile Phe Leu Gly Ser Arg Pro Trp Met Pro Gly Thr
690 695 700
Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro
705 710 715 720
Leu Phe Leu Glu Leu Leu Gly Asn His Ala Gln Cys Pro Tyr Gly Val
725 730 735
Leu Leu Lys Thr His Cys Pro Leu Arg Ala Ala Val Thr Pro Ala Ala
740 745 750
Gly Val Cys Ala Arg Glu Lys Pro Gln Gly Ser Val Ala Ala Pro Glu
755 760 765
Glu Glu Asp Thr Asp Pro Arg Arg Leu Val Gln Leu Leu Arg Gln His
770 775 780
Ser Ser Pro Trp Gln Val Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg
785 790 795 800
Leu Val Pro Pro Gly Leu Trp Gly Ser Arg His Asn Glu Arg Arg Phe
805 810 815
Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu Gly Lys His Ala Lys Leu
820 825 830
Ser Leu Gln Glu Leu Thr Trp Lys Met Ser Val Arg Asp Cys Ala Trp
835 840 845
Leu Arg Arg Ser Pro Gly Val Gly Cys Val Pro Ala Ala Glu His Arg
850 855 860
Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu His Trp Leu Met Ser Val
865 870 875 880
Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr
885 890 895
Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys
900 905 910
Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg
915 920 925
Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala
930 935 940
Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg
945 950 955 960
Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg
965 970 975
Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser
980 985 990
Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser
995 1000 1005
Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe Val
1010 1015 1020
Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val
1025 1030 1035
Lys Val Ala Ile Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg
1040 1045 1050
Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr
1055 1060 1065
Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly His
1070 1075 1080
Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu
1085 1090 1095
Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser
1100 1105 1110
Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn
1115 1120 1125
Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys
1130 1135 1140
His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln
1145 1150 1155
Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu
1160 1165 1170
Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg
1175 1180 1185
Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr
1190 1195 1200
Pro His Leu Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg
1205 1210 1215
Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val
1220 1225 1230
Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe
1235 1240 1245
Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys Gly Leu Leu
1250 1255 1260
Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr
1265 1270 1275
Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe
1280 1285 1290
Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val Leu Arg
1295 1300 1305
Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser Leu
1310 1315 1320
Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala
1325 1330 1335
Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln
1340 1345 1350
Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr
1355 1360 1365
Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met
1370 1375 1380
Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala
1385 1390 1395
Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg
1400 1405 1410
His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala
1415 1420 1425
Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala
1430 1435 1440
Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr
1445 1450 1455
Ile Leu Asp
1460
<210> 43
<211> 6117
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 43
atggctagca cccctggaac ccagagcccc ttcttccttc tgctgctgct gaccgtgctg 60
actgtcgtga caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 120
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 180
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 240
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 300
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 360
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 420
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 480
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 540
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 600
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 660
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 720
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 780
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 840
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 900
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 960
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 1020
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 1080
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 1140
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 1200
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 1260
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 1320
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 1380
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 1440
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 1500
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 1560
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct gggatccggc 1620
agaatcttca acgcccacta cgccggctac ttcgccgacc tgctgatcca cgacatcgag 1680
acaaaccctg gccccctggc tggcgagaca ggacaggaag ccgctcctct ggacggcgtg 1740
ctggccaacc ctcccaatat cagcagcctg agccccagac agctgctggg attcccttgt 1800
gccgaggtgt ccggcctgag cacagagaga gtgcgggaac tggctgtggc cctggcccag 1860
aaaaacgtga agctgagcac cgagcagctg cggtgcctgg cccacagact gtctgagcct 1920
cccgaggatc tggacgccct gcctctggat ctgctgctgt tcctgaaccc cgacgccttc 1980
agcggacctc aggcctgcac ccggttcttc agcagaatca ccaaggccaa cgtggacctg 2040
ctgcccagag gcgcccctga gagacagaga ctgctgcctg ctgctctggc ctgttgggga 2100
gtgcggggct ctctgctgtc tgaagctgat gtgcgggccc tgggaggcct ggcttgtgat 2160
ctgcctggaa gattcgtggc cgagagcgcc gaagtgctgc tgcctagact ggtgtcctgt 2220
cccggccctc tggaccagga tcagcaggaa gctgccagag ctgctctgca gggcggaggc 2280
cctccttatg gacctcctag cacttggagc gtgtccacca tggatgccct gaggggcctg 2340
ctgccagtgc tgggccagcc tatcatcaga tccatcccac agggcatcgt ggccgcctgg 2400
cggcagagaa gctctagaga tccctcttgg cggcagcccg agcggacaat cctgcggccc 2460
aggtttcgga gagaggtgga aaagaccgcc tgcccctctg gcaagaaggc cagagagatc 2520
gacgagagcc tgatcttcta caagaagtgg gagctggaag cctgcgtgga cgccgctctg 2580
ctggccaccc agatggacag agtgaacgcc atccccttca cctatgagca gctggacgtg 2640
ctgaagcaca agctggatga gctgtacccc cagggctacc ccgagagcgt gatccagcac 2700
ctgggctacc tgtttctgaa gatgagcccc gaggacatcc ggaagtggaa cgtgaccagc 2760
ctggaaaccc tgaaggccct gctggaagtg aacaagggcc acgagatgtc cccccaggtg 2820
gccacactga tcgacagatt cgtgaagggc agaggccagc tggacaagga caccctggat 2880
acactgaccg ccttctaccc cggctatctg tgcagcctgt cccccgagga actgagcagc 2940
gtgccaccta gctctatctg ggctgtgcgg ccccaggacc tggatacctg cgatcctaga 3000
cagctggatg tgctgtatcc caaggcccgg ctggccttcc agaacatgaa cggcagcgag 3060
tacttcgtga agatccagtc cttcctgggc ggagccccta ccgaggacct gaaagctctg 3120
agccagcaga acgtgtccat ggatctggcc acctttatga agctgcggac cgacgccgtg 3180
ctgcctctga cagtggctga ggtgcagaaa ctgctgggcc cccatgtgga agggctgaag 3240
gccgaagaac ggcacagacc cgtgcgcgac tggatcctga ggcagagaca ggatgacctg 3300
gacacactgg gcctgggact gcaggggggc atccctaatg gctacctggt gctggacctg 3360
agcatgcagg aagccctggg atccggcgag ggcagaggca gcctgctgac atgtggcgac 3420
gtggaagaga accctggccc cggagctgcc ccggagccgg agaggacccc cgttggccag 3480
ggatcgtggg cccatccggg acgcaccagg ggaccatccg acaggggatt ctgtgtggtg 3540
tcaccggcca ggccagcaga agaggcaacc agcctcgagg gagcgttgtc tggaaccaga 3600
cattcccacc cgtcggtggg ccggcagcac cacgcgggac caccgtccac ttccagaccg 3660
ccacggccat gggacacccc ttgcccgcct gtgtatgccg agactaaaca cttcctgtac 3720
tcatccggag acaaggaaca gcttcggccg tccttcctcc tgtcgtcgct cagaccgagc 3780
ctgaccggag cacgcagatt ggtggaaact atcttccttg ggtcacgtcc gtggatgcca 3840
ggtaccccac ggcgcctccc gcgcctccca cagagatact ggcagatgcg gcctctgttc 3900
ctggaattgc tgggaaacca cgctcagtgc ccgtacggag tcctgctcaa gactcactgc 3960
cctctgaggg cggcggtcac tccggcggcc ggagtgtgcg cacgggagaa gccccaggga 4020
agcgtggcag ctccggaaga ggaggacacc gatccgcgcc gcctcgtgca acttctgcgc 4080
cagcactcct cgccctggca agtctacggg ttcgtccgcg cctgcctgcg ccgcctggtg 4140
ccgcctgggc tctggggttc ccggcataac gagcgccgct tcctgagaaa tactaagaag 4200
tttatctcac ttggaaaaca tgccaagttg tcgctgcaag aactcacgtg gaagatgtca 4260
gtccgcgatt gcgcctggct gcgccgctcg ccgggcgtcg ggtgtgttcc agctgcagaa 4320
caccgcctga gagaagaaat tctggccaaa tttctgcatt ggctgatgtc agtgtacgtg 4380
gtcgagctgc tgcgctcctt tttctacgtc actgagacta cctttcaaaa gaaccgcctg 4440
ttcttctacc gcaaatctgt gtggagcaag ctgcagtcaa tcggcattcg ccagcatctg 4500
aagagggtgc agctgcggga actttccgag gcagaagtcc gccagcaccg ggaggcccgg 4560
ccggcgcttc tcacgtcgcg tctgagattc atcccaaagc ccgacgggct gaggcctatc 4620
gtcaacatgg attacgtcgt gggcgctcgc acctttcgcc gtgaaaagcg ggccgaacgc 4680
ttgacctcac gggtgaaggc cctcttctcc gtgctgaact acgagagagc aagacggcct 4740
ggcctgctgg gagcttcggt gctgggactg gacgatatcc accgggcttg gcggaccttt 4800
gttctccggg tgagagccca agaccctccg ccggaactgt acttcgtgaa ggtggcgatc 4860
accggagcct atgatactat tccgcaagat cgactcaccg aagtcatcgc ctcgatcatc 4920
aaaccgcaga acacttactg cgtcaggcgg tacgccgtgg tccagaaggc cgcgcatggc 4980
cacgtgagaa aggcgttcaa gtcgcacgtg tccactctca ccgacctcca gccttacatg 5040
aggcaattcg ttgcgcattt gcaagagact tcgcccctga gagatgcggt ggtcatcgag 5100
cagagctcca gcctgaacga agcgagcagc ggtctgtttg acgtgttcct ccgcttcatg 5160
tgtcatcacg cggtgcgaat caggggaaaa tcatacgtgc agtgccaggg aatcccacaa 5220
ggcagcattc tgtcgactct cttgtgttcc ctttgctacg gcgatatgga aaacaagctg 5280
ttcgctggga tcagacggga cgggttgctg ctcagactgg tggacgactt cctgctggtg 5340
actccgcacc tcactcacgc caaaaccttt ctccgcactc tggtgagggg agtgccagaa 5400
tacggctgtg tggtcaatct ccggaaaact gtggtgaatt tccctgtcga ggatgaggca 5460
ctcggaggaa ccgcatttgt ccaaatgcca gcacatggcc tgttcccatg gtgcggtctg 5520
ctgctggaca cccgaactct tgaagtgcag tccgactact ccagctatgc ccggacgagc 5580
atccgcgcca gcctcacttt caatcgcggc tttaaggccg gacgaaacat gcgcagaaag 5640
cttttcggag tcctccggct taaatgccat tcgctctttc tcgatctcca agtcaattcg 5700
ctgcagaccg tgtgcacgaa catctacaag atcctgctgc tccaagccta ccggttccac 5760
gcttgcgtgc ttcagctgcc gtttcaccaa caggtgtgga agaacccgac cttctttctg 5820
cgggtcatta gcgatactgc ctccctgtgt tactcaatcc tcaaggcaaa gaacgccgga 5880
atgtcgctgg gtgcgaaagg agccgcggga cctcttccta gcgaagcggt gcagtggctc 5940
tgccaccagg ctttcctcct gaagctgacc aggcacagag tgacctacgt cccgctgctg 6000
ggctcgctgc gcactgcaca gacccagctg tctagaaaac tccccggcac caccctgacc 6060
gctctggaag ccgccgccaa cccagcattg ccgtcagatt tcaagaccat cttggac 6117
<210> 44
<211> 2039
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 44
Met Ala Ser Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu
1 5 10 15
Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr
20 25 30
Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro
35 40 45
Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser
50 55 60
Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val
65 70 75 80
Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp
85 90 95
Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser
100 105 110
Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro
115 120 125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
130 135 140
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
145 150 155 160
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
165 170 175
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
180 185 190
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
195 200 205
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
210 215 220
Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val
225 230 235 240
Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His
245 250 255
Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr
260 265 270
Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala
275 280 285
Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val
290 295 300
Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr
305 310 315 320
Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe
325 330 335
Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln
340 345 350
Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe
355 360 365
Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln
370 375 380
Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu
385 390 395 400
Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu
405 410 415
Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala
420 425 430
Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
435 440 445
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
450 455 460
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro
465 470 475 480
Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr
485 490 495
His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu
500 505 510
Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro
515 520 525
Ala Val Ala Ala Ala Ser Ala Asn Leu Gly Ser Gly Arg Ile Phe Asn
530 535 540
Ala His Tyr Ala Gly Tyr Phe Ala Asp Leu Leu Ile His Asp Ile Glu
545 550 555 560
Thr Asn Pro Gly Pro Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro
565 570 575
Leu Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro
580 585 590
Arg Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr
595 600 605
Glu Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys
610 615 620
Leu Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro
625 630 635 640
Pro Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn
645 650 655
Pro Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg
660 665 670
Ile Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg
675 680 685
Gln Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser
690 695 700
Leu Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp
705 710 715 720
Leu Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg
725 730 735
Leu Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala
740 745 750
Arg Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr
755 760 765
Trp Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu
770 775 780
Gly Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp
785 790 795 800
Arg Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr
805 810 815
Ile Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro
820 825 830
Ser Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys
835 840 845
Lys Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln
850 855 860
Met Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val
865 870 875 880
Leu Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser
885 890 895
Val Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp
900 905 910
Ile Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu
915 920 925
Glu Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile
930 935 940
Asp Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp
945 950 955 960
Thr Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu
965 970 975
Glu Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln
980 985 990
Asp Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys
995 1000 1005
Ala Arg Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val
1010 1015 1020
Lys Ile Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys
1025 1030 1035
Ala Leu Ser Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met
1040 1045 1050
Lys Leu Arg Thr Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val
1055 1060 1065
Gln Lys Leu Leu Gly Pro His Val Glu Gly Leu Lys Ala Glu Glu
1070 1075 1080
Arg His Arg Pro Val Arg Asp Trp Ile Leu Arg Gln Arg Gln Asp
1085 1090 1095
Asp Leu Asp Thr Leu Gly Leu Gly Leu Gln Gly Gly Ile Pro Asn
1100 1105 1110
Gly Tyr Leu Val Leu Asp Leu Ser Met Gln Glu Ala Leu Gly Ser
1115 1120 1125
Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
1130 1135 1140
Asn Pro Gly Pro Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val
1145 1150 1155
Gly Gln Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser
1160 1165 1170
Asp Arg Gly Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu
1175 1180 1185
Ala Thr Ser Leu Glu Gly Ala Leu Ser Gly Thr Arg His Ser His
1190 1195 1200
Pro Ser Val Gly Arg Gln His His Ala Gly Pro Pro Ser Thr Ser
1205 1210 1215
Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys Pro Pro Val Tyr Ala
1220 1225 1230
Glu Thr Lys His Phe Leu Tyr Ser Ser Gly Asp Lys Glu Gln Leu
1235 1240 1245
Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser Leu Thr Gly
1250 1255 1260
Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser Arg Pro Trp
1265 1270 1275
Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg Tyr
1280 1285 1290
Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His Ala
1295 1300 1305
Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg
1310 1315 1320
Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro
1325 1330 1335
Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg
1340 1345 1350
Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val
1355 1360 1365
Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly
1370 1375 1380
Leu Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr
1385 1390 1395
Lys Lys Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln
1400 1405 1410
Glu Leu Thr Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg
1415 1420 1425
Arg Ser Pro Gly Val Gly Cys Val Pro Ala Ala Glu His Arg Leu
1430 1435 1440
Arg Glu Glu Ile Leu Ala Lys Phe Leu His Trp Leu Met Ser Val
1445 1450 1455
Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr
1460 1465 1470
Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp
1475 1480 1485
Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val
1490 1495 1500
Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu
1505 1510 1515
Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys
1520 1525 1530
Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly
1535 1540 1545
Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser
1550 1555 1560
Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg
1565 1570 1575
Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile
1580 1585 1590
His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp
1595 1600 1605
Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr Gly Ala
1610 1615 1620
Tyr Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser
1625 1630 1635
Ile Ile Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val
1640 1645 1650
Val Gln Lys Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser
1655 1660 1665
His Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe
1670 1675 1680
Val Ala His Leu Gln Glu Thr Ser Pro Leu Arg Asp Ala Val Val
1685 1690 1695
Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala Ser Ser Gly Leu Phe
1700 1705 1710
Asp Val Phe Leu Arg Phe Met Cys His His Ala Val Arg Ile Arg
1715 1720 1725
Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile
1730 1735 1740
Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met Glu Asn
1745 1750 1755
Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg Leu
1760 1765 1770
Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala Lys
1775 1780 1785
Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys
1790 1795 1800
Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp
1805 1810 1815
Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly
1820 1825 1830
Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu
1835 1840 1845
Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala
1850 1855 1860
Ser Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg
1865 1870 1875
Arg Lys Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe
1880 1885 1890
Leu Asp Leu Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile
1895 1900 1905
Tyr Lys Ile Leu Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val
1910 1915 1920
Leu Gln Leu Pro Phe His Gln Gln Val Trp Lys Asn Pro Thr Phe
1925 1930 1935
Phe Leu Arg Val Ile Ser Asp Thr Ala Ser Leu Cys Tyr Ser Ile
1940 1945 1950
Leu Lys Ala Lys Asn Ala Gly Met Ser Leu Gly Ala Lys Gly Ala
1955 1960 1965
Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu Cys His Gln
1970 1975 1980
Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr Tyr Val Pro
1985 1990 1995
Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg Lys
2000 2005 2010
Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro
2015 2020 2025
Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
2030 2035
<210> 45
<211> 6117
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 45
atggctagca cccctggaac ccagagcccc ttcttccttc tgctgctgct gaccgtgctg 60
actgtcgtga caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 120
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 180
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 240
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 300
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 360
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 420
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 480
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 540
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 600
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 660
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 720
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 780
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 840
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 900
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 960
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 1020
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 1080
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 1140
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 1200
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 1260
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 1320
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 1380
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 1440
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 1500
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 1560
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct gggatccggc 1620
acaatcctgt ctgagggcgc caccaacttc agcctgctga aactggccgg cgacgtggaa 1680
ctgaaccctg gccctggagc tgccccggag ccggagagga cccccgttgg ccagggatcg 1740
tgggcccatc cgggacgcac caggggacca tccgacaggg gattctgtgt ggtgtcaccg 1800
gccaggccag cagaagaggc aaccagcctc gagggagcgt tgtctggaac cagacattcc 1860
cacccgtcgg tgggccggca gcaccacgcg ggaccaccgt ccacttccag accgccacgg 1920
ccatgggaca ccccttgccc gcctgtgtat gccgagacta aacacttcct gtactcatcc 1980
ggagacaagg aacagcttcg gccgtccttc ctcctgtcgt cgctcagacc gagcctgacc 2040
ggagcacgca gattggtgga aactatcttc cttgggtcac gtccgtggat gccaggtacc 2100
ccacggcgcc tcccgcgcct cccacagaga tactggcaga tgcggcctct gttcctggaa 2160
ttgctgggaa accacgctca gtgcccgtac ggagtcctgc tcaagactca ctgccctctg 2220
agggcggcgg tcactccggc ggccggagtg tgcgcacggg agaagcccca gggaagcgtg 2280
gcagctccgg aagaggagga caccgatccg cgccgcctcg tgcaacttct gcgccagcac 2340
tcctcgccct ggcaagtcta cgggttcgtc cgcgcctgcc tgcgccgcct ggtgccgcct 2400
gggctctggg gttcccggca taacgagcgc cgcttcctga gaaatactaa gaagtttatc 2460
tcacttggaa aacatgccaa gttgtcgctg caagaactca cgtggaagat gtcagtccgc 2520
gattgcgcct ggctgcgccg ctcgccgggc gtcgggtgtg ttccagctgc agaacaccgc 2580
ctgagagaag aaattctggc caaatttctg cattggctga tgtcagtgta cgtggtcgag 2640
ctgctgcgct cctttttcta cgtcactgag actacctttc aaaagaaccg cctgttcttc 2700
taccgcaaat ctgtgtggag caagctgcag tcaatcggca ttcgccagca tctgaagagg 2760
gtgcagctgc gggaactttc cgaggcagaa gtccgccagc accgggaggc ccggccggcg 2820
cttctcacgt cgcgtctgag attcatccca aagcccgacg ggctgaggcc tatcgtcaac 2880
atggattacg tcgtgggcgc tcgcaccttt cgccgtgaaa agcgggccga acgcttgacc 2940
tcacgggtga aggccctctt ctccgtgctg aactacgaga gagcaagacg gcctggcctg 3000
ctgggagctt cggtgctggg actggacgat atccaccggg cttggcggac ctttgttctc 3060
cgggtgagag cccaagaccc tccgccggaa ctgtacttcg tgaaggtggc gatcaccgga 3120
gcctatgata ctattccgca agatcgactc accgaagtca tcgcctcgat catcaaaccg 3180
cagaacactt actgcgtcag gcggtacgcc gtggtccaga aggccgcgca tggccacgtg 3240
agaaaggcgt tcaagtcgca cgtgtccact ctcaccgacc tccagcctta catgaggcaa 3300
ttcgttgcgc atttgcaaga gacttcgccc ctgagagatg cggtggtcat cgagcagagc 3360
tccagcctga acgaagcgag cagcggtctg tttgacgtgt tcctccgctt catgtgtcat 3420
cacgcggtgc gaatcagggg aaaatcatac gtgcagtgcc agggaatccc acaaggcagc 3480
attctgtcga ctctcttgtg ttccctttgc tacggcgata tggaaaacaa gctgttcgct 3540
gggatcagac gggacgggtt gctgctcaga ctggtggacg acttcctgct ggtgactccg 3600
cacctcactc acgccaaaac ctttctccgc actctggtga ggggagtgcc agaatacggc 3660
tgtgtggtca atctccggaa aactgtggtg aatttccctg tcgaggatga ggcactcgga 3720
ggaaccgcat ttgtccaaat gccagcacat ggcctgttcc catggtgcgg tctgctgctg 3780
gacacccgaa ctcttgaagt gcagtccgac tactccagct atgcccggac gagcatccgc 3840
gccagcctca ctttcaatcg cggctttaag gccggacgaa acatgcgcag aaagcttttc 3900
ggagtcctcc ggcttaaatg ccattcgctc tttctcgatc tccaagtcaa ttcgctgcag 3960
accgtgtgca cgaacatcta caagatcctg ctgctccaag cctaccggtt ccacgcttgc 4020
gtgcttcagc tgccgtttca ccaacaggtg tggaagaacc cgaccttctt tctgcgggtc 4080
attagcgata ctgcctccct gtgttactca atcctcaagg caaagaacgc cggaatgtcg 4140
ctgggtgcga aaggagccgc gggacctctt cctagcgaag cggtgcagtg gctctgccac 4200
caggctttcc tcctgaagct gaccaggcac agagtgacct acgtcccgct gctgggctcg 4260
ctgcgcactg cacagaccca gctgtctaga aaactccccg gcaccaccct gaccgctctg 4320
gaagccgccg ccaacccagc attgccgtca gatttcaaga ccatcttgga cggatccggc 4380
gagggcagag gcagcctgct gacatgtggc gacgtggaag agaaccctgg ccccctggct 4440
ggcgagacag gacaggaagc cgctcctctg gacggcgtgc tggccaaccc tcccaatatc 4500
agcagcctga gccccagaca gctgctggga ttcccttgtg ccgaggtgtc cggcctgagc 4560
acagagagag tgcgggaact ggctgtggcc ctggcccaga aaaacgtgaa gctgagcacc 4620
gagcagctgc ggtgcctggc ccacagactg tctgagcctc ccgaggatct ggacgccctg 4680
cctctggatc tgctgctgtt cctgaacccc gacgccttca gcggacctca ggcctgcacc 4740
cggttcttca gcagaatcac caaggccaac gtggacctgc tgcccagagg cgcccctgag 4800
agacagagac tgctgcctgc tgctctggcc tgttggggag tgcggggctc tctgctgtct 4860
gaagctgatg tgcgggccct gggaggcctg gcttgtgatc tgcctggaag attcgtggcc 4920
gagagcgccg aagtgctgct gcctagactg gtgtcctgtc ccggccctct ggaccaggat 4980
cagcaggaag ctgccagagc tgctctgcag ggcggaggcc ctccttatgg acctcctagc 5040
acttggagcg tgtccaccat ggatgccctg aggggcctgc tgccagtgct gggccagcct 5100
atcatcagat ccatcccaca gggcatcgtg gccgcctggc ggcagagaag ctctagagat 5160
ccctcttggc ggcagcccga gcggacaatc ctgcggccca ggtttcggag agaggtggaa 5220
aagaccgcct gcccctctgg caagaaggcc agagagatcg acgagagcct gatcttctac 5280
aagaagtggg agctggaagc ctgcgtggac gccgctctgc tggccaccca gatggacaga 5340
gtgaacgcca tccccttcac ctatgagcag ctggacgtgc tgaagcacaa gctggatgag 5400
ctgtaccccc agggctaccc cgagagcgtg atccagcacc tgggctacct gtttctgaag 5460
atgagccccg aggacatccg gaagtggaac gtgaccagcc tggaaaccct gaaggccctg 5520
ctggaagtga acaagggcca cgagatgtcc ccccaggtgg ccacactgat cgacagattc 5580
gtgaagggca gaggccagct ggacaaggac accctggata cactgaccgc cttctacccc 5640
ggctatctgt gcagcctgtc ccccgaggaa ctgagcagcg tgccacctag ctctatctgg 5700
gctgtgcggc cccaggacct ggatacctgc gatcctagac agctggatgt gctgtatccc 5760
aaggcccggc tggccttcca gaacatgaac ggcagcgagt acttcgtgaa gatccagtcc 5820
ttcctgggcg gagcccctac cgaggacctg aaagctctga gccagcagaa cgtgtccatg 5880
gatctggcca cctttatgaa gctgcggacc gacgccgtgc tgcctctgac agtggctgag 5940
gtgcagaaac tgctgggccc ccatgtggaa gggctgaagg ccgaagaacg gcacagaccc 6000
gtgcgcgact ggatcctgag gcagagacag gatgacctgg acacactggg cctgggactg 6060
caggggggca tccctaatgg ctacctggtg ctggacctga gcatgcagga agccctg 6117
<210> 46
<211> 2039
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 46
Met Ala Ser Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu
1 5 10 15
Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr
20 25 30
Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro
35 40 45
Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser
50 55 60
Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val
65 70 75 80
Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp
85 90 95
Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser
100 105 110
Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro
115 120 125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
130 135 140
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
145 150 155 160
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
165 170 175
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
180 185 190
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
195 200 205
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
210 215 220
Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val
225 230 235 240
Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His
245 250 255
Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr
260 265 270
Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala
275 280 285
Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val
290 295 300
Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr
305 310 315 320
Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe
325 330 335
Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln
340 345 350
Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe
355 360 365
Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln
370 375 380
Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu
385 390 395 400
Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu
405 410 415
Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala
420 425 430
Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
435 440 445
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
450 455 460
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro
465 470 475 480
Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr
485 490 495
His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu
500 505 510
Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro
515 520 525
Ala Val Ala Ala Ala Ser Ala Asn Leu Gly Ser Gly Thr Ile Leu Ser
530 535 540
Glu Gly Ala Thr Asn Phe Ser Leu Leu Lys Leu Ala Gly Asp Val Glu
545 550 555 560
Leu Asn Pro Gly Pro Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val
565 570 575
Gly Gln Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp
580 585 590
Arg Gly Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr
595 600 605
Ser Leu Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val
610 615 620
Gly Arg Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg
625 630 635 640
Pro Trp Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe
645 650 655
Leu Tyr Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu
660 665 670
Ser Ser Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr
675 680 685
Ile Phe Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu
690 695 700
Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu
705 710 715 720
Leu Leu Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr
725 730 735
His Cys Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala
740 745 750
Arg Glu Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr
755 760 765
Asp Pro Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp
770 775 780
Gln Val Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro
785 790 795 800
Gly Leu Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr
805 810 815
Lys Lys Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu
820 825 830
Leu Thr Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser
835 840 845
Pro Gly Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu
850 855 860
Ile Leu Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu
865 870 875 880
Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn
885 890 895
Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile
900 905 910
Gly Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu
915 920 925
Ala Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser
930 935 940
Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn
945 950 955 960
Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala
965 970 975
Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr
980 985 990
Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu
995 1000 1005
Asp Asp Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg
1010 1015 1020
Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile
1025 1030 1035
Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val
1040 1045 1050
Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg
1055 1060 1065
Tyr Ala Val Val Gln Lys Ala Ala His Gly His Val Arg Lys Ala
1070 1075 1080
Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met
1085 1090 1095
Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser Pro Leu Arg Asp
1100 1105 1110
Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala Ser Ser
1115 1120 1125
Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His Ala Val
1130 1135 1140
Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln
1145 1150 1155
Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp
1160 1165 1170
Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu
1175 1180 1185
Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr
1190 1195 1200
His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu
1205 1210 1215
Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro
1220 1225 1230
Val Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro
1235 1240 1245
Ala His Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg
1250 1255 1260
Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser
1265 1270 1275
Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg
1280 1285 1290
Asn Met Arg Arg Lys Leu Phe Gly Val Leu Arg Leu Lys Cys His
1295 1300 1305
Ser Leu Phe Leu Asp Leu Gln Val Asn Ser Leu Gln Thr Val Cys
1310 1315 1320
Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala Tyr Arg Phe His
1325 1330 1335
Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln Val Trp Lys Asn
1340 1345 1350
Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala Ser Leu Cys
1355 1360 1365
Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu Gly Ala
1370 1375 1380
Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu
1385 1390 1395
Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr
1400 1405 1410
Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu
1415 1420 1425
Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala
1430 1435 1440
Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp Gly
1445 1450 1455
Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1460 1465 1470
Glu Asn Pro Gly Pro Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala
1475 1480 1485
Pro Leu Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu
1490 1495 1500
Ser Pro Arg Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly
1505 1510 1515
Leu Ser Thr Glu Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln
1520 1525 1530
Lys Asn Val Lys Leu Ser Thr Glu Gln Leu Arg Cys Leu Ala His
1535 1540 1545
Arg Leu Ser Glu Pro Pro Glu Asp Leu Asp Ala Leu Pro Leu Asp
1550 1555 1560
Leu Leu Leu Phe Leu Asn Pro Asp Ala Phe Ser Gly Pro Gln Ala
1565 1570 1575
Cys Thr Arg Phe Phe Ser Arg Ile Thr Lys Ala Asn Val Asp Leu
1580 1585 1590
Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg Leu Leu Pro Ala Ala
1595 1600 1605
Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu Ser Glu Ala Asp
1610 1615 1620
Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro Gly Arg Phe
1625 1630 1635
Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val Ser Cys
1640 1645 1650
Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala Ala
1655 1660 1665
Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
1670 1675 1680
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly
1685 1690 1695
Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp
1700 1705 1710
Arg Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg
1715 1720 1725
Thr Ile Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala
1730 1735 1740
Cys Pro Ser Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile
1745 1750 1755
Phe Tyr Lys Lys Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu
1760 1765 1770
Leu Ala Thr Gln Met Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr
1775 1780 1785
Glu Gln Leu Asp Val Leu Lys His Lys Leu Asp Glu Leu Tyr Pro
1790 1795 1800
Gln Gly Tyr Pro Glu Ser Val Ile Gln His Leu Gly Tyr Leu Phe
1805 1810 1815
Leu Lys Met Ser Pro Glu Asp Ile Arg Lys Trp Asn Val Thr Ser
1820 1825 1830
Leu Glu Thr Leu Lys Ala Leu Leu Glu Val Asn Lys Gly His Glu
1835 1840 1845
Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg Phe Val Lys Gly
1850 1855 1860
Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu Thr Ala Phe
1865 1870 1875
Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu Ser Ser
1880 1885 1890
Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu Asp
1895 1900 1905
Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
1910 1915 1920
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile
1925 1930 1935
Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu
1940 1945 1950
Ser Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu
1955 1960 1965
Arg Thr Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys
1970 1975 1980
Leu Leu Gly Pro His Val Glu Gly Leu Lys Ala Glu Glu Arg His
1985 1990 1995
Arg Pro Val Arg Asp Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu
2000 2005 2010
Asp Thr Leu Gly Leu Gly Leu Gln Gly Gly Ile Pro Asn Gly Tyr
2015 2020 2025
Leu Val Leu Asp Leu Ser Met Gln Glu Ala Leu
2030 2035
<210> 47
<211> 6138
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 47
atggctagcc tggctggcga gacaggacag gaagccgctc ctctggacgg cgtgctggcc 60
aaccctccca atatcagcag cctgagcccc agacagctgc tgggattccc ttgtgccgag 120
gtgtccggcc tgagcacaga gagagtgcgg gaactggctg tggccctggc ccagaaaaac 180
gtgaagctga gcaccgagca gctgcggtgc ctggcccaca gactgtctga gcctcccgag 240
gatctggacg ccctgcctct ggatctgctg ctgttcctga accccgacgc cttcagcgga 300
cctcaggcct gcacccggtt cttcagcaga atcaccaagg ccaacgtgga cctgctgccc 360
agaggcgccc ctgagagaca gagactgctg cctgctgctc tggcctgttg gggagtgcgg 420
ggctctctgc tgtctgaagc tgatgtgcgg gccctgggag gcctggcttg tgatctgcct 480
ggaagattcg tggccgagag cgccgaagtg ctgctgccta gactggtgtc ctgtcccggc 540
cctctggacc aggatcagca ggaagctgcc agagctgctc tgcagggcgg aggccctcct 600
tatggacctc ctagcacttg gagcgtgtcc accatggatg ccctgagggg cctgctgcca 660
gtgctgggcc agcctatcat cagatccatc ccacagggca tcgtggccgc ctggcggcag 720
agaagctcta gagatccctc ttggcggcag cccgagcgga caatcctgcg gcccaggttt 780
cggagagagg tggaaaagac cgcctgcccc tctggcaaga aggccagaga gatcgacgag 840
agcctgatct tctacaagaa gtgggagctg gaagcctgcg tggacgccgc tctgctggcc 900
acccagatgg acagagtgaa cgccatcccc ttcacctatg agcagctgga cgtgctgaag 960
cacaagctgg atgagctgta cccccagggc taccccgaga gcgtgatcca gcacctgggc 1020
tacctgtttc tgaagatgag ccccgaggac atccggaagt ggaacgtgac cagcctggaa 1080
accctgaagg ccctgctgga agtgaacaag ggccacgaga tgtcccccca ggtggccaca 1140
ctgatcgaca gattcgtgaa gggcagaggc cagctggaca aggacaccct ggatacactg 1200
accgccttct accccggcta tctgtgcagc ctgtcccccg aggaactgag cagcgtgcca 1260
cctagctcta tctgggctgt gcggccccag gacctggata cctgcgatcc tagacagctg 1320
gatgtgctgt atcccaaggc ccggctggcc ttccagaaca tgaacggcag cgagtacttc 1380
gtgaagatcc agtccttcct gggcggagcc cctaccgagg acctgaaagc tctgagccag 1440
cagaacgtgt ccatggatct ggccaccttt atgaagctgc ggaccgacgc cgtgctgcct 1500
ctgacagtgg ctgaggtgca gaaactgctg ggcccccatg tggaagggct gaaggccgaa 1560
gaacggcaca gacccgtgcg cgactggatc ctgaggcaga gacaggatga cctggacaca 1620
ctgggcctgg gactgcaggg gggcatccct aatggctacc tggtgctgga cctgagcatg 1680
caggaagccc tgggatccgg cagaatcttc aacgcccact acgccggcta cttcgccgac 1740
ctgctgatcc acgacatcga gacaaaccct ggccccaccc ctggaaccca gagccccttc 1800
ttccttctgc tgctgctgac cgtgctgact gtcgtgacag gctctggcca cgccagctct 1860
acacctggcg gcgagaaaga gacaagcgcc acccagagaa gcagcgtgcc aagcagcacc 1920
gagaagaacg ccgtgtccat gaccagctcc gtgctgagca gccactctcc tggcagcggc 1980
agcagcacaa cacagggcca ggatgtgaca ctggcccctg ccacagaacc tgcctctgga 2040
tctgccgcca cctggggaca ggacgtgaca agcgtgccag tgaccagacc tgccctgggc 2100
tctacaacac cccctgccca cgatgtgacc agcgcccctg ataacaagcc tgcccctgga 2160
agcacagccc ctccagctca tggcgtgacc tctgccccag ataccagacc agccccagga 2220
tctacagccc cacccgcaca cggcgtgaca agtgcccctg acacaagacc cgctccaggc 2280
tctactgctc ctcctgccca tggcgtgaca agcgctcccg atacaaggcc agctcctggc 2340
tccacagcac caccagcaca tggcgtgaca tcagctcccg acactagacc tgctcccgga 2400
tcaaccgctc caccagctca cggcgtgacc agcgcacctg ataccagacc tgctctggga 2460
agcaccgccc ctcccgtgca caatgtgaca tctgcttccg gcagcgccag cggctctgcc 2520
tctacactgg tgcacaacgg caccagcgcc agagccacaa caaccccagc cagcaagagc 2580
acccccttca gcatccctag ccaccacagc gacaccccta ccacactggc cagccactcc 2640
accaagaccg atgcctctag cacccaccac tccagcgtgc cccctctgac cagcagcaac 2700
cacagcacaa gcccccagct gtctaccggc gtctcattct tctttctgtc cttccacatc 2760
agcaacctgc agttcaacag cagcctggaa gatcccagca ccgactacta ccaggaactg 2820
cagcgggata tcagcgagat gttcctgcaa atctacaagc agggcggctt cctgggcctg 2880
agcaacatca agttcagacc cggcagcgtg gtggtgcagc tgaccctggc tttccgggaa 2940
ggcaccatca acgtgcacga cgtggaaacc cagttcaacc agtacaagac cgaggccgcc 3000
agccggtaca acctgaccat ctccgatgtg tccgtgtccg acgtgccctt cccattctct 3060
gcccagtctg gcgcaggcgt gccaggatgg ggaattgctc tgctggtgct cgtgtgcgtg 3120
ctggtggccc tggccatcgt gtatctgatt gccctggccg tgtgccagtg ccggcggaag 3180
aattacggcc agctggacat cttccccgcc agagacacct accaccccat gagcgagtac 3240
cccacatacc acacccacgg cagatacgtg ccacccagct ccaccgacag atccccctac 3300
gagaaagtgt ctgccggcaa cggcggcagc tccctgagct acacaaatcc tgccgtggcc 3360
gctgcctccg ccaacctggg atccggcaca atcctgtctg agggcgccac caacttcagc 3420
ctgctgaaac tggccggcga cgtggaactg aaccctggcc ctggagctgc cccggagccg 3480
gagaggaccc ccgttggcca gggatcgtgg gcccatccgg gacgcaccag gggaccatcc 3540
gacaggggat tctgtgtggt gtcaccggcc aggccagcag aagaggcaac cagcctcgag 3600
ggagcgttgt ctggaaccag acattcccac ccgtcggtgg gccggcagca ccacgcggga 3660
ccaccgtcca cttccagacc gccacggcca tgggacaccc cttgcccgcc tgtgtatgcc 3720
gagactaaac acttcctgta ctcatccgga gacaaggaac agcttcggcc gtccttcctc 3780
ctgtcgtcgc tcagaccgag cctgaccgga gcacgcagat tggtggaaac tatcttcctt 3840
gggtcacgtc cgtggatgcc aggtacccca cggcgcctcc cgcgcctccc acagagatac 3900
tggcagatgc ggcctctgtt cctggaattg ctgggaaacc acgctcagtg cccgtacgga 3960
gtcctgctca agactcactg ccctctgagg gcggcggtca ctccggcggc cggagtgtgc 4020
gcacgggaga agccccaggg aagcgtggca gctccggaag aggaggacac cgatccgcgc 4080
cgcctcgtgc aacttctgcg ccagcactcc tcgccctggc aagtctacgg gttcgtccgc 4140
gcctgcctgc gccgcctggt gccgcctggg ctctggggtt cccggcataa cgagcgccgc 4200
ttcctgagaa atactaagaa gtttatctca cttggaaaac atgccaagtt gtcgctgcaa 4260
gaactcacgt ggaagatgtc agtccgcgat tgcgcctggc tgcgccgctc gccgggcgtc 4320
gggtgtgttc cagctgcaga acaccgcctg agagaagaaa ttctggccaa atttctgcat 4380
tggctgatgt cagtgtacgt ggtcgagctg ctgcgctcct ttttctacgt cactgagact 4440
acctttcaaa agaaccgcct gttcttctac cgcaaatctg tgtggagcaa gctgcagtca 4500
atcggcattc gccagcatct gaagagggtg cagctgcggg aactttccga ggcagaagtc 4560
cgccagcacc gggaggcccg gccggcgctt ctcacgtcgc gtctgagatt catcccaaag 4620
cccgacgggc tgaggcctat cgtcaacatg gattacgtcg tgggcgctcg cacctttcgc 4680
cgtgaaaagc gggccgaacg cttgacctca cgggtgaagg ccctcttctc cgtgctgaac 4740
tacgagagag caagacggcc tggcctgctg ggagcttcgg tgctgggact ggacgatatc 4800
caccgggctt ggcggacctt tgttctccgg gtgagagccc aagaccctcc gccggaactg 4860
tacttcgtga aggtggcgat caccggagcc tatgatacta ttccgcaaga tcgactcacc 4920
gaagtcatcg cctcgatcat caaaccgcag aacacttact gcgtcaggcg gtacgccgtg 4980
gtccagaagg ccgcgcatgg ccacgtgaga aaggcgttca agtcgcacgt gtccactctc 5040
accgacctcc agccttacat gaggcaattc gttgcgcatt tgcaagagac ttcgcccctg 5100
agagatgcgg tggtcatcga gcagagctcc agcctgaacg aagcgagcag cggtctgttt 5160
gacgtgttcc tccgcttcat gtgtcatcac gcggtgcgaa tcaggggaaa atcatacgtg 5220
cagtgccagg gaatcccaca aggcagcatt ctgtcgactc tcttgtgttc cctttgctac 5280
ggcgatatgg aaaacaagct gttcgctggg atcagacggg acgggttgct gctcagactg 5340
gtggacgact tcctgctggt gactccgcac ctcactcacg ccaaaacctt tctccgcact 5400
ctggtgaggg gagtgccaga atacggctgt gtggtcaatc tccggaaaac tgtggtgaat 5460
ttccctgtcg aggatgaggc actcggagga accgcatttg tccaaatgcc agcacatggc 5520
ctgttcccat ggtgcggtct gctgctggac acccgaactc ttgaagtgca gtccgactac 5580
tccagctatg cccggacgag catccgcgcc agcctcactt tcaatcgcgg ctttaaggcc 5640
ggacgaaaca tgcgcagaaa gcttttcgga gtcctccggc ttaaatgcca ttcgctcttt 5700
ctcgatctcc aagtcaattc gctgcagacc gtgtgcacga acatctacaa gatcctgctg 5760
ctccaagcct accggttcca cgcttgcgtg cttcagctgc cgtttcacca acaggtgtgg 5820
aagaacccga ccttctttct gcgggtcatt agcgatactg cctccctgtg ttactcaatc 5880
ctcaaggcaa agaacgccgg aatgtcgctg ggtgcgaaag gagccgcggg acctcttcct 5940
agcgaagcgg tgcagtggct ctgccaccag gctttcctcc tgaagctgac caggcacaga 6000
gtgacctacg tcccgctgct gggctcgctg cgcactgcac agacccagct gtctagaaaa 6060
ctccccggca ccaccctgac cgctctggaa gccgccgcca acccagcatt gccgtcagat 6120
ttcaagacca tcttggac 6138
<210> 48
<211> 2046
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 48
Met Ala Ser Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp
1 5 10 15
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
20 25 30
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
35 40 45
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
50 55 60
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
65 70 75 80
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
85 90 95
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
100 105 110
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
115 120 125
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
130 135 140
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
145 150 155 160
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
165 170 175
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
180 185 190
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
195 200 205
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
210 215 220
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
225 230 235 240
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
245 250 255
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
260 265 270
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
275 280 285
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
290 295 300
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
305 310 315 320
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
325 330 335
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
340 345 350
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
355 360 365
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
370 375 380
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
385 390 395 400
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
405 410 415
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
420 425 430
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
435 440 445
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
450 455 460
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
465 470 475 480
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
485 490 495
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
500 505 510
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
515 520 525
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
530 535 540
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
545 550 555 560
Gln Glu Ala Leu Gly Ser Gly Arg Ile Phe Asn Ala His Tyr Ala Gly
565 570 575
Tyr Phe Ala Asp Leu Leu Ile His Asp Ile Glu Thr Asn Pro Gly Pro
580 585 590
Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr Val
595 600 605
Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly
610 615 620
Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr
625 630 635 640
Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser
645 650 655
Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala
660 665 670
Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp
675 680 685
Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro
690 695 700
Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly
705 710 715 720
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg
725 730 735
Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala
740 745 750
Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly
755 760 765
Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro
770 775 780
Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly
785 790 795 800
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg
805 810 815
Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala
820 825 830
Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr
835 840 845
Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser
850 855 860
Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser
865 870 875 880
Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro Leu
885 890 895
Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser
900 905 910
Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser
915 920 925
Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile
930 935 940
Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu
945 950 955 960
Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu
965 970 975
Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe
980 985 990
Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser
995 1000 1005
Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser
1010 1015 1020
Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val
1025 1030 1035
Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
1040 1045 1050
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe
1055 1060 1065
Pro Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr
1070 1075 1080
His Thr His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser
1085 1090 1095
Pro Tyr Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser
1100 1105 1110
Tyr Thr Asn Pro Ala Val Ala Ala Ala Ser Ala Asn Leu Gly Ser
1115 1120 1125
Gly Thr Ile Leu Ser Glu Gly Ala Thr Asn Phe Ser Leu Leu Lys
1130 1135 1140
Leu Ala Gly Asp Val Glu Leu Asn Pro Gly Pro Gly Ala Ala Pro
1145 1150 1155
Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser Trp Ala His Pro
1160 1165 1170
Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val Val Ser
1175 1180 1185
Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu
1190 1195 1200
Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His His
1205 1210 1215
Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr
1220 1225 1230
Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser
1235 1240 1245
Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser
1250 1255 1260
Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile
1265 1270 1275
Phe Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu
1280 1285 1290
Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu
1295 1300 1305
Glu Leu Leu Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu
1310 1315 1320
Lys Thr His Cys Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly
1325 1330 1335
Val Cys Ala Arg Glu Lys Pro Gln Gly Ser Val Ala Ala Pro Glu
1340 1345 1350
Glu Glu Asp Thr Asp Pro Arg Arg Leu Val Gln Leu Leu Arg Gln
1355 1360 1365
His Ser Ser Pro Trp Gln Val Tyr Gly Phe Val Arg Ala Cys Leu
1370 1375 1380
Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser Arg His Asn Glu
1385 1390 1395
Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu Gly Lys
1400 1405 1410
His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met Ser Val
1415 1420 1425
Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys Val
1430 1435 1440
Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe
1445 1450 1455
Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser
1460 1465 1470
Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe
1475 1480 1485
Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
1490 1495 1500
Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala
1505 1510 1515
Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser
1520 1525 1530
Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val
1535 1540 1545
Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys
1550 1555 1560
Arg Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val
1565 1570 1575
Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser
1580 1585 1590
Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe Val
1595 1600 1605
Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val
1610 1615 1620
Lys Val Ala Ile Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg
1625 1630 1635
Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr
1640 1645 1650
Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly His
1655 1660 1665
Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu
1670 1675 1680
Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser
1685 1690 1695
Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn
1700 1705 1710
Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys
1715 1720 1725
His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln
1730 1735 1740
Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu
1745 1750 1755
Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg
1760 1765 1770
Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr
1775 1780 1785
Pro His Leu Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg
1790 1795 1800
Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val
1805 1810 1815
Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe
1820 1825 1830
Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys Gly Leu Leu
1835 1840 1845
Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr
1850 1855 1860
Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe
1865 1870 1875
Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val Leu Arg
1880 1885 1890
Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser Leu
1895 1900 1905
Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala
1910 1915 1920
Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln
1925 1930 1935
Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr
1940 1945 1950
Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met
1955 1960 1965
Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala
1970 1975 1980
Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg
1985 1990 1995
His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala
2000 2005 2010
Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala
2015 2020 2025
Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr
2030 2035 2040
Ile Leu Asp
2045
<210> 49
<211> 6117
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 49
atggctagcc tggctggcga gacaggacag gaagccgctc ctctggacgg cgtgctggcc 60
aaccctccca atatcagcag cctgagcccc agacagctgc tgggattccc ttgtgccgag 120
gtgtccggcc tgagcacaga gagagtgcgg gaactggctg tggccctggc ccagaaaaac 180
gtgaagctga gcaccgagca gctgcggtgc ctggcccaca gactgtctga gcctcccgag 240
gatctggacg ccctgcctct ggatctgctg ctgttcctga accccgacgc cttcagcgga 300
cctcaggcct gcacccggtt cttcagcaga atcaccaagg ccaacgtgga cctgctgccc 360
agaggcgccc ctgagagaca gagactgctg cctgctgctc tggcctgttg gggagtgcgg 420
ggctctctgc tgtctgaagc tgatgtgcgg gccctgggag gcctggcttg tgatctgcct 480
ggaagattcg tggccgagag cgccgaagtg ctgctgccta gactggtgtc ctgtcccggc 540
cctctggacc aggatcagca ggaagctgcc agagctgctc tgcagggcgg aggccctcct 600
tatggacctc ctagcacttg gagcgtgtcc accatggatg ccctgagggg cctgctgcca 660
gtgctgggcc agcctatcat cagatccatc ccacagggca tcgtggccgc ctggcggcag 720
agaagctcta gagatccctc ttggcggcag cccgagcgga caatcctgcg gcccaggttt 780
cggagagagg tggaaaagac cgcctgcccc tctggcaaga aggccagaga gatcgacgag 840
agcctgatct tctacaagaa gtgggagctg gaagcctgcg tggacgccgc tctgctggcc 900
acccagatgg acagagtgaa cgccatcccc ttcacctatg agcagctgga cgtgctgaag 960
cacaagctgg atgagctgta cccccagggc taccccgaga gcgtgatcca gcacctgggc 1020
tacctgtttc tgaagatgag ccccgaggac atccggaagt ggaacgtgac cagcctggaa 1080
accctgaagg ccctgctgga agtgaacaag ggccacgaga tgtcccccca ggtggccaca 1140
ctgatcgaca gattcgtgaa gggcagaggc cagctggaca aggacaccct ggatacactg 1200
accgccttct accccggcta tctgtgcagc ctgtcccccg aggaactgag cagcgtgcca 1260
cctagctcta tctgggctgt gcggccccag gacctggata cctgcgatcc tagacagctg 1320
gatgtgctgt atcccaaggc ccggctggcc ttccagaaca tgaacggcag cgagtacttc 1380
gtgaagatcc agtccttcct gggcggagcc cctaccgagg acctgaaagc tctgagccag 1440
cagaacgtgt ccatggatct ggccaccttt atgaagctgc ggaccgacgc cgtgctgcct 1500
ctgacagtgg ctgaggtgca gaaactgctg ggcccccatg tggaagggct gaaggccgaa 1560
gaacggcaca gacccgtgcg cgactggatc ctgaggcaga gacaggatga cctggacaca 1620
ctgggcctgg gactgcaggg gggcatccct aatggctacc tggtgctgga cctgagcatg 1680
caggaagccc tgggatccgg cgagggcaga ggcagcctgc tgacatgtgg cgacgtggaa 1740
gagaaccctg gccccggagc tgccccggag ccggagagga cccccgttgg ccagggatcg 1800
tgggcccatc cgggacgcac caggggacca tccgacaggg gattctgtgt ggtgtcaccg 1860
gccaggccag cagaagaggc aaccagcctc gagggagcgt tgtctggaac cagacattcc 1920
cacccgtcgg tgggccggca gcaccacgcg ggaccaccgt ccacttccag accgccacgg 1980
ccatgggaca ccccttgccc gcctgtgtat gccgagacta aacacttcct gtactcatcc 2040
ggagacaagg aacagcttcg gccgtccttc ctcctgtcgt cgctcagacc gagcctgacc 2100
ggagcacgca gattggtgga aactatcttc cttgggtcac gtccgtggat gccaggtacc 2160
ccacggcgcc tcccgcgcct cccacagaga tactggcaga tgcggcctct gttcctggaa 2220
ttgctgggaa accacgctca gtgcccgtac ggagtcctgc tcaagactca ctgccctctg 2280
agggcggcgg tcactccggc ggccggagtg tgcgcacggg agaagcccca gggaagcgtg 2340
gcagctccgg aagaggagga caccgatccg cgccgcctcg tgcaacttct gcgccagcac 2400
tcctcgccct ggcaagtcta cgggttcgtc cgcgcctgcc tgcgccgcct ggtgccgcct 2460
gggctctggg gttcccggca taacgagcgc cgcttcctga gaaatactaa gaagtttatc 2520
tcacttggaa aacatgccaa gttgtcgctg caagaactca cgtggaagat gtcagtccgc 2580
gattgcgcct ggctgcgccg ctcgccgggc gtcgggtgtg ttccagctgc agaacaccgc 2640
ctgagagaag aaattctggc caaatttctg cattggctga tgtcagtgta cgtggtcgag 2700
ctgctgcgct cctttttcta cgtcactgag actacctttc aaaagaaccg cctgttcttc 2760
taccgcaaat ctgtgtggag caagctgcag tcaatcggca ttcgccagca tctgaagagg 2820
gtgcagctgc gggaactttc cgaggcagaa gtccgccagc accgggaggc ccggccggcg 2880
cttctcacgt cgcgtctgag attcatccca aagcccgacg ggctgaggcc tatcgtcaac 2940
atggattacg tcgtgggcgc tcgcaccttt cgccgtgaaa agcgggccga acgcttgacc 3000
tcacgggtga aggccctctt ctccgtgctg aactacgaga gagcaagacg gcctggcctg 3060
ctgggagctt cggtgctggg actggacgat atccaccggg cttggcggac ctttgttctc 3120
cgggtgagag cccaagaccc tccgccggaa ctgtacttcg tgaaggtggc gatcaccgga 3180
gcctatgata ctattccgca agatcgactc accgaagtca tcgcctcgat catcaaaccg 3240
cagaacactt actgcgtcag gcggtacgcc gtggtccaga aggccgcgca tggccacgtg 3300
agaaaggcgt tcaagtcgca cgtgtccact ctcaccgacc tccagcctta catgaggcaa 3360
ttcgttgcgc atttgcaaga gacttcgccc ctgagagatg cggtggtcat cgagcagagc 3420
tccagcctga acgaagcgag cagcggtctg tttgacgtgt tcctccgctt catgtgtcat 3480
cacgcggtgc gaatcagggg aaaatcatac gtgcagtgcc agggaatccc acaaggcagc 3540
attctgtcga ctctcttgtg ttccctttgc tacggcgata tggaaaacaa gctgttcgct 3600
gggatcagac gggacgggtt gctgctcaga ctggtggacg acttcctgct ggtgactccg 3660
cacctcactc acgccaaaac ctttctccgc actctggtga ggggagtgcc agaatacggc 3720
tgtgtggtca atctccggaa aactgtggtg aatttccctg tcgaggatga ggcactcgga 3780
ggaaccgcat ttgtccaaat gccagcacat ggcctgttcc catggtgcgg tctgctgctg 3840
gacacccgaa ctcttgaagt gcagtccgac tactccagct atgcccggac gagcatccgc 3900
gccagcctca ctttcaatcg cggctttaag gccggacgaa acatgcgcag aaagcttttc 3960
ggagtcctcc ggcttaaatg ccattcgctc tttctcgatc tccaagtcaa ttcgctgcag 4020
accgtgtgca cgaacatcta caagatcctg ctgctccaag cctaccggtt ccacgcttgc 4080
gtgcttcagc tgccgtttca ccaacaggtg tggaagaacc cgaccttctt tctgcgggtc 4140
attagcgata ctgcctccct gtgttactca atcctcaagg caaagaacgc cggaatgtcg 4200
ctgggtgcga aaggagccgc gggacctctt cctagcgaag cggtgcagtg gctctgccac 4260
caggctttcc tcctgaagct gaccaggcac agagtgacct acgtcccgct gctgggctcg 4320
ctgcgcactg cacagaccca gctgtctaga aaactccccg gcaccaccct gaccgctctg 4380
gaagccgccg ccaacccagc attgccgtca gatttcaaga ccatcttgga cggatccggc 4440
acaatcctgt ctgagggcgc caccaacttc agcctgctga aactggccgg cgacgtggaa 4500
ctgaaccctg gccctacccc tggaacccag agccccttct tccttctgct gctgctgacc 4560
gtgctgactg tcgtgacagg ctctggccac gccagctcta cacctggcgg cgagaaagag 4620
acaagcgcca cccagagaag cagcgtgcca agcagcaccg agaagaacgc cgtgtccatg 4680
accagctccg tgctgagcag ccactctcct ggcagcggca gcagcacaac acagggccag 4740
gatgtgacac tggcccctgc cacagaacct gcctctggat ctgccgccac ctggggacag 4800
gacgtgacaa gcgtgccagt gaccagacct gccctgggct ctacaacacc ccctgcccac 4860
gatgtgacca gcgcccctga taacaagcct gcccctggaa gcacagcccc tccagctcat 4920
ggcgtgacct ctgccccaga taccagacca gccccaggat ctacagcccc acccgcacac 4980
ggcgtgacaa gtgcccctga cacaagaccc gctccaggct ctactgctcc tcctgcccat 5040
ggcgtgacaa gcgctcccga tacaaggcca gctcctggct ccacagcacc accagcacat 5100
ggcgtgacat cagctcccga cactagacct gctcccggat caaccgctcc accagctcac 5160
ggcgtgacca gcgcacctga taccagacct gctctgggaa gcaccgcccc tcccgtgcac 5220
aatgtgacat ctgcttccgg cagcgccagc ggctctgcct ctacactggt gcacaacggc 5280
accagcgcca gagccacaac aaccccagcc agcaagagca cccccttcag catccctagc 5340
caccacagcg acacccctac cacactggcc agccactcca ccaagaccga tgcctctagc 5400
acccaccact ccagcgtgcc ccctctgacc agcagcaacc acagcacaag cccccagctg 5460
tctaccggcg tctcattctt ctttctgtcc ttccacatca gcaacctgca gttcaacagc 5520
agcctggaag atcccagcac cgactactac caggaactgc agcgggatat cagcgagatg 5580
ttcctgcaaa tctacaagca gggcggcttc ctgggcctga gcaacatcaa gttcagaccc 5640
ggcagcgtgg tggtgcagct gaccctggct ttccgggaag gcaccatcaa cgtgcacgac 5700
gtggaaaccc agttcaacca gtacaagacc gaggccgcca gccggtacaa cctgaccatc 5760
tccgatgtgt ccgtgtccga cgtgcccttc ccattctctg cccagtctgg cgcaggcgtg 5820
ccaggatggg gaattgctct gctggtgctc gtgtgcgtgc tggtggccct ggccatcgtg 5880
tatctgattg ccctggccgt gtgccagtgc cggcggaaga attacggcca gctggacatc 5940
ttccccgcca gagacaccta ccaccccatg agcgagtacc ccacatacca cacccacggc 6000
agatacgtgc cacccagctc caccgacaga tccccctacg agaaagtgtc tgccggcaac 6060
ggcggcagct ccctgagcta cacaaatcct gccgtggccg ctgcctccgc caacctg 6117
<210> 50
<211> 2039
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 50
Met Ala Ser Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp
1 5 10 15
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
20 25 30
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
35 40 45
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
50 55 60
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
65 70 75 80
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
85 90 95
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
100 105 110
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
115 120 125
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
130 135 140
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
145 150 155 160
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
165 170 175
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
180 185 190
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
195 200 205
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
210 215 220
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
225 230 235 240
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
245 250 255
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
260 265 270
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
275 280 285
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
290 295 300
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
305 310 315 320
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
325 330 335
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
340 345 350
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
355 360 365
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
370 375 380
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
385 390 395 400
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
405 410 415
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
420 425 430
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
435 440 445
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
450 455 460
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
465 470 475 480
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
485 490 495
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
500 505 510
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
515 520 525
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
530 535 540
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
545 550 555 560
Gln Glu Ala Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
565 570 575
Gly Asp Val Glu Glu Asn Pro Gly Pro Gly Ala Ala Pro Glu Pro Glu
580 585 590
Arg Thr Pro Val Gly Gln Gly Ser Trp Ala His Pro Gly Arg Thr Arg
595 600 605
Gly Pro Ser Asp Arg Gly Phe Cys Val Val Ser Pro Ala Arg Pro Ala
610 615 620
Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu Ser Gly Thr Arg His Ser
625 630 635 640
His Pro Ser Val Gly Arg Gln His His Ala Gly Pro Pro Ser Thr Ser
645 650 655
Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu
660 665 670
Thr Lys His Phe Leu Tyr Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro
675 680 685
Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg
690 695 700
Leu Val Glu Thr Ile Phe Leu Gly Ser Arg Pro Trp Met Pro Gly Thr
705 710 715 720
Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro
725 730 735
Leu Phe Leu Glu Leu Leu Gly Asn His Ala Gln Cys Pro Tyr Gly Val
740 745 750
Leu Leu Lys Thr His Cys Pro Leu Arg Ala Ala Val Thr Pro Ala Ala
755 760 765
Gly Val Cys Ala Arg Glu Lys Pro Gln Gly Ser Val Ala Ala Pro Glu
770 775 780
Glu Glu Asp Thr Asp Pro Arg Arg Leu Val Gln Leu Leu Arg Gln His
785 790 795 800
Ser Ser Pro Trp Gln Val Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg
805 810 815
Leu Val Pro Pro Gly Leu Trp Gly Ser Arg His Asn Glu Arg Arg Phe
820 825 830
Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu Gly Lys His Ala Lys Leu
835 840 845
Ser Leu Gln Glu Leu Thr Trp Lys Met Ser Val Arg Asp Cys Ala Trp
850 855 860
Leu Arg Arg Ser Pro Gly Val Gly Cys Val Pro Ala Ala Glu His Arg
865 870 875 880
Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu His Trp Leu Met Ser Val
885 890 895
Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr
900 905 910
Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys
915 920 925
Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg
930 935 940
Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala
945 950 955 960
Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg
965 970 975
Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg
980 985 990
Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser
995 1000 1005
Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala
1010 1015 1020
Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe
1025 1030 1035
Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe
1040 1045 1050
Val Lys Val Ala Ile Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp
1055 1060 1065
Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr
1070 1075 1080
Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly
1085 1090 1095
His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp
1100 1105 1110
Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr
1115 1120 1125
Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu
1130 1135 1140
Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met
1145 1150 1155
Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys
1160 1165 1170
Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser
1175 1180 1185
Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg
1190 1195 1200
Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val
1205 1210 1215
Thr Pro His Leu Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val
1220 1225 1230
Arg Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg Lys Thr
1235 1240 1245
Val Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr Ala
1250 1255 1260
Phe Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys Gly Leu
1265 1270 1275
Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser
1280 1285 1290
Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly
1295 1300 1305
Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val Leu
1310 1315 1320
Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser
1325 1330 1335
Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln
1340 1345 1350
Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln
1355 1360 1365
Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp
1370 1375 1380
Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly
1385 1390 1395
Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu
1400 1405 1410
Ala Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr
1415 1420 1425
Arg His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr
1430 1435 1440
Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr
1445 1450 1455
Ala Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys
1460 1465 1470
Thr Ile Leu Asp Gly Ser Gly Thr Ile Leu Ser Glu Gly Ala Thr
1475 1480 1485
Asn Phe Ser Leu Leu Lys Leu Ala Gly Asp Val Glu Leu Asn Pro
1490 1495 1500
Gly Pro Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu
1505 1510 1515
Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser
1520 1525 1530
Thr Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser
1535 1540 1545
Val Pro Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser
1550 1555 1560
Val Leu Ser Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln
1565 1570 1575
Gly Gln Asp Val Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly
1580 1585 1590
Ser Ala Ala Thr Trp Gly Gln Asp Val Thr Ser Val Pro Val Thr
1595 1600 1605
Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala His Asp Val Thr
1610 1615 1620
Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr Ala Pro Pro
1625 1630 1635
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly
1640 1645 1650
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
1655 1660 1665
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr
1670 1675 1680
Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
1685 1690 1695
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly
1700 1705 1710
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
1715 1720 1725
Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr
1730 1735 1740
Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His
1745 1750 1755
Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser
1760 1765 1770
Thr Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr
1775 1780 1785
Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His
1790 1795 1800
Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro
1805 1810 1815
Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile
1820 1825 1830
Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp
1835 1840 1845
Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln
1850 1855 1860
Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe
1865 1870 1875
Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu
1880 1885 1890
Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr
1895 1900 1905
Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val
1910 1915 1920
Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala
1925 1930 1935
Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val
1940 1945 1950
Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys
1955 1960 1965
Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala
1970 1975 1980
Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr
1985 1990 1995
His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr
2000 2005 2010
Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr
2015 2020 2025
Asn Pro Ala Val Ala Ala Ala Ser Ala Asn Leu
2030 2035
<210> 51
<211> 6117
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 51
atggctagcg gagctgcccc ggagccggag aggacccccg ttggccaggg atcgtgggcc 60
catccgggac gcaccagggg accatccgac aggggattct gtgtggtgtc accggccagg 120
ccagcagaag aggcaaccag cctcgaggga gcgttgtctg gaaccagaca ttcccacccg 180
tcggtgggcc ggcagcacca cgcgggacca ccgtccactt ccagaccgcc acggccatgg 240
gacacccctt gcccgcctgt gtatgccgag actaaacact tcctgtactc atccggagac 300
aaggaacagc ttcggccgtc cttcctcctg tcgtcgctca gaccgagcct gaccggagca 360
cgcagattgg tggaaactat cttccttggg tcacgtccgt ggatgccagg taccccacgg 420
cgcctcccgc gcctcccaca gagatactgg cagatgcggc ctctgttcct ggaattgctg 480
ggaaaccacg ctcagtgccc gtacggagtc ctgctcaaga ctcactgccc tctgagggcg 540
gcggtcactc cggcggccgg agtgtgcgca cgggagaagc cccagggaag cgtggcagct 600
ccggaagagg aggacaccga tccgcgccgc ctcgtgcaac ttctgcgcca gcactcctcg 660
ccctggcaag tctacgggtt cgtccgcgcc tgcctgcgcc gcctggtgcc gcctgggctc 720
tggggttccc ggcataacga gcgccgcttc ctgagaaata ctaagaagtt tatctcactt 780
ggaaaacatg ccaagttgtc gctgcaagaa ctcacgtgga agatgtcagt ccgcgattgc 840
gcctggctgc gccgctcgcc gggcgtcggg tgtgttccag ctgcagaaca ccgcctgaga 900
gaagaaattc tggccaaatt tctgcattgg ctgatgtcag tgtacgtggt cgagctgctg 960
cgctcctttt tctacgtcac tgagactacc tttcaaaaga accgcctgtt cttctaccgc 1020
aaatctgtgt ggagcaagct gcagtcaatc ggcattcgcc agcatctgaa gagggtgcag 1080
ctgcgggaac tttccgaggc agaagtccgc cagcaccggg aggcccggcc ggcgcttctc 1140
acgtcgcgtc tgagattcat cccaaagccc gacgggctga ggcctatcgt caacatggat 1200
tacgtcgtgg gcgctcgcac ctttcgccgt gaaaagcggg ccgaacgctt gacctcacgg 1260
gtgaaggccc tcttctccgt gctgaactac gagagagcaa gacggcctgg cctgctggga 1320
gcttcggtgc tgggactgga cgatatccac cgggcttggc ggacctttgt tctccgggtg 1380
agagcccaag accctccgcc ggaactgtac ttcgtgaagg tggcgatcac cggagcctat 1440
gatactattc cgcaagatcg actcaccgaa gtcatcgcct cgatcatcaa accgcagaac 1500
acttactgcg tcaggcggta cgccgtggtc cagaaggccg cgcatggcca cgtgagaaag 1560
gcgttcaagt cgcacgtgtc cactctcacc gacctccagc cttacatgag gcaattcgtt 1620
gcgcatttgc aagagacttc gcccctgaga gatgcggtgg tcatcgagca gagctccagc 1680
ctgaacgaag cgagcagcgg tctgtttgac gtgttcctcc gcttcatgtg tcatcacgcg 1740
gtgcgaatca ggggaaaatc atacgtgcag tgccagggaa tcccacaagg cagcattctg 1800
tcgactctct tgtgttccct ttgctacggc gatatggaaa acaagctgtt cgctgggatc 1860
agacgggacg ggttgctgct cagactggtg gacgacttcc tgctggtgac tccgcacctc 1920
actcacgcca aaacctttct ccgcactctg gtgaggggag tgccagaata cggctgtgtg 1980
gtcaatctcc ggaaaactgt ggtgaatttc cctgtcgagg atgaggcact cggaggaacc 2040
gcatttgtcc aaatgccagc acatggcctg ttcccatggt gcggtctgct gctggacacc 2100
cgaactcttg aagtgcagtc cgactactcc agctatgccc ggacgagcat ccgcgccagc 2160
ctcactttca atcgcggctt taaggccgga cgaaacatgc gcagaaagct tttcggagtc 2220
ctccggctta aatgccattc gctctttctc gatctccaag tcaattcgct gcagaccgtg 2280
tgcacgaaca tctacaagat cctgctgctc caagcctacc ggttccacgc ttgcgtgctt 2340
cagctgccgt ttcaccaaca ggtgtggaag aacccgacct tctttctgcg ggtcattagc 2400
gatactgcct ccctgtgtta ctcaatcctc aaggcaaaga acgccggaat gtcgctgggt 2460
gcgaaaggag ccgcgggacc tcttcctagc gaagcggtgc agtggctctg ccaccaggct 2520
ttcctcctga agctgaccag gcacagagtg acctacgtcc cgctgctggg ctcgctgcgc 2580
actgcacaga cccagctgtc tagaaaactc cccggcacca ccctgaccgc tctggaagcc 2640
gccgccaacc cagcattgcc gtcagatttc aagaccatct tggacggatc cggcgagggc 2700
agaggcagcc tgctgacatg tggcgacgtg gaagagaacc ctggccccct ggctggcgag 2760
acaggacagg aagccgctcc tctggacggc gtgctggcca accctcccaa tatcagcagc 2820
ctgagcccca gacagctgct gggattccct tgtgccgagg tgtccggcct gagcacagag 2880
agagtgcggg aactggctgt ggccctggcc cagaaaaacg tgaagctgag caccgagcag 2940
ctgcggtgcc tggcccacag actgtctgag cctcccgagg atctggacgc cctgcctctg 3000
gatctgctgc tgttcctgaa ccccgacgcc ttcagcggac ctcaggcctg cacccggttc 3060
ttcagcagaa tcaccaaggc caacgtggac ctgctgccca gaggcgcccc tgagagacag 3120
agactgctgc ctgctgctct ggcctgttgg ggagtgcggg gctctctgct gtctgaagct 3180
gatgtgcggg ccctgggagg cctggcttgt gatctgcctg gaagattcgt ggccgagagc 3240
gccgaagtgc tgctgcctag actggtgtcc tgtcccggcc ctctggacca ggatcagcag 3300
gaagctgcca gagctgctct gcagggcgga ggccctcctt atggacctcc tagcacttgg 3360
agcgtgtcca ccatggatgc cctgaggggc ctgctgccag tgctgggcca gcctatcatc 3420
agatccatcc cacagggcat cgtggccgcc tggcggcaga gaagctctag agatccctct 3480
tggcggcagc ccgagcggac aatcctgcgg cccaggtttc ggagagaggt ggaaaagacc 3540
gcctgcccct ctggcaagaa ggccagagag atcgacgaga gcctgatctt ctacaagaag 3600
tgggagctgg aagcctgcgt ggacgccgct ctgctggcca cccagatgga cagagtgaac 3660
gccatcccct tcacctatga gcagctggac gtgctgaagc acaagctgga tgagctgtac 3720
ccccagggct accccgagag cgtgatccag cacctgggct acctgtttct gaagatgagc 3780
cccgaggaca tccggaagtg gaacgtgacc agcctggaaa ccctgaaggc cctgctggaa 3840
gtgaacaagg gccacgagat gtccccccag gtggccacac tgatcgacag attcgtgaag 3900
ggcagaggcc agctggacaa ggacaccctg gatacactga ccgccttcta ccccggctat 3960
ctgtgcagcc tgtcccccga ggaactgagc agcgtgccac ctagctctat ctgggctgtg 4020
cggccccagg acctggatac ctgcgatcct agacagctgg atgtgctgta tcccaaggcc 4080
cggctggcct tccagaacat gaacggcagc gagtacttcg tgaagatcca gtccttcctg 4140
ggcggagccc ctaccgagga cctgaaagct ctgagccagc agaacgtgtc catggatctg 4200
gccaccttta tgaagctgcg gaccgacgcc gtgctgcctc tgacagtggc tgaggtgcag 4260
aaactgctgg gcccccatgt ggaagggctg aaggccgaag aacggcacag acccgtgcgc 4320
gactggatcc tgaggcagag acaggatgac ctggacacac tgggcctggg actgcagggg 4380
ggcatcccta atggctacct ggtgctggac ctgagcatgc aggaagccct gggatccggc 4440
agaatcttca acgcccacta cgccggctac ttcgccgacc tgctgatcca cgacatcgag 4500
acaaaccctg gccccacccc tggaacccag agccccttct tccttctgct gctgctgacc 4560
gtgctgactg tcgtgacagg ctctggccac gccagctcta cacctggcgg cgagaaagag 4620
acaagcgcca cccagagaag cagcgtgcca agcagcaccg agaagaacgc cgtgtccatg 4680
accagctccg tgctgagcag ccactctcct ggcagcggca gcagcacaac acagggccag 4740
gatgtgacac tggcccctgc cacagaacct gcctctggat ctgccgccac ctggggacag 4800
gacgtgacaa gcgtgccagt gaccagacct gccctgggct ctacaacacc ccctgcccac 4860
gatgtgacca gcgcccctga taacaagcct gcccctggaa gcacagcccc tccagctcat 4920
ggcgtgacct ctgccccaga taccagacca gccccaggat ctacagcccc acccgcacac 4980
ggcgtgacaa gtgcccctga cacaagaccc gctccaggct ctactgctcc tcctgcccat 5040
ggcgtgacaa gcgctcccga tacaaggcca gctcctggct ccacagcacc accagcacat 5100
ggcgtgacat cagctcccga cactagacct gctcccggat caaccgctcc accagctcac 5160
ggcgtgacca gcgcacctga taccagacct gctctgggaa gcaccgcccc tcccgtgcac 5220
aatgtgacat ctgcttccgg cagcgccagc ggctctgcct ctacactggt gcacaacggc 5280
accagcgcca gagccacaac aaccccagcc agcaagagca cccccttcag catccctagc 5340
caccacagcg acacccctac cacactggcc agccactcca ccaagaccga tgcctctagc 5400
acccaccact ccagcgtgcc ccctctgacc agcagcaacc acagcacaag cccccagctg 5460
tctaccggcg tctcattctt ctttctgtcc ttccacatca gcaacctgca gttcaacagc 5520
agcctggaag atcccagcac cgactactac caggaactgc agcgggatat cagcgagatg 5580
ttcctgcaaa tctacaagca gggcggcttc ctgggcctga gcaacatcaa gttcagaccc 5640
ggcagcgtgg tggtgcagct gaccctggct ttccgggaag gcaccatcaa cgtgcacgac 5700
gtggaaaccc agttcaacca gtacaagacc gaggccgcca gccggtacaa cctgaccatc 5760
tccgatgtgt ccgtgtccga cgtgcccttc ccattctctg cccagtctgg cgcaggcgtg 5820
ccaggatggg gaattgctct gctggtgctc gtgtgcgtgc tggtggccct ggccatcgtg 5880
tatctgattg ccctggccgt gtgccagtgc cggcggaaga attacggcca gctggacatc 5940
ttccccgcca gagacaccta ccaccccatg agcgagtacc ccacatacca cacccacggc 6000
agatacgtgc cacccagctc caccgacaga tccccctacg agaaagtgtc tgccggcaac 6060
ggcggcagct ccctgagcta cacaaatcct gccgtggccg ctgcctccgc caacctg 6117
<210> 52
<211> 2039
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 52
Met Ala Ser Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln
1 5 10 15
Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly
20 25 30
Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu
35 40 45
Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg
50 55 60
Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp
65 70 75 80
Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr
85 90 95
Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser
100 105 110
Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe
115 120 125
Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg
130 135 140
Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu
145 150 155 160
Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys
165 170 175
Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu
180 185 190
Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro
195 200 205
Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val
210 215 220
Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu
225 230 235 240
Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys
245 250 255
Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr
260 265 270
Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly
275 280 285
Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu
290 295 300
Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
305 310 315 320
Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu
325 330 335
Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
340 345 350
Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu
355 360 365
Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu
370 375 380
Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp
385 390 395 400
Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg
405 410 415
Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg
420 425 430
Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp
435 440 445
Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp
450 455 460
Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr Gly Ala Tyr
465 470 475 480
Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile
485 490 495
Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys
500 505 510
Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr
515 520 525
Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln
530 535 540
Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser
545 550 555 560
Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met
565 570 575
Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln
580 585 590
Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys
595 600 605
Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly
610 615 620
Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu
625 630 635 640
Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu
645 650 655
Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val
660 665 670
Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His
675 680 685
Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu
690 695 700
Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser
705 710 715 720
Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys
725 730 735
Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu
740 745 750
Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu
755 760 765
Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe
770 775 780
His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser
785 790 795 800
Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly
805 810 815
Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala
820 825 830
Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His
835 840 845
Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr
850 855 860
Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala
865 870 875 880
Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp Gly
885 890 895
Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
900 905 910
Asn Pro Gly Pro Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu
915 920 925
Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg
930 935 940
Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu
945 950 955 960
Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu
965 970 975
Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro
980 985 990
Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro
995 1000 1005
Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg
1010 1015 1020
Ile Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu
1025 1030 1035
Arg Gln Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg
1040 1045 1050
Gly Ser Leu Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu
1055 1060 1065
Ala Cys Asp Leu Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val
1070 1075 1080
Leu Leu Pro Arg Leu Val Ser Cys Pro Gly Pro Leu Asp Gln Asp
1085 1090 1095
Gln Gln Glu Ala Ala Arg Ala Ala Leu Gln Gly Gly Gly Pro Pro
1100 1105 1110
Tyr Gly Pro Pro Ser Thr Trp Ser Val Ser Thr Met Asp Ala Leu
1115 1120 1125
Arg Gly Leu Leu Pro Val Leu Gly Gln Pro Ile Ile Arg Ser Ile
1130 1135 1140
Pro Gln Gly Ile Val Ala Ala Trp Arg Gln Arg Ser Ser Arg Asp
1145 1150 1155
Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu Arg Pro Arg Phe
1160 1165 1170
Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly Lys Lys Ala
1175 1180 1185
Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp Glu Leu
1190 1195 1200
Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp Arg
1205 1210 1215
Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
1220 1225 1230
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val
1235 1240 1245
Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp
1250 1255 1260
Ile Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu
1265 1270 1275
Leu Glu Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr
1280 1285 1290
Leu Ile Asp Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp
1295 1300 1305
Thr Leu Asp Thr Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser
1310 1315 1320
Leu Ser Pro Glu Glu Leu Ser Ser Val Pro Pro Ser Ser Ile Trp
1325 1330 1335
Ala Val Arg Pro Gln Asp Leu Asp Thr Cys Asp Pro Arg Gln Leu
1340 1345 1350
Asp Val Leu Tyr Pro Lys Ala Arg Leu Ala Phe Gln Asn Met Asn
1355 1360 1365
Gly Ser Glu Tyr Phe Val Lys Ile Gln Ser Phe Leu Gly Gly Ala
1370 1375 1380
Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln Gln Asn Val Ser Met
1385 1390 1395
Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp Ala Val Leu Pro
1400 1405 1410
Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro His Val Glu
1415 1420 1425
Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp Trp Ile
1430 1435 1440
Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly Leu
1445 1450 1455
Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
1460 1465 1470
Gln Glu Ala Leu Gly Ser Gly Arg Ile Phe Asn Ala His Tyr Ala
1475 1480 1485
Gly Tyr Phe Ala Asp Leu Leu Ile His Asp Ile Glu Thr Asn Pro
1490 1495 1500
Gly Pro Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu
1505 1510 1515
Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser
1520 1525 1530
Thr Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser
1535 1540 1545
Val Pro Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser
1550 1555 1560
Val Leu Ser Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln
1565 1570 1575
Gly Gln Asp Val Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly
1580 1585 1590
Ser Ala Ala Thr Trp Gly Gln Asp Val Thr Ser Val Pro Val Thr
1595 1600 1605
Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala His Asp Val Thr
1610 1615 1620
Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr Ala Pro Pro
1625 1630 1635
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly
1640 1645 1650
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
1655 1660 1665
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr
1670 1675 1680
Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
1685 1690 1695
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly
1700 1705 1710
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
1715 1720 1725
Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr
1730 1735 1740
Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His
1745 1750 1755
Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser
1760 1765 1770
Thr Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr
1775 1780 1785
Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His
1790 1795 1800
Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro
1805 1810 1815
Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile
1820 1825 1830
Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp
1835 1840 1845
Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln
1850 1855 1860
Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe
1865 1870 1875
Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu
1880 1885 1890
Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr
1895 1900 1905
Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val
1910 1915 1920
Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala
1925 1930 1935
Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val
1940 1945 1950
Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys
1955 1960 1965
Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala
1970 1975 1980
Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr
1985 1990 1995
His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr
2000 2005 2010
Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr
2015 2020 2025
Asn Pro Ala Val Ala Ala Ala Ser Ala Asn Leu
2030 2035
<210> 53
<211> 6138
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 53
atggctagcg gagctgcccc ggagccggag aggacccccg ttggccaggg atcgtgggcc 60
catccgggac gcaccagggg accatccgac aggggattct gtgtggtgtc accggccagg 120
ccagcagaag aggcaaccag cctcgaggga gcgttgtctg gaaccagaca ttcccacccg 180
tcggtgggcc ggcagcacca cgcgggacca ccgtccactt ccagaccgcc acggccatgg 240
gacacccctt gcccgcctgt gtatgccgag actaaacact tcctgtactc atccggagac 300
aaggaacagc ttcggccgtc cttcctcctg tcgtcgctca gaccgagcct gaccggagca 360
cgcagattgg tggaaactat cttccttggg tcacgtccgt ggatgccagg taccccacgg 420
cgcctcccgc gcctcccaca gagatactgg cagatgcggc ctctgttcct ggaattgctg 480
ggaaaccacg ctcagtgccc gtacggagtc ctgctcaaga ctcactgccc tctgagggcg 540
gcggtcactc cggcggccgg agtgtgcgca cgggagaagc cccagggaag cgtggcagct 600
ccggaagagg aggacaccga tccgcgccgc ctcgtgcaac ttctgcgcca gcactcctcg 660
ccctggcaag tctacgggtt cgtccgcgcc tgcctgcgcc gcctggtgcc gcctgggctc 720
tggggttccc ggcataacga gcgccgcttc ctgagaaata ctaagaagtt tatctcactt 780
ggaaaacatg ccaagttgtc gctgcaagaa ctcacgtgga agatgtcagt ccgcgattgc 840
gcctggctgc gccgctcgcc gggcgtcggg tgtgttccag ctgcagaaca ccgcctgaga 900
gaagaaattc tggccaaatt tctgcattgg ctgatgtcag tgtacgtggt cgagctgctg 960
cgctcctttt tctacgtcac tgagactacc tttcaaaaga accgcctgtt cttctaccgc 1020
aaatctgtgt ggagcaagct gcagtcaatc ggcattcgcc agcatctgaa gagggtgcag 1080
ctgcgggaac tttccgaggc agaagtccgc cagcaccggg aggcccggcc ggcgcttctc 1140
acgtcgcgtc tgagattcat cccaaagccc gacgggctga ggcctatcgt caacatggat 1200
tacgtcgtgg gcgctcgcac ctttcgccgt gaaaagcggg ccgaacgctt gacctcacgg 1260
gtgaaggccc tcttctccgt gctgaactac gagagagcaa gacggcctgg cctgctggga 1320
gcttcggtgc tgggactgga cgatatccac cgggcttggc ggacctttgt tctccgggtg 1380
agagcccaag accctccgcc ggaactgtac ttcgtgaagg tggcgatcac cggagcctat 1440
gatactattc cgcaagatcg actcaccgaa gtcatcgcct cgatcatcaa accgcagaac 1500
acttactgcg tcaggcggta cgccgtggtc cagaaggccg cgcatggcca cgtgagaaag 1560
gcgttcaagt cgcacgtgtc cactctcacc gacctccagc cttacatgag gcaattcgtt 1620
gcgcatttgc aagagacttc gcccctgaga gatgcggtgg tcatcgagca gagctccagc 1680
ctgaacgaag cgagcagcgg tctgtttgac gtgttcctcc gcttcatgtg tcatcacgcg 1740
gtgcgaatca ggggaaaatc atacgtgcag tgccagggaa tcccacaagg cagcattctg 1800
tcgactctct tgtgttccct ttgctacggc gatatggaaa acaagctgtt cgctgggatc 1860
agacgggacg ggttgctgct cagactggtg gacgacttcc tgctggtgac tccgcacctc 1920
actcacgcca aaacctttct ccgcactctg gtgaggggag tgccagaata cggctgtgtg 1980
gtcaatctcc ggaaaactgt ggtgaatttc cctgtcgagg atgaggcact cggaggaacc 2040
gcatttgtcc aaatgccagc acatggcctg ttcccatggt gcggtctgct gctggacacc 2100
cgaactcttg aagtgcagtc cgactactcc agctatgccc ggacgagcat ccgcgccagc 2160
ctcactttca atcgcggctt taaggccgga cgaaacatgc gcagaaagct tttcggagtc 2220
ctccggctta aatgccattc gctctttctc gatctccaag tcaattcgct gcagaccgtg 2280
tgcacgaaca tctacaagat cctgctgctc caagcctacc ggttccacgc ttgcgtgctt 2340
cagctgccgt ttcaccaaca ggtgtggaag aacccgacct tctttctgcg ggtcattagc 2400
gatactgcct ccctgtgtta ctcaatcctc aaggcaaaga acgccggaat gtcgctgggt 2460
gcgaaaggag ccgcgggacc tcttcctagc gaagcggtgc agtggctctg ccaccaggct 2520
ttcctcctga agctgaccag gcacagagtg acctacgtcc cgctgctggg ctcgctgcgc 2580
actgcacaga cccagctgtc tagaaaactc cccggcacca ccctgaccgc tctggaagcc 2640
gccgccaacc cagcattgcc gtcagatttc aagaccatct tggacggatc cggcacaatc 2700
ctgtctgagg gcgccaccaa cttcagcctg ctgaaactgg ccggcgacgt ggaactgaac 2760
cctggcccta cccctggaac ccagagcccc ttcttccttc tgctgctgct gaccgtgctg 2820
actgtcgtga caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 2880
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 2940
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 3000
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 3060
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 3120
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 3180
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 3240
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 3300
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 3360
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 3420
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 3480
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 3540
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 3600
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 3660
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 3720
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 3780
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 3840
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 3900
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 3960
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 4020
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 4080
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 4140
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 4200
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 4260
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 4320
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct gggatccggc 4380
agaatcttca acgcccacta cgccggctac ttcgccgacc tgctgatcca cgacatcgag 4440
acaaaccctg gccccctggc tggcgagaca ggacaggaag ccgctcctct ggacggcgtg 4500
ctggccaacc ctcccaatat cagcagcctg agccccagac agctgctggg attcccttgt 4560
gccgaggtgt ccggcctgag cacagagaga gtgcgggaac tggctgtggc cctggcccag 4620
aaaaacgtga agctgagcac cgagcagctg cggtgcctgg cccacagact gtctgagcct 4680
cccgaggatc tggacgccct gcctctggat ctgctgctgt tcctgaaccc cgacgccttc 4740
agcggacctc aggcctgcac ccggttcttc agcagaatca ccaaggccaa cgtggacctg 4800
ctgcccagag gcgcccctga gagacagaga ctgctgcctg ctgctctggc ctgttgggga 4860
gtgcggggct ctctgctgtc tgaagctgat gtgcgggccc tgggaggcct ggcttgtgat 4920
ctgcctggaa gattcgtggc cgagagcgcc gaagtgctgc tgcctagact ggtgtcctgt 4980
cccggccctc tggaccagga tcagcaggaa gctgccagag ctgctctgca gggcggaggc 5040
cctccttatg gacctcctag cacttggagc gtgtccacca tggatgccct gaggggcctg 5100
ctgccagtgc tgggccagcc tatcatcaga tccatcccac agggcatcgt ggccgcctgg 5160
cggcagagaa gctctagaga tccctcttgg cggcagcccg agcggacaat cctgcggccc 5220
aggtttcgga gagaggtgga aaagaccgcc tgcccctctg gcaagaaggc cagagagatc 5280
gacgagagcc tgatcttcta caagaagtgg gagctggaag cctgcgtgga cgccgctctg 5340
ctggccaccc agatggacag agtgaacgcc atccccttca cctatgagca gctggacgtg 5400
ctgaagcaca agctggatga gctgtacccc cagggctacc ccgagagcgt gatccagcac 5460
ctgggctacc tgtttctgaa gatgagcccc gaggacatcc ggaagtggaa cgtgaccagc 5520
ctggaaaccc tgaaggccct gctggaagtg aacaagggcc acgagatgtc cccccaggtg 5580
gccacactga tcgacagatt cgtgaagggc agaggccagc tggacaagga caccctggat 5640
acactgaccg ccttctaccc cggctatctg tgcagcctgt cccccgagga actgagcagc 5700
gtgccaccta gctctatctg ggctgtgcgg ccccaggacc tggatacctg cgatcctaga 5760
cagctggatg tgctgtatcc caaggcccgg ctggccttcc agaacatgaa cggcagcgag 5820
tacttcgtga agatccagtc cttcctgggc ggagccccta ccgaggacct gaaagctctg 5880
agccagcaga acgtgtccat ggatctggcc acctttatga agctgcggac cgacgccgtg 5940
ctgcctctga cagtggctga ggtgcagaaa ctgctgggcc cccatgtgga agggctgaag 6000
gccgaagaac ggcacagacc cgtgcgcgac tggatcctga ggcagagaca ggatgacctg 6060
gacacactgg gcctgggact gcaggggggc atccctaatg gctacctggt gctggacctg 6120
agcatgcagg aagccctg 6138
<210> 54
<211> 2046
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 54
Met Ala Ser Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln
1 5 10 15
Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly
20 25 30
Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu
35 40 45
Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg
50 55 60
Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp
65 70 75 80
Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr
85 90 95
Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser
100 105 110
Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe
115 120 125
Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg
130 135 140
Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu
145 150 155 160
Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys
165 170 175
Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu
180 185 190
Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro
195 200 205
Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val
210 215 220
Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu
225 230 235 240
Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys
245 250 255
Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr
260 265 270
Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly
275 280 285
Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu
290 295 300
Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
305 310 315 320
Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu
325 330 335
Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
340 345 350
Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu
355 360 365
Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu
370 375 380
Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp
385 390 395 400
Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg
405 410 415
Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg
420 425 430
Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp
435 440 445
Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp
450 455 460
Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr Gly Ala Tyr
465 470 475 480
Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile
485 490 495
Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys
500 505 510
Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr
515 520 525
Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln
530 535 540
Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser
545 550 555 560
Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met
565 570 575
Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln
580 585 590
Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys
595 600 605
Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly
610 615 620
Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu
625 630 635 640
Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu
645 650 655
Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val
660 665 670
Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His
675 680 685
Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu
690 695 700
Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser
705 710 715 720
Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys
725 730 735
Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu
740 745 750
Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu
755 760 765
Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe
770 775 780
His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser
785 790 795 800
Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly
805 810 815
Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala
820 825 830
Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His
835 840 845
Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr
850 855 860
Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala
865 870 875 880
Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp Gly
885 890 895
Ser Gly Thr Ile Leu Ser Glu Gly Ala Thr Asn Phe Ser Leu Leu Lys
900 905 910
Leu Ala Gly Asp Val Glu Leu Asn Pro Gly Pro Thr Pro Gly Thr Gln
915 920 925
Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr Val Leu Thr Val Val Thr
930 935 940
Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly Glu Lys Glu Thr Ser
945 950 955 960
Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr Glu Lys Asn Ala Val
965 970 975
Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro Gly Ser Gly Ser
980 985 990
Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro Ala Thr Glu Pro
995 1000 1005
Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val Thr Ser Val
1010 1015 1020
Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala His
1025 1030 1035
Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr
1040 1045 1050
Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
1055 1060 1065
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala
1070 1075 1080
Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
1085 1090 1095
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr
1100 1105 1110
Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
1115 1120 1125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala
1130 1135 1140
Pro Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His
1145 1150 1155
Asn Val Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr
1160 1165 1170
Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala
1175 1180 1185
Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser Asp Thr
1190 1195 1200
Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser
1205 1210 1215
Thr His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser
1220 1225 1230
Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser
1235 1240 1245
Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro
1250 1255 1260
Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met
1265 1270 1275
Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn
1280 1285 1290
Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala
1295 1300 1305
Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe
1310 1315 1320
Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile
1325 1330 1335
Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln
1340 1345 1350
Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
1355 1360 1365
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu
1370 1375 1380
Ala Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile
1385 1390 1395
Phe Pro Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr
1400 1405 1410
Tyr His Thr His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg
1415 1420 1425
Ser Pro Tyr Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu
1430 1435 1440
Ser Tyr Thr Asn Pro Ala Val Ala Ala Ala Ser Ala Asn Leu Gly
1445 1450 1455
Ser Gly Arg Ile Phe Asn Ala His Tyr Ala Gly Tyr Phe Ala Asp
1460 1465 1470
Leu Leu Ile His Asp Ile Glu Thr Asn Pro Gly Pro Leu Ala Gly
1475 1480 1485
Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp Gly Val Leu Ala Asn
1490 1495 1500
Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln Leu Leu Gly Phe
1505 1510 1515
Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg Val Arg Glu
1520 1525 1530
Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser Thr Glu
1535 1540 1545
Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu Asp
1550 1555 1560
Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
1565 1570 1575
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile
1580 1585 1590
Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg
1595 1600 1605
Gln Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly
1610 1615 1620
Ser Leu Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala
1625 1630 1635
Cys Asp Leu Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu
1640 1645 1650
Leu Pro Arg Leu Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln
1655 1660 1665
Gln Glu Ala Ala Arg Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr
1670 1675 1680
Gly Pro Pro Ser Thr Trp Ser Val Ser Thr Met Asp Ala Leu Arg
1685 1690 1695
Gly Leu Leu Pro Val Leu Gly Gln Pro Ile Ile Arg Ser Ile Pro
1700 1705 1710
Gln Gly Ile Val Ala Ala Trp Arg Gln Arg Ser Ser Arg Asp Pro
1715 1720 1725
Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu Arg Pro Arg Phe Arg
1730 1735 1740
Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly Lys Lys Ala Arg
1745 1750 1755
Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp Glu Leu Glu
1760 1765 1770
Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp Arg Val
1775 1780 1785
Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys His
1790 1795 1800
Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
1805 1810 1815
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile
1820 1825 1830
Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu
1835 1840 1845
Glu Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu
1850 1855 1860
Ile Asp Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr
1865 1870 1875
Leu Asp Thr Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu
1880 1885 1890
Ser Pro Glu Glu Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala
1895 1900 1905
Val Arg Pro Gln Asp Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp
1910 1915 1920
Val Leu Tyr Pro Lys Ala Arg Leu Ala Phe Gln Asn Met Asn Gly
1925 1930 1935
Ser Glu Tyr Phe Val Lys Ile Gln Ser Phe Leu Gly Gly Ala Pro
1940 1945 1950
Thr Glu Asp Leu Lys Ala Leu Ser Gln Gln Asn Val Ser Met Asp
1955 1960 1965
Leu Ala Thr Phe Met Lys Leu Arg Thr Asp Ala Val Leu Pro Leu
1970 1975 1980
Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro His Val Glu Gly
1985 1990 1995
Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp Trp Ile Leu
2000 2005 2010
Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly Leu Gln
2015 2020 2025
Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met Gln
2030 2035 2040
Glu Ala Leu
2045
<210> 55
<211> 5214
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 55
atggctagca cccctggaac ccagagcccc ttcttccttc tgctgctgct gaccgtgctg 60
actgtcgtga caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 120
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 180
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 240
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 300
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 360
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 420
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 480
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 540
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 600
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 660
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 720
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 780
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 840
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 900
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 960
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 1020
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 1080
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 1140
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 1200
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 1260
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 1320
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 1380
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 1440
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 1500
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 1560
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct gggatccggc 1620
agaatcttca acgcccacta cgccggctac ttcgccgacc tgctgatcca cgacatcgag 1680
acaaaccctg gccccctggc tggcgagaca ggacaggaag ccgctcctct ggacggcgtg 1740
ctggccaacc ctcccaatat cagcagcctg agccccagac agctgctggg attcccttgt 1800
gccgaggtgt ccggcctgag cacagagaga gtgcgggaac tggctgtggc cctggcccag 1860
aaaaacgtga agctgagcac cgagcagctg cggtgcctgg cccacagact gtctgagcct 1920
cccgaggatc tggacgccct gcctctggat ctgctgctgt tcctgaaccc cgacgccttc 1980
agcggacctc aggcctgcac ccggttcttc agcagaatca ccaaggccaa cgtggacctg 2040
ctgcccagag gcgcccctga gagacagaga ctgctgcctg ctgctctggc ctgttgggga 2100
gtgcggggct ctctgctgtc tgaagctgat gtgcgggccc tgggaggcct ggcttgtgat 2160
ctgcctggaa gattcgtggc cgagagcgcc gaagtgctgc tgcctagact ggtgtcctgt 2220
cccggccctc tggaccagga tcagcaggaa gctgccagag ctgctctgca gggcggaggc 2280
cctccttatg gacctcctag cacttggagc gtgtccacca tggatgccct gaggggcctg 2340
ctgccagtgc tgggccagcc tatcatcaga tccatcccac agggcatcgt ggccgcctgg 2400
cggcagagaa gctctagaga tccctcttgg cggcagcccg agcggacaat cctgcggccc 2460
aggtttcgga gagaggtgga aaagaccgcc tgcccctctg gcaagaaggc cagagagatc 2520
gacgagagcc tgatcttcta caagaagtgg gagctggaag cctgcgtgga cgccgctctg 2580
ctggccaccc agatggacag agtgaacgcc atccccttca cctatgagca gctggacgtg 2640
ctgaagcaca agctggatga gctgtacccc cagggctacc ccgagagcgt gatccagcac 2700
ctgggctacc tgtttctgaa gatgagcccc gaggacatcc ggaagtggaa cgtgaccagc 2760
ctggaaaccc tgaaggccct gctggaagtg aacaagggcc acgagatgtc cccccaggtg 2820
gccacactga tcgacagatt cgtgaagggc agaggccagc tggacaagga caccctggat 2880
acactgaccg ccttctaccc cggctatctg tgcagcctgt cccccgagga actgagcagc 2940
gtgccaccta gctctatctg ggctgtgcgg ccccaggacc tggatacctg cgatcctaga 3000
cagctggatg tgctgtatcc caaggcccgg ctggccttcc agaacatgaa cggcagcgag 3060
tacttcgtga agatccagtc cttcctgggc ggagccccta ccgaggacct gaaagctctg 3120
agccagcaga acgtgtccat ggatctggcc acctttatga agctgcggac cgacgccgtg 3180
ctgcctctga cagtggctga ggtgcagaaa ctgctgggcc cccatgtgga agggctgaag 3240
gccgaagaac ggcacagacc cgtgcgcgac tggatcctga ggcagagaca ggatgacctg 3300
gacacactgg gcctgggact gcaggggggc atccctaatg gctacctggt gctggacctg 3360
agcatgcagg aagccctggg atccggcgag ggcagaggca gcctgctgac atgtggcgac 3420
gtggaagaga accctggccc cgccaaattt ctgcattggc tgatgtcagt gtacgtggtc 3480
gagctgctgc gctccttttt ctacgtcact gagactacct ttcaaaagaa ccgcctgttc 3540
ttctaccgca aatctgtgtg gagcaagctg cagtcaatcg gcattcgcca gcatctgaag 3600
agggtgcagc tgcgggaact ttccgaggca gaagtccgcc agcaccggga ggcccggccg 3660
gcgcttctca cgtcgcgtct gagattcatc ccaaagcccg acgggctgag gcctatcgtc 3720
aacatggatt acgtcgtggg cgctcgcacc tttcgccgtg aaaagcgggc cgaacgcttg 3780
acctcacggg tgaaggccct cttctccgtg ctgaactacg agagagcaag acggcctggc 3840
ctgctgggag cttcggtgct gggactggac gatatccacc gggcttggcg gacctttgtt 3900
ctccgggtga gagcccaaga ccctccgccg gaactgtact tcgtgaaggt ggcgatcacc 3960
ggagcctatg atactattcc gcaagatcga ctcaccgaag tcatcgcctc gatcatcaaa 4020
ccgcagaaca cttactgcgt caggcggtac gccgtggtcc agaaggccgc gcatggccac 4080
gtgagaaagg cgttcaagtc gcacgtgtcc actctcaccg acctccagcc ttacatgagg 4140
caattcgttg cgcatttgca agagacttcg cccctgagag atgcggtggt catcgagcag 4200
agctccagcc tgaacgaagc gagcagcggt ctgtttgacg tgttcctccg cttcatgtgt 4260
catcacgcgg tgcgaatcag gggaaaatca tacgtgcagt gccagggaat cccacaaggc 4320
agcattctgt cgactctctt gtgttccctt tgctacggcg atatggaaaa caagctgttc 4380
gctgggatca gacgggacgg gttgctgctc agactggtgg acgacttcct gctggtgact 4440
ccgcacctca ctcacgccaa aacctttctc cgcactctgg tgaggggagt gccagaatac 4500
ggctgtgtgg tcaatctccg gaaaactgtg gtgaatttcc ctgtcgagga tgaggcactc 4560
ggaggaaccg catttgtcca aatgccagca catggcctgt tcccatggtg cggtctgctg 4620
ctggacaccc gaactcttga agtgcagtcc gactactcca gctatgcccg gacgagcatc 4680
cgcgccagcc tcactttcaa tcgcggcttt aaggccggac gaaacatgcg cagaaagctt 4740
ttcggagtcc tccggcttaa atgccattcg ctctttctcg atctccaagt caattcgctg 4800
cagaccgtgt gcacgaacat ctacaagatc ctgctgctcc aagcctaccg gttccacgct 4860
tgcgtgcttc agctgccgtt tcaccaacag gtgtggaaga acccgacctt ctttctgcgg 4920
gtcattagcg atactgcctc cctgtgttac tcaatcctca aggcaaagaa cgccggaatg 4980
tcgctgggtg cgaaaggagc cgcgggacct cttcctagcg aagcggtgca gtggctctgc 5040
caccaggctt tcctcctgaa gctgaccagg cacagagtga cctacgtccc gctgctgggc 5100
tcgctgcgca ctgcacagac ccagctgtct agaaaactcc ccggcaccac cctgaccgct 5160
ctggaagccg ccgccaaccc agcattgccg tcagatttca agaccatctt ggac 5214
<210> 56
<211> 1738
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 56
Met Ala Ser Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu
1 5 10 15
Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr
20 25 30
Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro
35 40 45
Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser
50 55 60
Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val
65 70 75 80
Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp
85 90 95
Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser
100 105 110
Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro
115 120 125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
130 135 140
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
145 150 155 160
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
165 170 175
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
180 185 190
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
195 200 205
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
210 215 220
Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val
225 230 235 240
Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His
245 250 255
Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr
260 265 270
Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala
275 280 285
Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val
290 295 300
Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr
305 310 315 320
Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe
325 330 335
Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln
340 345 350
Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe
355 360 365
Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln
370 375 380
Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu
385 390 395 400
Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu
405 410 415
Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala
420 425 430
Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
435 440 445
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
450 455 460
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro
465 470 475 480
Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr
485 490 495
His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu
500 505 510
Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro
515 520 525
Ala Val Ala Ala Ala Ser Ala Asn Leu Gly Ser Gly Arg Ile Phe Asn
530 535 540
Ala His Tyr Ala Gly Tyr Phe Ala Asp Leu Leu Ile His Asp Ile Glu
545 550 555 560
Thr Asn Pro Gly Pro Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro
565 570 575
Leu Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro
580 585 590
Arg Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr
595 600 605
Glu Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys
610 615 620
Leu Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro
625 630 635 640
Pro Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn
645 650 655
Pro Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg
660 665 670
Ile Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg
675 680 685
Gln Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser
690 695 700
Leu Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp
705 710 715 720
Leu Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg
725 730 735
Leu Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala
740 745 750
Arg Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr
755 760 765
Trp Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu
770 775 780
Gly Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp
785 790 795 800
Arg Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr
805 810 815
Ile Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro
820 825 830
Ser Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys
835 840 845
Lys Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln
850 855 860
Met Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val
865 870 875 880
Leu Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser
885 890 895
Val Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp
900 905 910
Ile Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu
915 920 925
Glu Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile
930 935 940
Asp Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp
945 950 955 960
Thr Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu
965 970 975
Glu Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln
980 985 990
Asp Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys
995 1000 1005
Ala Arg Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val
1010 1015 1020
Lys Ile Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys
1025 1030 1035
Ala Leu Ser Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met
1040 1045 1050
Lys Leu Arg Thr Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val
1055 1060 1065
Gln Lys Leu Leu Gly Pro His Val Glu Gly Leu Lys Ala Glu Glu
1070 1075 1080
Arg His Arg Pro Val Arg Asp Trp Ile Leu Arg Gln Arg Gln Asp
1085 1090 1095
Asp Leu Asp Thr Leu Gly Leu Gly Leu Gln Gly Gly Ile Pro Asn
1100 1105 1110
Gly Tyr Leu Val Leu Asp Leu Ser Met Gln Glu Ala Leu Gly Ser
1115 1120 1125
Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
1130 1135 1140
Asn Pro Gly Pro Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr
1145 1150 1155
Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr
1160 1165 1170
Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser
1175 1180 1185
Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val Gln
1190 1195 1200
Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala
1205 1210 1215
Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro
1220 1225 1230
Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala
1235 1240 1245
Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg
1250 1255 1260
Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg
1265 1270 1275
Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His
1280 1285 1290
Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro
1295 1300 1305
Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr Gly Ala Tyr
1310 1315 1320
Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile
1325 1330 1335
Ile Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val
1340 1345 1350
Gln Lys Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser His
1355 1360 1365
Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val
1370 1375 1380
Ala His Leu Gln Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile
1385 1390 1395
Glu Gln Ser Ser Ser Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp
1400 1405 1410
Val Phe Leu Arg Phe Met Cys His His Ala Val Arg Ile Arg Gly
1415 1420 1425
Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu
1430 1435 1440
Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys
1445 1450 1455
Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg Leu Val
1460 1465 1470
Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala Lys Thr
1475 1480 1485
Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val
1490 1495 1500
Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu
1505 1510 1515
Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu
1520 1525 1530
Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val
1535 1540 1545
Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser
1550 1555 1560
Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg
1565 1570 1575
Lys Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu
1580 1585 1590
Asp Leu Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr
1595 1600 1605
Lys Ile Leu Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu
1610 1615 1620
Gln Leu Pro Phe His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe
1625 1630 1635
Leu Arg Val Ile Ser Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu
1640 1645 1650
Lys Ala Lys Asn Ala Gly Met Ser Leu Gly Ala Lys Gly Ala Ala
1655 1660 1665
Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu Cys His Gln Ala
1670 1675 1680
Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr Tyr Val Pro Leu
1685 1690 1695
Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg Lys Leu
1700 1705 1710
Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro Ala
1715 1720 1725
Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
1730 1735
<210> 57
<211> 5235
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 57
atggctagcc tggctggcga gacaggacag gaagccgctc ctctggacgg cgtgctggcc 60
aaccctccca atatcagcag cctgagcccc agacagctgc tgggattccc ttgtgccgag 120
gtgtccggcc tgagcacaga gagagtgcgg gaactggctg tggccctggc ccagaaaaac 180
gtgaagctga gcaccgagca gctgcggtgc ctggcccaca gactgtctga gcctcccgag 240
gatctggacg ccctgcctct ggatctgctg ctgttcctga accccgacgc cttcagcgga 300
cctcaggcct gcacccggtt cttcagcaga atcaccaagg ccaacgtgga cctgctgccc 360
agaggcgccc ctgagagaca gagactgctg cctgctgctc tggcctgttg gggagtgcgg 420
ggctctctgc tgtctgaagc tgatgtgcgg gccctgggag gcctggcttg tgatctgcct 480
ggaagattcg tggccgagag cgccgaagtg ctgctgccta gactggtgtc ctgtcccggc 540
cctctggacc aggatcagca ggaagctgcc agagctgctc tgcagggcgg aggccctcct 600
tatggacctc ctagcacttg gagcgtgtcc accatggatg ccctgagggg cctgctgcca 660
gtgctgggcc agcctatcat cagatccatc ccacagggca tcgtggccgc ctggcggcag 720
agaagctcta gagatccctc ttggcggcag cccgagcgga caatcctgcg gcccaggttt 780
cggagagagg tggaaaagac cgcctgcccc tctggcaaga aggccagaga gatcgacgag 840
agcctgatct tctacaagaa gtgggagctg gaagcctgcg tggacgccgc tctgctggcc 900
acccagatgg acagagtgaa cgccatcccc ttcacctatg agcagctgga cgtgctgaag 960
cacaagctgg atgagctgta cccccagggc taccccgaga gcgtgatcca gcacctgggc 1020
tacctgtttc tgaagatgag ccccgaggac atccggaagt ggaacgtgac cagcctggaa 1080
accctgaagg ccctgctgga agtgaacaag ggccacgaga tgtcccccca ggtggccaca 1140
ctgatcgaca gattcgtgaa gggcagaggc cagctggaca aggacaccct ggatacactg 1200
accgccttct accccggcta tctgtgcagc ctgtcccccg aggaactgag cagcgtgcca 1260
cctagctcta tctgggctgt gcggccccag gacctggata cctgcgatcc tagacagctg 1320
gatgtgctgt atcccaaggc ccggctggcc ttccagaaca tgaacggcag cgagtacttc 1380
gtgaagatcc agtccttcct gggcggagcc cctaccgagg acctgaaagc tctgagccag 1440
cagaacgtgt ccatggatct ggccaccttt atgaagctgc ggaccgacgc cgtgctgcct 1500
ctgacagtgg ctgaggtgca gaaactgctg ggcccccatg tggaagggct gaaggccgaa 1560
gaacggcaca gacccgtgcg cgactggatc ctgaggcaga gacaggatga cctggacaca 1620
ctgggcctgg gactgcaggg gggcatccct aatggctacc tggtgctgga cctgagcatg 1680
caggaagccc tgggatccgg cagaatcttc aacgcccact acgccggcta cttcgccgac 1740
ctgctgatcc acgacatcga gacaaaccct ggccccaccc ctggaaccca gagccccttc 1800
ttccttctgc tgctgctgac cgtgctgact gtcgtgacag gctctggcca cgccagctct 1860
acacctggcg gcgagaaaga gacaagcgcc acccagagaa gcagcgtgcc aagcagcacc 1920
gagaagaacg ccgtgtccat gaccagctcc gtgctgagca gccactctcc tggcagcggc 1980
agcagcacaa cacagggcca ggatgtgaca ctggcccctg ccacagaacc tgcctctgga 2040
tctgccgcca cctggggaca ggacgtgaca agcgtgccag tgaccagacc tgccctgggc 2100
tctacaacac cccctgccca cgatgtgacc agcgcccctg ataacaagcc tgcccctgga 2160
agcacagccc ctccagctca tggcgtgacc tctgccccag ataccagacc agccccagga 2220
tctacagccc cacccgcaca cggcgtgaca agtgcccctg acacaagacc cgctccaggc 2280
tctactgctc ctcctgccca tggcgtgaca agcgctcccg atacaaggcc agctcctggc 2340
tccacagcac caccagcaca tggcgtgaca tcagctcccg acactagacc tgctcccgga 2400
tcaaccgctc caccagctca cggcgtgacc agcgcacctg ataccagacc tgctctggga 2460
agcaccgccc ctcccgtgca caatgtgaca tctgcttccg gcagcgccag cggctctgcc 2520
tctacactgg tgcacaacgg caccagcgcc agagccacaa caaccccagc cagcaagagc 2580
acccccttca gcatccctag ccaccacagc gacaccccta ccacactggc cagccactcc 2640
accaagaccg atgcctctag cacccaccac tccagcgtgc cccctctgac cagcagcaac 2700
cacagcacaa gcccccagct gtctaccggc gtctcattct tctttctgtc cttccacatc 2760
agcaacctgc agttcaacag cagcctggaa gatcccagca ccgactacta ccaggaactg 2820
cagcgggata tcagcgagat gttcctgcaa atctacaagc agggcggctt cctgggcctg 2880
agcaacatca agttcagacc cggcagcgtg gtggtgcagc tgaccctggc tttccgggaa 2940
ggcaccatca acgtgcacga cgtggaaacc cagttcaacc agtacaagac cgaggccgcc 3000
agccggtaca acctgaccat ctccgatgtg tccgtgtccg acgtgccctt cccattctct 3060
gcccagtctg gcgcaggcgt gccaggatgg ggaattgctc tgctggtgct cgtgtgcgtg 3120
ctggtggccc tggccatcgt gtatctgatt gccctggccg tgtgccagtg ccggcggaag 3180
aattacggcc agctggacat cttccccgcc agagacacct accaccccat gagcgagtac 3240
cccacatacc acacccacgg cagatacgtg ccacccagct ccaccgacag atccccctac 3300
gagaaagtgt ctgccggcaa cggcggcagc tccctgagct acacaaatcc tgccgtggcc 3360
gctgcctccg ccaacctggg atccggcaca atcctgtctg agggcgccac caacttcagc 3420
ctgctgaaac tggccggcga cgtggaactg aaccctggcc ctgccaaatt tctgcattgg 3480
ctgatgtcag tgtacgtggt cgagctgctg cgctcctttt tctacgtcac tgagactacc 3540
tttcaaaaga accgcctgtt cttctaccgc aaatctgtgt ggagcaagct gcagtcaatc 3600
ggcattcgcc agcatctgaa gagggtgcag ctgcgggaac tttccgaggc agaagtccgc 3660
cagcaccggg aggcccggcc ggcgcttctc acgtcgcgtc tgagattcat cccaaagccc 3720
gacgggctga ggcctatcgt caacatggat tacgtcgtgg gcgctcgcac ctttcgccgt 3780
gaaaagcggg ccgaacgctt gacctcacgg gtgaaggccc tcttctccgt gctgaactac 3840
gagagagcaa gacggcctgg cctgctggga gcttcggtgc tgggactgga cgatatccac 3900
cgggcttggc ggacctttgt tctccgggtg agagcccaag accctccgcc ggaactgtac 3960
ttcgtgaagg tggcgatcac cggagcctat gatactattc cgcaagatcg actcaccgaa 4020
gtcatcgcct cgatcatcaa accgcagaac acttactgcg tcaggcggta cgccgtggtc 4080
cagaaggccg cgcatggcca cgtgagaaag gcgttcaagt cgcacgtgtc cactctcacc 4140
gacctccagc cttacatgag gcaattcgtt gcgcatttgc aagagacttc gcccctgaga 4200
gatgcggtgg tcatcgagca gagctccagc ctgaacgaag cgagcagcgg tctgtttgac 4260
gtgttcctcc gcttcatgtg tcatcacgcg gtgcgaatca ggggaaaatc atacgtgcag 4320
tgccagggaa tcccacaagg cagcattctg tcgactctct tgtgttccct ttgctacggc 4380
gatatggaaa acaagctgtt cgctgggatc agacgggacg ggttgctgct cagactggtg 4440
gacgacttcc tgctggtgac tccgcacctc actcacgcca aaacctttct ccgcactctg 4500
gtgaggggag tgccagaata cggctgtgtg gtcaatctcc ggaaaactgt ggtgaatttc 4560
cctgtcgagg atgaggcact cggaggaacc gcatttgtcc aaatgccagc acatggcctg 4620
ttcccatggt gcggtctgct gctggacacc cgaactcttg aagtgcagtc cgactactcc 4680
agctatgccc ggacgagcat ccgcgccagc ctcactttca atcgcggctt taaggccgga 4740
cgaaacatgc gcagaaagct tttcggagtc ctccggctta aatgccattc gctctttctc 4800
gatctccaag tcaattcgct gcagaccgtg tgcacgaaca tctacaagat cctgctgctc 4860
caagcctacc ggttccacgc ttgcgtgctt cagctgccgt ttcaccaaca ggtgtggaag 4920
aacccgacct tctttctgcg ggtcattagc gatactgcct ccctgtgtta ctcaatcctc 4980
aaggcaaaga acgccggaat gtcgctgggt gcgaaaggag ccgcgggacc tcttcctagc 5040
gaagcggtgc agtggctctg ccaccaggct ttcctcctga agctgaccag gcacagagtg 5100
acctacgtcc cgctgctggg ctcgctgcgc actgcacaga cccagctgtc tagaaaactc 5160
cccggcacca ccctgaccgc tctggaagcc gccgccaacc cagcattgcc gtcagatttc 5220
aagaccatct tggac 5235
<210> 58
<211> 1745
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 58
Met Ala Ser Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp
1 5 10 15
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
20 25 30
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
35 40 45
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
50 55 60
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
65 70 75 80
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
85 90 95
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
100 105 110
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
115 120 125
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
130 135 140
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
145 150 155 160
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
165 170 175
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
180 185 190
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
195 200 205
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
210 215 220
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
225 230 235 240
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
245 250 255
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
260 265 270
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
275 280 285
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
290 295 300
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
305 310 315 320
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
325 330 335
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
340 345 350
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
355 360 365
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
370 375 380
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
385 390 395 400
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
405 410 415
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
420 425 430
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
435 440 445
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
450 455 460
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
465 470 475 480
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
485 490 495
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
500 505 510
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
515 520 525
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
530 535 540
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
545 550 555 560
Gln Glu Ala Leu Gly Ser Gly Arg Ile Phe Asn Ala His Tyr Ala Gly
565 570 575
Tyr Phe Ala Asp Leu Leu Ile His Asp Ile Glu Thr Asn Pro Gly Pro
580 585 590
Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr Val
595 600 605
Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly
610 615 620
Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr
625 630 635 640
Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser
645 650 655
Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala
660 665 670
Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp
675 680 685
Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro
690 695 700
Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly
705 710 715 720
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg
725 730 735
Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala
740 745 750
Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly
755 760 765
Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro
770 775 780
Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly
785 790 795 800
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg
805 810 815
Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala
820 825 830
Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr
835 840 845
Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser
850 855 860
Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser
865 870 875 880
Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro Leu
885 890 895
Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser
900 905 910
Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser
915 920 925
Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile
930 935 940
Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu
945 950 955 960
Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu
965 970 975
Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe
980 985 990
Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser
995 1000 1005
Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser
1010 1015 1020
Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val
1025 1030 1035
Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
1040 1045 1050
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe
1055 1060 1065
Pro Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr
1070 1075 1080
His Thr His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser
1085 1090 1095
Pro Tyr Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser
1100 1105 1110
Tyr Thr Asn Pro Ala Val Ala Ala Ala Ser Ala Asn Leu Gly Ser
1115 1120 1125
Gly Thr Ile Leu Ser Glu Gly Ala Thr Asn Phe Ser Leu Leu Lys
1130 1135 1140
Leu Ala Gly Asp Val Glu Leu Asn Pro Gly Pro Ala Lys Phe Leu
1145 1150 1155
His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe
1160 1165 1170
Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe
1175 1180 1185
Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg
1190 1195 1200
Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu
1205 1210 1215
Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg
1220 1225 1230
Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn
1235 1240 1245
Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg
1250 1255 1260
Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu
1265 1270 1275
Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val
1280 1285 1290
Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe Val Leu
1295 1300 1305
Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val Lys
1310 1315 1320
Val Ala Ile Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg Leu
1325 1330 1335
Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys
1340 1345 1350
Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly His Val
1355 1360 1365
Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu Gln
1370 1375 1380
Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser Pro
1385 1390 1395
Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu
1400 1405 1410
Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His
1415 1420 1425
His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly
1430 1435 1440
Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys
1445 1450 1455
Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp
1460 1465 1470
Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro
1475 1480 1485
His Leu Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly
1490 1495 1500
Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val
1505 1510 1515
Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val
1520 1525 1530
Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu
1535 1540 1545
Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr Ala
1550 1555 1560
Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe Lys
1565 1570 1575
Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val Leu Arg Leu
1580 1585 1590
Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser Leu Gln
1595 1600 1605
Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala Tyr
1610 1615 1620
Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln Val
1625 1630 1635
Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala
1640 1645 1650
Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser
1655 1660 1665
Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val
1670 1675 1680
Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His
1685 1690 1695
Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln
1700 1705 1710
Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu
1715 1720 1725
Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile
1730 1735 1740
Leu Asp
1745
<210> 59
<211> 5214
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 59
atggctagcc tggctggcga gacaggacag gaagccgctc ctctggacgg cgtgctggcc 60
aaccctccca atatcagcag cctgagcccc agacagctgc tgggattccc ttgtgccgag 120
gtgtccggcc tgagcacaga gagagtgcgg gaactggctg tggccctggc ccagaaaaac 180
gtgaagctga gcaccgagca gctgcggtgc ctggcccaca gactgtctga gcctcccgag 240
gatctggacg ccctgcctct ggatctgctg ctgttcctga accccgacgc cttcagcgga 300
cctcaggcct gcacccggtt cttcagcaga atcaccaagg ccaacgtgga cctgctgccc 360
agaggcgccc ctgagagaca gagactgctg cctgctgctc tggcctgttg gggagtgcgg 420
ggctctctgc tgtctgaagc tgatgtgcgg gccctgggag gcctggcttg tgatctgcct 480
ggaagattcg tggccgagag cgccgaagtg ctgctgccta gactggtgtc ctgtcccggc 540
cctctggacc aggatcagca ggaagctgcc agagctgctc tgcagggcgg aggccctcct 600
tatggacctc ctagcacttg gagcgtgtcc accatggatg ccctgagggg cctgctgcca 660
gtgctgggcc agcctatcat cagatccatc ccacagggca tcgtggccgc ctggcggcag 720
agaagctcta gagatccctc ttggcggcag cccgagcgga caatcctgcg gcccaggttt 780
cggagagagg tggaaaagac cgcctgcccc tctggcaaga aggccagaga gatcgacgag 840
agcctgatct tctacaagaa gtgggagctg gaagcctgcg tggacgccgc tctgctggcc 900
acccagatgg acagagtgaa cgccatcccc ttcacctatg agcagctgga cgtgctgaag 960
cacaagctgg atgagctgta cccccagggc taccccgaga gcgtgatcca gcacctgggc 1020
tacctgtttc tgaagatgag ccccgaggac atccggaagt ggaacgtgac cagcctggaa 1080
accctgaagg ccctgctgga agtgaacaag ggccacgaga tgtcccccca ggtggccaca 1140
ctgatcgaca gattcgtgaa gggcagaggc cagctggaca aggacaccct ggatacactg 1200
accgccttct accccggcta tctgtgcagc ctgtcccccg aggaactgag cagcgtgcca 1260
cctagctcta tctgggctgt gcggccccag gacctggata cctgcgatcc tagacagctg 1320
gatgtgctgt atcccaaggc ccggctggcc ttccagaaca tgaacggcag cgagtacttc 1380
gtgaagatcc agtccttcct gggcggagcc cctaccgagg acctgaaagc tctgagccag 1440
cagaacgtgt ccatggatct ggccaccttt atgaagctgc ggaccgacgc cgtgctgcct 1500
ctgacagtgg ctgaggtgca gaaactgctg ggcccccatg tggaagggct gaaggccgaa 1560
gaacggcaca gacccgtgcg cgactggatc ctgaggcaga gacaggatga cctggacaca 1620
ctgggcctgg gactgcaggg gggcatccct aatggctacc tggtgctgga cctgagcatg 1680
caggaagccc tgggatccgg cgagggcaga ggcagcctgc tgacatgtgg cgacgtggaa 1740
gagaaccctg gccccgccaa atttctgcat tggctgatgt cagtgtacgt ggtcgagctg 1800
ctgcgctcct ttttctacgt cactgagact acctttcaaa agaaccgcct gttcttctac 1860
cgcaaatctg tgtggagcaa gctgcagtca atcggcattc gccagcatct gaagagggtg 1920
cagctgcggg aactttccga ggcagaagtc cgccagcacc gggaggcccg gccggcgctt 1980
ctcacgtcgc gtctgagatt catcccaaag cccgacgggc tgaggcctat cgtcaacatg 2040
gattacgtcg tgggcgctcg cacctttcgc cgtgaaaagc gggccgaacg cttgacctca 2100
cgggtgaagg ccctcttctc cgtgctgaac tacgagagag caagacggcc tggcctgctg 2160
ggagcttcgg tgctgggact ggacgatatc caccgggctt ggcggacctt tgttctccgg 2220
gtgagagccc aagaccctcc gccggaactg tacttcgtga aggtggcgat caccggagcc 2280
tatgatacta ttccgcaaga tcgactcacc gaagtcatcg cctcgatcat caaaccgcag 2340
aacacttact gcgtcaggcg gtacgccgtg gtccagaagg ccgcgcatgg ccacgtgaga 2400
aaggcgttca agtcgcacgt gtccactctc accgacctcc agccttacat gaggcaattc 2460
gttgcgcatt tgcaagagac ttcgcccctg agagatgcgg tggtcatcga gcagagctcc 2520
agcctgaacg aagcgagcag cggtctgttt gacgtgttcc tccgcttcat gtgtcatcac 2580
gcggtgcgaa tcaggggaaa atcatacgtg cagtgccagg gaatcccaca aggcagcatt 2640
ctgtcgactc tcttgtgttc cctttgctac ggcgatatgg aaaacaagct gttcgctggg 2700
atcagacggg acgggttgct gctcagactg gtggacgact tcctgctggt gactccgcac 2760
ctcactcacg ccaaaacctt tctccgcact ctggtgaggg gagtgccaga atacggctgt 2820
gtggtcaatc tccggaaaac tgtggtgaat ttccctgtcg aggatgaggc actcggagga 2880
accgcatttg tccaaatgcc agcacatggc ctgttcccat ggtgcggtct gctgctggac 2940
acccgaactc ttgaagtgca gtccgactac tccagctatg cccggacgag catccgcgcc 3000
agcctcactt tcaatcgcgg ctttaaggcc ggacgaaaca tgcgcagaaa gcttttcgga 3060
gtcctccggc ttaaatgcca ttcgctcttt ctcgatctcc aagtcaattc gctgcagacc 3120
gtgtgcacga acatctacaa gatcctgctg ctccaagcct accggttcca cgcttgcgtg 3180
cttcagctgc cgtttcacca acaggtgtgg aagaacccga ccttctttct gcgggtcatt 3240
agcgatactg cctccctgtg ttactcaatc ctcaaggcaa agaacgccgg aatgtcgctg 3300
ggtgcgaaag gagccgcggg acctcttcct agcgaagcgg tgcagtggct ctgccaccag 3360
gctttcctcc tgaagctgac caggcacaga gtgacctacg tcccgctgct gggctcgctg 3420
cgcactgcac agacccagct gtctagaaaa ctccccggca ccaccctgac cgctctggaa 3480
gccgccgcca acccagcatt gccgtcagat ttcaagacca tcttggacgg atccggcaca 3540
atcctgtctg agggcgccac caacttcagc ctgctgaaac tggccggcga cgtggaactg 3600
aaccctggcc ctacccctgg aacccagagc cccttcttcc ttctgctgct gctgaccgtg 3660
ctgactgtcg tgacaggctc tggccacgcc agctctacac ctggcggcga gaaagagaca 3720
agcgccaccc agagaagcag cgtgccaagc agcaccgaga agaacgccgt gtccatgacc 3780
agctccgtgc tgagcagcca ctctcctggc agcggcagca gcacaacaca gggccaggat 3840
gtgacactgg cccctgccac agaacctgcc tctggatctg ccgccacctg gggacaggac 3900
gtgacaagcg tgccagtgac cagacctgcc ctgggctcta caacaccccc tgcccacgat 3960
gtgaccagcg cccctgataa caagcctgcc cctggaagca cagcccctcc agctcatggc 4020
gtgacctctg ccccagatac cagaccagcc ccaggatcta cagccccacc cgcacacggc 4080
gtgacaagtg cccctgacac aagacccgct ccaggctcta ctgctcctcc tgcccatggc 4140
gtgacaagcg ctcccgatac aaggccagct cctggctcca cagcaccacc agcacatggc 4200
gtgacatcag ctcccgacac tagacctgct cccggatcaa ccgctccacc agctcacggc 4260
gtgaccagcg cacctgatac cagacctgct ctgggaagca ccgcccctcc cgtgcacaat 4320
gtgacatctg cttccggcag cgccagcggc tctgcctcta cactggtgca caacggcacc 4380
agcgccagag ccacaacaac cccagccagc aagagcaccc ccttcagcat ccctagccac 4440
cacagcgaca cccctaccac actggccagc cactccacca agaccgatgc ctctagcacc 4500
caccactcca gcgtgccccc tctgaccagc agcaaccaca gcacaagccc ccagctgtct 4560
accggcgtct cattcttctt tctgtccttc cacatcagca acctgcagtt caacagcagc 4620
ctggaagatc ccagcaccga ctactaccag gaactgcagc gggatatcag cgagatgttc 4680
ctgcaaatct acaagcaggg cggcttcctg ggcctgagca acatcaagtt cagacccggc 4740
agcgtggtgg tgcagctgac cctggctttc cgggaaggca ccatcaacgt gcacgacgtg 4800
gaaacccagt tcaaccagta caagaccgag gccgccagcc ggtacaacct gaccatctcc 4860
gatgtgtccg tgtccgacgt gcccttccca ttctctgccc agtctggcgc aggcgtgcca 4920
ggatggggaa ttgctctgct ggtgctcgtg tgcgtgctgg tggccctggc catcgtgtat 4980
ctgattgccc tggccgtgtg ccagtgccgg cggaagaatt acggccagct ggacatcttc 5040
cccgccagag acacctacca ccccatgagc gagtacccca cataccacac ccacggcaga 5100
tacgtgccac ccagctccac cgacagatcc ccctacgaga aagtgtctgc cggcaacggc 5160
ggcagctccc tgagctacac aaatcctgcc gtggccgctg cctccgccaa cctg 5214
<210> 60
<211> 1738
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 60
Met Ala Ser Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp
1 5 10 15
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
20 25 30
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
35 40 45
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
50 55 60
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
65 70 75 80
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
85 90 95
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
100 105 110
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
115 120 125
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
130 135 140
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
145 150 155 160
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
165 170 175
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
180 185 190
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
195 200 205
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
210 215 220
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
225 230 235 240
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
245 250 255
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
260 265 270
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
275 280 285
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
290 295 300
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
305 310 315 320
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
325 330 335
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
340 345 350
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
355 360 365
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
370 375 380
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
385 390 395 400
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
405 410 415
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
420 425 430
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
435 440 445
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
450 455 460
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
465 470 475 480
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
485 490 495
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
500 505 510
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
515 520 525
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
530 535 540
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
545 550 555 560
Gln Glu Ala Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
565 570 575
Gly Asp Val Glu Glu Asn Pro Gly Pro Ala Lys Phe Leu His Trp Leu
580 585 590
Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr
595 600 605
Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val
610 615 620
Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val
625 630 635 640
Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala
645 650 655
Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp
660 665 670
Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr
675 680 685
Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg Val Lys Ala
690 695 700
Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu
705 710 715 720
Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr
725 730 735
Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe
740 745 750
Val Lys Val Ala Ile Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg
755 760 765
Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys
770 775 780
Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly His Val Arg
785 790 795 800
Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr
805 810 815
Met Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser Pro Leu Arg Asp
820 825 830
Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala Ser Ser Gly
835 840 845
Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His Ala Val Arg Ile
850 855 860
Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile
865 870 875 880
Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys
885 890 895
Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg Leu Val Asp
900 905 910
Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala Lys Thr Phe Leu
915 920 925
Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu
930 935 940
Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly
945 950 955 960
Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys Gly
965 970 975
Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser
980 985 990
Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe
995 1000 1005
Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val Leu Arg
1010 1015 1020
Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser Leu
1025 1030 1035
Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala
1040 1045 1050
Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln
1055 1060 1065
Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr
1070 1075 1080
Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met
1085 1090 1095
Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala
1100 1105 1110
Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg
1115 1120 1125
His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala
1130 1135 1140
Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala
1145 1150 1155
Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr
1160 1165 1170
Ile Leu Asp Gly Ser Gly Thr Ile Leu Ser Glu Gly Ala Thr Asn
1175 1180 1185
Phe Ser Leu Leu Lys Leu Ala Gly Asp Val Glu Leu Asn Pro Gly
1190 1195 1200
Pro Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu
1205 1210 1215
Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr
1220 1225 1230
Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val
1235 1240 1245
Pro Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val
1250 1255 1260
Leu Ser Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly
1265 1270 1275
Gln Asp Val Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser
1280 1285 1290
Ala Ala Thr Trp Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg
1295 1300 1305
Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala His Asp Val Thr Ser
1310 1315 1320
Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala
1325 1330 1335
His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
1340 1345 1350
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg
1355 1360 1365
Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
1370 1375 1380
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala
1385 1390 1395
His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
1400 1405 1410
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg
1415 1420 1425
Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser
1430 1435 1440
Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn
1445 1450 1455
Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr
1460 1465 1470
Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu
1475 1480 1485
Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser
1490 1495 1500
Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln
1505 1510 1515
Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser
1520 1525 1530
Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr
1535 1540 1545
Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln Ile
1550 1555 1560
Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg
1565 1570 1575
Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly
1580 1585 1590
Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys
1595 1600 1605
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser
1610 1615 1620
Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly
1625 1630 1635
Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu
1640 1645 1650
Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln
1655 1660 1665
Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg
1670 1675 1680
Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His
1685 1690 1695
Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu
1700 1705 1710
Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn
1715 1720 1725
Pro Ala Val Ala Ala Ala Ser Ala Asn Leu
1730 1735
<210> 61
<211> 5808
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 61
atggctagca cccctggaac ccagagcccc ttcttccttc tgctgctgct gaccgtgctg 60
actgtcgtga caggctctgg ccacgccagc tctacacctg gcggcgagaa agagacaagc 120
gccacccaga gaagcagcgt gccaagcagc accgagaaga acgccgtgtc catgaccagc 180
tccgtgctga gcagccactc tcctggcagc ggcagcagca caacacaggg ccaggatgtg 240
acactggccc ctgccacaga acctgcctct ggatctgccg ccacctgggg acaggacgtg 300
acaagcgtgc cagtgaccag acctgccctg ggctctacaa caccccctgc ccacgatgtg 360
accagcgccc ctgataacaa gcctgcccct ggaagcacag cccctccagc tcatggcgtg 420
acctctgccc cagataccag accagcccca ggatctacag ccccacccgc acacggcgtg 480
acaagtgccc ctgacacaag acccgctcca ggctctactg ctcctcctgc ccatggcgtg 540
acaagcgctc ccgatacaag gccagctcct ggctccacag caccaccagc acatggcgtg 600
acatcagctc ccgacactag acctgctccc ggatcaaccg ctccaccagc tcacggcgtg 660
accagcgcac ctgataccag acctgctctg ggaagcaccg cccctcccgt gcacaatgtg 720
acatctgctt ccggcagcgc cagcggctct gcctctacac tggtgcacaa cggcaccagc 780
gccagagcca caacaacccc agccagcaag agcaccccct tcagcatccc tagccaccac 840
agcgacaccc ctaccacact ggccagccac tccaccaaga ccgatgcctc tagcacccac 900
cactccagcg tgccccctct gaccagcagc aaccacagca caagccccca gctgtctacc 960
ggcgtctcat tcttctttct gtccttccac atcagcaacc tgcagttcaa cagcagcctg 1020
gaagatccca gcaccgacta ctaccaggaa ctgcagcggg atatcagcga gatgttcctg 1080
caaatctaca agcagggcgg cttcctgggc ctgagcaaca tcaagttcag acccggcagc 1140
gtggtggtgc agctgaccct ggctttccgg gaaggcacca tcaacgtgca cgacgtggaa 1200
acccagttca accagtacaa gaccgaggcc gccagccggt acaacctgac catctccgat 1260
gtgtccgtgt ccgacgtgcc cttcccattc tctgcccagt ctggcgcagg cgtgccagga 1320
tggggaattg ctctgctggt gctcgtgtgc gtgctggtgg ccctggccat cgtgtatctg 1380
attgccctgg ccgtgtgcca gtgccggcgg aagaattacg gccagctgga catcttcccc 1440
gccagagaca cctaccaccc catgagcgag taccccacat accacaccca cggcagatac 1500
gtgccaccca gctccaccga cagatccccc tacgagaaag tgtctgccgg caacggcggc 1560
agctccctga gctacacaaa tcctgccgtg gccgctgcct ccgccaacct gggatccggc 1620
agaatcttca acgcccacta cgccggctac ttcgccgacc tgctgatcca cgacatcgag 1680
acaaaccctg gccccctggc tggcgagaca ggacaggaag ccgctcctct ggacggcgtg 1740
ctggccaacc ctcccaatat cagcagcctg agccccagac agctgctggg attcccttgt 1800
gccgaggtgt ccggcctgag cacagagaga gtgcgggaac tggctgtggc cctggcccag 1860
aaaaacgtga agctgagcac cgagcagctg cggtgcctgg cccacagact gtctgagcct 1920
cccgaggatc tggacgccct gcctctggat ctgctgctgt tcctgaaccc cgacgccttc 1980
agcggacctc aggcctgcac ccggttcttc agcagaatca ccaaggccaa cgtggacctg 2040
ctgcccagag gcgcccctga gagacagaga ctgctgcctg ctgctctggc ctgttgggga 2100
gtgcggggct ctctgctgtc tgaagctgat gtgcgggccc tgggaggcct ggcttgtgat 2160
ctgcctggaa gattcgtggc cgagagcgcc gaagtgctgc tgcctagact ggtgtcctgt 2220
cccggccctc tggaccagga tcagcaggaa gctgccagag ctgctctgca gggcggaggc 2280
cctccttatg gacctcctag cacttggagc gtgtccacca tggatgccct gaggggcctg 2340
ctgccagtgc tgggccagcc tatcatcaga tccatcccac agggcatcgt ggccgcctgg 2400
cggcagagaa gctctagaga tccctcttgg cggcagcccg agcggacaat cctgcggccc 2460
aggtttcgga gagaggtgga aaagaccgcc tgcccctctg gcaagaaggc cagagagatc 2520
gacgagagcc tgatcttcta caagaagtgg gagctggaag cctgcgtgga cgccgctctg 2580
ctggccaccc agatggacag agtgaacgcc atccccttca cctatgagca gctggacgtg 2640
ctgaagcaca agctggatga gctgtacccc cagggctacc ccgagagcgt gatccagcac 2700
ctgggctacc tgtttctgaa gatgagcccc gaggacatcc ggaagtggaa cgtgaccagc 2760
ctggaaaccc tgaaggccct gctggaagtg aacaagggcc acgagatgtc cccccaggtg 2820
gccacactga tcgacagatt cgtgaagggc agaggccagc tggacaagga caccctggat 2880
acactgaccg ccttctaccc cggctatctg tgcagcctgt cccccgagga actgagcagc 2940
gtgccaccta gctctatctg ggctgtgcgg ccccaggacc tggatacctg cgatcctaga 3000
cagctggatg tgctgtatcc caaggcccgg ctggccttcc agaacatgaa cggcagcgag 3060
tacttcgtga agatccagtc cttcctgggc ggagccccta ccgaggacct gaaagctctg 3120
agccagcaga acgtgtccat ggatctggcc acctttatga agctgcggac cgacgccgtg 3180
ctgcctctga cagtggctga ggtgcagaaa ctgctgggcc cccatgtgga agggctgaag 3240
gccgaagaac ggcacagacc cgtgcgcgac tggatcctga ggcagagaca ggatgacctg 3300
gacacactgg gcctgggact gcaggggggc atccctaatg gctacctggt gctggacctg 3360
agcatgcagg aagccctggg atccggcgag ggcagaggca gcctgctgac atgtggcgac 3420
gtggaagaga accctggccc cagcttcctc ctgtcgtcgc tcagaccgag cctgaccgga 3480
gcacgcagat tggtggaaac tatcttcctt gggtcacgtc cgtggatgcc aggtacccca 3540
cggcgcctcc cgcgcctccc acagagatac tggcagatgc ggcctctgtt cctggaattg 3600
ctgggaaacc acgctcagtg cccgtacgga gtcctgctca agactcactg ccctctgagg 3660
gcggcggtca ctccggcggc cggagtgtgc gcacgggaga agccccaggg aagcgtggca 3720
gctccggaag aggaggacac cgatccgcgc cgcctcgtgc aacttctgcg ccagcactcc 3780
tcgccctggc aagtctacgg gttcgtccgc gcctgcctgc gccgcctggt gccgcctggg 3840
ctctggggtt cccggcataa cgagcgccgc ttcctgagaa atactaagaa gtttatctca 3900
cttggaaaac atgccaagtt gtcgctgcaa gaactcacgt ggaagatgtc agtccgcgat 3960
tgcgcctggc tgcgccgctc gccgggcgtc gggtgtgttc cagctgcaga acaccgcctg 4020
agagaagaaa ttctggccaa atttctgcat tggctgatgt cagtgtacgt ggtcgagctg 4080
ctgcgctcct ttttctacgt cactgagact acctttcaaa agaaccgcct gttcttctac 4140
cgcaaatctg tgtggagcaa gctgcagtca atcggcattc gccagcatct gaagagggtg 4200
cagctgcggg aactttccga ggcagaagtc cgccagcacc gggaggcccg gccggcgctt 4260
ctcacgtcgc gtctgagatt catcccaaag cccgacgggc tgaggcctat cgtcaacatg 4320
gattacgtcg tgggcgctcg cacctttcgc cgtgaaaagc gggccgaacg cttgacctca 4380
cgggtgaagg ccctcttctc cgtgctgaac tacgagagag caagacggcc tggcctgctg 4440
ggagcttcgg tgctgggact ggacgatatc caccgggctt ggcggacctt tgttctccgg 4500
gtgagagccc aagaccctcc gccggaactg tacttcgtga aggtggcgat caccggagcc 4560
tatgatacta ttccgcaaga tcgactcacc gaagtcatcg cctcgatcat caaaccgcag 4620
aacacttact gcgtcaggcg gtacgccgtg gtccagaagg ccgcgcatgg ccacgtgaga 4680
aaggcgttca agtcgcacgt gtccactctc accgacctcc agccttacat gaggcaattc 4740
gttgcgcatt tgcaagagac ttcgcccctg agagatgcgg tggtcatcga gcagagctcc 4800
agcctgaacg aagcgagcag cggtctgttt gacgtgttcc tccgcttcat gtgtcatcac 4860
gcggtgcgaa tcaggggaaa atcatacgtg cagtgccagg gaatcccaca aggcagcatt 4920
ctgtcgactc tcttgtgttc cctttgctac ggcgatatgg aaaacaagct gttcgctggg 4980
atcagacggg acgggttgct gctcagactg gtggacgact tcctgctggt gactccgcac 5040
ctcactcacg ccaaaacctt tctccgcact ctggtgaggg gagtgccaga atacggctgt 5100
gtggtcaatc tccggaaaac tgtggtgaat ttccctgtcg aggatgaggc actcggagga 5160
accgcatttg tccaaatgcc agcacatggc ctgttcccat ggtgcggtct gctgctggac 5220
acccgaactc ttgaagtgca gtccgactac tccagctatg cccggacgag catccgcgcc 5280
agcctcactt tcaatcgcgg ctttaaggcc ggacgaaaca tgcgcagaaa gcttttcgga 5340
gtcctccggc ttaaatgcca ttcgctcttt ctcgatctcc aagtcaattc gctgcagacc 5400
gtgtgcacga acatctacaa gatcctgctg ctccaagcct accggttcca cgcttgcgtg 5460
cttcagctgc cgtttcacca acaggtgtgg aagaacccga ccttctttct gcgggtcatt 5520
agcgatactg cctccctgtg ttactcaatc ctcaaggcaa agaacgccgg aatgtcgctg 5580
ggtgcgaaag gagccgcggg acctcttcct agcgaagcgg tgcagtggct ctgccaccag 5640
gctttcctcc tgaagctgac caggcacaga gtgacctacg tcccgctgct gggctcgctg 5700
cgcactgcac agacccagct gtctagaaaa ctccccggca ccaccctgac cgctctggaa 5760
gccgccgcca acccagcatt gccgtcagat ttcaagacca tcttggac 5808
<210> 62
<211> 1936
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 62
Met Ala Ser Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu
1 5 10 15
Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr
20 25 30
Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro
35 40 45
Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser
50 55 60
Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val
65 70 75 80
Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp
85 90 95
Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser
100 105 110
Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro
115 120 125
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
130 135 140
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
145 150 155 160
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
165 170 175
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
180 185 190
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
195 200 205
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
210 215 220
Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val
225 230 235 240
Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His
245 250 255
Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr
260 265 270
Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala
275 280 285
Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val
290 295 300
Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr
305 310 315 320
Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe
325 330 335
Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln
340 345 350
Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe
355 360 365
Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln
370 375 380
Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu
385 390 395 400
Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu
405 410 415
Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala
420 425 430
Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
435 440 445
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
450 455 460
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro
465 470 475 480
Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr
485 490 495
His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu
500 505 510
Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro
515 520 525
Ala Val Ala Ala Ala Ser Ala Asn Leu Gly Ser Gly Arg Ile Phe Asn
530 535 540
Ala His Tyr Ala Gly Tyr Phe Ala Asp Leu Leu Ile His Asp Ile Glu
545 550 555 560
Thr Asn Pro Gly Pro Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro
565 570 575
Leu Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro
580 585 590
Arg Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr
595 600 605
Glu Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys
610 615 620
Leu Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro
625 630 635 640
Pro Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn
645 650 655
Pro Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg
660 665 670
Ile Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg
675 680 685
Gln Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser
690 695 700
Leu Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp
705 710 715 720
Leu Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg
725 730 735
Leu Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala
740 745 750
Arg Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr
755 760 765
Trp Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu
770 775 780
Gly Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp
785 790 795 800
Arg Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr
805 810 815
Ile Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro
820 825 830
Ser Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys
835 840 845
Lys Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln
850 855 860
Met Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val
865 870 875 880
Leu Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser
885 890 895
Val Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp
900 905 910
Ile Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu
915 920 925
Glu Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile
930 935 940
Asp Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp
945 950 955 960
Thr Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu
965 970 975
Glu Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln
980 985 990
Asp Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys
995 1000 1005
Ala Arg Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val
1010 1015 1020
Lys Ile Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys
1025 1030 1035
Ala Leu Ser Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met
1040 1045 1050
Lys Leu Arg Thr Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val
1055 1060 1065
Gln Lys Leu Leu Gly Pro His Val Glu Gly Leu Lys Ala Glu Glu
1070 1075 1080
Arg His Arg Pro Val Arg Asp Trp Ile Leu Arg Gln Arg Gln Asp
1085 1090 1095
Asp Leu Asp Thr Leu Gly Leu Gly Leu Gln Gly Gly Ile Pro Asn
1100 1105 1110
Gly Tyr Leu Val Leu Asp Leu Ser Met Gln Glu Ala Leu Gly Ser
1115 1120 1125
Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
1130 1135 1140
Asn Pro Gly Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser Leu
1145 1150 1155
Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser Arg
1160 1165 1170
Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln
1175 1180 1185
Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn
1190 1195 1200
His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro
1205 1210 1215
Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu
1220 1225 1230
Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp
1235 1240 1245
Pro Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp
1250 1255 1260
Gln Val Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro
1265 1270 1275
Pro Gly Leu Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg
1280 1285 1290
Asn Thr Lys Lys Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser
1295 1300 1305
Leu Gln Glu Leu Thr Trp Lys Met Ser Val Arg Asp Cys Ala Trp
1310 1315 1320
Leu Arg Arg Ser Pro Gly Val Gly Cys Val Pro Ala Ala Glu His
1325 1330 1335
Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu His Trp Leu Met
1340 1345 1350
Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr
1355 1360 1365
Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser
1370 1375 1380
Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys
1385 1390 1395
Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His
1400 1405 1410
Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile
1415 1420 1425
Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val
1430 1435 1440
Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu
1445 1450 1455
Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg
1460 1465 1470
Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp
1475 1480 1485
Asp Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala
1490 1495 1500
Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr
1505 1510 1515
Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile
1520 1525 1530
Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr
1535 1540 1545
Ala Val Val Gln Lys Ala Ala His Gly His Val Arg Lys Ala Phe
1550 1555 1560
Lys Ser His Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met Arg
1565 1570 1575
Gln Phe Val Ala His Leu Gln Glu Thr Ser Pro Leu Arg Asp Ala
1580 1585 1590
Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala Ser Ser Gly
1595 1600 1605
Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His Ala Val Arg
1610 1615 1620
Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly
1625 1630 1635
Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met
1640 1645 1650
Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu
1655 1660 1665
Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His
1670 1675 1680
Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr
1685 1690 1695
Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val
1700 1705 1710
Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala
1715 1720 1725
His Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr
1730 1735 1740
Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile
1745 1750 1755
Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn
1760 1765 1770
Met Arg Arg Lys Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser
1775 1780 1785
Leu Phe Leu Asp Leu Gln Val Asn Ser Leu Gln Thr Val Cys Thr
1790 1795 1800
Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala Tyr Arg Phe His Ala
1805 1810 1815
Cys Val Leu Gln Leu Pro Phe His Gln Gln Val Trp Lys Asn Pro
1820 1825 1830
Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala Ser Leu Cys Tyr
1835 1840 1845
Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu Gly Ala Lys
1850 1855 1860
Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu Cys
1865 1870 1875
His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr Tyr
1880 1885 1890
Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser
1895 1900 1905
Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala
1910 1915 1920
Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
1925 1930 1935
<210> 63
<211> 5829
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 63
atggctagcc tggctggcga gacaggacag gaagccgctc ctctggacgg cgtgctggcc 60
aaccctccca atatcagcag cctgagcccc agacagctgc tgggattccc ttgtgccgag 120
gtgtccggcc tgagcacaga gagagtgcgg gaactggctg tggccctggc ccagaaaaac 180
gtgaagctga gcaccgagca gctgcggtgc ctggcccaca gactgtctga gcctcccgag 240
gatctggacg ccctgcctct ggatctgctg ctgttcctga accccgacgc cttcagcgga 300
cctcaggcct gcacccggtt cttcagcaga atcaccaagg ccaacgtgga cctgctgccc 360
agaggcgccc ctgagagaca gagactgctg cctgctgctc tggcctgttg gggagtgcgg 420
ggctctctgc tgtctgaagc tgatgtgcgg gccctgggag gcctggcttg tgatctgcct 480
ggaagattcg tggccgagag cgccgaagtg ctgctgccta gactggtgtc ctgtcccggc 540
cctctggacc aggatcagca ggaagctgcc agagctgctc tgcagggcgg aggccctcct 600
tatggacctc ctagcacttg gagcgtgtcc accatggatg ccctgagggg cctgctgcca 660
gtgctgggcc agcctatcat cagatccatc ccacagggca tcgtggccgc ctggcggcag 720
agaagctcta gagatccctc ttggcggcag cccgagcgga caatcctgcg gcccaggttt 780
cggagagagg tggaaaagac cgcctgcccc tctggcaaga aggccagaga gatcgacgag 840
agcctgatct tctacaagaa gtgggagctg gaagcctgcg tggacgccgc tctgctggcc 900
acccagatgg acagagtgaa cgccatcccc ttcacctatg agcagctgga cgtgctgaag 960
cacaagctgg atgagctgta cccccagggc taccccgaga gcgtgatcca gcacctgggc 1020
tacctgtttc tgaagatgag ccccgaggac atccggaagt ggaacgtgac cagcctggaa 1080
accctgaagg ccctgctgga agtgaacaag ggccacgaga tgtcccccca ggtggccaca 1140
ctgatcgaca gattcgtgaa gggcagaggc cagctggaca aggacaccct ggatacactg 1200
accgccttct accccggcta tctgtgcagc ctgtcccccg aggaactgag cagcgtgcca 1260
cctagctcta tctgggctgt gcggccccag gacctggata cctgcgatcc tagacagctg 1320
gatgtgctgt atcccaaggc ccggctggcc ttccagaaca tgaacggcag cgagtacttc 1380
gtgaagatcc agtccttcct gggcggagcc cctaccgagg acctgaaagc tctgagccag 1440
cagaacgtgt ccatggatct ggccaccttt atgaagctgc ggaccgacgc cgtgctgcct 1500
ctgacagtgg ctgaggtgca gaaactgctg ggcccccatg tggaagggct gaaggccgaa 1560
gaacggcaca gacccgtgcg cgactggatc ctgaggcaga gacaggatga cctggacaca 1620
ctgggcctgg gactgcaggg gggcatccct aatggctacc tggtgctgga cctgagcatg 1680
caggaagccc tgggatccgg cagaatcttc aacgcccact acgccggcta cttcgccgac 1740
ctgctgatcc acgacatcga gacaaaccct ggccccaccc ctggaaccca gagccccttc 1800
ttccttctgc tgctgctgac cgtgctgact gtcgtgacag gctctggcca cgccagctct 1860
acacctggcg gcgagaaaga gacaagcgcc acccagagaa gcagcgtgcc aagcagcacc 1920
gagaagaacg ccgtgtccat gaccagctcc gtgctgagca gccactctcc tggcagcggc 1980
agcagcacaa cacagggcca ggatgtgaca ctggcccctg ccacagaacc tgcctctgga 2040
tctgccgcca cctggggaca ggacgtgaca agcgtgccag tgaccagacc tgccctgggc 2100
tctacaacac cccctgccca cgatgtgacc agcgcccctg ataacaagcc tgcccctgga 2160
agcacagccc ctccagctca tggcgtgacc tctgccccag ataccagacc agccccagga 2220
tctacagccc cacccgcaca cggcgtgaca agtgcccctg acacaagacc cgctccaggc 2280
tctactgctc ctcctgccca tggcgtgaca agcgctcccg atacaaggcc agctcctggc 2340
tccacagcac caccagcaca tggcgtgaca tcagctcccg acactagacc tgctcccgga 2400
tcaaccgctc caccagctca cggcgtgacc agcgcacctg ataccagacc tgctctggga 2460
agcaccgccc ctcccgtgca caatgtgaca tctgcttccg gcagcgccag cggctctgcc 2520
tctacactgg tgcacaacgg caccagcgcc agagccacaa caaccccagc cagcaagagc 2580
acccccttca gcatccctag ccaccacagc gacaccccta ccacactggc cagccactcc 2640
accaagaccg atgcctctag cacccaccac tccagcgtgc cccctctgac cagcagcaac 2700
cacagcacaa gcccccagct gtctaccggc gtctcattct tctttctgtc cttccacatc 2760
agcaacctgc agttcaacag cagcctggaa gatcccagca ccgactacta ccaggaactg 2820
cagcgggata tcagcgagat gttcctgcaa atctacaagc agggcggctt cctgggcctg 2880
agcaacatca agttcagacc cggcagcgtg gtggtgcagc tgaccctggc tttccgggaa 2940
ggcaccatca acgtgcacga cgtggaaacc cagttcaacc agtacaagac cgaggccgcc 3000
agccggtaca acctgaccat ctccgatgtg tccgtgtccg acgtgccctt cccattctct 3060
gcccagtctg gcgcaggcgt gccaggatgg ggaattgctc tgctggtgct cgtgtgcgtg 3120
ctggtggccc tggccatcgt gtatctgatt gccctggccg tgtgccagtg ccggcggaag 3180
aattacggcc agctggacat cttccccgcc agagacacct accaccccat gagcgagtac 3240
cccacatacc acacccacgg cagatacgtg ccacccagct ccaccgacag atccccctac 3300
gagaaagtgt ctgccggcaa cggcggcagc tccctgagct acacaaatcc tgccgtggcc 3360
gctgcctccg ccaacctggg atccggcaca atcctgtctg agggcgccac caacttcagc 3420
ctgctgaaac tggccggcga cgtggaactg aaccctggcc ctagcttcct cctgtcgtcg 3480
ctcagaccga gcctgaccgg agcacgcaga ttggtggaaa ctatcttcct tgggtcacgt 3540
ccgtggatgc caggtacccc acggcgcctc ccgcgcctcc cacagagata ctggcagatg 3600
cggcctctgt tcctggaatt gctgggaaac cacgctcagt gcccgtacgg agtcctgctc 3660
aagactcact gccctctgag ggcggcggtc actccggcgg ccggagtgtg cgcacgggag 3720
aagccccagg gaagcgtggc agctccggaa gaggaggaca ccgatccgcg ccgcctcgtg 3780
caacttctgc gccagcactc ctcgccctgg caagtctacg ggttcgtccg cgcctgcctg 3840
cgccgcctgg tgccgcctgg gctctggggt tcccggcata acgagcgccg cttcctgaga 3900
aatactaaga agtttatctc acttggaaaa catgccaagt tgtcgctgca agaactcacg 3960
tggaagatgt cagtccgcga ttgcgcctgg ctgcgccgct cgccgggcgt cgggtgtgtt 4020
ccagctgcag aacaccgcct gagagaagaa attctggcca aatttctgca ttggctgatg 4080
tcagtgtacg tggtcgagct gctgcgctcc tttttctacg tcactgagac tacctttcaa 4140
aagaaccgcc tgttcttcta ccgcaaatct gtgtggagca agctgcagtc aatcggcatt 4200
cgccagcatc tgaagagggt gcagctgcgg gaactttccg aggcagaagt ccgccagcac 4260
cgggaggccc ggccggcgct tctcacgtcg cgtctgagat tcatcccaaa gcccgacggg 4320
ctgaggccta tcgtcaacat ggattacgtc gtgggcgctc gcacctttcg ccgtgaaaag 4380
cgggccgaac gcttgacctc acgggtgaag gccctcttct ccgtgctgaa ctacgagaga 4440
gcaagacggc ctggcctgct gggagcttcg gtgctgggac tggacgatat ccaccgggct 4500
tggcggacct ttgttctccg ggtgagagcc caagaccctc cgccggaact gtacttcgtg 4560
aaggtggcga tcaccggagc ctatgatact attccgcaag atcgactcac cgaagtcatc 4620
gcctcgatca tcaaaccgca gaacacttac tgcgtcaggc ggtacgccgt ggtccagaag 4680
gccgcgcatg gccacgtgag aaaggcgttc aagtcgcacg tgtccactct caccgacctc 4740
cagccttaca tgaggcaatt cgttgcgcat ttgcaagaga cttcgcccct gagagatgcg 4800
gtggtcatcg agcagagctc cagcctgaac gaagcgagca gcggtctgtt tgacgtgttc 4860
ctccgcttca tgtgtcatca cgcggtgcga atcaggggaa aatcatacgt gcagtgccag 4920
ggaatcccac aaggcagcat tctgtcgact ctcttgtgtt ccctttgcta cggcgatatg 4980
gaaaacaagc tgttcgctgg gatcagacgg gacgggttgc tgctcagact ggtggacgac 5040
ttcctgctgg tgactccgca cctcactcac gccaaaacct ttctccgcac tctggtgagg 5100
ggagtgccag aatacggctg tgtggtcaat ctccggaaaa ctgtggtgaa tttccctgtc 5160
gaggatgagg cactcggagg aaccgcattt gtccaaatgc cagcacatgg cctgttccca 5220
tggtgcggtc tgctgctgga cacccgaact cttgaagtgc agtccgacta ctccagctat 5280
gcccggacga gcatccgcgc cagcctcact ttcaatcgcg gctttaaggc cggacgaaac 5340
atgcgcagaa agcttttcgg agtcctccgg cttaaatgcc attcgctctt tctcgatctc 5400
caagtcaatt cgctgcagac cgtgtgcacg aacatctaca agatcctgct gctccaagcc 5460
taccggttcc acgcttgcgt gcttcagctg ccgtttcacc aacaggtgtg gaagaacccg 5520
accttctttc tgcgggtcat tagcgatact gcctccctgt gttactcaat cctcaaggca 5580
aagaacgccg gaatgtcgct gggtgcgaaa ggagccgcgg gacctcttcc tagcgaagcg 5640
gtgcagtggc tctgccacca ggctttcctc ctgaagctga ccaggcacag agtgacctac 5700
gtcccgctgc tgggctcgct gcgcactgca cagacccagc tgtctagaaa actccccggc 5760
accaccctga ccgctctgga agccgccgcc aacccagcat tgccgtcaga tttcaagacc 5820
atcttggac 5829
<210> 64
<211> 1943
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 64
Met Ala Ser Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp
1 5 10 15
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
20 25 30
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
35 40 45
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
50 55 60
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
65 70 75 80
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
85 90 95
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
100 105 110
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
115 120 125
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
130 135 140
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
145 150 155 160
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
165 170 175
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
180 185 190
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
195 200 205
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
210 215 220
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
225 230 235 240
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
245 250 255
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
260 265 270
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
275 280 285
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
290 295 300
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
305 310 315 320
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
325 330 335
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
340 345 350
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
355 360 365
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
370 375 380
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
385 390 395 400
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
405 410 415
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
420 425 430
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
435 440 445
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
450 455 460
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
465 470 475 480
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
485 490 495
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
500 505 510
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
515 520 525
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
530 535 540
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
545 550 555 560
Gln Glu Ala Leu Gly Ser Gly Arg Ile Phe Asn Ala His Tyr Ala Gly
565 570 575
Tyr Phe Ala Asp Leu Leu Ile His Asp Ile Glu Thr Asn Pro Gly Pro
580 585 590
Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr Val
595 600 605
Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly
610 615 620
Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr
625 630 635 640
Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser
645 650 655
Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala
660 665 670
Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp
675 680 685
Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro
690 695 700
Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly
705 710 715 720
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg
725 730 735
Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala
740 745 750
Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly
755 760 765
Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro
770 775 780
Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly
785 790 795 800
Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg
805 810 815
Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala
820 825 830
Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr
835 840 845
Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser
850 855 860
Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser
865 870 875 880
Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro Leu
885 890 895
Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser
900 905 910
Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser
915 920 925
Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile
930 935 940
Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu
945 950 955 960
Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu
965 970 975
Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe
980 985 990
Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser
995 1000 1005
Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser
1010 1015 1020
Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val
1025 1030 1035
Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
1040 1045 1050
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe
1055 1060 1065
Pro Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr
1070 1075 1080
His Thr His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser
1085 1090 1095
Pro Tyr Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser
1100 1105 1110
Tyr Thr Asn Pro Ala Val Ala Ala Ala Ser Ala Asn Leu Gly Ser
1115 1120 1125
Gly Thr Ile Leu Ser Glu Gly Ala Thr Asn Phe Ser Leu Leu Lys
1130 1135 1140
Leu Ala Gly Asp Val Glu Leu Asn Pro Gly Pro Ser Phe Leu Leu
1145 1150 1155
Ser Ser Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu
1160 1165 1170
Thr Ile Phe Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg
1175 1180 1185
Arg Leu Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu
1190 1195 1200
Phe Leu Glu Leu Leu Gly Asn His Ala Gln Cys Pro Tyr Gly Val
1205 1210 1215
Leu Leu Lys Thr His Cys Pro Leu Arg Ala Ala Val Thr Pro Ala
1220 1225 1230
Ala Gly Val Cys Ala Arg Glu Lys Pro Gln Gly Ser Val Ala Ala
1235 1240 1245
Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu Val Gln Leu Leu
1250 1255 1260
Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe Val Arg Ala
1265 1270 1275
Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser Arg His
1280 1285 1290
Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu
1295 1300 1305
Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met
1310 1315 1320
Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly
1325 1330 1335
Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala
1340 1345 1350
Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
1355 1360 1365
Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg
1370 1375 1380
Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile
1385 1390 1395
Gly Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser
1400 1405 1410
Glu Ala Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu
1415 1420 1425
Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro
1430 1435 1440
Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg
1445 1450 1455
Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe
1460 1465 1470
Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly
1475 1480 1485
Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr
1490 1495 1500
Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr
1505 1510 1515
Phe Val Lys Val Ala Ile Thr Gly Ala Tyr Asp Thr Ile Pro Gln
1520 1525 1530
Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn
1535 1540 1545
Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His
1550 1555 1560
Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr
1565 1570 1575
Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu
1580 1585 1590
Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser
1595 1600 1605
Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe
1610 1615 1620
Met Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln
1625 1630 1635
Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys
1640 1645 1650
Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile
1655 1660 1665
Arg Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu
1670 1675 1680
Val Thr Pro His Leu Thr His Ala Lys Thr Phe Leu Arg Thr Leu
1685 1690 1695
Val Arg Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg Lys
1700 1705 1710
Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr
1715 1720 1725
Ala Phe Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys Gly
1730 1735 1740
Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr Ser
1745 1750 1755
Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn Arg
1760 1765 1770
Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val
1775 1780 1785
Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn
1790 1795 1800
Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu
1805 1810 1815
Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His
1820 1825 1830
Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser
1835 1840 1845
Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala
1850 1855 1860
Gly Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser
1865 1870 1875
Glu Ala Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu
1880 1885 1890
Thr Arg His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg
1895 1900 1905
Thr Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu
1910 1915 1920
Thr Ala Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe
1925 1930 1935
Lys Thr Ile Leu Asp
1940
<210> 65
<211> 5808
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 65
atggctagcc tggctggcga gacaggacag gaagccgctc ctctggacgg cgtgctggcc 60
aaccctccca atatcagcag cctgagcccc agacagctgc tgggattccc ttgtgccgag 120
gtgtccggcc tgagcacaga gagagtgcgg gaactggctg tggccctggc ccagaaaaac 180
gtgaagctga gcaccgagca gctgcggtgc ctggcccaca gactgtctga gcctcccgag 240
gatctggacg ccctgcctct ggatctgctg ctgttcctga accccgacgc cttcagcgga 300
cctcaggcct gcacccggtt cttcagcaga atcaccaagg ccaacgtgga cctgctgccc 360
agaggcgccc ctgagagaca gagactgctg cctgctgctc tggcctgttg gggagtgcgg 420
ggctctctgc tgtctgaagc tgatgtgcgg gccctgggag gcctggcttg tgatctgcct 480
ggaagattcg tggccgagag cgccgaagtg ctgctgccta gactggtgtc ctgtcccggc 540
cctctggacc aggatcagca ggaagctgcc agagctgctc tgcagggcgg aggccctcct 600
tatggacctc ctagcacttg gagcgtgtcc accatggatg ccctgagggg cctgctgcca 660
gtgctgggcc agcctatcat cagatccatc ccacagggca tcgtggccgc ctggcggcag 720
agaagctcta gagatccctc ttggcggcag cccgagcgga caatcctgcg gcccaggttt 780
cggagagagg tggaaaagac cgcctgcccc tctggcaaga aggccagaga gatcgacgag 840
agcctgatct tctacaagaa gtgggagctg gaagcctgcg tggacgccgc tctgctggcc 900
acccagatgg acagagtgaa cgccatcccc ttcacctatg agcagctgga cgtgctgaag 960
cacaagctgg atgagctgta cccccagggc taccccgaga gcgtgatcca gcacctgggc 1020
tacctgtttc tgaagatgag ccccgaggac atccggaagt ggaacgtgac cagcctggaa 1080
accctgaagg ccctgctgga agtgaacaag ggccacgaga tgtcccccca ggtggccaca 1140
ctgatcgaca gattcgtgaa gggcagaggc cagctggaca aggacaccct ggatacactg 1200
accgccttct accccggcta tctgtgcagc ctgtcccccg aggaactgag cagcgtgcca 1260
cctagctcta tctgggctgt gcggccccag gacctggata cctgcgatcc tagacagctg 1320
gatgtgctgt atcccaaggc ccggctggcc ttccagaaca tgaacggcag cgagtacttc 1380
gtgaagatcc agtccttcct gggcggagcc cctaccgagg acctgaaagc tctgagccag 1440
cagaacgtgt ccatggatct ggccaccttt atgaagctgc ggaccgacgc cgtgctgcct 1500
ctgacagtgg ctgaggtgca gaaactgctg ggcccccatg tggaagggct gaaggccgaa 1560
gaacggcaca gacccgtgcg cgactggatc ctgaggcaga gacaggatga cctggacaca 1620
ctgggcctgg gactgcaggg gggcatccct aatggctacc tggtgctgga cctgagcatg 1680
caggaagccc tgggatccgg cgagggcaga ggcagcctgc tgacatgtgg cgacgtggaa 1740
gagaaccctg gccccagctt cctcctgtcg tcgctcagac cgagcctgac cggagcacgc 1800
agattggtgg aaactatctt ccttgggtca cgtccgtgga tgccaggtac cccacggcgc 1860
ctcccgcgcc tcccacagag atactggcag atgcggcctc tgttcctgga attgctggga 1920
aaccacgctc agtgcccgta cggagtcctg ctcaagactc actgccctct gagggcggcg 1980
gtcactccgg cggccggagt gtgcgcacgg gagaagcccc agggaagcgt ggcagctccg 2040
gaagaggagg acaccgatcc gcgccgcctc gtgcaacttc tgcgccagca ctcctcgccc 2100
tggcaagtct acgggttcgt ccgcgcctgc ctgcgccgcc tggtgccgcc tgggctctgg 2160
ggttcccggc ataacgagcg ccgcttcctg agaaatacta agaagtttat ctcacttgga 2220
aaacatgcca agttgtcgct gcaagaactc acgtggaaga tgtcagtccg cgattgcgcc 2280
tggctgcgcc gctcgccggg cgtcgggtgt gttccagctg cagaacaccg cctgagagaa 2340
gaaattctgg ccaaatttct gcattggctg atgtcagtgt acgtggtcga gctgctgcgc 2400
tcctttttct acgtcactga gactaccttt caaaagaacc gcctgttctt ctaccgcaaa 2460
tctgtgtgga gcaagctgca gtcaatcggc attcgccagc atctgaagag ggtgcagctg 2520
cgggaacttt ccgaggcaga agtccgccag caccgggagg cccggccggc gcttctcacg 2580
tcgcgtctga gattcatccc aaagcccgac gggctgaggc ctatcgtcaa catggattac 2640
gtcgtgggcg ctcgcacctt tcgccgtgaa aagcgggccg aacgcttgac ctcacgggtg 2700
aaggccctct tctccgtgct gaactacgag agagcaagac ggcctggcct gctgggagct 2760
tcggtgctgg gactggacga tatccaccgg gcttggcgga cctttgttct ccgggtgaga 2820
gcccaagacc ctccgccgga actgtacttc gtgaaggtgg cgatcaccgg agcctatgat 2880
actattccgc aagatcgact caccgaagtc atcgcctcga tcatcaaacc gcagaacact 2940
tactgcgtca ggcggtacgc cgtggtccag aaggccgcgc atggccacgt gagaaaggcg 3000
ttcaagtcgc acgtgtccac tctcaccgac ctccagcctt acatgaggca attcgttgcg 3060
catttgcaag agacttcgcc cctgagagat gcggtggtca tcgagcagag ctccagcctg 3120
aacgaagcga gcagcggtct gtttgacgtg ttcctccgct tcatgtgtca tcacgcggtg 3180
cgaatcaggg gaaaatcata cgtgcagtgc cagggaatcc cacaaggcag cattctgtcg 3240
actctcttgt gttccctttg ctacggcgat atggaaaaca agctgttcgc tgggatcaga 3300
cgggacgggt tgctgctcag actggtggac gacttcctgc tggtgactcc gcacctcact 3360
cacgccaaaa cctttctccg cactctggtg aggggagtgc cagaatacgg ctgtgtggtc 3420
aatctccgga aaactgtggt gaatttccct gtcgaggatg aggcactcgg aggaaccgca 3480
tttgtccaaa tgccagcaca tggcctgttc ccatggtgcg gtctgctgct ggacacccga 3540
actcttgaag tgcagtccga ctactccagc tatgcccgga cgagcatccg cgccagcctc 3600
actttcaatc gcggctttaa ggccggacga aacatgcgca gaaagctttt cggagtcctc 3660
cggcttaaat gccattcgct ctttctcgat ctccaagtca attcgctgca gaccgtgtgc 3720
acgaacatct acaagatcct gctgctccaa gcctaccggt tccacgcttg cgtgcttcag 3780
ctgccgtttc accaacaggt gtggaagaac ccgaccttct ttctgcgggt cattagcgat 3840
actgcctccc tgtgttactc aatcctcaag gcaaagaacg ccggaatgtc gctgggtgcg 3900
aaaggagccg cgggacctct tcctagcgaa gcggtgcagt ggctctgcca ccaggctttc 3960
ctcctgaagc tgaccaggca cagagtgacc tacgtcccgc tgctgggctc gctgcgcact 4020
gcacagaccc agctgtctag aaaactcccc ggcaccaccc tgaccgctct ggaagccgcc 4080
gccaacccag cattgccgtc agatttcaag accatcttgg acggatccgg cacaatcctg 4140
tctgagggcg ccaccaactt cagcctgctg aaactggccg gcgacgtgga actgaaccct 4200
ggccctaccc ctggaaccca gagccccttc ttccttctgc tgctgctgac cgtgctgact 4260
gtcgtgacag gctctggcca cgccagctct acacctggcg gcgagaaaga gacaagcgcc 4320
acccagagaa gcagcgtgcc aagcagcacc gagaagaacg ccgtgtccat gaccagctcc 4380
gtgctgagca gccactctcc tggcagcggc agcagcacaa cacagggcca ggatgtgaca 4440
ctggcccctg ccacagaacc tgcctctgga tctgccgcca cctggggaca ggacgtgaca 4500
agcgtgccag tgaccagacc tgccctgggc tctacaacac cccctgccca cgatgtgacc 4560
agcgcccctg ataacaagcc tgcccctgga agcacagccc ctccagctca tggcgtgacc 4620
tctgccccag ataccagacc agccccagga tctacagccc cacccgcaca cggcgtgaca 4680
agtgcccctg acacaagacc cgctccaggc tctactgctc ctcctgccca tggcgtgaca 4740
agcgctcccg atacaaggcc agctcctggc tccacagcac caccagcaca tggcgtgaca 4800
tcagctcccg acactagacc tgctcccgga tcaaccgctc caccagctca cggcgtgacc 4860
agcgcacctg ataccagacc tgctctggga agcaccgccc ctcccgtgca caatgtgaca 4920
tctgcttccg gcagcgccag cggctctgcc tctacactgg tgcacaacgg caccagcgcc 4980
agagccacaa caaccccagc cagcaagagc acccccttca gcatccctag ccaccacagc 5040
gacaccccta ccacactggc cagccactcc accaagaccg atgcctctag cacccaccac 5100
tccagcgtgc cccctctgac cagcagcaac cacagcacaa gcccccagct gtctaccggc 5160
gtctcattct tctttctgtc cttccacatc agcaacctgc agttcaacag cagcctggaa 5220
gatcccagca ccgactacta ccaggaactg cagcgggata tcagcgagat gttcctgcaa 5280
atctacaagc agggcggctt cctgggcctg agcaacatca agttcagacc cggcagcgtg 5340
gtggtgcagc tgaccctggc tttccgggaa ggcaccatca acgtgcacga cgtggaaacc 5400
cagttcaacc agtacaagac cgaggccgcc agccggtaca acctgaccat ctccgatgtg 5460
tccgtgtccg acgtgccctt cccattctct gcccagtctg gcgcaggcgt gccaggatgg 5520
ggaattgctc tgctggtgct cgtgtgcgtg ctggtggccc tggccatcgt gtatctgatt 5580
gccctggccg tgtgccagtg ccggcggaag aattacggcc agctggacat cttccccgcc 5640
agagacacct accaccccat gagcgagtac cccacatacc acacccacgg cagatacgtg 5700
ccacccagct ccaccgacag atccccctac gagaaagtgt ctgccggcaa cggcggcagc 5760
tccctgagct acacaaatcc tgccgtggcc gctgcctccg ccaacctg 5808
<210> 66
<211> 1936
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 66
Met Ala Ser Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp
1 5 10 15
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
20 25 30
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
35 40 45
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
50 55 60
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
65 70 75 80
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
85 90 95
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
100 105 110
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
115 120 125
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
130 135 140
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
145 150 155 160
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
165 170 175
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
180 185 190
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
195 200 205
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
210 215 220
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
225 230 235 240
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
245 250 255
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
260 265 270
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
275 280 285
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
290 295 300
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
305 310 315 320
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
325 330 335
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
340 345 350
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
355 360 365
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
370 375 380
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
385 390 395 400
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
405 410 415
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
420 425 430
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
435 440 445
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
450 455 460
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
465 470 475 480
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
485 490 495
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
500 505 510
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
515 520 525
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
530 535 540
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
545 550 555 560
Gln Glu Ala Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
565 570 575
Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Phe Leu Leu Ser Ser Leu
580 585 590
Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu
595 600 605
Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu
610 615 620
Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly
625 630 635 640
Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro
645 650 655
Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys
660 665 670
Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg
675 680 685
Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr
690 695 700
Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp
705 710 715 720
Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe
725 730 735
Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp
740 745 750
Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val
755 760 765
Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala
770 775 780
Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg
785 790 795 800
Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe
805 810 815
Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg
820 825 830
Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val
835 840 845
Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg
850 855 860
Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr
865 870 875 880
Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu
885 890 895
Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala
900 905 910
Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile
915 920 925
His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro
930 935 940
Pro Pro Glu Leu Tyr Phe Val Lys Val Ala Ile Thr Gly Ala Tyr Asp
945 950 955 960
Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys
965 970 975
Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala
980 985 990
Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu
995 1000 1005
Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln
1010 1015 1020
Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser
1025 1030 1035
Ser Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg
1040 1045 1050
Phe Met Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val
1055 1060 1065
Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu
1070 1075 1080
Cys Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly
1085 1090 1095
Ile Arg Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu
1100 1105 1110
Leu Val Thr Pro His Leu Thr His Ala Lys Thr Phe Leu Arg Thr
1115 1120 1125
Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg
1130 1135 1140
Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly
1145 1150 1155
Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys
1160 1165 1170
Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr
1175 1180 1185
Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn
1190 1195 1200
Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly
1205 1210 1215
Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val
1220 1225 1230
Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu
1235 1240 1245
Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe
1250 1255 1260
His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile
1265 1270 1275
Ser Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn
1280 1285 1290
Ala Gly Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro
1295 1300 1305
Ser Glu Ala Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys
1310 1315 1320
Leu Thr Arg His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu
1325 1330 1335
Arg Thr Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr
1340 1345 1350
Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp
1355 1360 1365
Phe Lys Thr Ile Leu Asp Gly Ser Gly Thr Ile Leu Ser Glu Gly
1370 1375 1380
Ala Thr Asn Phe Ser Leu Leu Lys Leu Ala Gly Asp Val Glu Leu
1385 1390 1395
Asn Pro Gly Pro Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu
1400 1405 1410
Leu Leu Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala
1415 1420 1425
Ser Ser Thr Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg
1430 1435 1440
Ser Ser Val Pro Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr
1445 1450 1455
Ser Ser Val Leu Ser Ser His Ser Pro Gly Ser Gly Ser Ser Thr
1460 1465 1470
Thr Gln Gly Gln Asp Val Thr Leu Ala Pro Ala Thr Glu Pro Ala
1475 1480 1485
Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val Thr Ser Val Pro
1490 1495 1500
Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala His Asp
1505 1510 1515
Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr Ala
1520 1525 1530
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala
1535 1540 1545
Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
1550 1555 1560
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly
1565 1570 1575
Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
1580 1585 1590
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala
1595 1600 1605
Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
1610 1615 1620
Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn
1625 1630 1635
Val Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu
1640 1645 1650
Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser
1655 1660 1665
Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro
1670 1675 1680
Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr
1685 1690 1695
His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser Thr
1700 1705 1710
Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe
1715 1720 1725
His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser
1730 1735 1740
Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe
1745 1750 1755
Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile
1760 1765 1770
Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe
1775 1780 1785
Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn
1790 1795 1800
Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser
1805 1810 1815
Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser
1820 1825 1830
Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val
1835 1840 1845
Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala
1850 1855 1860
Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe
1865 1870 1875
Pro Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr
1880 1885 1890
His Thr His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser
1895 1900 1905
Pro Tyr Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser
1910 1915 1920
Tyr Thr Asn Pro Ala Val Ala Ala Ala Ser Ala Asn Leu
1925 1930 1935
<210> 67
<211> 84
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 67
ggatccggca gaatcttcaa cgcccactac gccggctact tcgccgacct gctgatccac 60
gacatcgaga caaaccctgg cccc 84
<210> 68
<211> 28
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 68
Gly Ser Gly Arg Ile Phe Asn Ala His Tyr Ala Gly Tyr Phe Ala Asp
1 5 10 15
Leu Leu Ile His Asp Ile Glu Thr Asn Pro Gly Pro
20 25
<210> 69
<211> 63
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 69
ggatccggcg agggcagagg cagcctgctg acatgtggcg acgtggaaga gaaccctggc 60
ccc 63
<210> 70
<211> 21
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 70
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20
<210> 71
<211> 84
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 71
ggatccggca caatcctgtc tgagggcgcc accaacttca gcctgctgaa actggccggc 60
gacgtggaac tgaaccctgg ccct 84
<210> 72
<211> 28
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 72
Gly Ser Gly Thr Ile Leu Ser Glu Gly Ala Thr Asn Phe Ser Leu Leu
1 5 10 15
Lys Leu Ala Gly Asp Val Glu Leu Asn Pro Gly Pro
20 25
<210> 73
<211> 66
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 73
ggatccggcg ccaccaattt cagcctgctg aaacaggccg gcgacgtgga agagaaccct 60
ggccct 66
<210> 74
<211> 22
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 74
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 75
<211> 43
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 75
gagacaaacc ctggccccct ggctggcgag acaggacagg aag 43
<210> 76
<211> 46
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 76
gttgaagatt ctgccggatc ccaggttggc ggaggcagcg gccacg 46
<210> 77
<211> 47
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 77
gctacttcgc cgacctgctg atccacgaca tcgagacaaa ccctggc 47
<210> 78
<211> 47
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 78
ggtcggcgaa gtagccggcg tagtgggcgt tgaagattct gccggat 47
<210> 79
<211> 24
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 79
ttctgaagat gagccccgag gaca 24
<210> 80
<211> 24
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 80
cggcgtctca ttcttctttc tgtc 24
<210> 81
<211> 46
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 81
accctgtgac gaacatggct agcctggctg gcgagacagg acagga 46
<210> 82
<211> 43
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 82
accctgtgac gaacatggct agcacaggct ctggccacgc cag 43
<210> 83
<211> 42
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 83
accctgtgac gaacatggct agcacccctg gaacccagag cc 42
<210> 84
<211> 42
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 84
accctgtgac gaacatggct agcggagctg ccccggagcc gg 42
<210> 85
<211> 24
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 85
tctcaccgac ctccagcctt acat 24
<210> 86
<211> 37
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 86
acggaggctc cggcggactg gctggcgaga caggaca 37
<210> 87
<211> 36
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 87
tgggaggctc cggcggagga gctgccccgg agccgg 36
<210> 88
<211> 56
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 88
cctgctgatc cacgacatcg agacaaaccc tggccccacc cctggaaccc agagcc 56
<210> 89
<211> 52
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 89
tggccggcga cgtggaactg aaccctggcc ctacaggctc tggccacgcc ag 52
<210> 90
<211> 51
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 90
tggccggcga cgtggaactg aaccctggcc ctacccctgg aacccagagc c 51
<210> 91
<211> 54
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 91
tggccggcga cgtggaactg aaccctggcc ctagcttcct cctgtcgtcg ctca 54
<210> 92
<211> 51
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 92
tggccggcga cgtggaactg aaccctggcc ctggagctgc cccggagccg g 51
<210> 93
<211> 56
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 93
tggccggcga cgtggaactg aaccctggcc ctgccaaatt tctgcattgg ctgatg 56
<210> 94
<211> 43
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 94
tggaagagaa ccctggccct ctggctggcg agacaggaca gga 43
<210> 95
<211> 39
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 95
tggaagagaa ccctggccct acccctggaa cccagagcc 39
<210> 96
<211> 49
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 96
gcgacgtgga agagaaccct ggccccctgg ctggcgagac aggacagga 49
<210> 97
<211> 48
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 97
gcgacgtgga agagaaccct ggccccagct tcctcctgtc gtcgctca 48
<210> 98
<211> 50
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 98
gcgacgtgga agagaaccct ggccccgcca aatttctgca ttggctgatg 50
<210> 99
<211> 45
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 99
gcgacgtgga agagaaccct ggccccggag ctgccccgga gccgg 45
<210> 100
<211> 59
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 100
agaatcttca acgcccacta cgccggctac ttcgccgacc tgctgatcca cgacatcga 59
<210> 101
<211> 56
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 101
tgtctgaggg cgccaccaac ttcagcctgc tgaaactggc cggcgacgtg gaactg 56
<210> 102
<211> 48
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 102
ttcagcctgc tgaaacaggc cggcgacgtg gaagagaacc ctggccct 48
<210> 103
<211> 54
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 103
ccggcgaggg cagaggcagc ctgctgacat gtggcgacgt ggaagagaac cctg 54
<210> 104
<211> 45
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 104
gggcccagat cttcacaggg cttcctgcat gctcaggtcc agcac 45
<210> 105
<211> 39
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 105
acgaacatgg ctagcacccc tggaacccag agccccttc 39
<210> 106
<211> 50
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 106
gtgggcgttg aagattctgc cggatcccag ggcttcctgc atgctcaggt 50
<210> 107
<211> 53
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 107
tggtggcgcc ctcagacagg attgtgccgg atcccaggtt ggcggaggca gcg 53
<210> 108
<211> 58
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 108
tggtggcgcc ctcagacagg attgtgccgg atccgtccaa gatggtcttg aaatctga 58
<210> 109
<211> 38
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 109
tccgccggag cctcccaggg cttcctgcat gctcaggt 38
<210> 110
<211> 34
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 110
tccgccggag cctcccaggt tggcggaggc agcg 34
<210> 111
<211> 39
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 111
tccgccggag cctccgtcca agatggtctt gaaatctga 39
<210> 112
<211> 19
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 112
tgtcctcggg gctcatctt 19
<210> 113
<211> 24
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 113
aaggacagaa agaagaatga gacg 24
<210> 114
<211> 48
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 114
ttgttttgtt agggcccaga tcttcacagg gcttcctgca tgctcagg 48
<210> 115
<211> 45
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 115
ttgttttgtt agggcccaga tcttcacagg ttggcggagg cagcg 45
<210> 116
<211> 50
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 116
ttgttttgtt agggcccaga tcttcagtcc aagatggtct tgaaatctga 50
<210> 117
<211> 59
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 117
ctgtttcagc aggctgaaat tggtggcgcc ggatcccagg gcttcctgca tgctcaggt 59
<210> 118
<211> 55
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 118
ctgtttcagc aggctgaaat tggtggcgcc ggatcccagg ttggcggagg cagcg 55
<210> 119
<211> 45
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 119
tgcctctgcc ctcgccggat cccagggctt cctgcatgct caggt 45
<210> 120
<211> 46
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 120
tgcctctgcc ctcgccggat ccgtccaaga tggtcttgaa atctga 46
<210> 121
<211> 24
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 121
aggctggagg tcggtgagag tgga 24
<210> 122
<211> 57
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 122
agggttctct tccacgtcgc cacatgtcag caggctgcct ctgccctcgc cggatcc 57
<210> 123
<211> 41
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 123
acgaacatgg ctagcttcct cctgtcgtcg ctcagaccga g 41
<210> 124
<211> 47
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 124
ttgttttgtt agggcccaga tcttcagtcc aagatggtct tgaaatc 47
<210> 125
<211> 41
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 125
acgaacatgg ctagcgccaa atttctgcat tggctgatgt c 41
<210> 126
<211> 47
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 126
ttgttttgtt agggcccaga tcttcagtcc aagatggtct tgaaatc 47
<210> 127
<211> 39
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 127
accctgtgac gaacatggga gctgccccgg agccggaga 39
<210> 128
<211> 32
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 128
caacaagcta gcctggctgg cgagacagga ca 32
<210> 129
<211> 36
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 129
caacaaagat ctttacaggg cttcctgcat gcacag 36
<210> 130
<211> 23
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 130
accctgtgac gaacatggct agc 23
<210> 131
<211> 17
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 131
agatctgggc cctaaca 17
<210> 132
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 132
Met Ala Ser Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu
1 5 10 15
<210> 133
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 133
Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
<210> 134
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 134
Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr Val Leu Thr
1 5 10 15
<210> 135
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 135
Phe Phe Leu Leu Leu Leu Leu Thr Val Leu Thr Val Val Thr Gly
1 5 10 15
<210> 136
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 136
Leu Leu Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala
1 5 10 15
<210> 137
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 137
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro
1 5 10 15
<210> 138
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 138
Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly Glu Lys
1 5 10 15
<210> 139
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 139
Gly His Ala Ser Ser Thr Pro Gly Gly Glu Lys Glu Thr Ser Ala
1 5 10 15
<210> 140
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 140
Ser Thr Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser
1 5 10 15
<210> 141
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 141
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser
1 5 10 15
<210> 142
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 142
Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr Glu Lys
1 5 10 15
<210> 143
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 143
Gln Arg Ser Ser Val Pro Ser Ser Thr Glu Lys Asn Ala Val Ser
1 5 10 15
<210> 144
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 144
Val Pro Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser
1 5 10 15
<210> 145
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 145
Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser
1 5 10 15
<210> 146
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 146
Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro Gly
1 5 10 15
<210> 147
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 147
Thr Ser Ser Val Leu Ser Ser His Ser Pro Gly Ser Gly Ser Ser
1 5 10 15
<210> 148
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 148
Leu Ser Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly
1 5 10 15
<210> 149
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 149
Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr
1 5 10 15
<210> 150
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 150
Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro Ala
1 5 10 15
<210> 151
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 151
Thr Gln Gly Gln Asp Val Thr Leu Ala Pro Ala Thr Glu Pro Ala
1 5 10 15
<210> 152
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 152
Asp Val Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala
1 5 10 15
<210> 153
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 153
Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly
1 5 10 15
<210> 154
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 154
Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val Thr
1 5 10 15
<210> 155
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 155
Gly Ser Ala Ala Thr Trp Gly Gln Asp Val Thr Ser Val Pro Val
1 5 10 15
<210> 156
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 156
Thr Trp Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala
1 5 10 15
<210> 157
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 157
Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr
1 5 10 15
<210> 158
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 158
Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala
1 5 10 15
<210> 159
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 159
Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala His Asp Val Thr
1 5 10 15
<210> 160
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 160
Gly Ser Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp
1 5 10 15
<210> 161
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 161
Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala
1 5 10 15
<210> 162
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 162
Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr
1 5 10 15
<210> 163
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 163
Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala
1 5 10 15
<210> 164
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 164
Lys Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr
1 5 10 15
<210> 165
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 165
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp
1 5 10 15
<210> 166
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 166
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala
1 5 10 15
<210> 167
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 167
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr
1 5 10 15
<210> 168
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 168
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala
1 5 10 15
<210> 169
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 169
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr
1 5 10 15
<210> 170
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 170
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Leu Gly Ser Thr
1 5 10 15
<210> 171
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 171
Ala Pro Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val
1 5 10 15
<210> 172
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 172
Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr
1 5 10 15
<210> 173
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 173
Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala Ser Gly
1 5 10 15
<210> 174
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 174
Pro Pro Val His Asn Val Thr Ser Ala Ser Gly Ser Ala Ser Gly
1 5 10 15
<210> 175
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 175
Asn Val Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr
1 5 10 15
<210> 176
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 176
Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn
1 5 10 15
<210> 177
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 177
Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala
1 5 10 15
<210> 178
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 178
Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr
1 5 10 15
<210> 179
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 179
Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser
1 5 10 15
<210> 180
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 180
Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro
1 5 10 15
<210> 181
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 181
Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro
1 5 10 15
<210> 182
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 182
Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser
1 5 10 15
<210> 183
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 183
Ser Thr Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr
1 5 10 15
<210> 184
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 184
Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser
1 5 10 15
<210> 185
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 185
His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys
1 5 10 15
<210> 186
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 186
Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser
1 5 10 15
<210> 187
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 187
Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His
1 5 10 15
<210> 188
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 188
Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro
1 5 10 15
<210> 189
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 189
Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro Leu Thr Ser
1 5 10 15
<210> 190
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 190
Thr His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser
1 5 10 15
<210> 191
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 191
Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln
1 5 10 15
<210> 192
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 192
Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly
1 5 10 15
<210> 193
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 193
Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe
1 5 10 15
<210> 194
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 194
Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe
1 5 10 15
<210> 195
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 195
Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn
1 5 10 15
<210> 196
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 196
Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn
1 5 10 15
<210> 197
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 197
Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu
1 5 10 15
<210> 198
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 198
Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr
1 5 10 15
<210> 199
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 199
Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln
1 5 10 15
<210> 200
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 200
Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg
1 5 10 15
<210> 201
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 201
Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu
1 5 10 15
<210> 202
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 202
Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln
1 5 10 15
<210> 203
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 203
Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln
1 5 10 15
<210> 204
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 204
Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu
1 5 10 15
<210> 205
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 205
Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn
1 5 10 15
<210> 206
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 206
Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg
1 5 10 15
<210> 207
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 207
Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val
1 5 10 15
<210> 208
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 208
Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu
1 5 10 15
<210> 209
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 209
Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe
1 5 10 15
<210> 210
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 210
Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr
1 5 10 15
<210> 211
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 211
Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn
1 5 10 15
<210> 212
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 212
Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp
1 5 10 15
<210> 213
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 213
Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln
1 5 10 15
<210> 214
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 214
Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr
1 5 10 15
<210> 215
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 215
Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala
1 5 10 15
<210> 216
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 216
Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr
1 5 10 15
<210> 217
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 217
Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile
1 5 10 15
<210> 218
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 218
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser
1 5 10 15
<210> 219
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 219
Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp Val
1 5 10 15
<210> 220
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 220
Leu Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe
1 5 10 15
<210> 221
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 221
Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser
1 5 10 15
<210> 222
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 222
Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val
1 5 10 15
<210> 223
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 223
Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly Trp Gly
1 5 10 15
<210> 224
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 224
Ala Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu
1 5 10 15
<210> 225
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 225
Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys
1 5 10 15
<210> 226
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 226
Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala
1 5 10 15
<210> 227
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 227
Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu Ala Ile Val
1 5 10 15
<210> 228
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 228
Leu Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala
1 5 10 15
<210> 229
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 229
Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys
1 5 10 15
<210> 230
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 230
Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg
1 5 10 15
<210> 231
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 231
Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly
1 5 10 15
<210> 232
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 232
Ala Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile
1 5 10 15
<210> 233
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 233
Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg
1 5 10 15
<210> 234
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 234
Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg Asp Thr Tyr His
1 5 10 15
<210> 235
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 235
Leu Asp Ile Phe Pro Ala Arg Asp Thr Tyr His Pro Met Ser Glu
1 5 10 15
<210> 236
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 236
Pro Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr
1 5 10 15
<210> 237
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 237
Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly
1 5 10 15
<210> 238
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 238
Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg Tyr Val Pro
1 5 10 15
<210> 239
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 239
Pro Thr Tyr His Thr His Gly Arg Tyr Val Pro Pro Ser Ser Thr
1 5 10 15
<210> 240
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 240
Thr His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro
1 5 10 15
<210> 241
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 241
Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val
1 5 10 15
<210> 242
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 242
Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val Ser Ala Gly Asn
1 5 10 15
<210> 243
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 243
Arg Ser Pro Tyr Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser
1 5 10 15
<210> 244
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 244
Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr
1 5 10 15
<210> 245
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 245
Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val
1 5 10 15
<210> 246
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 246
Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val Ala Ala Ala Ser
1 5 10 15
<210> 247
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 247
Leu Ser Tyr Thr Asn Pro Ala Val Ala Ala Ala Ser Ala Asn Leu
1 5 10 15
<210> 248
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 248
Met Ala Ser Leu Pro Thr Ala Arg Pro Leu Leu Gly Ser Cys Gly
1 5 10 15
<210> 249
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 249
Thr Ala Arg Pro Leu Leu Gly Ser Cys Gly Thr Pro Ala Leu Gly
1 5 10 15
<210> 250
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 250
Leu Leu Gly Ser Cys Gly Thr Pro Ala Leu Gly Ser Leu Leu Phe
1 5 10 15
<210> 251
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 251
Cys Gly Thr Pro Ala Leu Gly Ser Leu Leu Phe Leu Leu Phe Ser
1 5 10 15
<210> 252
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 252
Ala Leu Gly Ser Leu Leu Phe Leu Leu Phe Ser Leu Gly Trp Val
1 5 10 15
<210> 253
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 253
Leu Leu Phe Leu Leu Phe Ser Leu Gly Trp Val Gln Pro Ser Arg
1 5 10 15
<210> 254
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 254
Leu Phe Ser Leu Gly Trp Val Gln Pro Ser Arg Thr Leu Ala Gly
1 5 10 15
<210> 255
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 255
Gly Trp Val Gln Pro Ser Arg Thr Leu Ala Gly Glu Thr Gly Gln
1 5 10 15
<210> 256
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 256
Pro Ser Arg Thr Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro
1 5 10 15
<210> 257
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 257
Thr Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu Asp Gly
1 5 10 15
<210> 258
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 258
Thr Gly Gln Glu Ala Ala Pro Leu Asp Gly Val Leu Ala Asn Pro
1 5 10 15
<210> 259
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 259
Ala Ala Pro Leu Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser
1 5 10 15
<210> 260
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 260
Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro
1 5 10 15
<210> 261
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 261
Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln Leu Leu
1 5 10 15
<210> 262
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 262
Asn Ile Ser Ser Leu Ser Pro Arg Gln Leu Leu Gly Phe Pro Cys
1 5 10 15
<210> 263
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 263
Leu Ser Pro Arg Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser
1 5 10 15
<210> 264
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 264
Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr
1 5 10 15
<210> 265
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 265
Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg Val Arg
1 5 10 15
<210> 266
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 266
Glu Val Ser Gly Leu Ser Thr Glu Arg Val Arg Glu Leu Ala Val
1 5 10 15
<210> 267
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 267
Leu Ser Thr Glu Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln
1 5 10 15
<210> 268
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 268
Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys
1 5 10 15
<210> 269
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 269
Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser Thr Glu
1 5 10 15
<210> 270
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 270
Leu Ala Gln Lys Asn Val Lys Leu Ser Thr Glu Gln Leu Arg Cys
1 5 10 15
<210> 271
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 271
Asn Val Lys Leu Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg
1 5 10 15
<210> 272
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 272
Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro
1 5 10 15
<210> 273
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 273
Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu Asp Leu
1 5 10 15
<210> 274
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 274
Ala His Arg Leu Ser Glu Pro Pro Glu Asp Leu Asp Ala Leu Pro
1 5 10 15
<210> 275
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 275
Ser Glu Pro Pro Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu
1 5 10 15
<210> 276
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 276
Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn
1 5 10 15
<210> 277
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 277
Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp Ala Phe
1 5 10 15
<210> 278
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 278
Asp Leu Leu Leu Phe Leu Asn Pro Asp Ala Phe Ser Gly Pro Gln
1 5 10 15
<210> 279
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 279
Phe Leu Asn Pro Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg
1 5 10 15
<210> 280
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 280
Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg
1 5 10 15
<210> 281
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 281
Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr Lys Ala
1 5 10 15
<210> 282
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 282
Cys Thr Arg Phe Phe Ser Arg Ile Thr Lys Ala Asn Val Asp Leu
1 5 10 15
<210> 283
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 283
Phe Ser Arg Ile Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly
1 5 10 15
<210> 284
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 284
Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg
1 5 10 15
<210> 285
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 285
Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg Leu Leu
1 5 10 15
<210> 286
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 286
Pro Arg Gly Ala Pro Glu Arg Gln Arg Leu Leu Pro Ala Ala Leu
1 5 10 15
<210> 287
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 287
Pro Glu Arg Gln Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly
1 5 10 15
<210> 288
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 288
Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser
1 5 10 15
<210> 289
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 289
Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu Ser Glu
1 5 10 15
<210> 290
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 290
Cys Trp Gly Val Arg Gly Ser Leu Leu Ser Glu Ala Asp Val Arg
1 5 10 15
<210> 291
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 291
Arg Gly Ser Leu Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly
1 5 10 15
<210> 292
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 292
Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp
1 5 10 15
<210> 293
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 293
Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro Gly Arg
1 5 10 15
<210> 294
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 294
Leu Gly Gly Leu Ala Cys Asp Leu Pro Gly Arg Phe Val Ala Glu
1 5 10 15
<210> 295
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 295
Ala Cys Asp Leu Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val
1 5 10 15
<210> 296
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 296
Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg
1 5 10 15
<210> 297
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 297
Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val Ser Cys
1 5 10 15
<210> 298
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 298
Ala Glu Val Leu Leu Pro Arg Leu Val Ser Cys Pro Gly Pro Leu
1 5 10 15
<210> 299
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 299
Leu Pro Arg Leu Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln
1 5 10 15
<210> 300
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 300
Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala
1 5 10 15
<210> 301
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 301
Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala Ala Leu
1 5 10 15
<210> 302
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 302
Gln Asp Gln Gln Glu Ala Ala Arg Ala Ala Leu Gln Gly Gly Gly
1 5 10 15
<210> 303
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 303
Glu Ala Ala Arg Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly
1 5 10 15
<210> 304
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 304
Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr
1 5 10 15
<210> 305
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 305
Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser Val Ser
1 5 10 15
<210> 306
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 306
Pro Tyr Gly Pro Pro Ser Thr Trp Ser Val Ser Thr Met Asp Ala
1 5 10 15
<210> 307
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 307
Pro Ser Thr Trp Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu
1 5 10 15
<210> 308
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 308
Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu
1 5 10 15
<210> 309
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 309
Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln Pro Ile
1 5 10 15
<210> 310
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 310
Arg Gly Leu Leu Pro Val Leu Gly Gln Pro Ile Ile Arg Ser Ile
1 5 10 15
<210> 311
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 311
Pro Val Leu Gly Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile
1 5 10 15
<210> 312
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 312
Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp
1 5 10 15
<210> 313
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 313
Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln Arg Ser
1 5 10 15
<210> 314
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 314
Gln Gly Ile Val Ala Ala Trp Arg Gln Arg Ser Ser Arg Asp Pro
1 5 10 15
<210> 315
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 315
Ala Ala Trp Arg Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln
1 5 10 15
<210> 316
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 316
Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr
1 5 10 15
<210> 317
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 317
Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu Arg Pro
1 5 10 15
<210> 318
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 318
Trp Arg Gln Pro Glu Arg Thr Ile Leu Arg Pro Arg Phe Arg Arg
1 5 10 15
<210> 319
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 319
Glu Arg Thr Ile Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys
1 5 10 15
<210> 320
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 320
Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro
1 5 10 15
<210> 321
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 321
Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly Lys Lys
1 5 10 15
<210> 322
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 322
Val Glu Lys Thr Ala Cys Pro Ser Gly Lys Lys Ala Arg Glu Ile
1 5 10 15
<210> 323
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 323
Ala Cys Pro Ser Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu
1 5 10 15
<210> 324
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 324
Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys
1 5 10 15
<210> 325
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 325
Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp Glu Leu
1 5 10 15
<210> 326
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 326
Glu Ser Leu Ile Phe Tyr Lys Lys Trp Glu Leu Glu Ala Cys Val
1 5 10 15
<210> 327
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 327
Phe Tyr Lys Lys Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu
1 5 10 15
<210> 328
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 328
Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln
1 5 10 15
<210> 329
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 329
Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp Arg Val
1 5 10 15
<210> 330
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 330
Ala Ala Leu Leu Ala Thr Gln Met Asp Arg Val Asn Ala Ile Pro
1 5 10 15
<210> 331
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 331
Ala Thr Gln Met Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu
1 5 10 15
<210> 332
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 332
Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val
1 5 10 15
<210> 333
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 333
Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys His Lys
1 5 10 15
<210> 334
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 334
Thr Tyr Glu Gln Leu Asp Val Leu Lys His Lys Leu Asp Glu Leu
1 5 10 15
<210> 335
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 335
Leu Asp Val Leu Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly
1 5 10 15
<210> 336
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 336
Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser
1 5 10 15
<210> 337
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 337
Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile Gln His
1 5 10 15
<210> 338
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 338
Pro Gln Gly Tyr Pro Glu Ser Val Ile Gln His Leu Gly Tyr Leu
1 5 10 15
<210> 339
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 339
Pro Glu Ser Val Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met
1 5 10 15
<210> 340
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 340
Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp
1 5 10 15
<210> 341
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 341
Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg Lys Trp
1 5 10 15
<210> 342
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 342
Leu Lys Met Ser Pro Glu Asp Ile Arg Lys Trp Asn Val Thr Ser
1 5 10 15
<210> 343
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 343
Pro Glu Asp Ile Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu
1 5 10 15
<210> 344
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 344
Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu
1 5 10 15
<210> 345
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 345
Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val Asn Lys
1 5 10 15
<210> 346
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 346
Glu Thr Leu Lys Ala Leu Leu Glu Val Asn Lys Gly His Glu Met
1 5 10 15
<210> 347
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 347
Ala Leu Leu Glu Val Asn Lys Gly His Glu Met Ser Pro Gln Val
1 5 10 15
<210> 348
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 348
Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile
1 5 10 15
<210> 349
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 349
His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg Phe Val
1 5 10 15
<210> 350
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 350
Pro Gln Val Ala Thr Leu Ile Asp Arg Phe Val Lys Gly Arg Gly
1 5 10 15
<210> 351
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 351
Thr Leu Ile Asp Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys
1 5 10 15
<210> 352
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 352
Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp
1 5 10 15
<210> 353
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 353
Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu Thr Ala
1 5 10 15
<210> 354
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 354
Leu Asp Lys Asp Thr Leu Asp Thr Leu Thr Ala Phe Tyr Pro Gly
1 5 10 15
<210> 355
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 355
Thr Leu Asp Thr Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser
1 5 10 15
<210> 356
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 356
Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu
1 5 10 15
<210> 357
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 357
Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu Ser Ser
1 5 10 15
<210> 358
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 358
Leu Cys Ser Leu Ser Pro Glu Glu Leu Ser Ser Val Pro Pro Ser
1 5 10 15
<210> 359
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 359
Ser Pro Glu Glu Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala
1 5 10 15
<210> 360
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 360
Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln
1 5 10 15
<210> 361
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 361
Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu Asp Thr
1 5 10 15
<210> 362
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 362
Ile Trp Ala Val Arg Pro Gln Asp Leu Asp Thr Cys Asp Pro Arg
1 5 10 15
<210> 363
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 363
Arg Pro Gln Asp Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp Val
1 5 10 15
<210> 364
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 364
Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys
1 5 10 15
<210> 365
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 365
Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg Leu Ala
1 5 10 15
<210> 366
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 366
Leu Asp Val Leu Tyr Pro Lys Ala Arg Leu Ala Phe Gln Asn Met
1 5 10 15
<210> 367
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 367
Tyr Pro Lys Ala Arg Leu Ala Phe Gln Asn Met Asn Gly Ser Glu
1 5 10 15
<210> 368
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 368
Arg Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys
1 5 10 15
<210> 369
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 369
Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln Ser Phe
1 5 10 15
<210> 370
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 370
Gly Ser Glu Tyr Phe Val Lys Ile Gln Ser Phe Leu Gly Gly Ala
1 5 10 15
<210> 371
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 371
Phe Val Lys Ile Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp
1 5 10 15
<210> 372
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 372
Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu
1 5 10 15
<210> 373
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 373
Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln Gln Asn
1 5 10 15
<210> 374
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 374
Thr Glu Asp Leu Lys Ala Leu Ser Gln Gln Asn Val Ser Met Asp
1 5 10 15
<210> 375
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 375
Lys Ala Leu Ser Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe
1 5 10 15
<210> 376
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 376
Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg
1 5 10 15
<210> 377
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 377
Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp Ala Val
1 5 10 15
<210> 378
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 378
Ala Thr Phe Met Lys Leu Arg Thr Asp Ala Val Leu Pro Leu Thr
1 5 10 15
<210> 379
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 379
Lys Leu Arg Thr Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val
1 5 10 15
<210> 380
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 380
Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu
1 5 10 15
<210> 381
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 381
Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro His Val
1 5 10 15
<210> 382
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 382
Ala Glu Val Gln Lys Leu Leu Gly Pro His Val Glu Gly Leu Lys
1 5 10 15
<210> 383
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 383
Lys Leu Leu Gly Pro His Val Glu Gly Leu Lys Ala Glu Glu Arg
1 5 10 15
<210> 384
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 384
Pro His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val
1 5 10 15
<210> 385
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 385
Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp Trp Ile
1 5 10 15
<210> 386
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 386
Glu Glu Arg His Arg Pro Val Arg Asp Trp Ile Leu Arg Gln Arg
1 5 10 15
<210> 387
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 387
Arg Pro Val Arg Asp Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu
1 5 10 15
<210> 388
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 388
Asp Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly
1 5 10 15
<210> 389
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 389
Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly Leu Gln
1 5 10 15
<210> 390
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 390
Asp Asp Leu Asp Thr Leu Gly Leu Gly Leu Gln Gly Gly Ile Pro
1 5 10 15
<210> 391
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 391
Thr Leu Gly Leu Gly Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu
1 5 10 15
<210> 392
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 392
Gly Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu
1 5 10 15
<210> 393
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 393
Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met Gln Glu
1 5 10 15
<210> 394
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 394
Tyr Leu Val Leu Asp Leu Ser Met Gln Glu Ala Leu Ser Gly Thr
1 5 10 15
<210> 395
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 395
Leu Asp Leu Ser Met Gln Glu Ala Leu Ser Gly Thr Pro Cys Leu
1 5 10 15
<210> 396
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 396
Met Gln Glu Ala Leu Ser Gly Thr Pro Cys Leu Leu Gly Pro Gly
1 5 10 15
<210> 397
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 397
Leu Ser Gly Thr Pro Cys Leu Leu Gly Pro Gly Pro Val Leu Thr
1 5 10 15
<210> 398
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 398
Pro Cys Leu Leu Gly Pro Gly Pro Val Leu Thr Val Leu Ala Leu
1 5 10 15
<210> 399
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 399
Gly Pro Gly Pro Val Leu Thr Val Leu Ala Leu Leu Leu Ala Ser
1 5 10 15
<210> 400
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 400
Pro Val Leu Thr Val Leu Ala Leu Leu Leu Ala Ser Thr Leu Ala
1 5 10 15
<210> 401
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 401
Arg Arg Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln
1 5 10 15
<210> 402
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 402
Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gln Gly Ser Trp Ala
1 5 10 15
<210> 403
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 403
Glu Arg Thr Pro Val Gly Gln Gly Ser Trp Ala His Pro Gly Arg
1 5 10 15
<210> 404
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 404
Val Gly Gln Gly Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro
1 5 10 15
<210> 405
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 405
Ser Trp Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly
1 5 10 15
<210> 406
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 406
Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val Val
1 5 10 15
<210> 407
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 407
Arg Gly Pro Ser Asp Arg Gly Phe Cys Val Val Ser Pro Ala Arg
1 5 10 15
<210> 408
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 408
Asp Arg Gly Phe Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu
1 5 10 15
<210> 409
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 409
Cys Val Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu
1 5 10 15
<210> 410
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 410
Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu
1 5 10 15
<210> 411
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 411
Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala Leu Ser Gly Thr Arg
1 5 10 15
<210> 412
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 412
Thr Ser Leu Glu Gly Ala Leu Ser Gly Thr Arg His Ser His Pro
1 5 10 15
<210> 413
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 413
Gly Ala Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg
1 5 10 15
<210> 414
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 414
Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gln His His Ala
1 5 10 15
<210> 415
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 415
Ser His Pro Ser Val Gly Arg Gln His His Ala Gly Pro Pro Ser
1 5 10 15
<210> 416
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 416
Val Gly Arg Gln His His Ala Gly Pro Pro Ser Thr Ser Arg Pro
1 5 10 15
<210> 417
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 417
His His Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp
1 5 10 15
<210> 418
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 418
Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys
1 5 10 15
<210> 419
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 419
Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro Cys Pro Pro Val Tyr
1 5 10 15
<210> 420
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 420
Arg Pro Trp Asp Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys
1 5 10 15
<210> 421
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 421
Thr Pro Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr
1 5 10 15
<210> 422
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 422
Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser Gly Asp
1 5 10 15
<210> 423
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 423
Glu Thr Lys His Phe Leu Tyr Ser Ser Gly Asp Lys Glu Gln Leu
1 5 10 15
<210> 424
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 424
Phe Leu Tyr Ser Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe
1 5 10 15
<210> 425
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 425
Ser Gly Asp Lys Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser
1 5 10 15
<210> 426
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 426
Glu Gln Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser
1 5 10 15
<210> 427
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 427
Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro Ser Leu Thr Gly Ala
1 5 10 15
<210> 428
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 428
Leu Ser Ser Leu Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val
1 5 10 15
<210> 429
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 429
Arg Pro Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe
1 5 10 15
<210> 430
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 430
Thr Gly Ala Arg Arg Leu Val Glu Thr Ile Phe Leu Gly Ser Arg
1 5 10 15
<210> 431
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 431
Arg Leu Val Glu Thr Ile Phe Leu Gly Ser Arg Pro Trp Met Pro
1 5 10 15
<210> 432
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 432
Thr Ile Phe Leu Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg
1 5 10 15
<210> 433
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 433
Gly Ser Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg
1 5 10 15
<210> 434
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 434
Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg
1 5 10 15
<210> 435
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 435
Thr Pro Arg Arg Leu Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met
1 5 10 15
<210> 436
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 436
Leu Pro Arg Leu Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe
1 5 10 15
<210> 437
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 437
Pro Gln Arg Tyr Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu
1 5 10 15
<210> 438
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 438
Trp Gln Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His Ala
1 5 10 15
<210> 439
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 439
Pro Leu Phe Leu Glu Leu Leu Gly Asn His Ala Gln Cys Pro Tyr
1 5 10 15
<210> 440
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 440
Glu Leu Leu Gly Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu
1 5 10 15
<210> 441
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 441
Asn His Ala Gln Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys
1 5 10 15
<210> 442
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 442
Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg Ala
1 5 10 15
<210> 443
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 443
Val Leu Leu Lys Thr His Cys Pro Leu Arg Ala Ala Val Thr Pro
1 5 10 15
<210> 444
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 444
Thr His Cys Pro Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val
1 5 10 15
<210> 445
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 445
Leu Arg Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu
1 5 10 15
<210> 446
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 446
Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gln Gly
1 5 10 15
<210> 447
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 447
Ala Gly Val Cys Ala Arg Glu Lys Pro Gln Gly Ser Val Ala Ala
1 5 10 15
<210> 448
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 448
Ala Arg Glu Lys Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu
1 5 10 15
<210> 449
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 449
Pro Gln Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro
1 5 10 15
<210> 450
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 450
Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu Val
1 5 10 15
<210> 451
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 451
Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu Val Gln Leu Leu Arg
1 5 10 15
<210> 452
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 452
Thr Asp Pro Arg Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser
1 5 10 15
<210> 453
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 453
Arg Leu Val Gln Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val
1 5 10 15
<210> 454
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 454
Leu Leu Arg Gln His Ser Ser Pro Trp Gln Val Tyr Gly Phe Val
1 5 10 15
<210> 455
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 455
His Ser Ser Pro Trp Gln Val Tyr Gly Phe Val Arg Ala Cys Leu
1 5 10 15
<210> 456
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 456
Trp Gln Val Tyr Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val
1 5 10 15
<210> 457
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 457
Gly Phe Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu
1 5 10 15
<210> 458
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 458
Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser Arg
1 5 10 15
<210> 459
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 459
Arg Leu Val Pro Pro Gly Leu Trp Gly Ser Arg His Asn Glu Arg
1 5 10 15
<210> 460
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 460
Pro Gly Leu Trp Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg
1 5 10 15
<210> 461
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 461
Gly Ser Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys
1 5 10 15
<210> 462
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 462
Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu
1 5 10 15
<210> 463
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 463
Phe Leu Arg Asn Thr Lys Lys Phe Ile Ser Leu Gly Lys His Ala
1 5 10 15
<210> 464
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 464
Thr Lys Lys Phe Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu
1 5 10 15
<210> 465
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 465
Ile Ser Leu Gly Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr
1 5 10 15
<210> 466
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 466
Lys His Ala Lys Leu Ser Leu Gln Glu Leu Thr Trp Lys Met Ser
1 5 10 15
<210> 467
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 467
Leu Ser Leu Gln Glu Leu Thr Trp Lys Met Ser Val Arg Asp Cys
1 5 10 15
<210> 468
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 468
Glu Leu Thr Trp Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg
1 5 10 15
<210> 469
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 469
Lys Met Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly
1 5 10 15
<210> 470
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 470
Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys Val
1 5 10 15
<210> 471
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 471
Trp Leu Arg Arg Ser Pro Gly Val Gly Cys Val Pro Ala Ala Glu
1 5 10 15
<210> 472
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 472
Ser Pro Gly Val Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg
1 5 10 15
<210> 473
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 473
Gly Cys Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu
1 5 10 15
<210> 474
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 474
Ala Ala Glu His Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu
1 5 10 15
<210> 475
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 475
Arg Leu Arg Glu Glu Ile Leu Ala Lys Phe Leu His Trp Leu Met
1 5 10 15
<210> 476
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 476
Glu Ile Leu Ala Lys Phe Leu His Trp Leu Met Ser Val Tyr Val
1 5 10 15
<210> 477
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 477
Lys Phe Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu
1 5 10 15
<210> 478
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 478
Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe
1 5 10 15
<210> 479
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 479
Val Tyr Val Val Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu
1 5 10 15
<210> 480
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 480
Glu Leu Leu Arg Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln
1 5 10 15
<210> 481
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 481
Ser Phe Phe Tyr Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu
1 5 10 15
<210> 482
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 482
Val Thr Glu Thr Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg
1 5 10 15
<210> 483
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 483
Thr Phe Gln Lys Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp
1 5 10 15
<210> 484
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 484
Asn Arg Leu Phe Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln
1 5 10 15
<210> 485
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 485
Phe Tyr Arg Lys Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile
1 5 10 15
<210> 486
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 486
Ser Val Trp Ser Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu
1 5 10 15
<210> 487
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 487
Lys Leu Gln Ser Ile Gly Ile Arg Gln His Leu Lys Arg Val Gln
1 5 10 15
<210> 488
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 488
Ile Gly Ile Arg Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu
1 5 10 15
<210> 489
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 489
Gln His Leu Lys Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu
1 5 10 15
<210> 490
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 490
Arg Val Gln Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His
1 5 10 15
<210> 491
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 491
Arg Glu Leu Ser Glu Ala Glu Val Arg Gln His Arg Glu Ala Arg
1 5 10 15
<210> 492
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 492
Glu Ala Glu Val Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu
1 5 10 15
<210> 493
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 493
Arg Gln His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu
1 5 10 15
<210> 494
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 494
Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro
1 5 10 15
<210> 495
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 495
Ala Leu Leu Thr Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly
1 5 10 15
<210> 496
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 496
Ser Arg Leu Arg Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile
1 5 10 15
<210> 497
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 497
Phe Ile Pro Lys Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp
1 5 10 15
<210> 498
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 498
Pro Asp Gly Leu Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly
1 5 10 15
<210> 499
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 499
Arg Pro Ile Val Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe
1 5 10 15
<210> 500
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 500
Asn Met Asp Tyr Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys
1 5 10 15
<210> 501
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 501
Val Val Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg
1 5 10 15
<210> 502
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 502
Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg
1 5 10 15
<210> 503
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 503
Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu
1 5 10 15
<210> 504
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 504
Ala Glu Arg Leu Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu
1 5 10 15
<210> 505
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 505
Thr Ser Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg
1 5 10 15
<210> 506
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 506
Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro
1 5 10 15
<210> 507
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 507
Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly
1 5 10 15
<210> 508
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 508
Tyr Glu Arg Ala Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu
1 5 10 15
<210> 509
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 509
Arg Arg Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp
1 5 10 15
<210> 510
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 510
Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala
1 5 10 15
<210> 511
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 511
Ser Val Leu Gly Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe
1 5 10 15
<210> 512
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 512
Leu Asp Asp Ile His Arg Ala Trp Arg Thr Phe Val Leu Arg Val
1 5 10 15
<210> 513
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 513
His Arg Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp
1 5 10 15
<210> 514
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 514
Arg Thr Phe Val Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu
1 5 10 15
<210> 515
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 515
Leu Arg Val Arg Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val
1 5 10 15
<210> 516
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 516
Ala Gln Asp Pro Pro Pro Glu Leu Tyr Phe Val Lys Val Asp Val
1 5 10 15
<210> 517
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 517
Pro Pro Glu Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr
1 5 10 15
<210> 518
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 518
Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr Ile Pro
1 5 10 15
<210> 519
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 519
Val Asp Val Thr Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg Leu
1 5 10 15
<210> 520
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 520
Gly Ala Tyr Asp Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile
1 5 10 15
<210> 521
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 521
Thr Ile Pro Gln Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile
1 5 10 15
<210> 522
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 522
Asp Arg Leu Thr Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn
1 5 10 15
<210> 523
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 523
Glu Val Ile Ala Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys Val
1 5 10 15
<210> 524
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 524
Ser Ile Ile Lys Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala
1 5 10 15
<210> 525
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 525
Pro Gln Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys
1 5 10 15
<210> 526
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 526
Tyr Cys Val Arg Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly
1 5 10 15
<210> 527
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 527
Arg Tyr Ala Val Val Gln Lys Ala Ala His Gly His Val Arg Lys
1 5 10 15
<210> 528
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 528
Val Gln Lys Ala Ala His Gly His Val Arg Lys Ala Phe Lys Ser
1 5 10 15
<210> 529
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 529
Ala His Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr
1 5 10 15
<210> 530
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 530
Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu
1 5 10 15
<210> 531
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 531
Phe Lys Ser His Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met
1 5 10 15
<210> 532
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 532
Val Ser Thr Leu Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val
1 5 10 15
<210> 533
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 533
Thr Asp Leu Gln Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln
1 5 10 15
<210> 534
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 534
Pro Tyr Met Arg Gln Phe Val Ala His Leu Gln Glu Thr Ser Pro
1 5 10 15
<210> 535
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 535
Gln Phe Val Ala His Leu Gln Glu Thr Ser Pro Leu Arg Asp Ala
1 5 10 15
<210> 536
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 536
His Leu Gln Glu Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu
1 5 10 15
<210> 537
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 537
Thr Ser Pro Leu Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser
1 5 10 15
<210> 538
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 538
Arg Asp Ala Val Val Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala
1 5 10 15
<210> 539
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 539
Val Ile Glu Gln Ser Ser Ser Leu Asn Glu Ala Ser Ser Gly Leu
1 5 10 15
<210> 540
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 540
Ser Ser Ser Leu Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe
1 5 10 15
<210> 541
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 541
Asn Glu Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met
1 5 10 15
<210> 542
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 542
Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His Ala
1 5 10 15
<210> 543
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 543
Asp Val Phe Leu Arg Phe Met Cys His His Ala Val Arg Ile Arg
1 5 10 15
<210> 544
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 544
Arg Phe Met Cys His His Ala Val Arg Ile Arg Gly Lys Ser Tyr
1 5 10 15
<210> 545
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 545
His His Ala Val Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln
1 5 10 15
<210> 546
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 546
Arg Ile Arg Gly Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln
1 5 10 15
<210> 547
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 547
Lys Ser Tyr Val Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu
1 5 10 15
<210> 548
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 548
Gln Cys Gln Gly Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu
1 5 10 15
<210> 549
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 549
Ile Pro Gln Gly Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys
1 5 10 15
<210> 550
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 550
Ser Ile Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met
1 5 10 15
<210> 551
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 551
Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu
1 5 10 15
<210> 552
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 552
Ser Leu Cys Tyr Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile
1 5 10 15
<210> 553
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 553
Gly Asp Met Glu Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly
1 5 10 15
<210> 554
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 554
Asn Lys Leu Phe Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg
1 5 10 15
<210> 555
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 555
Ala Gly Ile Arg Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp
1 5 10 15
<210> 556
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 556
Arg Asp Gly Leu Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val
1 5 10 15
<210> 557
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 557
Leu Leu Arg Leu Val Asp Asp Phe Leu Leu Val Thr Pro His Leu
1 5 10 15
<210> 558
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 558
Val Asp Asp Phe Leu Leu Val Thr Pro His Leu Thr His Ala Lys
1 5 10 15
<210> 559
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 559
Leu Leu Val Thr Pro His Leu Thr His Ala Lys Thr Phe Leu Arg
1 5 10 15
<210> 560
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 560
Pro His Leu Thr His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg
1 5 10 15
<210> 561
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 561
His Ala Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu
1 5 10 15
<210> 562
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 562
Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val
1 5 10 15
<210> 563
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 563
Leu Val Arg Gly Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg
1 5 10 15
<210> 564
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 564
Val Pro Glu Tyr Gly Cys Val Val Asn Leu Arg Lys Thr Val Val
1 5 10 15
<210> 565
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 565
Gly Cys Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val
1 5 10 15
<210> 566
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 566
Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala
1 5 10 15
<210> 567
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 567
Thr Val Val Asn Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr
1 5 10 15
<210> 568
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 568
Phe Pro Val Glu Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln
1 5 10 15
<210> 569
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 569
Asp Glu Ala Leu Gly Gly Thr Ala Phe Val Gln Met Pro Ala His
1 5 10 15
<210> 570
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 570
Gly Gly Thr Ala Phe Val Gln Met Pro Ala His Gly Leu Phe Pro
1 5 10 15
<210> 571
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 571
Phe Val Gln Met Pro Ala His Gly Leu Phe Pro Trp Cys Gly Leu
1 5 10 15
<210> 572
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 572
Pro Ala His Gly Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr
1 5 10 15
<210> 573
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 573
Leu Phe Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu
1 5 10 15
<210> 574
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 574
Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp
1 5 10 15
<210> 575
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 575
Leu Asp Thr Arg Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr
1 5 10 15
<210> 576
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 576
Thr Leu Glu Val Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser
1 5 10 15
<210> 577
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 577
Gln Ser Asp Tyr Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser
1 5 10 15
<210> 578
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 578
Ser Ser Tyr Ala Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn
1 5 10 15
<210> 579
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 579
Arg Thr Ser Ile Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe Lys
1 5 10 15
<210> 580
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 580
Arg Ala Ser Leu Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn
1 5 10 15
<210> 581
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 581
Thr Phe Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys
1 5 10 15
<210> 582
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 582
Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val
1 5 10 15
<210> 583
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 583
Gly Arg Asn Met Arg Arg Lys Leu Phe Gly Val Leu Arg Leu Lys
1 5 10 15
<210> 584
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 584
Arg Arg Lys Leu Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu
1 5 10 15
<210> 585
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 585
Phe Gly Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu
1 5 10 15
<210> 586
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 586
Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser
1 5 10 15
<210> 587
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 587
His Ser Leu Phe Leu Asp Leu Gln Val Asn Ser Leu Gln Thr Val
1 5 10 15
<210> 588
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 588
Leu Asp Leu Gln Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile
1 5 10 15
<210> 589
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 589
Val Asn Ser Leu Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu
1 5 10 15
<210> 590
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 590
Gln Thr Val Cys Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala
1 5 10 15
<210> 591
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 591
Thr Asn Ile Tyr Lys Ile Leu Leu Leu Gln Ala Tyr Arg Phe His
1 5 10 15
<210> 592
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 592
Lys Ile Leu Leu Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu
1 5 10 15
<210> 593
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 593
Leu Gln Ala Tyr Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe
1 5 10 15
<210> 594
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 594
Arg Phe His Ala Cys Val Leu Gln Leu Pro Phe His Gln Gln Val
1 5 10 15
<210> 595
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 595
Cys Val Leu Gln Leu Pro Phe His Gln Gln Val Trp Lys Asn Pro
1 5 10 15
<210> 596
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 596
Leu Pro Phe His Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu
1 5 10 15
<210> 597
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 597
Gln Gln Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser
1 5 10 15
<210> 598
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 598
Lys Asn Pro Thr Phe Phe Leu Arg Val Ile Ser Asp Thr Ala Ser
1 5 10 15
<210> 599
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 599
Phe Phe Leu Arg Val Ile Ser Asp Thr Ala Ser Leu Cys Tyr Ser
1 5 10 15
<210> 600
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 600
Val Ile Ser Asp Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala
1 5 10 15
<210> 601
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 601
Thr Ala Ser Leu Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly
1 5 10 15
<210> 602
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 602
Cys Tyr Ser Ile Leu Lys Ala Lys Asn Ala Gly Met Ser Leu Gly
1 5 10 15
<210> 603
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 603
Leu Lys Ala Lys Asn Ala Gly Met Ser Leu Gly Ala Lys Gly Ala
1 5 10 15
<210> 604
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 604
Asn Ala Gly Met Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu
1 5 10 15
<210> 605
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 605
Ser Leu Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala
1 5 10 15
<210> 606
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 606
Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu
1 5 10 15
<210> 607
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 607
Gly Pro Leu Pro Ser Glu Ala Val Gln Trp Leu Cys His Gln Ala
1 5 10 15
<210> 608
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 608
Ser Glu Ala Val Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys
1 5 10 15
<210> 609
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 609
Gln Trp Leu Cys His Gln Ala Phe Leu Leu Lys Leu Thr Arg His
1 5 10 15
<210> 610
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 610
His Gln Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr Tyr
1 5 10 15
<210> 611
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 611
Leu Leu Lys Leu Thr Arg His Arg Val Thr Tyr Val Pro Leu Leu
1 5 10 15
<210> 612
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 612
Thr Arg His Arg Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg
1 5 10 15
<210> 613
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 613
Val Thr Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr
1 5 10 15
<210> 614
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 614
Pro Leu Leu Gly Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg
1 5 10 15
<210> 615
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 615
Ser Leu Arg Thr Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly
1 5 10 15
<210> 616
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 616
Ala Gln Thr Gln Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr
1 5 10 15
<210> 617
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 617
Leu Ser Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala
1 5 10 15
<210> 618
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 618
Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro
1 5 10 15
<210> 619
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 619
Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser
1 5 10 15
<210> 620
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 620
Leu Glu Ala Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr
1 5 10 15
<210> 621
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 621
Ala Ala Asn Pro Ala Leu Pro Ser Asp Phe Lys Thr Ile Leu Asp
1 5 10 15
2
482
<---
название | год | авторы | номер документа |
---|---|---|---|
ГЕТЕРОДИМЕРНЫЕ Fc-СЛИТЫЕ БЕЛКИ IL15/IL15Rα | 2017 |
|
RU2779938C2 |
IL-12 ГЕТЕРОДИМЕРНЫЕ СЛИТЫЕ БЕЛКИ FC | 2019 |
|
RU2819097C2 |
Химерные антигенные рецепторы, нацеливающиеся на CD70 | 2019 |
|
RU2801824C2 |
Т-КЛЕТКИ С ХИМЕРНЫМИ АНТИГЕННЫМИ РЕЦЕПТОРАМИ (CAR-T) ДЛЯ ЛЕЧЕНИЯ РАКА | 2019 |
|
RU2811466C2 |
ИММУНОЦИТОКИНЫ И ИХ ПРИМЕНЕНИЕ | 2021 |
|
RU2818371C1 |
СПОСОБЫ УСОВЕРШЕНСТВОВАНИЯ ОДНОДОЛЬНЫХ РАСТЕНИЙ | 2015 |
|
RU2727428C2 |
АНТИ-CD39 АНТИТЕЛА, КОМПОЗИЦИИ, СОДЕРЖАЩИЕ АНТИ-CD39 АНТИТЕЛА, И СПОСОБЫ ПРИМЕНЕНИЯ АНТИ-CD39 АНТИТЕЛ | 2018 |
|
RU2795348C2 |
СПОСОБЫ УСОВЕРШЕНСТВОВАНИЯ РАСТЕНИЙ | 2015 |
|
RU2727424C2 |
АНТИТЕЛА, СПЕЦИФИЧЕСКИЕ В ОТНОШЕНИИ CD70, И ПУТИ ИХ ПРИМЕНЕНИЯ | 2019 |
|
RU2801093C2 |
МОЛЕКУЛЫ, НАЦЕЛЕННЫЕ НА СИСТЕМУ СЕКРЕЦИИ ТИПА III | 2016 |
|
RU2759949C2 |
Изобретение относится к области биотехнологии. Предложена мультиантигенная конструкция, индуцирующая иммунный ответ против раковой клетки у млекопитающего, а также вектор, композиция, фармацевтическая композиция и способ лечения рака. Изобретение может быть использовано в медицине для увеличения иммунного ответа на рак. 5 н. и 46 з.п. ф-лы, 20 табл., 7 пр.
1. Мультиантигенная конструкция, индуцирующая иммунный ответ против раковой клетки у млекопитающего, которая включает:
(i) по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1; и
(ii) по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид TERT, или по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид MSLN, где иммуногенный полипептид MUC1, иммуногенный полипептид TERT и иммуногенный полипептид MSLN экспрессируются в виде отдельных полипептидов, и где аминокислотная последовательность иммуногенного полипептида MUC1 включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 8;
(2) аминокислотной последовательности, содержащей аминокислоты 4-537 последовательности SEQ ID NO: 8;
(3) аминокислотной последовательности, содержащей аминокислоты 24-537 последовательности SEQ ID NO: 8;
(4) аминокислотной последовательности SEQ ID NO: 16;
(5) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16; и
(6) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16, где аминокислота в положении 513 представляет собой Т.
2. Мультиантигенная конструкция по п.1, которая включает:
(i) по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид MSLN;
(ii) по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1; и
(iii) по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид TERT.
3. Мультиантигенная конструкция по п.1, где иммуногенный полипептид MUC1 включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 8;
(2) аминокислотной последовательности, содержащей аминокислоты 4-537 последовательности SEQ ID NO: 8; и
(3) аминокислотной последовательности, содержащей аминокислоты 24-537 последовательности SEQ ID NO: 8.
4. Мультиантигенная конструкция по п.1, где иммуногенный полипептид MSLN включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности, содержащей аминокислоты 37-597 аминокислотной последовательности SEQ ID NO: 2;
(2) аминокислотной последовательности, состоящей из аминокислот 37-597 аминокислотной последовательности SEQ ID NO: 2;
(3) аминокислотной последовательности SEQ ID NO: 6; и
(4) аминокислотной последовательности, содержащей аминокислоты 4-564 аминокислотной последовательности SEQ ID NO: 6.
5. Мультиантигенная конструкция по п.1, где иммуногенный полипептид TERT включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 10;
(2) аминокислотной последовательности SEQ ID NO: 12;
(3) аминокислотной последовательности SEQ ID NO: 14;
(4) аминокислотной последовательности, содержащей аминокислоты 2-892 последовательности SEQ ID NO: 10;
(5) аминокислотной последовательности, содержащей аминокислоты 4-591 последовательности SEQ ID NO: 12; и
(6) аминокислотной последовательности, содержащей аминокислоты 3-789 последовательности SEQ ID NO: 14.
6. Мультиантигенная конструкция по п.1, где:
(i) иммуногенный полипептид MUC1 включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 8;
(2) аминокислотной последовательности, содержащей аминокислоты 4-537 последовательности SEQ ID NO: 8;
(3) аминокислотной последовательности, содержащей аминокислоты 24-537 последовательности SEQ ID NO: 8;
(4) аминокислотной последовательности SEQ ID NO: 16;
(5) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16; и
(6) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16, при условии, что аминокислота в положении 513 представляет собой Т;
(ii) иммуногенный полипептид MSLN включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности, содержащей аминокислоты 37-597 аминокислотной последовательности SEQ ID NO: 2;
(2) аминокислотной последовательности, состоящей из аминокислот 37-597 аминокислотной последовательности SEQ ID NO: 2;
(3) аминокислотной последовательности SEQ ID NO: 6; и
(4) аминокислотной последовательности, содержащей аминокислоты 4-564 аминокислотной последовательности SEQ ID NO: 6; и
(iii) иммуногенный полипептид TERT включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 10;
(2) аминокислотной последовательности SEQ ID NO: 12;
(3) аминокислотной последовательности SEQ ID NO: 14;
(4) аминокислотной последовательности, содержащей аминокислоты 2-892 последовательности SEQ ID NO: 10;
(5) аминокислотной последовательности, содержащей аминокислоты 4-591 последовательности SEQ ID NO: 12; и
(6) аминокислотной последовательности, содержащей аминокислоты 3-789 последовательности SEQ ID NO: 14.
7. Мультиантигенная конструкция по п.1, где нуклеотидная последовательность, кодирующая иммуногенный полипептид MUC1, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 7;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7;
(3) нуклеотидной последовательности SEQ ID NO: 15;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15; и
(5) вырожденного варианта любой нуклеотидной последовательности (1)-(4).
8. Мультиантигенная конструкция по п.1, где нуклеотидная последовательность, кодирующая иммуногенный полипептид MSLN, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 5;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(3) вырожденного варианта (i) нуклеотидной последовательности SEQ ID NO: 5 или (ii) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5.
9. Мультиантигенная конструкция по п.1, где нуклеотидная последовательность, кодирующая иммуногенный полипептид TERT, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 9;
(2) нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9;
(3) нуклеотидной последовательности SEQ ID NO: 11;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11;
(5) нуклеотидной последовательности SEQ ID NO: 13;
(6) нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 13; и
(7) вырожденного варианта любой нуклеотидной последовательности (1)-(6).
10. Мультиантигенная конструкция по п.1, где:
(i) нуклеотидная последовательность, кодирующая иммуногенный полипептид MUC1, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 7;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7;
(3) нуклеотидной последовательности SEQ ID NO: 15;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15; и
(5) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 7; нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7; нуклеотидной последовательности SEQ ID NO: 15 или нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15;
(ii) нуклеотидная последовательность, кодирующая иммуногенный полипептид MSLN, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 5;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(3) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 5 или нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(iii) нуклеотидная последовательность, кодирующая иммуногенный полипептид TERT, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 9;
(2) нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9;
(3) нуклеотидной последовательности SEQ ID NO: 11;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11;
(5) нуклеотидной последовательности SEQ ID NO: 13;
(6) нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 13; и
(7) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 9; нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9; нуклеотидной последовательности SEQ ID NO: 11; нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11; нуклеотидной последовательности SEQ ID NO: 13 или нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 13.
11. Мультиантигенная конструкция по п.1, которая включает нуклеотидную последовательность, кодирующую аминокислотную последовательность SEQ ID NO: 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64 или 66.
12. Мультиантигенная конструкция по п.1, которая включает:
(1) нуклеотидные последовательности SEQ ID NO: 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63 или 65; или
(2) вырожденный вариант нуклеотидной последовательности SEQ ID NO: 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63 или 65.
13. Мультиантигенная конструкция по п.2, где иммуногенный полипептид MUC1 включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 8;
(2) аминокислотной последовательности, содержащей аминокислоты 4-537 последовательности SEQ ID NO: 8;
(3) аминокислотной последовательности, содержащей аминокислоты 24-537 последовательности SEQ ID NO: 8;
(4) аминокислотной последовательности SEQ ID NO: 16;
(5) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16; и
(6) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16, где аминокислота в положении 513 представляет собой Т.
14. Мультиантигенная конструкция по п.2, где иммуногенный полипептид MSLN включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности, содержащей аминокислоты 37-597 аминокислотной последовательности SEQ ID NO: 2;
(2) аминокислотной последовательности, состоящей из аминокислот 37-597 аминокислотной последовательности SEQ ID NO: 2;
(3) аминокислотной последовательности SEQ ID NO: 6; и
(4) аминокислотной последовательности, содержащей аминокислоты 4-564 аминокислотной последовательности SEQ ID NO: 6.
15. Мультиантигенная конструкция по п.2, где иммуногенный полипептид TERT включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 10;
(2) аминокислотной последовательности SEQ ID NO: 12;
(3) аминокислотной последовательности SEQ ID NO: 14;
(4) аминокислотной последовательности, содержащей аминокислоты 2-892 последовательности SEQ ID NO: 10;
(5) аминокислотной последовательности, содержащей аминокислоты 4-591 последовательности SEQ ID NO: 12; и
(6) аминокислотной последовательности, содержащей аминокислоты 3-789 последовательности SEQ ID NO: 14.
16. Мультиантигенная конструкция по п.2, где:
(i) иммуногенный полипептид MUC1 включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 8;
(2) аминокислотной последовательности, содержащей аминокислоты 4-537 последовательности SEQ ID NO: 8;
(3) аминокислотной последовательности, содержащей аминокислоты 24-537 последовательности SEQ ID NO: 8;
(4) аминокислотной последовательности SEQ ID NO: 16;
(5) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16; и
(6) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16, при условии, что аминокислота в положении 513 представляет собой Т;
(ii) иммуногенный полипептид MSLN включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности, содержащей аминокислоты 37-597 аминокислотной последовательности SEQ ID NO: 2;
(2) аминокислотной последовательности, состоящей из аминокислот 37-597 аминокислотной последовательности SEQ ID NO: 2;
(3) аминокислотной последовательности SEQ ID NO: 6; и
(4) аминокислотной последовательности, содержащей аминокислоты 4-564 аминокислотной последовательности SEQ ID NO: 6; и
(iii) иммуногенный полипептид TERT включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 10;
(2) аминокислотной последовательности SEQ ID NO: 12;
(3) аминокислотной последовательности SEQ ID NO: 14;
(4) аминокислотной последовательности, содержащей аминокислоты 2-892 последовательности SEQ ID NO: 10;
(5) аминокислотной последовательности, содержащей аминокислоты 4-591 последовательности SEQ ID NO: 12; и
(6) аминокислотной последовательности, содержащей аминокислоты 3-789 последовательности SEQ ID NO: 14.
17. Мультиантигенная конструкция по п.2, где нуклеотидная последовательность, кодирующая иммуногенный полипептид MUC1, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 7;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7;
(3) нуклеотидной последовательности SEQ ID NO: 15;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15; и
(5) вырожденного варианта любой нуклеотидной последовательности (1)-(4).
18. Мультиантигенная конструкция по п.2, где нуклеотидная последовательность, кодирующая иммуногенный полипептид MSLN, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 5;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(3) вырожденного варианта (i) нуклеотидной последовательности SEQ ID NO: 5 или (ii) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5.
19. Мультиантигенная конструкция по п.2, где нуклеотидная последовательность, кодирующая иммуногенный полипептид TERT, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 9;
(2) нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9;
(3) нуклеотидной последовательности SEQ ID NO: 11;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11;
(5) нуклеотидной последовательности SEQ ID NO: 13;
(6) нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 13; и
(7) вырожденного варианта любой нуклеотидной последовательности (1)-(6).
20. Мультиантигенная конструкция по п.2, где:
(i) нуклеотидная последовательность, кодирующая иммуногенный полипептид MUC1, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 7;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7;
(3) нуклеотидной последовательности SEQ ID NO: 15;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15; и
(5) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 7; нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7; нуклеотидной последовательности SEQ ID NO: 15 или нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15;
(ii) нуклеотидная последовательность, кодирующая иммуногенный полипептид MSLN, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 5;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(3) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 5 или нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(iii) нуклеотидная последовательность, кодирующая иммуногенный полипептид TERT, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 9;
(2) нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9;
(3) нуклеотидной последовательности SEQ ID NO: 11;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11;
(5) нуклеотидной последовательности SEQ ID NO: 13;
(6) нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 13; и
(7) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 9; нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9; нуклеотидной последовательности SEQ ID NO: 11; нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11; нуклеотидной последовательности SEQ ID NO: 13 или нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 1.
21. Мультиантигенная конструкция по п.2, где:
(i) нуклеотидная последовательность, кодирующая иммуногенный полипептид MUC1, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 7;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7; и
(3) вырожденного варианта нуклеотидной последовательности SEQ ID NO: 7 или нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7;
(ii) нуклеотидная последовательность, кодирующая иммуногенный полипептид MSLN, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 5;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(3) вырожденного варианта нуклеотидной последовательности SEQ ID NO: 5 или нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(iii) нуклеотидная последовательность, кодирующая иммуногенный полипептид TERT, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 9;
(2) нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9;
(3) вырожденного варианта нуклеотидной последовательности SEQ ID NO: 9 или нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9.
22. Мультиантигенная конструкция по п.2, которая имеет структуру формулы (VIII):
TAA1-SPACER1-TAA2-SPACER2-TAA3, (VIII)
где в формуле (VIII):
(i) каждая TAA1, TAA2 и TAA3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид TAA, выбранную из группы, состоящей из иммуногенного полипептида MUC1, иммуногенного полипептида MSLN и иммуногенного полипептида TERT, где TAA1, TAA2 и TAA3 кодируют разные иммуногенные полипептиды TAA; и
(ii) каждый SPACER1 и SPACER2 представляет собой спейсерную нуклеотидную последовательность, которая может быть одинаковой или различной.
23. Мультиантигенная конструкция по п.22, где в формуле (VIII) каждый SPACER1 и SPACER2 представляет собой спейсерную нуклеотидную последовательность, кодирующую пептид 2A, выбранный из пептида 2A вируса ящура (FMD2A), пептида 2A вируса ринита лошадей А (ERA2A), пептида 2A вируса ринита лошадей B (ERB2A), пептид 2A вируса энцефаломиокардита (EMC2A), пептида 2A свиного тешовируса (PT2A) или пептида 2A вируса Thosea asigna (T2A).
24. Мультиантигенная конструкция по п.23, где иммуногенный полипептид MUC1 включает аминокислотную последовательность, выбранную из группы, состоящей из:
(i) аминокислотной последовательности SEQ ID NO: 8;
(ii) аминокислотной последовательности, содержащей аминокислоты 4-537 последовательности SEQ ID NO: 8;
(iii) аминокислотной последовательности, содержащей аминокислоты 24-537 последовательности SEQ ID NO: 8;
(iv) аминокислотной последовательности SEQ ID NO: 16;
(v) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16; и
(vi) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16, при условии, что аминокислота в положении 513 представляет собой Т.
25. Мультиантигенная конструкция по п.23, где иммуногенный полипептид MSLN включает аминокислотную последовательность, выбранную из группы, состоящей из:
(i) аминокислотной последовательности SEQ ID NO: 2;
(ii) аминокислотной последовательности, содержащей аминокислоты 37-597 аминокислотной последовательности SEQ ID NO: 2;
(iii) аминокислотной последовательности SEQ ID NO: 6; и
(iv) аминокислотной последовательности, содержащей аминокислоты 4-564 аминокислотной последовательности SEQ ID NO: 6.
26. Мультиантигенная конструкция по п.23, где иммуногенный полипептид TERT включает аминокислотную последовательность, выбранную из группы, состоящей из:
(i) аминокислотной последовательности SEQ ID NO: 10;
(ii) аминокислотной последовательности SEQ ID NO: 12;
(iii) аминокислотной последовательности SEQ ID NO: 14;
(iv) аминокислотной последовательности, содержащей аминокислоты 2-892 последовательности SEQ ID NO: 10;
(v) аминокислотной последовательности, содержащей аминокислоты 4-591 последовательности SEQ ID NO: 12; и
(vi) аминокислотной последовательности, содержащей аминокислоты 3-789 последовательности SEQ ID NO: 14.
27. Мультиантигенная конструкция по п.23, где:
(i) иммуногенный полипептид MUC1 включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 8;
(2) аминокислотной последовательности, содержащей аминокислоты 4-537 последовательности SEQ ID NO: 8;
(3) аминокислотной последовательности, содержащей аминокислоты 24-537 последовательности SEQ ID NO: 8;
(4) аминокислотной последовательности SEQ ID NO: 16;
(5) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16; и
(6) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16, при условии, что аминокислота в положении 513 представляет собой Т;
(ii) иммуногенный полипептид MSLN включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности, содержащей аминокислоты 37-597 последовательности SEQ ID NO: 2;
(2) аминокислотной последовательности, состоящей из аминокислот 37-597 последовательности SEQ ID NO: 2;
(3) аминокислотной последовательности SEQ ID NO: 6; и
(4) аминокислотной последовательности, содержащей аминокислоты 4-564 последовательности SEQ ID NO: 6; и
(iii) иммуногенный полипептид TERT включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 10;
(2) аминокислотной последовательности SEQ ID NO: 12;
(3) аминокислотной последовательности SEQ ID NO: 14;
(4) аминокислотной последовательности, содержащей аминокислоты 2-892 последовательности SEQ ID NO: 10;
(5) аминокислотной последовательности, содержащей аминокислоты 4-591 последовательности SEQ ID NO: 12; и
(6) аминокислотной последовательности, содержащей аминокислоты 3-789 последовательности SEQ ID NO: 14.
28. Мультиантигенная конструкция по п.23, где нуклеотидная последовательность, кодирующая иммуногенный полипептид MUC1, выбрана из группы, состоящей из:
(i) нуклеотидной последовательности SEQ ID NO: 7;
(ii) нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7;
(iii) нуклеотидной последовательности SEQ ID NO: 15;
(iv) нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15; и
(v) вырожденного варианта любой из нуклеотидных последовательностей (i)-(iv).
29. Мультиантигенная конструкция по п.23, где нуклеотидная последовательность, кодирующая иммуногенный полипептид MSLN, выбрана из группы, состоящей из:
(i) нуклеотидной последовательности SEQ ID NO: 5;
(ii) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(iii) вырожденного варианта (1) нуклеотидной последовательности SEQ ID NO: 5 или (2) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5.
30. Мультиантигенная конструкция по п.23, где нуклеотидная последовательность, кодирующая иммуногенный полипептид TERT, выбрана из группы, состоящей из:
(i) нуклеотидной последовательности SEQ ID NO: 9;
(ii) нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9;
(iii) нуклеотидной последовательности SEQ ID NO: 11;
(iv) нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11;
(v) нуклеотидной последовательности SEQ ID NO: 13;
(vi) нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 13; и
(vii) вырожденного варианта любой из нуклеотидных последовательностей (i)-(vi).
31. Мультиантигенная конструкция по п.23, где:
(i) нуклеотидная последовательность, кодирующая иммуногенный полипептид MUC1, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 7;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7;
(3) нуклеотидной последовательности SEQ ID NO: 15;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15; и
(5) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 7; нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7; нуклеотидной последовательности SEQ ID NO: 15 или нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15;
(ii) нуклеотидная последовательность, кодирующая иммуногенный полипептид MSLN, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 5;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(3) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 5 или нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(iii) нуклеотидная последовательность, кодирующая иммуногенный полипептид TERT, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 9
(2) нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9;
(3) нуклеотидной последовательности SEQ ID NO: 11;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11;
(5) нуклеотидной последовательности SEQ ID NO: 13;
(6) нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 13; и
(7) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 9; нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9; нуклеотидной последовательности SEQ ID NO: 11; нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11; нуклеотидной последовательности SEQ ID NO: 13 или нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 1.
32. Мультиантигенная конструкция по п.23, где в формуле (VIII): TAA1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MUC1, TAA2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид MSLN, и TAA3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид TERT.
33. Мультиантигенная конструкция по п.32, где иммуногенный полипептид TERT включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 10;
(2) аминокислотной последовательности SEQ ID NO: 12;
(3) аминокислотной последовательности SEQ ID NO: 14;
(4) аминокислотной последовательности, содержащей аминокислоты 2-892 последовательности SEQ ID NO: 10;
(5) аминокислотной последовательности, содержащей аминокислоты 4-591 последовательности SEQ ID NO: 12; и
(6) аминокислотной последовательности, содержащей аминокислоты 3-789 последовательности SEQ ID NO: 14.
34. Мультиантигенная конструкция по п.32, где иммуногенный полипептид MSLN включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности, содержащей аминокислоты 37-597 последовательности SEQ ID NO: 2;
(2) аминокислотной последовательности, состоящей из аминокислот 37-597 последовательности SEQ ID NO: 2;
(3) аминокислотной последовательности SEQ ID NO: 6; и
(4) аминокислотной последовательности, содержащей аминокислоты 4-564 последовательности SEQ ID NO: 6.
35. Мультиантигенная конструкция по п.32, где иммуногенный полипептид MUC1 включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 8;
(2) аминокислотной последовательности, содержащей аминокислоты 4-537 последовательности SEQ ID NO: 8;
(3) аминокислотной последовательности, содержащей аминокислоты 24-537 последовательности SEQ ID NO: 8;
(4) аминокислотной последовательности SEQ ID NO: 16;
(5) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16; и
(6) аминокислотной последовательности, содержащей аминокислоты 4-517 из SEQ ID NO: 16, при условии, что аминокислота в положении 513 представляет собой Т.
36. Мультиантигенная конструкция по п.32, где:
(i) иммуногенный полипептид MUC1 включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 8;
(2) аминокислотной последовательности, содержащей аминокислоты 4-537 последовательности SEQ ID NO: 8;
(3) аминокислотной последовательности, содержащей аминокислоты 24-537 последовательности SEQ ID NO: 8;
(4) аминокислотной последовательности SEQ ID NO: 16;
(5) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16; и
(6) аминокислотной последовательности, содержащей аминокислоты 4-517 последовательности SEQ ID NO: 16, при условии, что аминокислота в положении 513 представляет собой Т;
(ii) иммуногенный полипептид MSLN включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности, содержащей аминокислоты 37-597 последовательности SEQ ID NO: 2;
(2) аминокислотной последовательности, состоящей из аминокислот 37-597 последовательности SEQ ID NO: 2;
(3) аминокислотной последовательности SEQ ID NO: 6; и
(4) аминокислотной последовательности, содержащей аминокислоты 4-564 последовательности SEQ ID NO: 6; и
(iii) иммуногенный полипептид TERT включает аминокислотную последовательность, выбранную из группы, состоящей из:
(1) аминокислотной последовательности SEQ ID NO: 10;
(2) аминокислотной последовательности SEQ ID NO: 12;
(3) аминокислотной последовательности SEQ ID NO: 14;
(4) аминокислотной последовательности, содержащей аминокислоты 2-892 последовательности SEQ ID NO: 10;
(5) аминокислотной последовательности, содержащей аминокислоты 4-591 последовательности SEQ ID NO: 12; и
(6) аминокислотной последовательности, содержащей аминокислоты 3-789 последовательности SEQ ID NO: 14.
37. Мультиантигенная конструкция по п.32, где нуклеотидная последовательность, кодирующая иммуногенный полипептид MUC1, выбрана из группы, состоящей из:
(i) нуклеотидной последовательности SEQ ID NO: 7;
(ii) нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7;
(iii) нуклеотидной последовательности SEQ ID NO: 15;
(iv) нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15; и
(v) вырожденного варианта любой из нуклеотидных последовательностей (i)-(iv).
38. Мультиантигенная конструкция по п.32, где нуклеотидная последовательность, кодирующая иммуногенный полипептид MSLN, выбрана из группы, состоящей из:
(i) нуклеотидной последовательности SEQ ID NO: 5;
(ii) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(iii) вырожденного варианта (1) нуклеотидной последовательности SEQ ID NO: 5 или (2) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5.
39. Мультиантигенная конструкция по п.32, где нуклеотидная последовательность, кодирующая иммуногенный полипептид TERT, выбрана из группы, состоящей из:
(i) нуклеотидной последовательности SEQ ID NO: 9;
(ii) нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9;
(iii) нуклеотидной последовательности SEQ ID NO: 11;
(iv) нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11;
(v) нуклеотидной последовательности SEQ ID NO: 13;
(vi) нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 13; и
(vii) вырожденного варианта любой из нуклеотидных последовательностей (i)-(vi).
40. Мультиантигенная конструкция по п.32, где:
(i) нуклеотидная последовательность, кодирующая иммуногенный полипептид MUC1, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 7;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7;
(3) нуклеотидной последовательности SEQ ID NO: 15;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15; и
(5) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 7; нуклеотидной последовательности, содержащей нуклеотиды 10-1611 последовательности SEQ ID NO: 7; нуклеотидной последовательности SEQ ID NO: 15 или нуклеотидной последовательности, содержащей нуклеотиды 10-1551 последовательности SEQ ID NO: 15;
(ii) нуклеотидная последовательность, кодирующая иммуногенный полипептид MSLN, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 5;
(2) нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(3) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 5 или нуклеотидной последовательности, содержащей нуклеотиды 10-1692 последовательности SEQ ID NO: 5; и
(iii) нуклеотидная последовательность, кодирующая иммуногенный полипептид TERT, выбрана из группы, состоящей из:
(1) нуклеотидной последовательности SEQ ID NO: 9;
(2) нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9;
(3) нуклеотидной последовательности SEQ ID NO: 11;
(4) нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11;
(5) нуклеотидной последовательности SEQ ID NO: 13;
(6) нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 13; и
(7) вырожденного варианта: нуклеотидной последовательности SEQ ID NO: 9; нуклеотидной последовательности, содержащей нуклеотиды 4-2679 последовательности SEQ ID NO: 9; нуклеотидной последовательности SEQ ID NO: 11; нуклеотидной последовательности, содержащей нуклеотиды 10-1782 последовательности SEQ ID NO: 11; нуклеотидной последовательности SEQ ID NO: 13 или нуклеотидной последовательности, содержащей нуклеотиды 7-2373 последовательности SEQ ID NO: 1.
41. Мультиантигенная конструкция по п.32, где:
(i) аминокислотная последовательность иммуногенного полипептида MUC1 включает аминокислоты 4-537 последовательности SEQ ID NO: 8;
(ii) аминокислотная последовательность иммуногенного полипептида MSLN включает аминокислоты 4-564 последовательности SEQ ID NO: 6; и
(iii) аминокислотная последовательность иммуногенного полипептида TERT включает аминокислоты 2-892 последовательности SEQ ID NO: 10.
42. Мультиантигенная конструкция по п.32, где:
(i) нуклеотидная последовательность, кодирующая иммуногенный полипептид MSLN, включает нуклеотиды 10-1692 последовательности SEQ ID NO: 5;
(ii) нуклеотидная последовательность, кодирующая иммуногенный полипептид MUC1, включает нуклеотиды 10-1611 последовательности SEQ ID NO: 7; и
(iii) нуклеотидная последовательность, кодирующая иммуногенный полипептид TERT, включает нуклеотиды 4-2679 последовательности SEQ ID NO: 9.
43. Мультиантигенная конструкция по п.1, где:
(i) аминокислотная последовательность иммуногенного полипептида MSLN включает аминокислоты 4-564 последовательности SEQ ID NO: 6;
(ii) аминокислотная последовательность иммуногенного полипептида MUC1 включает аминокислоты 4-537 последовательности SEQ ID NO: 8; и
(iii) аминокислотная последовательность иммуногенного полипептида TERT включает аминокислоты 2-892 последовательности SEQ ID NO: 10.
44. Вектор для индукции иммунного ответа у млекопитающего, содержащий мультиантигенную конструкцию по любому из пп.1-43.
45. Композиция, индуцирующая иммунный ответ у млекопитающего, содержащая: (i) эффективное количество вектора по п.44 и (ii) эксципиент.
46. Фармацевтическая композиция, индуцирующая иммунный ответ у млекопитающего, содержащая: (i) эффективное количество вектора по п.44 и (ii) фармацевтически приемлемый носитель.
47. Способ лечения рака у пациента, включающий введение пациенту эффективного количества фармацевтической композиции по п.46.
48. Способ по п.47, где рак сверхэкспрессирует один или несколько опухолевых антигенов, выбранных из MUC1, MSLN или TERT.
49. Способ по п.47, где рак представляет собой рак молочной железы, рак яичников или рак поджелудочной железы.
50. Способ по п.47, дополнительно включающий введение пациенту эффективного количества иммуномодулятора.
51. Способ по п.50, где иммуномодулятор представляет собой ингибитор CTLA-4, ингибитор IDO1, ингибитор PD-1 или ингибитор PD-L1.
WO 2013025972 A1, 21.02.2013 | |||
TSUKASA TANIDA et al | |||
Pancreatic cancer immunotherapy using a tumor lysate vaccine, engineered to express α-gal epitopes, targets pancreatic cancer stem cells | |||
Термосно-паровая кухня | 1921 |
|
SU72A1 |
Изложница с суживающимся книзу сечением и с вертикально перемещающимся днищем | 1924 |
|
SU2012A1 |
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами | 1921 |
|
SU10A1 |
Векторы для экспрессии простатоассоциированных антигенов | 2014 |
|
RU2650860C2 |
Авторы
Даты
2020-04-13—Публикация
2017-01-16—Подача