Перекрестная ссылка на связанные заявки
[1] По данной заявке испрашивают приоритет предварительной заявки США №62/290,894, поданной 3 февраля 2016 года, которая озаглавлена «Compositions of Influenza Hemagglutinin with Heterologous Epitopes and/or Altered Maturation Cleavage Sites and Methods of Use Thereof», содержание которой включено по ссылке в полном объеме.
Включение списка последовательностей по ссылке
[2] Настоящая заявка подана вместе со списком последовательностей в электронном формате. Список последовательностей предоставлен в виде файла с названием Списки последовательностей.txt, который создан 25 июля 2018 года, размер 174136 Б. Информация в электронном формате о списке последовательностей включена по ссылке в полном объеме.
Область техники
[3] Это изобретение относится к области иммунологии и вирусологии. Более конкретно, она относится к композициям белков рекомбинантного гемагглютинина гриппа (HA) с измененными и гетерологичными эпитопами и/или измененными сайтами расщепления при созревании. (Применяют следующие сокращения. HA, гемагглютинин; NA, нейраминидаза; NAb, нейтрализующие антитела; bNAb, нейтрализующие антитела широкого спектра; TEV, вирус гравировки табака; ДНК, дезоксирибонуклеиновая кислота; кДНК, комплементарная ДНК; РНК, рибонуклеиновая кислота; т.о., тысяча основания; кДа, килодальтон; клетки CHO, клетки яичника китайского хомяка; клетки HEK 293, клетки 293 эмбриональной почки человека; VLP, вирусоподобная частица; BEVS, система бакуловирусного экспрессирующего вектора; AcNPV, вирус ядерного полиэдроза Autographa californica; BmNPV, вирус ядерного полиэдроза Bombyx mori; TIPS, беститровое консервирование и наращивание в инфицированных клетках; BIIC, инфицированные бакуловирусом клетки насекомого; ПЦР, полимеразная цепная реакция; FBS, эмбриональная телячья сыворотка; PDB, Protein Data Bank, который находится во всемирной паутине по адресу (rcsb.org/pdb/home/home.do); MOI, множественность заражения; MCS, сайт расщепления при созревании; HPAI, высоко патогенный птичий грипп; HI, ингибирование HA; WT, дикий тип; TIV, трехвалентные инактивированные противогриппозные вакцины; PBS, фосфатно-солевой буфер.
Уровень техники
[4] Грипп, обычно известный как «инфлюэнция», представляет собой инфекционное заболевание дыхательных путей, обусловленное инфекцией человеческих или зоонозных вирусов гриппа. Вспышки гриппа возникают ежегодно во время холодных месяцев каждого года, обычно известного как «сезон гриппа». Эти ежегодные эпидемии вызывают 3-5 миллионов случаев тяжелого заболевания и вплоть до 500000 смертей по всему миру, несмотря на то, что большинство симптомов инфекции гриппа являются мягкими (World Health Organization: Influenza (Seasonal) во всемирной паутине по адресу who.int/mediacentre/factsheets/fs211/en/). Каждое столетие возникает несколько пандемий гриппа, когда вирусы гриппа инфицируют большую долю человеческой популяции и влекут значимую распространенность болезни и смертность по всему миру. В 1918 году пандемия испанского гриппа унесла от 3 до 5 процентов мировой популяции, что было наиболее смертоносной пандемией, зафиксированной в истории.
Существующие стратегии создания антител с реактивностью к стеблевому домену
[5] Создание нейтрализующих антител широкого спектра (bNAb) против всех вирусов гриппа было конечной целью разработки вакцины против гриппа. Большинство выделенных bNAb распознают консервативные эпитопы в стеблевом домене HA. Однако антитела, вызываемые с помощью естественной инфекции вирусом гриппа или существующих вакцин против гриппа, главным образом распознают области детерминанты, которые окружают сайт связывания рецептора в домене глобулярной головки HA из-за иммунодоминирования этих областей детерминанты. В целом, эти антитела обладают штаммовой специфичностью в результате высокой вариабельности этих областей детерминанты среди штаммов вируса гриппа. Таким образом, существующие вакцины против гриппа не индуцируют универсальный иммунитет против вирусов гриппа.
[6] Гемагглютинин (HA) представляет собой интегральный мембранный гликопротеин. Он является наиболее обильным белком в липидной двухслойной оболочке вируса гриппа. По оценкам, на поверхности вириона находится 500 молекул HA. HA является единственным белком, необходимым для адсорбции и проникновения вируса в клетку-хозяина. Он связывается с рецепторами клетки-хозяина и делает возможным слияние между липидной оболочкой вириона и мембраной клетки-хозяина. Через его способность связывать рецепторы клеток-хозяев, HA определяет спектр хозяев определенного штамма гриппа.
[7] HA синтезируется в виде одноцепочечного предшественника, называемого HA0, в эндоплазматическом ретикулуме (Stevens, J., et al., Science (2006) 312:404-410). Предшественник HA0 имеет сигнальный пептид на его N-конце и мембранную якорную последовательность на его C-конце. Удаление N-концевого сигнального пептида происходит во время процесса, в котором HA транспортируется сквозь мембрану клетки-хозяина и заякоривается в ней. HA собирается в тримеры из идентичных субъединиц в эндоплазматическом ретикулуме и затем происходит его экспорт на клеточную поверхность через сеть Гольджи. В HA0 происходит расщепление на C-конце в сайте расщепления при созревании (MCS) с помощью специфичной трипсиноподобной протеазы хозяина и превращение в зрелую форму, состоящую из двух связанных дисульфидной связью полипептидов, HA1 и HA2. HA1 представляет собой более крупную N-концевую часть и HA2 представляет собой более C-концевую часть от HA0. HA2 имеет трансмембранную область с коротким C-концевым внутриклеточным хвостом и заякоривает HA в мембране. Каждый зрелый HA имеет общую молекулярную массу приблизительно 70 кДа, где HA1 составляет приблизительно 45 кДа и HA2 составляет приблизительно 25 кДа. Установлены атомные структуры внеклеточной части HA из многих штаммов гриппа. Структурная модель зрелого HA показана на фиг. 1. Все HA, будь то HA0 или зрелая форма, имеют одинаковую общую тримерную структуру с глобулярной головкой на стебле. Каждый мономер HA заякорен на мембране с помощью одной C-концевой трансмембранной области с коротким гидрофильным цитоплазматическим хвостом.
[8] Домен глобулярной головки состоит полностью из HA1 и содержит иммунодоминантные эпитопы. Стеблевой домен главным образом состоит из HA2 и содержит консервативные области, которые иммуногенно субдоминантны. Домен глобулярной головки содержит структуру β-листа из 8 тяжей в его сердцевине с поверхностными петлями и спиралями. Мембранный проксимальный стеблевой домен состоит из левозакрученной сверхспирали тройной суперспиральной структуры из остатков как из HA1, так и из HA2. Каждый мономер HA имеет несколько участков гликозилирования с суммарной молекулярной массой углеводов приблизительно 13 кДа или 19% от общей молекулярной массы HA. Основное гликозилирование имеет место в стеблевом домене около мембранной поверхности. HA также подвержен модификациям посредством пальмитоилирования остатков цистеина на цитоплазматическом хвосте (Veit, M., et al., J. Virol (1991) 65:2491-2500).
[9] Чтобы обойти иммунодоминирование домена глобулярной головки, разрабатывали иммуногены на основании стеблевого домена HA без домена глобулярной головки (безголовые HA). Эти попытки были главным образом безуспешными из-за сложности получения таких молекул с надлежащей третичной структурой (Krammer, F. and Palese, P. Curr Opin Virol (2013) 3:521-530; Eckert, D. M., and Kay, M. S., PNAS (2010) 107:13563-13564). Сам HA2 экспрессировали в E. coli в растворимой форме, которая укладывается в наиболее стабильную после слияния конформацию, вызываемую низким pH (Chen, J., et al., PNAS (1995) 92:12205-12209). Посредством встраивания разработанных мутаций для дестабилизации конформации HA2 при низком pH, другую конструкцию HA2 (HA6) на основании H3 HA экспрессировали в E. coli и повторно укладывали в желаемую конформацию перед слиянием при нейтральном pH (Bommakanti, G., et al., PNAS (2010) 107:13701-13706). HA6 высоко иммуногенен у мышей и защищает мышей от инфекции гомологичными вирусами гриппа A. Однако, сыворотки иммунизированных HA6 мышей не могут нейтрализовать вирус in vitro, что может быть обусловлено ограничением анализа, который только обнаруживает нейтрализующую вирус активность антител, распознающих домен глобулярной головки. Описана другая «безголовая» конструкция стеблевого домена HA с HA2 и областью HA1 в стеблевом домене (Steel, J., et al., mBio (2010) 1:e00018-10). Этот иммуноген защищал мышей от заражения гомологичным гриппом и индуцировал антисыворотки с перекрестной реактивностью к гетерологичным HA внутри той же группы. Как и в случае HA6, антисыворотки не демонстрируют нейтрализующую активность in vitro. Все эти конструкции основаны на минимизации белка посредством элиминации иммунодоминантых областей.
[10] В последнее время через рациональную разработку, основанную на структуре, и реитеративный bNAb отбор в библиотеках конструкций создавали стабильные тримерные H1 HA иммуногены только из стебля (безголовые мини-HA) (Impagliazzo, A., et al., Science (2015) 349:1301-1306; Yassing, H., M., et al., Nat Med (2015) 21:1065-1070; патентная заявка WO 2014/191435 A1). Эти мини-HA иммуногены только из стебля индуцировали ожидаемые антитела к стеблевому домену HA. Мыши и хорьки, иммунизированные этими мини-HA иммуногенами, были защищены от летального инфицирования высоко патогенным вирусом H5. Кроме того, мини-HA иммуноген индуцировали нейтрализующие H5 антитела у яванских макаков. Эти мини-HA иммуногены отбирали по их связывания со специфичными bNAb. Длинный реитеративный процесс bNAb отбора требует повторения для bNAb различных типов. Несмотря на то, что конформации эпитопов bNAb сохранены в этих мини-HA иммуногенах, общие структуры отличались от стеблевого домена нативного HA. Из-за этих структурных изменений маловероятно эти безголовые мини-HA иммуногены могут быть собраны в вирусы гриппа или подобные вирусу гриппа частицы (VLP). Кроме того, безголовые мини-HA иммуногены не имеют сайт связывания рецептора для связывания клетки-хозяина.
[11] Разработаны химерные HA для того, чтобы направлять иммунный ответ хозяина на стеблевой домен. Большинство нейтрализующих антител, индуцированных пандемической инфекцией H1N1, обладали широкой перекрестной реактивностью против эпитопов в стеблевом домене HA и домене глобулярной головки многих штаммов гриппа (Wrammert, J., et al., J. Exp Med (2011) 208:181-193). Иммунизация с использованием HA, полученного из штаммов гриппа H5N1 (группа 1 HA), который не циркулирует у человека, по существу увеличивает специфический ответ на стебель HA циркулирующих сезонных штаммов группы 1 (Ellebedy, A. H., et al., PNAS (2014) 111:13133-13138; Nachbagauer, R., et al., J Virol (2014) 88:13260-13268; Whittle, J. R. R., et al., J. Virol (2014) 88:4047-4057). После каждого появления пандемических штаммов вируса гриппа в 1957, 1968 и 2009 годах, существующие сезонные штаммы вируса были заменены в популяции человека на новые пандемические штаммы.
[12] Гипотетически воздействие новых пандемических штаммов вируса гриппа с отличающимися доменами глобулярной головки ведет к аффинно зрелому вторичному иммунному ответу на консервативные эпитопы в стеблевых доменах (Palese, P. and Wang, T. T., mBio (2011) 2:e00150-11). В поддержку этой гипотезы сконструированный рекомбинантный химерный HA из домена глобулярной головки H6, H9 или H5 и стеблевого домена H1 вызывал высокий титр нейтрализующих антител со специфичностью к стеблю (Pica, N., et al., PNAS (2012) 109:2573-2578; Krammer, F., et al., J. Virol (2013) 87:6542-6550). В этих случаях домен глобулярной головки H1 HA заменяли на домен глобулярной головки из H6, H9 или H5 из той же группы 1 HA, в отношении которой большинство человеческой популяции является наивным. Эти замены выполняли посредством замены последовательности H1 HA между цистеином 52 и цистеином 277 в HA1 на соответствующую последовательность из H6, H9 или H5. Цистеин 52 и цистеин 277 образуют дисульфидную связь в шарнирной области между доменом глобулярной головки и стеблевым доменом. Схожие химерные HA получали с использованием стеблевого домена H3, чтобы разрабатывать вакцины для штаммов гриппа группы 2 (Krammer, F., et al., J. Virol (2014) 88:2340-2343; Margine, I., et al., J. Virol (2013) 87:10435-10446). Иммунизация животных этими химерными HA индуцировала специфичные антитела к стеблю с широкой нейтрализующей активностью против каждой группы вирусов. Человеческая популяция имеет конституциональный иммунитет к циркулирующим штаммам вирусов H1 (группа 1), H3 (группа 2) и гриппа B. Вакцинация химерным HA повышала уровни антител против стеблевых доменов, которые являются общими для HA из циркулирующих штаммов и химерного HA. Только первичный ответ индуцировали против нового домена глобулярной головки на химерном HA, в отношении которого человек является наивным. Последующая стимуляция вторым химерным HA, который имеет тот же стеблевой домен, но другой домен головки, дополнительно увеличивала уровни антител со специфичностью к стеблю. Результаты подсказывают, что изменение экспонирования хозяина для иммунодоминантных эпитопов в домене глобулярной головки может увеличивать защитные иммунные ответы широкого спектра против иммуносубдоминантных эпитопов в стеблевом домене.
[13] Петлю из шести аминокислот в области детерминанты B гемагглютинина A/WSN/33(H1N1) можно заменять на гомологичные остатки области детерминанты B из HA из A/Japan/57(H2N2) и A/Hong Kong/8/68(H3N2) (Li, S., et al., J. Virol (1992) 66: 399-404). Эти замены не препятствуют функции HA по связыванию рецептора. Рекомбинантные вирусы гриппа с этими химерными HA реплицировали в клеточной культуре MDCK (эпителиальные клетки почки собаки Madin-Darby). Вирусы с химерными HA из A/WSN/33(H1N1) и A/Hong Kong/8/68(H3N2) индуцировали антитела против A/WSN/33(H1N1) и A/Hong Kong/8/68(H3N2). Эти результаты подсказывают, что иммунодоминантные области детерминанты HA можно заменять соответствующими гомологичными иммунодоминантными областями детерминанты других HA из различных штаммов. Эти замены меняют антигенную специфичность получаемых химерных HA.
[14] Следовательно, в приведенных выше абзацах иммунодоминантные эпитопы в одном штамме гриппа заменяли на гомологичные иммунодоминантные эпитопы другого штамма.
[15] Другая стратегия состоит в том, чтобы ослаблять иммунодоминантные эпитопы и перефокусировать иммунный ответ хозяина в направлении стеблевого домена. Иммунодоминантные области детерминанты в домене глобулярной головки можно экранировать посредством введения дополнительных участков гликозилирования для гипергликозилирования (Eggink, D., et al., J. Virol (2014) 88:699-704, патентная заявка US 2014/0004149 A1). Гипергликозилирование в домене глобулярной головки не меняет аффинность связывания антител с реактивностью к стеблю. Иммунизация мышей гипергликозилированным HA индуцировала высокие титры антител с реактивностью к стеблю и защиту от распространенности болезни и смертности при заражении различными сезонными вирусами. В патентной заявке US 2013/0315929 A1 раскрыт другой способ ослабления иммунодоминантных эпитопов в домене глобулярной головки посредством замены некоторых остатков этих эпитопов на другие аминокислоты с меньшей вероятностью оказаться частью эпитопа. Результаты показывали, что экранирование иммунодоминантных эпитопов в домене глобулярной головки может увеличивать защитный иммунный ответ широкого спектра против иммуносубдоминантных эпитопов в стеблевом домене.
HA в качестве носителя для представления чужеродных эпитопов
[16] HA гриппа использовали в качестве носителя для эпитопов петли V3 оболочечного белка HIV 1. Инсерцией пептидов иммунодоминантных эпитопов от 12 до 22 остатков в длину из оболочечного белка gp120 из HIV 1 в иммунодоминантную область детерминанты HA, область A или область B, получали химерные HA с индивидуальным эпитопом HIV 1 в домене глобулярной головки. Остатки области A и области B не удаляли. Иммунодоминантные эпитопы HIV-1 вставляли в эти области. Химерные HA индуцировали иммунный ответ на эпитоп петли V3 HIV 1 у животных (Kalyan, N. K., et al., Vaccine (1994) 12:753-760; патент США U.S. 5591823 A; Li, S., et al., J. Virol (1993) 67:6659-6666). Иммуногенность вставленных эпитопов выглядела усиленной с помощью HA, поскольку очень низкой дозы химерного белка HA было достаточно для того, чтобы индуцировать антитела со специфичностью ко вставленному эпитопу. Эти результаты показывают, что иммунодоминантные чужеродные эпитопы из белков, отличных от HA, можно вставлять в иммунодоминантные области детерминанты HA. Эти химерные молекулы HA со вставленными чужеродными иммунодоминантными эпитопами могут индуцировать иммунный ответ на вставленные чужеродные иммунодоминантные эпитопы.
Описание изобретения
[17] Это изобретение направлено на модифицированные формы белка гемагглютинина гриппа, на вакцины, вирусоподобные частицы и вирусы, которые содержат их, а также рекомбинантные способы и материалы для их получения. В целом, эти модификации включают замену иммунодоминантных областей домена глобулярной головки белка HA на альтернативные эпитопы для создания антител и/или модификации сайта расщепления при созревании (MCS) в стеблевом домене белка HA. Расщепление HA0 между MCS и слитым пептидом для того, чтобы создавать свободный N-конец в HA2, необходимо для попадания в клетку. Изменяя MCS с тем, чтобы предотвращать его расщепление протеазами животного, вирус, где MCS уже расщеплен, делает возможной инфекцию клеток-хозяев, где вирус может размножаться, но его потомством является неинфекционным. Таким образом, присутствие любых эпитопов, в том числе тех, которые занимают иммунодоминантные участки, усиливают без дальнейшей инфекции хозяина потомством вируса.
[18] В одном из аспектов изобретение направлено на вакцину против гриппа, которая содержит модифицированный HA, или вирус или вирусоподобную частицу, которые содержат его, где иммунодоминантная область белка HA содержит консервативный альтернативный эпитоп того же штамма гриппа или другого штамма гриппа, вставленный в эту область. Это обеспечивает более успешную иммуногенную форму вставленного альтернативного эпитопа, который является иммуносубдоминантным в его нативном положении. Альтернативные эпитопы представляют собой те, которые не получают из домена глобулярной головки других HA. Обычно они происходят из стеблевых доменов HA или из белков не HA гриппа, таких как M2.
[19] В другом аспекте изобретение направлено на модифицированный вирус гриппа (который также можно использовать в качестве вакцины), который модифицировали, чтобы он содержал MCS, который не расщепляют протеазы животного. Как указано выше, это делает возможным амплификацию вируса без порождения его инфекционных форм. Такой вирус дополнительно можно модифицировать посредством замены одной или более иммунодоминантных областей на альтернативный или гетерологичный эпитоп, который может представлять собой эпитоп гриппа или чужеродный эпитоп, в том числе, например, эпитопы, характерные для других вирусов, бактерий или опухолеассоциированных антигенов.
[20] В других аспектах изобретение направлено на рекомбинантные материалы и способы получения белков, вирусов или вирусоподобных частиц с модифицированным белком HA и способы создания антител с использованием белков, вирусоподобных частиц или модифицированных вирусов.
Краткое описание фигур
[21] На фиг. 1 проиллюстрирована рентгеновская кристаллическая структура внеклеточной части зрелого HA из A/California/07/2009, исходный штамм H1N1 вируса гриппа A свиньи (PDB:3LZG). Эту структуру используют для того, чтобы направлять разработку конструкций в этом изобретении. Пептидную последовательность этого HA используют для создания родительской конструкции H1 HA дикого типа (WT). На фиг. 1A представлен тример HA, где один мономер HA изображен в виде ленты и другие два в виде остова. Указаны ориентация относительно мембраны, положение домена глобулярной головки и стеблевого домена. HA1 показан в виде светло-серой ленты и HA2 показан в виде темно-серой ленты. На фиг. 1B представлен один мономер HA с положениями HA1 и HA2, а также N- и C-концы от HA1 и HA2. Слитый пептид обведен.
[22] На фиг. 2 проиллюстрированы приблизительные положения иммунодоминантных областей детерминанты H3 HA, картированные на H1 мономер HA из A/California/07/2009. На фиг. 2A представлено ленточное изображение, как на фиг. 1. Иммунодоминантные области детерминанты A, B, C, D и E из H3 HA показаны темными оттенками. На фиг. 2B представлен вид сверху на фиг. 2A над доменом глобулярной головки дистально от мембраны.
[23] На фиг. 3 проиллюстрированы приблизительные положения иммунодоминантных областей детерминанты из H1 HA, картированные на H1 мономер HA из A/California/07/2009. На фиг. 3A представлено ленточное изображение, как на фиг. 1. Иммунодоминантные области детерминанты Ca1, Ca2, Cb, Sa и Sb из H1 HA представлены темными оттенками. На фиг. 3B представлен вид сверху на фиг. 3A над доменом глобулярной головки дистально от мембраны. Многие из этих иммунодоминантных областей детерминант окружают сайт связывания рецептора клетки-хозяина, как показано стрелкой.
[24] На фиг. 4 проиллюстрирована принципиальная схема конструкций H1 HA. На фиг. 4A приведено схематическое представление признаков нуклеиновых кислот в конструкциях. Помечены положения участков рестрикции для субклонирования. На фиг. 4B приведено схематическое представление признаков белков в конструкциях в пропорциях относительно нуклеиновой кислоты, представленной на фиг. 4A. GP67ss представляет сигнал секреции GP67 (сигнальный пептид) на N-конце. HA1 представляет HA HA1. MCS представляет сайт расщепления HA при созревании, который является частью HA1. HA2 представляет HA HA2. TEV представляет сайт расщепления TEV. Фолдон представляет последовательность фолдона. His представляет метку из 10 гистидинов (метка 10× гистидинов) на C-конце.
[25] На фиг. 5 проиллюстрированы положения, где гетерологичные эпитопы размещают в домене глобулярной головки HA и где имеют место измененные сайты расщепления при созревании. Пептидную последовательность родительской конструкции (WT) выравнивают с последовательностями HA из H3 (A/Aichi/2/1968 H3N2) и H1 (A/Puerto Rico/8/1934 H1N1). Аминокислотные положения каждой последовательности помечены справа на основании нумерации HA0, где первый остаток после удаления сигнальной последовательности представляет положение 1. Сайт расщепления при созревании (MCS) обозначен стрелкой и вертикальной линией. Иммунодоминантные области детерминант A, B, C, D и E из H3 HA отмечены над последовательностью H3. Иммунодоминантные области детерминант Ca1, Ca2, Cb, Sa и Sb из H1 HA помечены под последовательностью H1. Подчеркнутые последовательности в WT заменяют на гетерологичные эпитопы, указанные под последовательностями. Измененные сайты расщепления при созревании показаны под сайтом расщепления при созревании (MCS). Нативные иммуносубдоминантные области детерминант для нейтрализующих антител широкого спектра (bNAb), FI6, 1C9 и CR8020, помечены линиями над последовательностями, соответственно.
[26] На фиг. 6 проиллюстрированы модели мономера HA с композитным эпитопом CR8020, расположенным в иммунодоминантных областях детерминант домена глобулярной головки. Мономер HA приведен в виде ленточного изображения, как на фиг. 1. Иммунодоминантные области детерминант, которые заменены композитным эпитопом CR8020, показаны темным оттенком. Исходные нативные эпитопы CR8020 в стеблевом домене также показаны темным оттенком. На фиг. 6A представлена модель CR8020Sa4. На фиг. 6B представлена модель CR8020Ca.
[27] На фиг. 7 представлены данные об экспрессии конструкций HA, описанных в этом изобретении. Среду клеточной культуры от клеток SF9, инфицированных рекомбинантным бакуловирусом указанной конструкции, собирали и захватывали с помощью смолы Ni-NTA (осаждение Ni). Смолу Ni-NTA промывали в 1× PBS для того, чтобы удалять не связанные белки. Белки, связанные со смолой Ni-NTA, анализировали посредством SDS-PAGE с окрашиванием Coomassie® (фиг. 7A, B, C и D) или вестерн-блоттинга против His (фиг. 7E). Стрелка указывает полноразмерный HA0.
[28] На фиг. 8 представлены очищенные конструкции HA, используемые в этом изобретении. Среду клеточной культуры от клеток SF9, инфицированных рекомбинантным бакуловирусом указанной конструкции, собирали и захватывали с помощью смолы Ni-NTA (осаждение Ni). Смолу Ni-NTA промывали в 1× PBS. Связанные белки элюировали имидазолом и анализировали посредством SDS-PAGE с окрашиванием Coomassie®. Стрелка указывает полноразмерный HA0.
Способы осуществления изобретения
[29] Поскольку это изобретение направлено на модификации белка HA, может быть полезно дополнительное описание этого белка и его функции в дополнение к тому, что приведено выше.
[30] Протеазное расщепление HA0 является предпосылкой к инфекционности вирусов гриппа A. Распределение этих протеаз у хозяина является одной из детерминант тканевого тропизма и, по существу, патогенности. В дыхательных путях и легких идентифицировано несколько трипсиноподобных протеаз, которые расщепляют большинство HA с использованием сайтов расщепления при созревании, содержащих одну основную аминокислоту (Kido, H., et al., J. Biol Chem (1992) 267:13573-13579; Peitsch, C., et al., J. Virol (2014) 88:282-291; Zhirnov, O., P., et al., J. Virol (2002) 76: 8682-8689). Эти протеазы представляют собой сериновые протеазы. Одной из них является трипсиноподобная протеаза Clara, впервые выделенная из бронхиолярных эпителиальных клеток Clara крысы. В тканях ограниченное распределение этих протеаз, которые расщепляют HA0, ограничивают инфекцию вирусом гриппа дыхательными путями и легкими млекопитающих.
[31] Протеазы, отвечающие за созревание HA, не достаточно хорошо охарактеризованы. Подобно трипсину, эти протеазы расщепляют пептидную связь на C-конце от основного остатка такого как аргинин (R) или лизин (K). Сайт расщепления при созревании (MCS) расположен на C-конце HA1 и расщепление на C-конце MCS необходимо для инфекционности.
[32] Последовательность нескольких основных аминокислот в сайтах расщепления при созревании в субтипах H5 и H7 ведет к чувствительности к расщеплению более широким спектром клеточных протеаз, таких как протеазы типа фурина и субтилизина, что коррелирует с более широким тканевым тропизмом и более высокой патогенностью этих вирусов у млекопитающих (Stieneke A., et al., EMBO J (1992) 11:2407-2414; Maines, T. R., et al., J. Virol (2005) 79:11788-11800). Многие высоко патогенные субтипы птичьего гриппа (HPAI) являются H5 и H7. Во время вспышек HPAI у человека, приводимые уровни летальности выше таковых для пандемических и сезонных вирусов гриппа (Morens, D. M., et al., Nature (2012) 486:335-340). Эти последовательности нескольких основных аминокислот в MCS также ведут к репликации вируса во многих органах птиц различных видов, что ведет к высокой смертности у этих видов птиц.
[33] Расщепление HA сезонных вирусов гриппа и непатогенных вирусов птичьего гриппа происходит внеклеточно с помощью конкретных протеазы в дыхательных путях и легких, что ограничивает их тканевой тропизм. С другой стороны, расщепление HA высоко патогенных вирусов происходит внутриклеточно с помощью повсеместно встречающихся протеаз. Эти высоко патогенные вирусы проходят множество циклов репликации в различных тканях, вызывая системные инфекции (Steinhauer, D. A., Вирус. Virol (1999) 258:1-20; Taubenberger, J. K., PNAS (1998) 95:9713-9715). Пандемический штамм вируса гриппа человека 1918 года также использует широкий диапазон клеточных протеаз и использует свою нейраминидазу (NA) для привлечения плазминогена для расщепления HA (Goto, H. and Kawaoka, Y. PNAS (1998) 95:10224-10228; Chaipan, C., et al., J. Virol (2009) 83:3200-3211).
[34] При расщеплении HA0 происходит образование HA2 с новым свободным N-концом, который важен для слияния вириона с клетками-хозяевами. расщепленная форма представляет собой зрелую форму HA с полной функцией связывания рецепторов и слияния с мембраной. HA0 обладает способностью связывать рецепторы, но не опосредовать слияние с мембраной. И предшественник и зрелая форма HA существуют на поверхности вирионов. Вирусы только с HA0 не обладают активностью слияния и не вызывают инфекцию.
[35] 12 N-концевых остатков HA2 называют «слитым пептидом» (Skehel, et al., Biochem Soc Trans (2001) 29:623-626). Слитый пептид имеет гидрофобную последовательность. В HA0 MCS и слитый пептид формируют поверхностную петлю. После расщепления, вновь созданный N-концевой слитый пептид входит в область контакта в тримере HA. После связывания с рецепторами клетки-хозяина, происходит эндоцитоз прикрепленных вирионов гриппа клетками-хозяевами в эндосомы. Потенциал слияния зрелого HA активируется при эндосомальном pH, между pH 5 и 6, в зависимости от конкретного штамма вируса гриппа. Экстенсивные изменения структуры HA при низком pH ведут к выдавливанию слитого пептида в направлении клеточной мембраны. Проникновение слитого пептида в эндосомальную мембрану хозяина ведет к слиянию окружающей эндосомальной мембраны хозяина с вирусной мембраной, содержащей C-концевую область мембранного якоря HA. Слияние высвобождает сегменты вирусной РНК в цитоплазму клетки-хозяина для проникновения в ядро клетки-хозяина, где происходит репликация вируса.
[36] HA определяет спектр хозяев для штамма вируса гриппа. HA связывается с терминальной сиаловой кислотой гликопротеинов и гликолипидов поверхности клетки-хозяина. HA из штаммов гриппа человека связываются почти исключительно с сиалилолигосахаридами, оканчивающимися SAα2,6Gal, тогда как HA из штаммов гриппа птиц и лошадей связывают SAα2,3Gal. Человек имеет главным образом сиалилолигосахариды SAα2,6Gal, а виды птиц имеют главным образом сиалилолигосахариды SAα2,3Gal. Как схематически показано на фиг. 3, сайты связывания рецептора хозяина на HA расположены в домене глобулярной головки, который состоит исключительно из HA1. Рецепторная специфичность вируса гриппа HA хорошо описана. Картированы аминокислотные остатки, отвечающие за распознавание SAα2,6Gal или SAα2,3Gal. Показано, что замена одного аминокислотного остатка в рецептор-связывающем кармане меняет рецепторную специфичность связывания (Rogers, G. N., et al., Nature (1983) 304:76-78). Различные изоляты пандемического вируса гриппа 1918 года имеют различную рецепторную специфичность связывания в результате замены одной аминокислоты в сайте связывания рецептора в HA (Glaser, L., et al., J. Virol (2005) 79:11533-11536). Штамм A/South Carolina/1/18 HA предпочтительно связывает клеточный рецептор SAα2,6Gal человека, тогда как штамм A/New York/1/18 HA связывает и клеточный рецептор SAα2,6Gal человека и клеточный рецептор SAα2,3Gal птиц, что раскрывает динамическую природу адаптации вирусов гриппа к хозяину.
[37] Даже несмотря на то, что одна мутация в сайте связывания рецептора в HA меняет рецепторную специфичность связывания с птиц на человеке, эффективная передача штамма вируса гриппа птиц H5 человеку требует несколько других изменений в HA вне сайта связывания рецептора и изменений в других белках гриппа (Imai, M., et al., Nature (2012) 486:420-428; Herfst, S., et al., Science (2012) 336:1534-1541; Chen, L M., et al., Virol (2012) 422:105-113; Russell, C. A., et al., Science (2012) 336:1541-1547). Вместе с другими изменениями, всего четырех замен аминокислот в H5 HA достаточно для того, чтобы сделать возможной передачу мутантного вируса птиц H5 среди хорьков через респираторные капельки. В дополнение к пониманию передачи вируса гриппа между видами, в этих исследованиях созданы лабораторные процедуры для изучения передачи вирус гриппа, относящегося не к млекопитающим, у млекопитающих, которые можно использовать для того, чтобы оценивать кандидатов на универсальные противогриппозные вакцины.
Описание антител против гриппа и областей детерминант в HA
[38] Являясь наиболее обильным белком вируса гриппа в липидной двухслойной оболочке, HA представляет собой основной антиген вируса гриппа и несет первичные эпитопы для нейтрализующих антител. Большинство антител человека против гриппа направлены против HA и NA. Шестьдесят процентов (60%) антител с реактивностью к гриппу, индуцированных посредством вакцинации, реагируют с HA (Wrammert, J., et al., Nature (2008) 453:667-671). Большинство реагирующих с HA антител распознают области детерминант, которые окружают сайт связывания рецептора в домене глобулярной головки. Некоторые из этих антител представляют собой нейтрализующие вирус антитела. Эти нейтрализующие антитела (NAb) в целом препятствуют связыванию HA с клетками-хозяевами и демонстрируют активность ингибирования HA (HI). В целом они являются штамм-специфическими из-за высокой вариабельности этих областей детерминант и, таким образом, не обладают столь желаемой широкой нейтрализующей активностью (Wang, T. T., and Palese, P., Nat Struct Mol Biol (2009) 16:233-234).
[39] Повсеместная инфекция вирусами гриппа является результатом способности вируса изменять свои антигенные свойства. Изменения антигенных свойств вирусов гриппа являются результатом низкой точности репликации вирусного генома подверженным ошибкам комплексом РНК полимеразы, зависимой от вирусной РНК. Высокая частота мутаций ведет к антигенному дрейфу, постепенному изменению антигенных свойств HA. Антигенный дрейф возникает в вирусах гриппа всех типов. Анализ последовательностей генов HA показывает, что большинство изменений в аминокислотных последовательностях расположено в HA1, даже несмотря на то, что молчащие изменения в последовательности нуклеиновой кислоты распределены по всему гену HA (Palese, P., and Young, J. F., Science (1982) 215:1468-1474). HA2 является более консервативным, чем HA1.
[40] Сегментированная природа вирусного генома также ведет к перегруппировке сегментов вирусного генома, когда вирусы двух различных штаммов совместно инфицируют хозяина одновременно. При этой перегруппировке возникает новый штамм вируса с отличающимися белками вирусной поверхности, что ведет к антигенной изменчивости, внезапному изменению антигенных свойств HA. Антигенная изменчивость возникает только у вирусов гриппа A. Антигенный дрейф и антигенная изменчивость позволяют вирусам гриппа уходить от нейтрализации с помощью существующих антител.
Грипп H3
[41] Первая подробная структура гриппа HA, которую определили более 35 лет назад, пролила свет на сайты связывания антител в HA и дала молекулярное объяснение антигенного дрейфа и антигенной изменчивости (Wilson, I. A., et al., Nature (1981) 289:366-373; Wiley, D. C., et al., Nature (1981) 289:373-378; Wiley, D. C., and Skehel, J. J., Ann Rev Biochem (1987) 6:365-394).
[42] Сравнение последовательностей HA антигенно различных вирусов позволило идентифицировать иммунодоминантные области детерминант в домене глобулярной головки H3 HA субтипа HA группы 2. Описания иммунодоминантных областей детерминант в H3 HA подтверждены другими (Both, G. W., et al., J. Virol (1983) 48:52-60). Приблизительные положения этих областей детерминант в структуре HA схематически представлены на фиг. 2. Положения последовательностей этих областей детерминант представлены на фиг. 5. Область A расположена в поверхностной петле из остатков с 133 до 148 в HA из штамма H3N2 A/Aichi/2/1968 (нумерация по H3 на фиг. 5). Эта петля, известная как 140-петля, выступает из домена глобулярной головки и находится на нижнем краю рецептор-связывающего кармана. Область B расположена в верхней части домена глобулярной головки и содержит поверхностную α-спираль из остатков с 187 до 196 и смежную поверхностную петлю из остатков с 155 до 160 вдоль верхнего края рецептор-связывающего кармана. Область C окружает дисульфидную связь между Cys52 и Cys277. Перекрещивание петли (остатки с 46 до 55), сосредоточенной у Cys52, и петли (остатки с 271 до 280), сосредоточенной у Cys277, образует выпуклость в шарнире между доменом глобулярной головки и стеблевым доменом. Область D находится в области контакта между мономерными субъединицами HA из тримера HA. Она сосредоточена в двух β-тяжах из остатков с 200 до 214 в структуре β-листа из 8 тяжей в сердцевине домена глобулярной головки. Остатки на поворотах других β-тяжей также могут быть частью области D. Область D главным образом погружена в область контакта тримера HA. Не ясно, как область D выполняет функцию области детерминанты. Область E расположена между областью A и областью C на стороне домена глобулярной головки и выполнена из поверхностных петель из остатков с 62 до 63, остатков с 78 до 83 и β-тяжа из остатков с 119 до 122 на краю β-листов из 8 тяжей. Вместе эти остатки области E образуют непрерывную поверхность на стороне домена глобулярной головки. Сравнение замен аминокислот и антигенных свойств вирусов гриппа, которые возникали в период с 1968 до 2003 года, показало, что замены, отвечающие за основные антигенные изменения, расположены исключительно в области A и области B (Smith, D. J., et al., Science (2004) 305:371-376; Koel, B. F., et al., Science (2013) 342:976-979). Замены в областях C, D и E, похоже, вызывают минорные антигенные изменения. Результаты подсказывают, что большинство штамм-специфических нейтрализующих антител связывается с областью A и областью B на периферии сайта связывания рецептора домена глобулярной головки.
Грипп H1
[43] Генетический анализ антигенно отличной группы 1 H1 HA вирусного штамма A/PR/8/34 выявил отчетливые области детерминант в домене глобулярной головки, названные областями Ca1, Ca2, Cb, Sa и Sb (Caton, A. J., et al., Cell (1982) 31:417-427; Gerhard, W., et al., Nature (1981) 290:713-717). Приблизительные положения этих областей детерминант в структуре HA схематически представлены на фиг. 3. Положения последовательностей этих областей детерминант представлены на фиг. 5. Область Ca1 расположена на поворотах β-тяжей структуры β-листа из 8 тяжей. Один из поворотов из остатков с 165 до 169 (нумерация по H1 на фиг. 5) экспонирован на поверхности. Остаток 207 из области Ca1 находится в повороте, соединяющем два β-тяжа, соответствующих области D из H3 HA. Область Ca1 из H1 HA в целом соответствует области D из H3 HA. область Ca2 также состоит из двух сегментов, которые разделены в первичной структуре, но вместе в третичной структуре. Один сегмент Ca2 находится в поверхностной петле из остатков с 136 до 141 в соответствующем положении области A из H3 HA. Другой сегмент Ca2 состоит из остатков с 220 до 221 на длинной поверхностной петле. Область Ca2 находится на противоположной стороне от Ca1 в домене глобулярной головки мономера HA, но смежно с областью Ca1 другого мономера HA в тримере HA. Область Ca1 одного мономера HA образует непрерывную поверхность с областью Ca2 другого мономера HA в структуре тримера. Область Cb представляет собой линейный эпитоп из остатков с 70 до 75, которые образуют поверхностную петлю радом со структурой β-листа из 8 тяжей. Она соответствует области E из H3 HA. Области Sa и Sb можно рассматривать как подобласти, которые соответствуют области B из H3 HA. Область Sa из остатков с 154 до 163 перекрывается с петлей, соответствующей петле области B из H3 HA. Другой сегмент области Sa представляет собой соседний поворот из остатков с 124 до 125. Область Sb соответствует α-спирали области B из H3 HA и главным образом содержит остатки α-спирали с 188 до 194.
Нейтрализующие антитела широкого спектра и консервативные эпитопы
[44] Естественная инфекция вирусом гриппа или вакцинация трехвалентными инактивированными противогриппозными вакцинами (TIV) также вызывают низкие уровни антител против консервативных эпитопов HA, которые главным образом расположены в мембранном проксимальном стеблевом домене (Ellebedy, A. H., et al., PNAS (2014) 111:13133-13138). Эти антитела распознают эпитопы, консервативные среди многих штаммов вирусов гриппа. Те, которые обеспечивают защиту от нескольких штаммов, называют нейтрализующими антителами широкого спектра (bNAb). Эти bNAb в целом не обладают активностью ингибирования HA и не предотвращают связывание HA с поверхностными рецепторами клетки-хозяина. Первые антитела C179 с перекрестной реактивностью к нескольким штаммам охарактеризованы более 20 лет назад (Okuno, Y., et al., J. Virol (1993) 67:2552-2558). Они распознают конформационный эпитоп из остатков с 318 до 322 (TGLRN) в HA1 и остатков с 47 до 58 (GITNKVNSVIEK) в HA2, которые консервативны среди штаммов H1 и H2. C179 ингибирует активность слияния HA и, таким образом, ведет к нейтрализации вируса.
[45] Многие bNAb обнаружены или выделены у пациентов, инфицированных вирусами гриппа (Ekiert, D. C., и Wilson, I. A., Curr Opin Virol (2012) 2:134-141). Показано, что bNAb нейтрализуют вирусы гриппа A группы 1, группы 2 или обеих групп 1 и 2. Идентифицированы и охарактеризованы многие антигенные эпитопы, распознаваемые с помощью bNAb. Эти эпитопы представляют собой или линейный сегмент последовательности HA или конформационные эпитопы из нескольких линейных сегментов последовательности HA. Многие эпитопы для bNAb расположены в менее вариабельном стеблевом домене белков HA. Эти эпитопы включают, но не ограничиваясь этим, слитые пептиды и пептидные последовательности около MCS.
[46] Многие bNAb и их эпитопы охарактеризованы структурно. Например, bNAb FI6 распознает остатки из MCS и слитого пептида в HA0 (Corti, D., et al., Science (2011) 333:850-856). При пептидном картировании HA идентифицированы два пептида в качестве эпитопов FI6, RKKRGLFGAIAGFIE, состоящего из MCS и большей части слитого пептида, и KESTQKAIDGVTNKVNS из суперспирального пептида спирали в HA2. Предложенный механизм нейтрализации FI6 состоит в том, чтобы ингибировать слияние с мембраной, а также предотвращать созревание HA посредством блокирования доступа протеазы к MCS в HA0. Другое bNAb F10 распознает конформационный эпитоп около слитого пептида в зрелой форме HA (Su, J., et al., Nat Struct Mol Biol (2009) 16:265-273). F10 ингибирует все вирусы гриппа A группы 1 предположительно посредством предотвращения слияния с мембраной.
[47] Моноклональное bNAb 1C9 ингибирует слияние клеток in vitro (патент США 8540995; Prabhu, N., et al., J. Virol (2009) 83:2553-2562). 1C9 распознает линейный эпитоп GLFGAIAGF, N-конец слитого пептида из H5 HA2 из HPAI H5N1 (Immune Epitope Database, веб-адрес: iedb.org/assay details.php?assayId=1599077). 1C9 проявляет защиту мышей от инфекции высоко патогенными вирусом птичьего гриппа (HPAI) H5N1. Моноклональные bNAb также выделены из B-клеток памяти (Hu, W., et al., Virol (2013) 435:320-328). Некоторые из этих моноклональных антител распознают линейный эпитоп FIEGGWTGMVDGWYGYHH в HA2 из пандемического вируса гриппа 2009 года H1N1. Этот эпитоп расположен на C-конце относительно эпитопа 1C9 из слитого пептида. Последовательности из 14 остатков слитых пептидов HA высококонсервативными среди вирусов гриппа A и B.
[48] Консервативную природу HA слитых пептидов исследовали для разработки универсальной противогриппозной вакцины. Пептидная конъюгатная вакцина, на основании высоко консервативной последовательности из HA0 вируса гриппа B, которая содержит последние 9 аминокислотных остатков HA1, которая содержит MCS и слитый пептид HA2 по обеим сторонам от разрезаемой связи, вызывала защитный иммунный ответ от летального заражения штаммами вирусов антигенно различных линий вирусов гриппа B (Bianchi, E., et al., J. Virol (2005) 79:7380-7388).
[49] Моноклональное bNAb CR6261 распознает высоко консервативную область в HA2 спирали A и HA1 остатки в стеблевом домене (Ekiert, D. C., et al., Science (2009) 324:246-251). CR6261 нейтрализует вирусы гриппа группы 1 посредством предотвращения превращения HA в конформацию после слияния. CR6261 относится к bNAb, в которых используют ту же тяжелую цепь антитела VH1-69 эмбрионального типа. Другое моноклональное антитело VH1-69, CR8020 нейтрализует вирусы гриппа группы 2. CR8020 связывает HA у основания стеблевого домена в непосредственной близости (от ~15 до 20 ангстремов) от мембраны, аналогично тем антителам против HIV, которые распознают мембранную проксимальную внешнюю область (MPER) из субъединицы gp41 HIV (Ekiert, D. C., et al., Science (2011) 333:843-850). Два основных компонента эпитопа CR8020 состоят из C-концевой части (остатки HA2 с 15 до 19, EGMID из H3) слитого пептида и самого внешнего тяжа (остатки HA2 с 30 до 36, EGTGQAA из H3) β-листа из 5 тяжей около основания стеблевого домена. Эти два компонента находятся на расстоянии в 10 остатков в первичной структуре H3. Большинство bNAb, которые связываются со стеблевым доменом HA, нейтрализуют HA вирусов гриппа A группы 1 (H1, H2, H5, H6, H8, H9, H11, H12, H13 и H16) или группы 2 (H3, H4, H7, H10, H14 и H15). Эти антитела не ингибируют связывание HA с клетками-хозяевами, но могут предотвращать слияние вирусной мембраны и мембраны клетки-хозяина.
[50] Сайт связывания рецептора в HA представляет собой карман в верхней части домена глобулярной головки (Wilson, I. A., et al., Nature (1981) 289:366-373; Wiley, D. C., и Skehel, J. J., Ann Rev Biochem (1987) 56:365-394). Этот карман формируют аминокислотные остатки, которые высоко консервативны среди многих штаммов гриппа. Край кармана формируют иммунодоминантные области детерминант, такие как область A и область B из H3, как описано выше. ПРи клонировании моноклональных антител (mAb) человека от здоровых субъектов-людей идентифицированы bNAb, которые распознают консервативные остатки в непосредственной близости от сайта связывания рецептора в домене глобулярной головки в HA из штаммов H1, H2 и H3 (Krause, J. C., et al., J. Virol (2011) 85:10905-10908; Krause, J. C., et al., J. Virol (2012) 86:6334-6340). Структурные исследования выявили, что по меньшей мере некоторые из этих bNAb имитируют взаимодействие сиаловой кислоты с рецептор-связывающим карманом (Whittle, J. R. R., et al., PNAS (2011) 108:14216-14221; Ekiert, D. C., et al., Nature (2012) 489:526-532).
[51] Антитела с реактивностью к стеблю редко встречаются при естественной инфекции и еще реже при иммунизации с использованием существующих вакцин против сезонного гриппа. Только некоторое подмножество этих антител представляет собой нейтрализующие антитела. Из-за консервативной природы стеблевого домена, большинство нейтрализующих антител представляют собой bNAb. Клонирование из библиотек антител, полученных от субъектов-людей, теперь обычным образом позволяет идентифицировать эти редкие нейтрализующие антитела широкого спектра с реактивностью к стеблю (Kashyap, A. K., et al., PNAS (2008) 105:5986-5991; Wrammert, J., et al., Nature (2008) 453:667-671). Редкое возникновение этих антител с реактивностью к стеблю ведет к предположению о том, что эти эпитопа в стеблевом домене являются иммуносубдоминантными, тогда как эпитопы в домене глобулярной головки являются иммунодоминантными, и на них направлено большинство антител (Krammer, F., и Palese, P., Nature Rev Drug Disc (2015) 14:167-182). Повторная экспозиция преобладающих сезонных вирусов гриппа или иммунизация вакцинами против сезонного гриппа ведет к образованию антител против иммунодоминантных областей детерминант в домене глобулярной головки. Предполагали, что присутствие иммунодоминантных эпитопов в домене глобулярной головки может отклонять вторичный ответ с сторону от стеблевого домена (Russell, C. J., N Engl J Med (2011) 365:1541-1542). Индивидуумы, которых инфицировали существующими штаммами или вакцинировали против них, могут иметь трудности с установлением универсального ответа по сравнению с теми, кто иммунологически наивен.
Белок M2 и его эпитоп
[52] M2 представляет собой пронизывающий один раз трансмембранный белок, который образует гомотетрамерный протонный канал в вирусной оболочке (Lamb. R. A., et al., Cell (1985) 40:627-633; Pielak, R. M., и Chou, J. J., Biochim Biophys Acta. (2011) 1808:522-529). Он имеет значительно более низкое относительное содержание по сравнению с HA (соотношение M2:HA составляет от 1:10 до 1:100) в вирусной оболочке. Функция протонного канала M2 важна для регуляции pH внутренней части вируса для высвобождения вирусных белков в цитозоль клеток-хозяев и регуляции pH в просвете Гольджи для транспортировки HA на клеточную поверхность. Белок M2 (AM2) вируса гриппа A имеет 97 остатков с внеклеточным N-концевым доменом из остатков с 1 до 23, известный как M2e, трансмембранный (TM) домен из остатков с 24 до 46 и внутриклеточный C-концевой домен из остатков с 47 до 97. Домены TM из четырех молекул M2 образуют пучок из четырех спиралей, который выполняет функцию pH-чувствительного протонного канала для того, чтобы регулировать pH на вирусной мембране во время проникновения в клетку и на мембране транс-Гольджи инфицированных клеток во время сборки и выхода вируса. Большой цитоплазматический домен является ключевым для стабильного формирования тетрамера и играет роль в сборке вируса, через его ассоциацию с белком M1 внутренней оболочки вириона. За исключением мотива последовательности HXXXW в домене TM, который важен для функции протонного канала, белки M2 вирусов гриппа A, B и C почти не обладают гомологией последовательностей. Однако 10 N-концевых внеклеточных остатков в AM2 консервативны у всех вирусов гриппа A.
[53] M2 (AM2) вируса гриппа A является мишенью противовирусных лекарственных средств амантадина и римантадина, которые блокируют протонный канал AM2. Лекарственное средство римантадин, которое стабилизирует закрытое состояние протонного канала, связывается с обращенным к липидам карманом около C-конца домена канала. Амантадин представляет собой противовирусное лекарственное средство с активностью против вирусов гриппа A, но не вирусов гриппа B. Использование этих блокаторов каналов прекращено из-за распространенной лекарственной устойчивости в результате мутаций в домене канала AM2. Многие из этих мутаций дают начало несколько аттенуированным вирусам, которые передаются хуже, чем вирусы дикого типа (WT). Эти мутанты с лекарственной устойчивостью могут возвращаться к WT в отсутствие давления лекарственного отбора.
[54] Белок M2 представляет собой интегральный мембранный белок, обильно экспрессируемый на поверхности клеток-хозяев, инфицированных вирусами гриппа (Lamb, R. A., et al., Cell (1985) 40:627-633). Предположительно M2 представляет собой антиген клеточной поверхности для ответа цитотоксических T-лимфоцитов (CTL) на вирус гриппа. Инфекция вирусами гриппа A вызывает только низкие титры антител против M2 (Feng, J., et al., Virol J. (2006) 3:102-115). Высокая степень структурной консервативности M2e отчасти может быть следствием слабого образования M2e-специфических антител и, таким образом, отсутствия давления для изменений. Образование антител против M2 более выражено среди индивидуумов с уже существующими антителами к белку M2 (Zhong, W., et al., J. Infect Dis (2014) 209:986-994). Антитела против M2, индуцированные в результате инфекции пандемическим вирусом гриппа A H1N1 2009 года, обладают перекрестной реактивностью к белку M2 вирусов сезонного гриппа A. Лечение мышей антителами против M2e значительно замедляло прогрессирование заболевания и вело к выделению ускользнувших M2e мутантов, что указывает на потенциал использования M2e в качестве вакцины против инфекции вирусом гриппа A (Zharikova, D., et al., J. Virol (2005) 79:6644-6654).
[55] Описана ДНК вакцина на основе слияния M2e с HA (Park, K. S., et al., Vaccine (2011) 29:5481-5487). Этот слитый белок имеет один пептид M2e человека и один пептид M2e птицы, расположенные на N-конце белка HA через линкер в 20 остатков между ними. Подтверждали экспрессию кодируемого M2e-HA слитого белка. Мышей иммунизировали с использованием слитой M2e-HA ДНК вакцины, которая демонстрировала усиленный T-клеточный ответ на M2e и полную защиту от летального заражения гетерологичным вирусом гриппа птиц.
[56] Рекомбинантный слитый белок, содержащий четыре тандемных повтора из M2e, генетически слитый с C-концом белка HSP70 из Mycobacterium tuberculosis (mHSP70), демонстрировал защиту от нескольких штаммов вирусов гриппа у мышей (Ebrahimi, S. M., et al., Virology (2012) 430:63-72). Пептид M2e, SLLTEVETPIRNEWGCRCNDSSD, конъюгировали с носителем катионной липосомальной доставки наряду с пептидами из других белков гриппа и BM2, гомологом M2e из вируса гриппа B, в качестве вакцины (патентная заявка US2010/086584 A1). Вакцина вызывала иммунный ответ против M2e у мышей. Мыши, которых вакцинировали содержащей пептид M2e вакциной, получали защиту от летального заражения вирусом гриппа. Инактивированная противогриппозная вакцина с добавлением M2e VLP обеспечивала усовершенствованную и длительную перекрестную защиту против антигенно различных вирусов гриппа A у мышей (Song, J M., et al., PNAS (2011) 108:757-761).
Модификация иммунодоминантных областей
[57] Это изобретение включает генетически модифицированные рекомбинантные гены и белки гемагглютинина гриппа (HA), которые являются результатом замены иммунодоминантных областей домена глобулярной головки в HA на альтернативные эпитопы или вставки альтернативных эпитопов в него, чтобы направлять иммунный ответ хозяина на эти эпитопы. Некоторые из этих эпитопов распознают bNAb к HA. Изобретение также направлено на модифицированные белки и гены HA с модифицированными MCS и на комбинации этих модификаций.
[58] В одном из вариантов осуществления модифицированные рекомбинантные HA имеют иммунодоминантные области детерминант домена глобулярной головки, замененные внеклеточным доменом белка M2 (M2e), или M2e вставляют в иммунодоминантные области детерминант.
[59] Руководствуясь трехмерными структурами белков HA, специфический поверхностный пептид или такие поверхностные пептиды иммунодоминантных областей заменяют на гетерологичный пептид или более гетерологичных пептидов из других областей того же HA или гетерологичный пептид или более гетерологичных пептидов из HA вируса гриппа другого субтипа или штамма. Эти гетерологичные пептиды можно вставлять в иммунодоминантные области. Кроме того, специфический поверхностный пептид или пептиды HA заменяют на гетерологичные пептиды из других белков, которые не родственны HA, или такие пептиды вставляют в них. Эти гетерологичные пептиды или представляют собой природные белки или искусственно разработаны. Их могут не распознавать антитела, известные в настоящее время.
[60] Иммунодоминантные области HA находятся на поверхности домена глобулярной головки HA. Эти поверхностные области, подлежащие модификации, представляют собой спирали, β-тяжи или петли, экспонированные на поверхности. Эти поверхностные области предпочтительно представляют собой иммунодоминантные области детерминант и эпитопы или части таких областей детерминант и эпитопов или находятся рядом с такими областями детерминант и эпитопами.
[61] В некоторых вариантах осуществления иммунодоминантные области домена глобулярной головки HA заменяют на пептиды иммуносубдоминантных эпитопов HA, которые распознают bNAb к HA. В других вариантах осуществления иммунодоминантные области домена глобулярной головки HA заменяют на пептиды иммуносубдоминантных эпитопов, которые распознают антитела, которые нейтрализуют определенную группу вирусов гриппа. Эти иммуносубдоминантные эпитопы выбирают из стеблевого домен HA, или они включают слитый пептид HA или сайт расщепления HA при созревании.
[62] Рекомбинантные модифицированные белки HA по данному изобретению экспрессируют в клеточной культуре и секретируют в среды клеточных культур на уровнях, схожих с рекомбинантным HA дикого типа. Эти конструкции применимы к любому HA гриппа всех штаммов вирусов гриппа A, B и C, включая в качестве неограничивающих примеров вирусы гриппа, которые инфицируют человека, и вирусы гриппа, которые инфицируют другие виды млекопитающих и птиц. В одном из вариантов осуществления эти модифицированные белки HA можно использовать в качестве иммуногенов для получения вакцин против инфекции вирусом гриппа у человека или животных.
[63] Эти иммунодоминантные области можно изменять посредством сайт-специфического мутагенеза. Экспонированные для растворителя остатки области детерминанты идентифицируют по трехмерным структурам белков HA. Экспонированный для растворителя остаток или более экспонированных для растворителя остатков области детерминанты меняют с помощью сайт-специфического мутагенеза или заменяют на пептид, содержащий конкретные изменения этих остатков. Новый сайт имеет ту же вторичную структуру, что и исходный сайт.
Иллюстративный HA с областями детерминант, замененными на гетерологичные эпитопы
[64] На основании структуры HA, как проиллюстрировано на фиг. 3, несколько положений в HA выбраны для того, чтобы иллюстрировать осуществимость замены иммунодоминантных областей детерминант в домене глобулярной головки, например, гетерологичными пептидами из стеблевого домена HA.
[65] Пептид KTSS из остатков с 119 до 122 (нумерация по WT на фиг. 5) представляет собой экспонированную на поверхности спиральную структуру около остатков с 124 до 125 области Sa. Область Sa находится на одной стороне домена глобулярной головки тримера HA и вдали от сайта связывания рецептора. Модификация в этом участке маловероятно изменит сайт связывания рецептора и, таким образом, связывание рецептора хозяина модифицированным HA. Пептид из 4 остатков KTSS заменяют на эпитопы bNAb стеблевого домена. Остатки HAGAKS с 137 до 142 в области Ca2, которая соответствует области A в H3 HA, представляют собой основной иммунодоминантный участок. KKGNSYPKLSKS в остатках с 153 до 164 представляет собой поверхностную петлю в области Sa, которая соответствует области B в H3 HA. N-концевую часть этого пептида KKGNS в остатках с 153 до 157 заменяют в некоторых конструкциях. TSADQQSLYQNA в остатках с 184 до 195 из области Sb образует спираль в верхней части домена глобулярной головки HA.
[66] Поверхностная петля области Sa и спираль области Sb смежны друг с другом в домене глобулярной головки HA и соответствуют области B из H3. Вместе область Sa и область Sb могут вмещать конформационный эпитоп вместе с петлевой и спиральной структурами. Однако, поскольку эти области около сайта связывания рецептора, замена этих пептидов может разрушать сайт связывания рецептора. EIAIRPKVRDQE в остатках с 213 до 224 в области Ca2 представляет собой петлю около области контакта между двумя мономерами HA. Эта петля имеет контакты с β-тяжами смежного мономера HA, который соответствует области D в H3 HA. Часть петли экспонирована на поверхности. Область Ca2 расположена внутри этого пептида. В некоторых конструкциях этот пептид частично заменяют.
[67] Кроме того, гетерологичные пептиды можно помещать в или около любых других областей детерминант, как проиллюстрировано на фиг. 5, и поверхностных петель или спиралей, как проиллюстрировано на фиг. с 1 до 3. Кроме того, гетерологичный пептид можно вставлять в любое из этих положений без какой-либо делеции остатков областей детерминант.
[68] Эпитоп bNAb CR8020 расположен в стеблевом домене. Как показано на фиг. 5 и фиг. 6, эпитоп CR8020 имеет два основных компонента, состоящих из самого внешнего β-тяжа (HA2 остатки с 30 до 36, EGTGQAA в H3 HA, SEQ ID №26) β-листа из 5-тяжей около основания стеблевого домена и C-концевой части (HA2 остатки с 15 до 19, EGMID в H3 HA, SEQ ID №25) слитого пептида. Эти два компонента разделены 10 аминокислотными остатками в первичной структуре. Разработан композитный эпитоп CR8020 EGMIDYEGTGQAA (SEQ ID №27), в котором два эпитопных компонента соединены тирозином (Y). Этот композитный эпитоп CR8020 используют в качестве гетерологичного пептида для замены иммунодоминантных участков.
[69] Другой эпитоп bNAb 1C9 представляет собой слитый пептид на N-конце HA2, присутствующий в стеблевом домене. Модифицированный пептид эпитопа 1C9 GIFGAIAGFIEG (SEQ ID №36) разрабатывали в качестве пептида для представления в иммунодоминантном участке. Этот модифицированный пептид 1C9, обозначаемый как I1C9, имеет замену лейцина (L) изолейцином (I) в положении 2 в H5 слитом пептиде, распознаваемом с помощью bNAb 1C9. Этот слитый пептид I1C9 присутствует в H1 HA свиньи и HA некоторых H6 и H9 вирусов. Этот пептид I1C9 помещен в различные иммунодоминантные участки. Выполнено множество конструкций с использованием I1C9 в области детерминанты со смещенными положениями.
[70] Эпитоп bNAb FI6 представляет собой конформационный эпитоп, содержащий два пептида, которые образуют непрерывную поверхность в третичной структуре HA0, предшественника HA, но разделены в первичной структуре (фиг. 5). Один пептид RKKRGLFGAIAGFIE эпитопа FI6 представляет собой сайт расщепления при созревании и слитый пептид HA0. Другой FI6-пептид KESTQKAIDGVTNKVNS имеет суперспиральную структуру в HA2. Создана конструкция, в которой эти два пептида эпитопа FI6 помещали в домен глобулярной головки. Пептид RKKRGLFGAIAGFIE эпитопа FI6 помещен в область Sa из остатков с 153 до 164 и суперспиральный пептид KESTQKAIDGVTNKVNS эпитопа FI6 помещен в область Sb из остатков с 184 до 195. В другой конструкции пептид RKKRGLFGAIAGFIE эпитопа FI6 помещен в область Sa без второго пептида эпитопа FI6.
[71] Охарактеризованы многие эпитопы bNAb. Любой из них можно помещать в или около иммунодоминантных областей детерминант или поверхностных петель в домене глобулярной головки, как описано выше.
[72] В других вариантах осуществления гетерологичные пептиды представляют собой пептиды внеклеточного домена белков M2 (пептиды M2e). пептиды M2e консервативны и менее вариабельны среди вирусов гриппа A. Пептиды M2e также консервативны и менее вариабельны среди вирусов гриппа B, несмотря на то, что пептиды M2e из вирусов гриппа A и вирусов гриппа B различны.
[73] В некоторых вариантах осуществления гетерологичные пептиды представляют собой искусственно разработанные пептиды, которые вносят конкретные изменения в иммунодоминантные области детерминант посредством сайт-специфического мутагенеза. В некоторых вариантах осуществления искусственный пептид объединяет желательные признаки иммунодоминантной области детерминанты и гетерологичного пептида. В некоторых вариантах осуществления искусственный пептид имеет остатки для взаимодействия с bNAb и остатки исходных иммунодоминантных областей детерминант для того, чтобы поддерживать трехмерную структуру домена глобулярной головки HA. Эти искусственные пептиды или конструируют рационально на основании трехмерных структур HA или посредством скрининга библиотеки случайно сгенерированных пептидов.
[74] Создавали конструкции, чтобы помещать пептид M2e SLLTEVETPTRNGWECKCSDS или в область Ca2 или в область Sb для экспрессии с использованием бакуловирусной экспрессирующей системы или млекопитающей экспрессирующей системы. Пептид M2e дополнительно можно оптимизировать на основании консенсуса последовательностей от различных штаммов гриппа.
HA с модифицированным сайт расщепления при созревании
[75] Это изобретение включает варианты осуществления, в которых протеазную чувствительность сайта расщепления при созревании (MCS) в HA изменяют для создания результирующего HA, чувствительного к протеазам другого класса и устойчивого к тем трипсиноподобным протеазам, которые расщепляют нативные сайты расщепления при созревании в HA всех штаммов вирусов гриппа. Измененный MCS разрабатывают для распознавания конкретной протеазой, которая не присутствует у известных природных хозяев вирусов гриппа. Это делает получаемый HA устойчивым к созреванию у всех природных хозяев вирусов гриппа. В присутствии этой конкретной протеазы, которая распознает этот измененный сайт расщепления при созревании, происходит расщепление этих получаемых HA до зрелой формы, содержащей HA1 и HA2. Рекомбинантные вирусы гриппа, созданные из получаемых HA, в присутствии этой конкретной протеазы образуют зрелый HA и становятся инфекционными для природных хозяев гриппа. Однако вирусное потомство, реплицированное в инфицированных природных хозяевах, не инфекционно из-за отсутствия надлежащих протеаз у природных хозяев.
[76] Молекулы H1 HA часто имеют один основный остаток в MCS. Этот один основный остаток обычно представляет собой остаток аргинина (R), расположенный с N-конца от разрезаемой связи. Добавление нескольких основных остатков, таких как аргинин (R) или лизин (K), в MCS в H1 HA увеличивает инфекционность рекомбинантных вирусов гриппа, содержащих модифицированный HA. Замена нативного MCS H1 на MCS H5, который содержит несколько основных остатков, увеличивает инфекционность рекомбинантных вирусов гриппа, содержащих модифицированный HA (Kong, W-p., et al., PNAS (2006) 103:15987-15991). Эти несколько основных остатков более чувствительны к расщеплению многими внутриклеточными трипсиноподобными протеазами. В некоторых вариантах осуществления MCS HA H1 модифицируют посредством его замены на MCS HA H5 или более основных остатков. MCS HA H1 также модифицируют с помощью вставки нескольких основных остатков между последним остатком (аргинином) в HA1 и первым остатком (глицином) в HA2.
[77] Кроме того, раскрыты гены генетически модифицированного рекомбинантного гриппа HA и белки с измененными последовательностями MCS. Нативный MCS заменяют на последовательности из MCS от другого HA. Указанные изменения включают замену нативного MCS из HA на другой MCS из других HA, которые, как известно, позволяют создавать более инфекционные рекомбинантные вирусы гриппа, предположительно посредством создания получаемого HA, который более чувствителен к расщеплению при созревании с помощью не идентифицированных протеаз хозяина. В предпочтительном варианте осуществления нативный MCS из HA H1 заменяют на MCS из HA H5 или заменяют на несколько основных остатков аргинина (R) и лизина (K).
[78] Некоторые протеазы млекопитающих, такие как фактор Xa и энтерокиназа, имеют соответствующий им участок узнавания расщепления, расположенный полностью на N-концевой стороне разрезаемой связи. Их участок узнавания расщепления также можно использовать для замены нативного сайта расщепления HA при созревании. Как в случае нативного HA, C-концевая сторона разрезаемой связи этих сайтов протеазного расщепления представляет собой глицин (G). Сайт расщепления тромбина также имеет глицин (G) на C-концевой стороне разрезаемой связи. После расщепления тромбином образуется новый N-конец из глицина (G). Все эти протеазы присутствуют у многих природных хозяев гриппа. Однако эти протеазы обычно или отсутствуют или присутствуют в следовом количестве в средах клеточных культур или клеточных линиях, используемых для рекомбинантного получения HA.
[79] TEV протеаза вируса гравировки табака (TEV) распознает сайт расщепления ENLYFQG и осуществляет расщепление между глутаматом (Q) и глицином (G). Свободный N-конец, образуемый посредством расщепления TEV протеазой, представляет собой глицин (G), такой же, как N-концевой остаток HA2 после созревания HA. В отличие от MCS нативного HA, в TEV сайте расщепления основные остатки отсутствуют. В некоторых вариантах осуществления весь MCS HA заменяют на TEV сайт расщепления или более остатков MCS заменяют на TEV сайт расщепления или только аргинин (R) с N-конца от разрезаемой связь, например, заменяют на TEV сайт расщепления. Конструкции HA с MCS, замененными на TEV сайт расщепления, экспрессируют с использованием бакуловирусной экспрессирующей системы или млекопитающей экспрессирующей системы, и идентифицированы конструкции, которые экспрессируют до того же уровня, что и HA дикого типа.
[80] В присутствии TEV протеазы, которая расщепляет модифицированный MCS, указанный модифицированный HA проходит созревание и превращается в HA1 и HA2 с нативным N-концом слитого пептида. Зрелый модифицированный рекомбинантный HA обладает способностью связывать соответствующие рецепторы клетки-хозяина и претерпевать слияние с мембраной. В отсутствие TEV протеазы, вновь синтезированный указанный модифицированный HA остается в виде не расщепленного предшественника HA0. Отсутствие свободного N-конца слитого пептида препятствует слиянию указанного HA с мембраной. Белок HA потомства, продуцируемого в инфицированных клетках-хозяевах, остается в виде HA0 и не претерпевает процессинг до зрелой функциональной формы из-за отсутствия TEV протеазы у хозяина. Вновь созданные вирусы с HA0 не обладают способностью слияния с мембраной и, следовательно, являются не инфекционными.
Комбинации областей детерминант и сайтов расщепления при созревании
[81] Изменения областей детерминант в глобулярном домене HA и изменения MCS в стеблевом домене HA могут находиться в комбинациях любого типа. Конкретный гетерологичный пептид можно вводить в область детерминанты в домене глобулярной головки белков HA с различными измененными сайтами расщепления при созревании. Кроме того, два или больше гетерологичных пептидов можно вводить в один белок HA в различных областях детерминант. В одном из вариантов осуществления генетически модифицированный рекомбинантный HA гриппа имеет пептид M2e, заменяющий область детерминанты в домене глобулярной головки HA, и сайт TEV протеазы в качестве MCS. В другом варианте осуществления генетически модифицированный рекомбинантный HA гриппа H1 имеет пептид M2e, заменяющий область детерминанты в домене глобулярной головки HA и MCS H5 вместо нативного MCS H1.
Способы получения
[82] Для получения модифицированного HA, белок секретируют с помощью клеток в среду клеточной культуры в растворимой форме, и он не является интегральным мембранным белком или его не прикрепляют к клеточным мембранам или клеточной поверхности. В некоторых вариантах осуществления нативную сигнальную последовательность HA используют для секреции в клетках насекомого и в клетках млекопитающих. В других вариантах осуществления нативную сигнальную последовательность HA заменяют на сигнальную последовательность клетки насекомого для секреции в клетках насекомого или сигнальную последовательность млекопитающего для секреции в клетках млекопитающих. Вместо трансмембранного домена и внутриклеточного домена HA, сайт протеазного расщепления помещают на C-конце внеклеточного домена HA, после чего следует последовательность «фолдона», полученная из фибритина бактериофага T4 для того, чтобы стабилизировать тример HA, и C-концевая гистидиновая метка для того, чтобы содействовать очистке. Рекомбинантный белок HA получают или в виде полноразмерного нерасщепленного предшественника HA0 с удаленной сигнальной последовательностью или зрелой формы, содержащей субъединицы HA1 и HA2 со слитым пептидом дикого типа на N-конце HA2. В предпочтительном варианте осуществления конечный очищенный генетически модифицированный HA образует тример как HA дикого типа.
[83] Гены разработанного рекомбинантного HA гриппа получают с помощью синтеза генов de novo. Технологии синтеза генов общепризнаны и всесторонне изучены (Kosuri, S., and Church, G. M., Nat Methods (2014) 11:499-507). Гены более 10 т. о. в длину обычно получают с помощью коммерческих поставщиков. Синтез генов дает способность модифицировать конкретные последовательности HA и возможность оптимизации кодонов в соответствии с экспрессионными хозяевами или конкретными нуждами генетической инженерии. Участки рестрикции конструируют в конкретных местоположениях синтезированных генов HA для того, чтобы содействовать обмену фрагментами HA между различными конструкциями. Синтезированные гены HA с сигнальными последовательностями и сайтами протеаз, последовательностью фолдона и C-концевой гистидиновой меткой встраивают в бакуловирусный геном с использованием общепринятых протоколов с тем, чтобы управлять экспрессией модифицированных белков HA с помощью промотора полиэдрина бакуловируса. В других вариантах осуществления тот же набор генов HA клонируют в экспрессирующие векторы млекопитающих для экспрессии в клетках млекопитающих.
[84] В некоторых вариантах осуществления в конструкциях HA кодоны оптимизированы для экспрессии в клетках насекомого с использованием бакуловирусных векторов. В других вариантах осуществления кодоны конструкций HA оптимизированы для экспрессии в клетках млекопитающих, включая в качестве неограничивающих примеров клетки CHO (клетки яичника китайского хомяка) и клетки HEK 293 (клетки 293 эмбриональной почки человека). Оптимизацию кодонов в любом организме обычно выполняют с использованием коммерческого программного обеспечения, такого как пакет программного обеспечения Lasergene из DNASTAR, Inc. (3801 Regent Street, Madison, WI 53705 USA), онлайн веб-сервера, такого как OPTIMIZER (расположен во всемирной паутине по адресу genomes.urv.es/OPTIMIZER/) или с помощью поставщиков услуг синтеза генов с использованием их проприетарных алгоритмов. Оптимизация кодонов учитывает содержание G/C, устранение скрытых сайтов сплайсинга и элементы последовательностей, дестабилизирующие РНК, а также избегание стабильных вторичных структур РНК. Кодоны также вручную корректируют на основании базы данных использования кодонов (расположенной во всемирной паутине по адресу kazusa.or.jp/codon/). Из-за вырожденности кодонов, последовательности генов можно изменять, не изменяя кодируемые аминокислотные последовательности. Участки рестрикции вводят в конкретные местоположения посредством изменения кодонов без изменения аминокислотных последовательностей. Используя любые из этих способов, последовательности генов, с оптимизацией кодонов для конкретного организма или без нее, обычно создают посредством обратной трансляции последовательностей белков с использованием компьютерного алгоритма или вручную.
[85] Другие варианты осуществления включают способ получения рекомбинантных не инфекционных вирусов гриппа из генетически модифицированных генов HA с MCS, измеренным на участок узнавания TEV протеазы, используя общепринятые способы с клеточными культурами. Разработаны обратные генетические системы, которые позволяют получать вирусы гриппа из сегментов РНК или плазмид с клонированной кДНК, с использованием вируса-помощника или без него (Luytjes, W., et al., Cell (1989) 59:1107-1113; Neumann, G., et al., PNAS (1999) 96:9345-9350; Fodor, E., et al., J. Virol (1999) 73:9679-9682; de Wit, E., et al., J. Gen Virol (2007) 88:1281-1287). Инфекционные вирусы гриппа получают посредством временной трансфекции клеток млекопитающих сегментами РНК гриппа или плазмидами с кДНК из РНК гриппа. Эти вирусы, которые выделяют из сред клеточных культур, используют для того, чтобы инфицировать оплодотворенные куриные яйца для получения живых инфекционных вирусов гриппа для создания вакцин. Некоторые сегменты РНК гриппа заменяют на чужеродный ген. Рекомбинантные вирусы гриппа A получали с использованием белка HEF вируса гриппа C, заменяющего белок HA (Gao, Q., et al., J. Virol (2008) 82:6419-6426). В этих вариантах осуществления кДНК или РНК модифицированного HA совместно трансфицируют в клетки млекопитающих с кДНК из сегментов других 7 РНК гриппа или других 7 РНК, созданных с помощью стандартных молекулярных способов и синтеза генов. Используя общепризнанный способ или схожие способы, множество идентичных или других белков HA можно упаковывать в один вирион (Uraki, R., et al., J. Virol (2013) 87:7874-7881).
[86] В способах получения рекомбинантных инфекционных вирусов гриппа из генетически модифицированного гена HA используют общепринятые способы с клеточными культурами, как описано выше. В этих вариантах осуществления генетически модифицированный ген HA с MCS HA H5 или последовательностью нескольких основных аминокислот в MCS совместно трансфицируют в клетки млекопитающих с использованием кДНК из сегментов других 7 РНК гриппа или других 7 РНК, созданных с помощью стандартной обратной генетической системы, как описано выше. Эти модифицированные сайты расщепления при созревании увеличивают эффективность созревания HA в природных хозяевах гриппа или в клеточной культуре (Kong, W p., et al., PNAS (2006) 103:15987-15991). Зрелый функциональный белок HA обладает способностью связываться с клетками-хозяевами и сливаться с мембраной клетки-хозяина.
[87] Другие варианты осуществления включают способ получения рекомбинантных подобных вирусу гриппа частиц (VLP) из генетически модифицированных генов HA, используя общепринятые способы с клеточными культурами в клетках млекопитающих, в клетках насекомого и в клетках растения (Chen, B. J., et al., J. Virol (2007) 81:7111-7123; Smith, G. E., et al., Vaccine (2013) 31:4305-4313; D'Aoust, M. A., et al., Plant Biotech (2010) 8:607-619).
[88] Другие варианты осуществления включают способ получения ДНК-вакцин из генетически модифицированных генов HA с использованием общепринятых способов (Jiang, Y., et al., Antiviral Res (2007) 75:234-241; Alexander, J., et al., Vaccine (2010) 28:664-672; Rao, S. S., et al., PLoS one (2010) 5:e9812).
[89] Результаты экспрессии, раскрытые в настоящем описании, показывают, что MCS из H1 HA можно модифицировать, не оказывая влияния на экспрессию получаемого HA. Показано, что конструкции с H5 HAMCS или MCS с несколькими основными аминокислотами осуществляют экспрессию на том же уровне, что H1 HA дикого типа. Кроме того, MCS из HA заменяют на сайт расщепления TEV протеазой, который не содержит какие-либо основные остатки. Изменяя положение сайта расщепления TEV протеазой, получали конструкции с TEV сайтом расщепления в качестве MCS, которые экспрессировали до того же уровня, что и H1 HA дикого типа.
[90] Кроме того, результаты экспрессии показывают, что многие из областей детерминант в домене глобулярной головки HA1 можно заменять на гетерологичные пептиды из стеблевого домена того же HA или других HA. Некоторые конструкции обеспечивают экспрессию на том же уровне, что и HA дикого типа, тогда как другие конструкции обеспечивают значительно меньшую экспрессию. Свойства гетерологичных пептидов и местоположения гетерологичных пептидов в домене глобулярной головки оказывают значимое влияние на уровень экспрессии каждой получаемой конструкции HA. Больше конструкций можно создавать и тестировать аналогичным образом на их экспрессию для того, чтобы идентифицировать конструкции с наиболее оптимальной экспрессией.
[91] Кроме того, создают рекомбинантные HA с заменами определенных иммунодоминантных областей детерминант домена глобулярной головки HA на эпитоп M2e из белка M2 гриппа. Предположительно, любой эпитоп из других белков гриппа может случить в качестве заменяющего пептида для замены иммунодоминантной области детерминанты в домене глобулярной головки HA. Кроме того, гетерологичный заменяющий пептид можно получать из другого белка, не связанного с вирусами гриппа. Конкретную область детерминанты в домене глобулярной головки HA можно выбирать для заменяющего пептида, чтобы поддерживать признак нативной структуры заменяющего пептида насколько возможно, чтобы презентировать заменяющий пептид для иммунной системы хозяина.
Бакуловирусная экспрессирующая система
[92] С момента появления приблизительно 30 лет назад (патент США 4745051; Summers, M. D., and Smith, G. E., (1987) A Manual of Methods for Baculovirus Vectors and Insect Cell Culture Procedures. Texas Agricultural Experiment Station Bulletin No. 1555), бакуловирусную экспрессирующую векторную систему (BEVS) использовали для экспрессии белков человека и вирусов многих различных типов, включая внутриклеточные белки, мембранные белки и секретируемые белки. BEVS использовали для получения вирусоподобных частиц (VLP). BEVS представляет собой эукариотическую экспрессирующую систему, в которой используют клетки насекомого в качестве хозяина, который обеспечивает посттрансляционные модификации белков, подобно клеткам млекопитающих (Jarvis, D. L., «Baculovirus Expression Vectors» в The Baculoviruses, ред. Miller, L. K. (1997) стр. 389-420 Plenum Press, New York). Общепризнанна BEVS на основе вируса ядерного полиэдроза Autographa californica (AcNPV). Для получения рекомбинантных бакуловирусов доступны многие коммерческие наборы. BEVS успешно использовали для получения рекомбинантных вакцин, представленных на рынке США. Две одобренные FDA вакцины, Cervarix™, рекомбинантная двухвалентная (типы 16 и 18) вакцина против папилломавируса человека в форме не инфекционных вирусоподобных частиц (VLP) против злокачественной опухоли шейки матки (патентная заявка WO 2010/012780 A1), и Flublok® (патент США 5762939 A и 5858368 A), трехвалентная противогриппозная вакцина против гриппа, созданная из мембраносвязанных предшественников гемагглютинина (HA0), получают с использованием BEVS.
[93] Чтобы экспрессировать целевой белок с использованием BEVS, интересующий ген, который кодирует целевой белок, сначала субклонируют в вектор для переноса, который представляет собой плазмиду E. coli, содержащую бакуловирусные последовательности, фланкирующие ген полиэдрина бакуловируса. Полиэдрин представляет собой обильный вирусный белок у бакуловирусов дикого типа, который не требуется для размножения бакуловирусов в клеточной культуре. Вектор для переноса размножают в E. coli и выделяют с использованием стандартных способов молекулярной биологии (Sambrook, J., et al., (1989) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor). Вектор для переноса с интересующим геном рекомбинируют с бакуловирусной геномной ДНК для получения рекомбинантного бакуловирусного генома или в E. coli или в клетках насекомого. Рекомбинантный бакуловирусный геном управляет продуцированием рекомбинантных бакуловирусов и экспрессией целевого белка. Исходный способ основан на гомологичной рекомбинации между одинаковыми последовательностями, фланкирующими ген полиэдрина в векторе для переноса и в вирусной геномной ДНК в клетках насекомого. Выделенную ДНК вектора для переноса трансфицируют совместно с бакуловирусной геномной ДНК в клетки насекомого. Рекомбинантные бакуловирусы отбирают по отсутствию полиэдрина. В существующих коммерческих наборах, таких как бакуловирусная экспрессирующая система BacPAK™ из Clontech и BacMagic™ System из Millipore, используют линеаризованную бакуловирусную геномную ДНК, которая не образует жизнеспособный вирус без рекомбинации. Эти наборы позволяют получать рекомбинантные бакуловирусы с высокой эффективностью и небольшой контаминацией не рекомбинантными вирусами. Рекомбинацию в вирусном геноме также можно выполнять in vitro с использованием реакции рекомбинации Gateway (бакуловирусная экспрессирующая система BaculoDirect™, Life Technologies). Другой способ получения рекомбинантных вирусов происходит через сайт-специфическую транспозицию в E. coli (Bac-to-Bac System, Life Technologies). Вектор для переноса на основе pFastBac содержит транспозоны, которые создают бакмиды (большая плазмида, содержащая геном бакуловируса) в E. coli (патент США 5348886). Рекомбинацию интересующего гена в бакмиду легко подтверждают посредством полимеразной цепной реакции (ПЦР) перед трансфекцией бакмид в клетки насекомого.
[94] Рекомбинантные бакуловирусы размножают в культуре клеток насекомого. Небольшое количество вирусов используют для того, чтобы инфицировать клетки насекомого. После нескольких суток кондиционированные среды, содержащие амплифицированные вирусы, собирают в качестве вирусных стоков. Этот процесс амплификации часто повторяют несколько раз для того, чтобы создавать большой объем вирусных стоков. Вирусные стоки обычным образом хранят в темноте с охлаждением в течение месяцев и даже лет. Для сохранения вирусных стоков использовали добавление 5-10% эмбриональной телячьей сыворотки (FBS) в вирусные стоки, что, как полагают, продлевает их время хранения. Вирусные стоки иногда замораживают для длительного хранения при -70°C. Вирусы также амплифицировали и хранили в виде инфицированных бакуловирусами клеток насекомого (BIIC) (Wasilko, D. J., et al., Prot Exp Purif (2009) 65:122-132). инфицированные клетки насекомого собирают перед их лизисом в виде BIIC стоков и замораживают, придерживаясь стандартной процедуры заморозки клеток. BIIC стоки хранят в жидком азоте или при сверхнизкой температуре между -65°C и -85°C в течение длительного периода времени и используют в качестве вирусных стоков для того, чтобы инфицировать клетки насекомого для экспрессии белка. Замороженные BIIC стоки обеспечивают более длительное время хранения, чем вирусные стоки в жидкой форме.
[95] Широко используемые линии клеток насекомых для BEVS представляют собой клетки SF9 и SF21, полученные из совки травяной (Spodoptera frugiperda), и клетки Hi5 или T. ni, полученные из совки капустной (Trichoplusia ni). Также использовали другие клетки насекомых, получены от видов шелковичного червя (Bombyx mori), огневки пчелиной (Galleria mellonella) и непарного шелкопряда (Lymantria dispar). Клетки SF9, SF21 и Hi5 (или T. ni) адаптированы для суспензионной культуры в бессывороточных средах. Эти клеточные линии и среды доступны во многих коммерческих источниках. Клеточную культуру этих клеточных линий обычным образом поддерживают во встряхиваемых колбах в небольших объемах вплоть до 1 или 2 литров в инкубаторах-встряхивателях в окружающей атмосфере без добавления газа при температуре в диапазоне 22-28°C. Клеточную культуру увеличивают в биореакторах с перемешиваемым резервуаром или биореакторах одноразового использования. Условия для культуры клеток насекомого в биореакторах в большом масштабе общеизвестны (WAVE Bioreactor Systems - Cell culture procedures. GE Healthcare). Добавление кислорода также обычно используют в культуре клеток насекомого большого масштаба для увеличения плотности клеток.
[96] Ряд условий для экспрессии конкретного целевого белка тестируют для того, чтобы оптимизировать экспрессию целевого белка с использованием различных клеточных линий посредством изменения соотношения вирус и клеток и времени сбора после инфекции. Клетки SF9, SF21 и Hi5 (или T. ni) представляют собой наиболее распространенные клеточные линии, используемые для BEVS экспрессии белка. Одна из клеточных линий может лучше экспрессировать целевой белок, чем другие. Некоторые сообщения указывают, что клетки Hi5 (или T. ni) дают больше экспрессии определенных секретируемых белков. Соотношение вируса и клеток, обычно известное как множественность заражения (MOI), тестируют для того, чтобы определять наилучшее условие инфицирования для экспрессии целевого белка. Образцы культуры берут в различные моменты времени после инфекции. Клетки и кондиционированные среды разделяют посредством центрифугирования или фильтрования. Уровни экспрессии белка определяют стандартными способами. В культуре осуществляют мониторинг плотности клеток, жизнеспособности клеток и размера клеток, что дает информацию о клеточном росте и условиях культивирования. Иногда осуществляют мониторинг уровня глюкозы, растворенного кислорода и pH культуры для оценки потребления питательных веществ в средах. Условия, которые ведут к наилучшей экспрессии целевого белка, выбирают для крупномасштабного получения белка.
[97] Несмотря на то, что определение титров вирусных стоков и MOI широко используют для того, чтобы определять условия инфицирования для амплификации вирусов и экспрессии белков xBEVS, указанный выше способ TIPS предоставляет более быстрый путь для определения наилучших условий инфицирования для амплификации вирусов и экспрессии белков. Клетки насекомого увеличиваются в размере после инфекции рекомбинантными бакуловирусами. Клеточное деление также останавливается после инфекции. Рекомбинантные бакуловирусы вызывают лизис клеток приблизительно через 48 часов после инфекции. Мониторинг клеточного деления осуществляют посредством подсчета клеток в виде плотности клеток культуры. Мониторинг лизиса клеток осуществляют в виде жизнеспособности клеток посредством подсчета живых и погибших клеток в культуре. Размер жизнеспособных клеток измеряют в виде диаметра клетки. Плотность клеток, жизнеспособность клеток и размер жизнеспособных клеток обычно измеряют с помощью нескольких моделей приборов для подсчета клеток. Плотность клеток и жизнеспособность клеток также можно измерять вручную с использованием гемоцитометра. В совокупности, плотность клеток, жизнеспособность клеток и размер жизнеспособных клеток предоставляют информацию о кинетике инфекции. В способе TIPS кинетику инфекции используют для того, чтобы определять оптимальные условия для экспрессии конкретного целевого белка с использованием конкретного вирусного стока. Это устраняет времязатратные измерения вирусного титра для вычисления MOI. С использованием способа TIPS обычно достигают согласованной амплификации вируса и экспрессии белка.
[98] В дополнение к клеткам насекомого, использовали живых насекомых, инфицированных рекомбинантными бакуловирусами, чтобы экспрессировать несколько секретируемых белков и мембранных белков. Зрелый HA экспрессировали в личинках табачной листовертки (Heliothis virescens) (Kuroda, K., et al., J. Virol (1989) 63:1677-1685).
[99] Также разработана экспрессирующая система на основании бакуловирусов других типов, таких как вирус ядерного полиэдроза Bombyx mori (BmNPV). BmNPV может иметь более хороший профиль биологической безопасности относительно AcNPV в том отношении, что он имеет более узкий спектр хозяев и не будет расти в качестве вредителя насекомых в поле. Бакуловирусную экспрессирующую систему на основе BmNPV использовали для экспрессии функциональных белков в клеточной культуре и у личинок шелковичного червя (Bombyx mori) (Maeda, S., et al., Nature (1985) 315:592-594).
[100] BEVS обычно использовали для получения белковых комплексов и VLP. Два или больше генов клонируют в один вектор для экспрессии нескольких белков. Два или больше вирусных стоков, каждый управляет экспрессией одного белка, используют для совместного инфицирования клеток насекомого, чтобы получать белковые комплексы или VLP. VLP гриппа получали с использованием бакуловирусной экспрессирующей системы (Bright, R. A., et al., PLoS one (2008) 3:e1501).
Векторы для переноса HA для бакуловирусной экспрессии
[101] Гены, подлежащие экспрессии с использованием BEVS, обычно находятся под управлением промотора полиэдрина, мощного позднего промотора бакуловируса, который ведет к экспрессии белка прежде гибели клеток насекомого, индуцированных бакуловирусом. Другие ранние или поздние промоторы также используют для экспрессии белка. Чтобы клетки насекомого секретировали рекомбинантный целевой белок в среды клеточных культур, сегмент ДНК, который кодирует сигнальный пептид, конструируют на 5'-конце с сохранением рамки считывания интересующего гена. Два широко используемых сигнальных пептида для клеток насекомого представляют собой сигнальную последовательность мелиттина медоносной пчелы или сигнальную последовательность поверхностного гликопротеина GP67 оболочки AcNPV. В базе данных сигнальных последовательностей (расположенной во всемирной паутине по адресу signalpeptide.de/index.php) перечислены многие другие возможные сигнальные пептиды для рассмотрения. После секреции сигнальный пептид удаляют с помощью клеточной протеазы, которая процессирует сигнальный пептид. Несмотря на то, что вирусы гриппа не являются вирусами насекомых, сигнальные пептиды HA использовали в качестве пептидов сигналов секреции для секреции или встраивания в мембрану рекомбинантных белков в BEVS. Сигнальный пептид HA MKTIIALSYIFCLVFA широко используют для экспрессии рекомбинантных трансмембранных сопряженных с G-белком рецепторов (GPCR) в клетках насекомого (Rosenbaum, D. M., et al., Science (2007) 318:1266-1273; Zou, Y., et al., PLoS one (2012) 7: e46039). HA экспрессировали в клетках насекомого с использованием его нативного сигнального пептида. В этом конкретном случае, общая экспрессия ниже таковой при использовании сигнального пептида клеток насекомого, но экспрессируемый HA имел зрелую форму, содержащую HA1 и HA2 (патент США 5858368 A). Сигнальные пептиды HA не являются консервативными среди HA. Например, указанный выше сигнальный пептид HA отличается от сигнального пептида H1 HA из SEQ ID №7. Эмпирический отбор сигнальных пептидов HA может усовершенствовать экспрессию HA в клетках насекомого.
[102] Доступны коммерческие векторы для создания рекомбинантных бакуловирусов через гомологичную рекомбинацию, используя систему Bac-to-Bac или систему Gateway (Life Technologies). Признаки этих векторов для переноса, такие как промоторы и сигнальные последовательности, можно подбирать с помощью стандартных способов молекулярной биологии. Сейчас целый вектор для переноса можно синтезировать полностью с помощью синтеза генов. Синтез генов допускает конструкции векторов для переноса с конкретными последовательностями и признаками.
[103] Способы экспрессии HA гриппа с использованием BEVS общепризнаны в лабораторном масштабе (Stevens, J., et al., Science (2004) 303:1866-1870). Например, вектор для переноса содержит HA из вируса гриппа 1918 года под управлением промотора полиэдрина. Экспрессионная конструкция HA вируса гриппа 1918 года для секреции имеет сигнальный пептид GP67 вместо сигнального пептида HA на N-конце. Вместо трансмембранного домена, сайт расщепления тромбина вводят в C-конец внеклеточного домена HA, после чего следует последовательность «фолдона», полученная из фибритина бактериофага T4, чтобы стабилизировать тример HA, и C-концевая гистидиновая метка для того, чтобы содействовать очистке. Последовательность фолдона и гистидиновую метку можно удалять посредством расщепления тромбином. Схожие конструкции экспрессионных векторов для переноса HA использовали для того, чтобы экспрессировать различные HA из многих штаммов гриппа (Stevens, J., et al., Science (2006) 312:404-410; Xu, R., et al., Science (2010) 328:357-360; Whittle, J. R. R., et al., PNAS (2011) 108:14216-14221).
[104] В дополнение к фолдону, другие домены тримеризации можно использовать для того, чтобы стабилизировать тример рекомбинантных HA. Например, домен тримеризации термостабильного гликопротеина 41 (gp41) HIV 1 или начальные 16 из 31 остатка последовательности лейциновой молнии GCN4 использовали для содействия тримеризации усеченных конструкций HA (Impagliazzo, A., et al., Science (2015) 349:1301-1306; Yassing, H. M., et al., Nat Med (2015) 21:1065-1070).
[105] Рекомбинантные предшественники HA (HA0) как из вируса гриппа A, так и из гриппа B с трансмембранным доменом и внутриклеточным доменом, получали с использованием BEVS в коммерческом масштабе, как раскрыто в патентах США 5762939 A, 5858368 A и 6245532 B1. Эти рекомбинантные белки HA являются ингредиентами в Flublok®, которая получила одобрение FDA в качестве противогриппозной вакцины. HA0 в Flublok® получают с использованием сигнального пептида хитиназы бакуловируса (обозначаемого как сигнальный пептид 61K) для замены сигнального пептида HA. Рекомбинантный HA ассоциирован с периферической мембраной клеток насекомого. Его экстрагируют из мембраны с использованием детергента и дополнительно очищают.
Экспрессия у млекопитающих
[106] Клетки яичника китайского хомяка (CHO) и клетки 293 эмбриональной почки человека (HEK293) представляют собой широко используемые клетки-хозяева млекопитающего для временной трансфекции для экспрессии гена рекомбинантных белков. Как клетки CHO, так и клетки HEK293, имеют суспензионные клеточные линии и прилипающие клеточные линии. Эти клетки обычным образом культивируют в средах с FBS или без нее. Когда клетки культивируют без FBS, часто используют среды с определенным химическим составом. Все суспензионные и прилипающие клеточные линии можно использовать для экспрессии HA или других секретируемых белков.
[107] Временная трансфекция представляет собой общепринятый способ введения ДНК в клетки для экспрессии белка. Доступны многие коммерческие реактивы для трансфекции. Подобно процессу оптимизации экспрессии для бакуловирусной экспрессии, образцы сред берут периодически после трансфекции для анализа экспрессии белка с использованием стандартных способов. Белки HA легко обнаруживают с помощью аффинного захвата через гистидиновую метку в конструкциях HA или вестерн-блоттинг с использованием многих коммерчески доступных антител против HA. Экспрессия белка обычно начинается приблизительно через 48 часов после трансфекции и может возрастать в течение нескольких суток после трансфекции. Добавки иногда добавляют после трансфекции для увеличения экспрессии целевого белка. Другие клеточные линии млекопитающих, такие как COS 1, фибробластоподобная клеточная линия, полученная из ткани почки африканской зеленой мартышки, также использовали для экспрессии HA. VLP гриппа получали посредством совместной трансфекции несколькими плазмидами, содержащими кДНК всех 10 белков, кодируемых вирусом гриппа (Mena, I., et al., J. Virol (1996) 70: 5016-5024; Chen, B. J., et al., J. Virol (2007) 81:7111-7123).
[108] В другом способе доставки генов в клетки млекопитающих используют рекомбинантный бакуловирус, известный как BacMam, для бакуловирусного переноса генов в клетки млекопитающих (Boyce, F. M., and Bucher, N. L., PNAS (1996) 93:2348-2352; Dukkipatia. A., et al., Protein Expr Purif (2008) 62:160-170). Бакуловирус модифицировали посредством встраивания экспрессирующей кассеты млекопитающего в бакуловирусный экспрессирующий вектор для экспрессии трансгена в клетках млекопитающих. Рекомбинантные бакуловирусы BacMam создают стандартными способами получения бакуловирусов. Вирусные стоки амплифицированных рекомбинантных бакуловирусов BacMam добавляют в культуру CHO или HEK293 для доставки экспрессирующей кассеты млекопитающего в клетки CHO или HEK293 для экспрессии белка. Платформа BacMam делает возможной легкую трансдукцию больших количеств клеток млекопитающих.
[109] Векторы для экспрессии генов, трансфицированные в клетки млекопитающих, можно встраивать в хромосомы клеток, чтобы создавать стабильные клеточные линии для экспрессии целевых белков. Стабильные клеточные линии CHO являются наиболее распространенными хозяевами для получения терапевтических биологических средств, таких как моноклональные антитела. Технология хорошо приспособлена для крупномасштабного получения терапевтических белков и вакцин. Для создания стабильной клеточной линии, клетки, трансфицированные экспрессирующим вектором, подвергают отбору на основании селективного маркера в экспрессирующем векторе. В геном стабильной клеточной линии часто встраивают несколько копий целевых генов.
Векторы для экспрессии HA у млекопитающего
[110] Экспрессионные HA конструкции для экспрессии у млекопитающего имеют те же устройство и аминокислотные последовательности, что и для бакуловирусной экспрессии. Кодоны оптимизируют для экспрессии в клетках CHO или экспрессии в клетках HEK293. Бакуловирусные кодоны также хорошо работают в клетках млекопитающих, и наоборот. Сигнальный пептид HA использовали в качестве сигнального пептида для секреции или встраивания в мембрану рекомбинантных белков в экспрессирующих системах млекопитающих. Другие широко используемые сигнальные пептиды млекопитающих включают сигнальный пептид IL2 человека, сигнальный пептид тканевого активатора плазминогена (tPA) и многие другие сигнальные пептиды, находящиеся в базе данных сигнальных последовательностей (расположенной во всемирной паутине по адресу signalpeptide.de/index.php). Многие экспрессирующие векторы млекопитающих коммерчески доступны. Каждый вектор обычно имеет энхансер-промотор для экспрессии на высоком уровне, сигнал полиаденилирования и последовательность терминации транскрипции для стабильности мРНК, точку начала репликации SV40 для эписомальной репликации, ген устойчивости к антибиотикам и точку начала репликации pUC для отбора и поддержания в E. coli. Широко используемые промоторы для экспрессии у млекопитающего включают промотор CMV (цитомегаловируса), промотор hEF1-HTLV, композитный промотор, содержащий коровый промотор фактора элонгации 1α (EF 1α) и сегмент R и часть последовательности U5 (R-U5') длинного концевого повтора вируса T-клеточного лейкоза человека (HTLV) типа 1, или другие промоторы, находящиеся в MPromDb (Mammalian Promoter Database, расположенная во всемирной паутине по адресу mpromdb.wistar.upenn.edu/) или Eukaryotic Promoter Database (EPD, расположенная во всемирной паутине по адресу epd.vital-it.ch/). Вектор для переноса часто имеет другой селективный маркер для создания стабильных клеточных линий.
[111] Следующие примеры приведены для того, чтобы иллюстрировать, но не ограничивать изобретение.
Пример 1
Конструирование векторов для переноса H1 HA для рекомбинантного бакуловирусного получения
[112] В этом примере описана родительская плазмида, которую можно модифицировать для того, чтобы получать модифицированный белок HA по изобретению. Основные черты этой плазмиды представлены на фиг. 4, где вставка в стандартную плазмиду для экспрессии в бакуловирусе заключена между участками рестрикции для такой вставки и имеют место участки рестрикции, которые допускают замену MCS белка HA и замену иммунодоминантных областей в домене глобулярной головки HA. Кодируемый белок сливают с аффинной меткой из 10 гистидинов (10× гистидиновая метка) для очистки, которую можно удалять с помощью вставленного сайта протеазного расщепления после очистки. Этот вектор обозначают H1WT.
[113] Последовательность HA (SEQ ID №1) из A/California/07/2009, исходного штамма вируса гриппа A свиньи H1N1, который рекомендован WHO для получения противогриппозной вакцины 2009 года (как указано во всемирной паутине по адресу who.int/csr/resources/publications/swineflu/vaccine_ recommendations/en/), использовали в качестве родительской последовательности для встраивания гетерологичных пептидов. Эта последовательность HA имеет номер доступа UniProt:C3W5X2. Все конструкции имеют одинаковое устройство, как проиллюстрировано схематически на фиг. 4. N-концевой сигнальный пептид HA (SEQ ID №7) заменяли на сигнальный пептид GP67 MVSAIVLYVLLAAAAHSAFA (SEQ ID №2). C-концевой трансмембранный (TM) домен с последовательностью ILAIYSTVASSLVLVVSLGAISFWMCS и внутриклеточный домен с последовательностью NGSLQCRICI из HA заменяли на TEV сайт расщепления (SEQ ID №4), за которым следовал фолдон (SEQ ID №5) и 10× гистидиновая метка (SEQ ID №6), а именно GAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH (SEQ ID №3), на основании конструкции HA, впервые описанной в Stevens, J., et al., Science (2006) 312:404-410. Фолдон стабилизирует рекомбинантный HA, тогда как 10× гистидиновая метка облегчает очистку HA от сред клеточных культур. Фолдон и 10× гистидиновую метку можно удалять с помощью TEV протеазы, которая распознает TEV сайт расщепления, расположенный между последовательностью HA и последовательностью фолдона. Кодоны гена оптимизировали для бакуловирусной экспрессии и синтезировали стандартным способом (GENEWIZ, South Plainfield, NJ 07080, USA).
[114] Как показано схематически на фиг. 4, разнесенные уникальные участки рестрикции, участок ClaI, участок NsiI и участок BamHI, вводили в последовательность HA для того, чтобы содействовать изменению и обмену последовательностей. Получаемую конструкцию GP67-H1WT-TEV-фолдон-10His, обозначаемую как «H1WT» (SEQ ID №9), субклонировали в плазмиду pFastBac между участком NcoI и участком HindIII. Последовательность между участками ClaI и NsiI кодирует большинство иммунодоминантных областей детерминант домена глобулярной головки. Последовательность между участками NsiI и BamHI кодирует MCS. Экспрессия конструкции H1WT происходит под управлением промотора полиэдрина бакуловируса. Получаемая плазмида представляет собой вектор для переноса для экспрессии рекомбинантного HA дикого типа из A/California/07/2009. Конструкция H1WT представляет собой родительскую конструкцию, из которой получают генетически модифицированные конструкции HA.
[115] Для получения генетически модифицированного HA с гетерологичными пептидами, фрагменты H1WT дикого типа заменяли с использованием указанных выше участков рестрикции и синтезированных фрагментов ДНК, которые кодируют конкретные изменения в HA. Для того чтобы модифицировать MCS, фрагмент NsiI-BamHI в H1WT заменяли на фрагменты ДНК, которые кодируют измененные сайты расщепления при созревании. Для того чтобы менять области детерминант в домене глобулярной головки HA1, фрагмент ClaI-NsiI в H1WT заменяли на фрагменты ДНК, которые кодируют измененные области детерминант с гетерологичными пептидами. Конструкции с различными комбинациями сайтов расщепления при созревании и областей детерминант получали посредством простых замен рестрикционных фрагментов различных плазмид. Получаемые конструкции подтверждали посредством секвенирования ДНК.
Пример 2
Разработка и конструирование конструкций H1 HA с модифицированными сайтами расщепления при созревании
[116] В этом примере, сегмент H1WT между участками рестрикции NsiI и BamH1, которые окружают MCS, заменяют на альтернативные последовательности, которые модифицируют этот MCS. В нескольких случаях TEV сайт расщепления включают в модифицированный MCS.
[117] Модифицированные сайты расщепления при созревании вводили в векторы для переноса H1 HA, описанные в примере 1. Конструкции с модифицированными сайтами расщепления при созревании перечислены в таблице 1.
Таблица 1. Список конструкций H1 HA с измененным сайтом расщепления при созревании
a Название конструкции основано на сайте расщепления при созревании. H1 обозначает H1 HA. MCS обозначает сайт расщепления при созревании.
b Конструкции описаны по их признакам последовательности. GP67ss обозначает сигнальную последовательность GP67. TEV-фолдон-10His обозначает последовательность TEV сайта расщепления, последовательность фолдона и 10× гистидиновую метку на C-конце конструкций. Схематические изображения конструкций представлены на фиг. 4.
c H1WT представляет собой конструкцию H1 HA дикого типа с нативным MCS.
[118] Положения этих модификаций проиллюстрированы на фиг. 5.
[119] Конструкция H1H5cs (SEQ ID №11) имеет MCS из H1 HA дикого типа (SEQ ID №9), замененную на H5 MCS (SEQ ID №12). Конструкция H1R5cs (SEQ ID №14) имеет MCS из H1 дикого типа, замененный на пять аргининов. Конструкция H1IR5cs (SEQ ID №16) имеет четыре аргинина, вставленных между последовательностями HA1 и HA2, при сохранении всех нативных остатков HA1. Фрагмент NsiI-BamHI с изменениями синтезировали и субклонировали между участками NsiI и BamHI в H1WT, чтобы заменять фрагмент дикого типа.
[120] Для того чтобы тестировать, можно ли MCS H1 HA модифицировать в TEV сайт расщепления, который не содержит какой-либо основной остаток, получали несколько конструкций посредством замены определенного числа остатков в MCS H1 HA. Конструкция H1TEV1 (SEQ ID №18) имеет 7 остатков, PSIQSRG, в MCS H1 HA, замененные на TEV сайт расщепления из 7 остатков ENLYFQG (SEQ ID №4). Конструкция H1TEV2 (SEQ ID №20) имеет 8 остатков, IPSIQSRG, в MCS H1 HA, замененные на SPENLYFQG, содержащие TEV сайт расщепления. Конструкция H1TEV3 (SEQ ID №22) имеет последние 3 остатка (QSR) в MCS H1 HA (SEQ ID №8), замененные на TEV сайт расщепления.
Пример 3
Разработка и конструирование конструкций H1 HA с гетерологичными эпитопами в домене глобулярной головки
[121] В этом примере основную плазмиду и плазмиду с модифицированными MCS модифицировали между участками ClaI и NsiI с помощью альтернативных нуклеотидных последовательностей, где различные иммунодоминантные участки заменяли на гетерологичные эпитопы.
[122] Гетерологичные эпитопы вводили в конструкции, описанные в примере 1 и примере 2. Гетерологичные эпитопы вставляли около иммунодоминантных областей детерминант домена глобулярной головки HA или заменяли иммунодоминантные области детерминант домена глобулярной головки HA. Конструкции с модифицированной областью(ями) детерминанты перечислены в таблице 2.
Таблица 2. Список конструкций H1 HA с модифицированной иммунодоминантной областью детерминанты в домене глобулярной головки
a Название конструкции основано на сайте расщепления при созревании и модификации области детерминанты. H1 обозначает H1 HA. MCS обозначает сайт расщепления при созревании. AS обозначает измененную иммунодоминантную область детерминанты в домене глобулярной головки H1 HA с гетерологичным эпитопом. Каждую AS обозначают с помощью гетерологичного эпитопа и иммунодоминантной области детерминанты H1 HA, куда помещают гетерологичный эпитоп.
b Конструкции описаны по их признакам последовательностей. GP67ss обозначает сигнальную последовательность GP67. TEV-фолдон-10His обозначает TEV сайт расщепления, последовательность фолдона и 10× гистидиновую метку на C-конце конструкций. Схематические изображения конструкций представлены на фиг. 4.
[123] Положения этих модификаций проиллюстрированы на фиг. 5.
[124] Пептид композитного эпитопа CR8020 из 13 аминокислотных остатков заменял поверхностную петлю из 12 остатков EIAIRPKVRDQE около области детерминанты Ca2. Фрагмент ClaI-NsiI с заменой пептида композитного эпитопа CR8020 синтезировали и субклонировали между участками ClaI и NsiI в H1H5cs для того, чтобы создавать конструкцию HA, обозначаемую как H1H5cs-CR8020Ca (SEQ ID №24). Для получения H1TEV2-CR8020Ca (SEQ ID №29) фрагмент ClaI-NsiI из H1H5cs-CR8020Ca выделяли и субклонировали между участками ClaI и NsiI в H1TEV2.
[125] Конструкция H1TEV2-CR8020Sa3 (SEQ ID №31) имеет пептид композитного эпитопа CR8020, заменяющий остатки KKGNS из одной из областей Sa, которые соответствуют петле области B в H3 HA в верхней части домена глобулярной головки. Фрагмент ClaI-NsiI с модификацией CR8020 синтезировали и субклонировали между участками ClaI и NsiI в H1TEV2 для того, чтобы создавать конструкцию HA, обозначаемую как H1TEV2-CR8020Sa3.
[126] Конструкция H1TEV2-CR8020Sa4 (SEQ ID №33) имеет пептид композитного эпитопа CR8020, заменяющий спиральную структуру остатков KTSS около одной из областей Sa. Это положение находится на стороне домена глобулярной головки тримера HA и вдали от сайта связывания рецептора. Такая модификация маловероятно изменит связывание рецептора. Фрагмент ClaI-NsiI с модификацией CR8020 синтезировали и субклонировали между участками ClaI и NsiI в H1TEV2 для того, чтобы создавать конструкцию HA, обозначаемую как H1TEV2-CR8020Sa4.
[127] Модели мономера HA конструкций CR8020Sa4 и CR8020Ca представлены на фиг. 6. Каждый мономер HA имеет пептид композитного эпитопа CR8020 в домене глобулярной головки и нативный эпитоп CR8020 в стеблевом домене.
[128] Создавали несколько конструкций HA с пептидом эпитопа I1C9 GIFGAIAGFIEG (SEQ ID №36). Одна конструкция H1TEV2-I1C9Ca1 (SEQ ID №35) имеет пептид I1C9, заменяющий RPKVRDQE в остатках с 217 до 224 около области Ca2. Другая конструкция H1H5cs-I1C9Ca (SEQ ID №46) имеет пептид I1C9, заменяющий более длинный пептид EIAIRPKVRDQE в остатках с 213 до 224 в Ca2. Другие конструкции имеют пептид I1C9, индивидуально заменяющий область Ca2, HAGAKS, которая соответствует области A в H3 HA, область Sa KKGNS и область Sa KTSS. Каждый из фрагментов ClaI-NsiI с изменениями синтезировали и субклонировали между участками ClaI и NsiI в H1TEV2 для того, чтобы создавать конструкцию HA, обозначаемую как H1TEV2-I1C9Ca1 (SEQ ID №35), H1TEV2-I1C9Ca2 (SEQ ID №38), H1TEV2 1C9Sa3 (SEQ ID №40) и H1TEV2-I1C9Sa4 (SEQ ID №42), соответственно. Фрагмент ClaI-NsiI с изменением I1C9Ca синтезировали и субклонировали между участками ClaI и NsiI в H1H5cs для того, чтобы создавать конструкцию HA H1H5cs-I1C9Ca. Пептид I1C9 также заменял остатки TSADQQSLYQNA в области Sb конструкции H1H5cs в виде H1H5cs-I1C9Sb (SEQ ID №44) тем же способом. Область Sb соответствует спирали области B в H3 HA.
[129] Фрагмент ClaI-NsiI генетически синтезировали с использованием пептида эпитопа FI6 RKKRGLFGAIAGFIE (SEQ ID №49), который помещали в область Sa, и пептида суперспирального эпитопа FI6 KESTQKAIDGVTNKVNS (SEQ ID №50), который помещали в область Sb. Этот фрагмент ClaI-NsiI с заменами FI6 субклонировали между участками ClaI и NsiI в H1H5cs и H1WT и получали конструкции H1H5cs-FI6Sab (SEQ ID №48) и H1WT-FI6Sab (SEQ ID №52), соответственно. Другой фрагмент ClaI-NsiI генетически синтезировали с использованием пептида эпитопа FI6 RKKRGLFGAIAGFIE (SEQ ID №49), который помещали в область Sa. Этот фрагмент заменял фрагмент ClaI-NsiI в H1TEV1 для того, чтобы создавать конструкцию H1TEV1-FI6Sa (SEQ ID №54).
Пример 4
Разработка и конструирование конструкций H1 HA с пептидом M2e в областях детерминант в домене глобулярной головки
[130] В этом примере снова нуклеотидную последовательность фрагмента ClaI-NsiI заменяли на нуклеотидные последовательности, в которых часть области Ca2 или области Sb заменяли на нуклеотидную последовательность, кодирующую пептид M2e. Конструкции с пептидами M2e перечислены в таблице 2. Положения этих модификаций проиллюстрированы на фиг. 5.
[131] Синтезом генов создавали фрагменты ClaI-NsiI с пептидом M2e (SEQ ID №57), заменяющим EIAIRPKVRDQE в области Ca2 или заменяющим спираль из остатков TSADQQSLYQNA в области Sb. Конструкции HA с пептидом M2e сначала создавали в H1H5cs, где фрагмент ClaI-NsiI в H1H5cs заменяли на индивидуальный фрагмент ClaI-NsiI, содержащий пептид M2e, получая конструкции H1H5cs-M2eCa (SEQ ID №56) и H1H5cs-M2eSb (SEQ ID №59), соответственно. Для переноса фрагмента ClaI-NsiI из H1H5cs-M2eCa в конструкцию H1TEV2, фрагмент ClaI-NsiI из H1H5cs-M2eCa выделяли и субклонировали между участками ClaI и NsiI в H1TEV2, что вело к конструкции, называемой H1TEV2-M2eCa (SEQ ID №61).
Пример 5
Создание рекомбинантных бакуловирусов с использованием бакуловирусных экспрессирующих систем Bac-to-Bac
[132] В этом примере описаны способы получения клеток насекомого, содержащих экспрессирующие системы, находящиеся в конструкциях, полученных в примерах 1-4.
[133] Рекомбинантные бакуловирусы создавали из векторов pFastBacbased для переноса конструкций, следуя инструкциям производителя (бакуловирусные экспрессирующие системы Bac-to-Bac, Life Technology, Carlsbad, CA, USA). В кратком изложении, векторы для переноса трансформировали в химически компетентные клетки E. coli DH10Bac. Белые колонии с рекомбинантными бакмидами отбирали на чашках с Blue-gal. ДНК бакмид выделяли стандартным способом щелочного лизиса Miniprep по инструкциям производителя. Рекомбинантные бакмиды идентифицировали с помощью ПЦР, используя прямой праймер M13 (-40) (GTTTTCCCAGTCACGAC) и обратный праймер M13 (CAGGAAACAGCTATGAC). Рекомбинантные бакмиды давали ПЦР продукт приблизительно 4 т.о.
[134] Клетки SF9 насекомого, прикрепленные к 12-луночным планшетам, трансфицировали рекомбинантными бакмидами, используя реактив Cellfectin®, другие коммерчески доступные реактивы для трансфекции или полиэтиленимин (PEI). Через 4-7 суток после трансфекции или когда клетки SF9 увеличивались из-за вирусной инфекции, среды клеточных культур собирали в качестве вирусных стоков P0. Каждый вирусный сток P0 использовали для того, чтобы инфицировать 50 мл клеток SF9 при плотности 2×106 клеток/мл во встряхиваемых колбах для амплификации вирусов. Осуществляли мониторинг культур с использованием счетчика клеток Cedex (Roche Diagnostics Corporation, Indianapolis, IN, USA). Время сбора определяли по усредненному размеру жизнеспособных клеток и жизнеспособности клеток. Когда усредненный размер жизнеспособных клеток составлял на 4-7 мкм больше, чем у не инфицированных клеток, и жизнеспособность находилась в диапазоне 50-70% через 4-5 суток после инфекции, клетки удаляли посредством центрифугирования и супернатанты клеточных культур собирали и хранили при 4°C в темноте в качестве вирусных стоков P1. Иногда вирусные стоки фильтровали через 0,2 мкм стерильный фильтр для того, чтобы поддерживать стерильность.
[135] Для дополнительной амплификации вирусных стоков 500 мл клеток SF9 при плотности 2×106 клеток/мл инфицировали с использованием 250 мкл вирусного стока P1. Осуществляли мониторинг культур с использованием счетчика клеток Cedex. Когда усредненный размер жизнеспособных клеток составлял на 4-7 мкм больше, чем у не инфицированных клеток, и жизнеспособность находилась в диапазоне 50-70% через 4-5 суток после инфекции, клетки удаляли посредством центрифугирования и супернатанты клеточных культур собирали и хранили при 4°C в темноте в качестве вирусных стоков P2. Иногда вирусные стоки фильтровали через 0,2 мкм стерильный фильтр для того, чтобы поддерживать стерильность.
Пример 6
Экспрессия рекомбинантных белков HA.
[136] В этом примере продемонстрирована экспрессия различных конструкций, описанных в примерах 1-4, в клетках насекомого. В зависимости от конкретной конструкции, получали различные уровни экспрессии целевого белка.
[137] Для того чтобы обнаруживать экспрессию рекомбинантного HA, среды клеточных культур клеток SF9, которые инфицировали рекомбинантными бакуловирусными стоками, обычно вирусными стоками P1 или P2, как описано в примере 5, собирали и инкубировали со смолами Ni-NTA (Qiagen, Germantown, MD USA) для аффинного захвата через 10× гистидиновую метку рекомбинантного HA. После промывания смолы Ni-NTA фосфатно-солевым буфером (1× PBS), смолы Ni-NTA кипятили с загрузочным буфером для гелей в присутствии или отсутствии восстанавливающего средства для анализа посредством SDS-PAGE или вестерн-блоттинга с использованием антител против His. Белковая полоса приблизительно 63 кДа на геле с окрашиванием Coomassie® или вестерн-блоттинге против His указывает на экспрессию секретируемого рекомбинантного полноразмерного белка HA.
[138] Как показано на фиг. 7 и фиг. 8, экспрессию белка H1 HA родительской конструкции H1WT обнаруживали, как ожидали. Белки HA с измененным сайтом расщепления при созревании из нескольких основных остатков, H1H5cs, H1R5cs и H1IR5cs, экспрессированы на том же уровне, что и H1WT. H1TEV1, с целым сайтом расщепления при созревании в H1 HA, замененным на TEV сайт расщепления, экспрессирован значительно меньше, чем H1WT. При сохранении большего числа нативных остатков в сайте расщепления при созревании, H1TEV2 и H1TEV3 экспрессированы очень хорошо по сравнению с H1WT (фиг. 7 и фиг. 8). Не все замены экспрессированы на одном и том же уровне. Посредством корректировки местоположения TEV сайта расщепления в конструкциях достигали уровня экспрессии HA дикого типа.
[139] На фиг. 7 и фиг. 8 также показано, что размещение одного и того же иммуносубдоминантного эпитопа bNAb в различных иммунодоминантных областях детерминант вело к различным уровням экспрессии. Конструкции пептида композитного эпитопа CR8020 в области Sa (H1TEV2-CR8020Sa4) или в области Ca2 (H1H5cs-CR8020Ca) экспрессированы на том же уровне, что и HA дикого типа, тогда как конструкция H1TEV2-CR8020Sa3 не экспрессирована хорошо. Таким образом, точные положения размещения гетерологичного эпитопа могут быть важны для экспрессии получаемого HA. Свойства иммуносубдоминантных эпитопов bNAb также могут влиять на уровни экспрессии получаемых белков HA.
[140] Индивидуальное размещение эпитопа I1C9 в нескольких областях детерминант также демонстрировало различные уровни экспрессии получаемых белков HA (фиг. 7 и фиг. 8). Конструкция H1H5cs-I1C9Ca демонстрировала более высокую экспрессию, чем конструкция H1TEV2-I1C9Ca1. Пептидные последовательности в областях детерминант, замененные пептидом эпитопа I1C9 в этих двух конструкциях, слегка различны. Подобно конструкциям с TEV сайтом расщепления в качестве MCS, местоположение замены влияет на уровень экспрессии.
[141] Конструкции с пептидом M2e в области Ca2s, а именно H1H5cs-M2eCa и H1TEV2-M2eCa, дают такую же экспрессию, как H1WT, независимо от сайтов расщепления при созревании (фиг. 7 и фиг. 8). Однако конструкция H1H5cs-M2eSb с пептидом M2e в области Sb не экспрессирована хорошо. Область Sb находится в спиральной структуре, которая может быть необходима для надлежащей укладки HA.
[142] Успешная экспрессия многих конструкций H1 HA демонстрировала, что иммунодоминантные области детерминант домена глобулярной головки HA можно заменять на иммуносубдоминантные эпитопы bNAb из стеблевого домена или на пептид M2e из другого белка, не родственного для HA. Эти результаты обнаруживали пластичность домена глобулярной головки и валидировали выполнимость создания функционального HA для представления гетерологичных эпитопов в его домене глобулярной головки. В примерах 1-6 вместе продемонстрированы способы конструирования HA с гетерологичными эпитопами и/или измененным MCS и отбора модифицированных HA с хорошей экспрессией.
Пример 7
Очистка рекомбинантных белков HA
[143] В этом примере продемонстрирована очистка различных конструкций, описанных в примерах 1-4.
[144] Во встряхиваемых колбах от 50 мл до 1 л клеток SF9 при плотности 2×106 клеток/мл инфицировали бакуловирусным стоком при объемном соотношении 1-4 мл вирусного стока P1 или P2 на 1 литр клеток. Мониторинг культуры осуществляли с использованием счетчика клеток Cedex. Время сбора определяли по усредненному размеру жизнеспособных клеток и жизнеспособности клеток. Когда усредненный размер жизнеспособных клеток составлял на 4-7 мкм больше, чем у не инфицированных клеток, и жизнеспособность составляла приблизительно 80% через 2-3 суток после инфекции, клетки удаляли посредством центрифугирования и кондиционированные среды клеточных культур собирали и хранили при 4°C. Кондиционированные среды клеточных культур инкубировали со смолами Ni-NTA при качании на платформе Rotisserie в течение 2-4 часов при 4°C. Смолы Ni-NTA собирали посредством центрифугирования и промывали в 1× PBS. Промытые смолы Ni-NTA набивали в колонку с гравитационным течением и дополнительно промывали в 1× PBS с добавлением 50 мМ имидазола. Затем смолы Ni-NTA элюировали с использованием 400 мМ имидазола в 1× PBS под действием гравитационного течения. В элюируемых белках HA проводили замену буфера на 1× PBS и концентрирование посредством ультрафильтрования. Очищенные белки HA анализировали посредством SDS-PAGE, как показано на фиг. 8.
ПРИЛОЖЕНИЕ
Описание вирусов гриппа, их типов и хозяев
[145] Вирусы гриппа включают три рода в семействе вирусов Orthomyxoviridae, которые представляют собой вирус гриппа A, B и C. Каждый род имеет только один вид вирусов, а именно вирус гриппа A, B и C, соответственно. Вирусы гриппа A, B и C также называют вирусами гриппа типа A, B и C, соответственно. Вирусы гриппа представляют собой оболочечные вирусы с отрицательно-полярной одноцепочечной РНК. Вирусный геном закодирован отдельными сегментами РНК. Каждый из вирусов гриппа A и B имеет 8 сегментов РНК, которые кодируют 10 белков. Каждый из вирусов гриппа C имеет 7 сегментов РНК, которые кодируют 9 белков. 10 охарактеризованных белков вирусов гриппа A представляют собой полимеразы PB2, PB1 и PA, гемагглютинин (HA), нуклеопротеин (NP), нейраминидазу (NA), матричные белки M1 и M2, неструктурные белки NS1 и NS2 (Webster, R. G., et al., Microbiol Rev (1992) 56:152-179). Вирусы гриппа C имеют слитый белок гемагглютинин-эстераза (HEF), который объединяет функции HA и NA (Herrler, G., et al., J. Gen Virol (1988) 69:839-846). Классификация вирусов гриппа A, B и C основана на антигенных различиях в их NP и матричных белках.
[146] Вирусы гриппа A представляют собой небольшие частицы 80-120 нм в диаметре, которые состоят из липидной двухслойной оболочки из организма-хозяина, усеянной кодируемыми вирусом мембранными белками HA, NA и M2, внутренней оболочки, состоящей из матричного белка M1, и нуклеокапсидов вирусного генома из индивидуальных сегментов РНК в центре (Webster, R. G., et al., Microbiol Rev (1992) 56:152-179). Сегменты РНК свободно инкапсулированы несколькими молекулами NP. Комплексы из трех белков вирусных полимераз (PB1, PB2 и PA) расположены на концах нуклеокапсидов. Все сегменты РНК необходимы для получения инфекционной вирусной частицы.
[147] Сегмент РНК 1, наиболее медленно мигрирующая частица РНК при электрофорезе в геле, кодирует РНК полимеразу PB2. Сегмент РНК 2 кодирует РНК полимеразу PB1, плюс два других транскрипта для белков PB1-N40 и PB1-F2 с использованием других рамок считывания с той же последовательности РНК. Белки PB1-N40 и PB1-F2 вызывают апоптоз клетки-хозяина. Сегмент РНК 3 кодирует РНК полимеразу PA, которая образует РНК-зависимый комплекс РНК полимеразы с PB1 и PB2. Сегмент РНК 4 кодирует HA, основной поверхностный антиген вириона гриппа. Каждый вирион имеет приблизительно 500 молекул HA, что выглядит как единообразно распределенные шипы на поверхности вириона (Ruigrok, R. W. H., et al., J. Gen Virol (1984) 65:799-902; Murti, K. G., and Webster, R. G., Virol (1986) 149:36-43). Связываясь с рецепторами хозяев, HA определяет спектр хозяев. Сегмент РНК 5 кодирует нуклеопротеин NP. NP заключает вирусную РНК в капсид и транспортируется в ядро клетки-хозяина. Инфицированные клетки обильно синтезируют NP, который является вторым наиболее обильным белком в вирионе вируса гриппа. Он является основной мишенью цитотоксического T-клеточного иммунного ответа хозяина. Сегмент РНК 6 кодирует нейраминидазу (NA), второй основной поверхностный антиген вириона вируса гриппа. NA представляет собой фермент, который отщепляет терминальную сиаловую кислоту от гликопротеинов или гликолипидов для высвобождения вирусных частиц из рецепторов клетки-хозяина. Ее функция необходима для распространения вируса. Каждый вирион имеет приблизительно 100 молекул NA на его поверхности. NA образует тетрамер и располагается дискретными очагами на оболочке вириона (Murti, K. G., and Webster, R. G., Virol (1986) 149:36-43). Сегмент РНК 7 является бицистронным и кодирует оба матричных белка, M1 и M2. M1 образует оболочку, окружающую нуклеокапсиды вириона под оболочкой вириона, и является наиболее обильным белком в вирионе вируса гриппа. M2 состоит из другой сплайсированной формы того же транскрипта M1. M2 представляет собой интегральный мембранный белок и выполняет функцию протонного канала для того, чтобы управлять pH в сети Гольджи во время продуцирования вируса гриппа в клетках-хозяевах. M2 можно частично заменять на альтернативно сплайсированный вариант M42. Приблизительно 3000 молекул матричных белков необходимы для создания одного вириона. Сегмент РНК 8 кодирует два неструктурных белка NS1 и NS2 для репликации вируса. NS2 происходит из другой рамки считывания с NS1. Оба белка в изобилии присутствуют в инфицированной клетке, но не встраиваются в вирионы потомства.
[148] Среди трех родов вирусов гриппа, вирусы гриппа A представляют собой наиболее вирулентные патогены человека и вызывают наиболее тяжелое заболевание у человека. Вирусы гриппа A делят на субтипы на основании антигенных свойств их поверхностных гликопротеинов HA и NA. Идентифицировано всего 18 субтипов HA, называемых с H1 до H18, и 10 субтипов NA, называемых с N1 до N10 (Tong, S., et al., PLoS Pathogens (2013) 9:e1003657). Общая номенклатура субтипов гриппа A происходит от различных комбинаций субтипа HA и субтипа NA, например, H1N1, H3N2 и H7N9 (Bull World Health Organ (1980) 58: 585-591). Водоплавающие птицы рода Anseriformes представляют собой природный резервуар субтипов с H1 до H16 и с N1 до N9. Субтипы H17N10 и H18N10 в последнее время обнаружены у американских плодоядных летучих мышей. В природе сегментированный геном вирусов гриппа A допускает перегруппировку сегментов РНК, когда организм совместно инфицирован вирусами гриппа A двух субтипов. Сегменты РНК от двух различных субтипов могут быть упакованы в один вирион с образованием нового субтипа. Среди этих многих субтипов вирусов гриппа A только H1N1, H2N2 и H3N2 развили способность к эффективной передаче у человека. Эти три субтипа являются преобладающими вирусными субтипами так называемых сезонных вирусов гриппа. Следовательно, человеческая популяция иммунологически наивна в отношении многих субтипов гриппа A. Иногда другие субтипы вирусов гриппа A осуществляют межвидовой переход и инфицируют человека, вызывая пандемические вспышки с высокой смертностью.
[149] На основании их филогенетической связи, субтипы HA гриппа A делят на две отчетливые группы. Группа 1 включает 10 из 16 субтипов: H1, H2, H5, H6, H8, H9, H11, H12, H13 и H16. Группа 2 состоит из остальных 6 субтипов: H3, H4, H7, H10, H14 и H15.
[150] Вирусы гриппа B антигенно отличаются от вирусов гриппа A. Вирусы гриппа B циркулируют совместно с вирусами типа A и вызывают эпидемии у человека. Вирусы гриппа B стабильно адаптированы к человеку без известного животного-резервуара. В отличие от широких генетических вариаций HA у вирусов гриппа A, существуют сообщения только об одном серотипе HA у вирусов гриппа B, несмотря на то, что по филогенетическим связям определены три линии генов HA. Похоже, что вирусы гриппа B не рекомбинируют с вирусами гриппа A, поскольку не было сообщений о перегруппировке сегментов РНК между вирусами гриппа A и гриппа B.
[151] Оба вируса гриппа A и B используют терминальную сиаловую кислоту на поверхности клетки-хозяина в качестве клеточного рецептора. HA обоих типов вирусов имеют одинаковые структурные признаки и связываются с рецептором сиаловой кислоты для проникновения в клетки-хозяева.
[152] Субтипы вирусов гриппа A и гриппа B дополнительно делят на штаммы. Существует множество различных штаммов вирусов гриппа A и гриппа B. В каждый сезон гриппа преобладает несколько штаммов вирусов гриппа A и B, которые обычно генетически отличны от штаммов предыдущего сезона гриппа. Вирусы одного штамма, выделяемые в различных географических местоположениях или в различные моменты сезона гриппа, известные как изоляты, часто имеют генетические изменения.
[153] Инфекция вирусами гриппа C в целом является бессимптомной или вызывает легкое заболевание, затрагивающее главным образом детей или молодых взрослых. Вирусы гриппа C связаны со спорадическими случаями и второстепенными локализованными вспышками. Вирусы гриппа C влекут за собой значительно меньшее бремя заболевания, чем вирусы гриппа A и B. Большая доля человеческой популяции демонстрирует сероконверсию, что указывает на широкую циркуляцию вирусов гриппа C в человеческой популяции. Вирусы гриппа C также выделены у животных. Слитый белок гемагглютинин-эстераза (HEF) вируса гриппа C объединяет функции HA и NA вирусов гриппа A и B. В отличие от HA вирусов гриппа A и B, HEF вируса гриппа C использует концевую 9-O-ацетил-N-ацетилнейраминовую кислоту (9-O-Ac-NeuAc) в качестве клеточного рецептора (Herrler, G., et al., EMBO J. (1985) 4:1503-1506).
Описание процесса вирусной инфекции и жизненного цикла
[154] Вирусы гриппа распространятся от человека к человеку через респираторные капельки или фомиты (любой объект или вещество, способное нести инфекционные организмы). Вирусы инфицируют эпителиальные клетки дыхательных путей. После связывания с рецепторами клеточной поверхности, происходит эндоцитоз прикрепленного вириона клеткой-хозяином в эндосомы, где низкий pH запускает конформационное изменение HA, которое ведет ко вставке его гидрофобного слитого пептида в везикулярную мембрану клетки-хозяина и инициирует слияние вирусной и везикулярной мембран. При слиянии высвобождается содержимое вириона в цитоплазму инфицированной клетки. Вирусные нуклеокапсиды мигрируют в ядро клетки-хозяина, и ассоциированные с ними полимеразные комплексы начинают первичную транскрипцию мРНК для трансляции вирусных белков. Одновременно происходит блокирование трансляции мРНК хозяина. Вокруг вновь синтезированной вирусной РНК образуется капсид и вирусные структурные белки синтезируются и транспортируются к поверхности клетки-хозяина, где они встраиваются в мембрану клетки-хозяина. Вирусы гриппа отпочковываются от апикальной поверхности полярных эпителиальных клеток, таких как бронхиальные эпителиальные клетки, в просвет легких и, следовательно, обычно являются пневмотропными (Roth, M. G., et al., PNAS (1979) 76: 6430-6434; Nayak, D. P., et al., Virus Res (2009) 143:147-161). Продемонстрирована передача вируса гриппа между свиньями и человеком. После инфицирования индивидуума иммунная система вырабатывает антитела против вирус гриппа. Это является основными источником защиты организма.
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ
SEQ ID №1: пептидная последовательность HA из A/California/07/2009, происходящий от свиньи штамм H1N1 вируса гриппа A (UniProt:C3W5X2)
MKAILVVLLYTFATANADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKHNGK LCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEELREQ LSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKSYIND KGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQEGRMNYY WTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTSLPFQN IHPITIGKCPKYVKSTKLRLATGLRNIPSIQSRGLFGAIAGFIEGGWTGMVDGWYGYHHQNEQ GSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGFLDIWT YNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCMESVKN GTYDYPKYSEEAKLNREEIDGVKLESTRIYQILAIYSTVASSLVLVVSLGAISFWMCSNGSLQC RICI
SEQ ID №2: пептидная последовательность сигнала секреции GP67 (GP67ss)
MVSAIVLYVLLAAAAHSAFA
SEQ ID №3: пептидная последовательность TEV сайта расщепления, фолдона и 10× гистидиновой метки
GAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №4: пептидная последовательность TEV сайта расщепления
ENLYFQG
SEQ ID №5: пептидная последовательность фолдона
GSGYIPEAPRDGQAYVRKDGEWVLLSTFL
SEQ ID №6: пептидная последовательность 10× гистидиновой метки
HHHHHHHHHH
SEQ ID №7: пептидная последовательность сигнального пептида HA из A/California/07/2009 (UniProt:C3W5X2)
MKAILVVLLYTFATANA
SEQ ID №8: пептидная последовательность сайта расщепления при созревании (MCS) H1 HA
IPSIQSR
SEQ ID №9: пептидная последовательность GP67ss-H1WT-TEV-фолдон-10His (H1WT)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKS YINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQEGR MNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTS LPFQNIHPITIGKCPKYVKSTKLRLATGLRNIPSIQSRGLFGAIAGFIEGGWTGMVDGWYGYHH QNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGF LDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCM ESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYVRK DGEWVLLSTFLGHHHHHHHHHH
SEQ ID №10: нуклеотидная последовательность GP67ss-H1WT-TEV-фолдон-10His (H1WT)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCG GCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATA TCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACG AGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTA AGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATG CCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACC CTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGA ATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTAT GTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCC AAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGA TAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGA GAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACC TGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCA CCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGA GAAATATCCCTAGCATCCAGAGCAGAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGG GAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGA TCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAG GTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAA CCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATA TTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACC ACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCC AAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAG TCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAG AGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACC TGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGT TCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCAT CACCATCATCACTGATAAaagctt
SEQ ID №11: пептидная последовательность GP67ss-H1H5cs-TEV-фолдон-10His (H1H5cs)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKS YINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQEGR MNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTS LPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPQRERRKKRGLFGAIAGFIEGGWTGMVDGWY GYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKV DDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCD NTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQ AYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №12: пептидная последовательность сайта расщепления при созревании H5
QRERRKKR
SEQ ID №13: нуклеотидная последовательность GP67ss-H1H5cs-TEV-фолдон-10His (H1H5cs)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCG GCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATA TCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACG AGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTA AGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATG CCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACC CTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGA ATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTAT GTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCC AAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGA TAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGA GAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACC TGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCA CCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGA GAAATAGCCCTCAGAGGGAGAGACGCAAGAAGAGAGGCCTGTTTGGAGCCATCGCCGGC TTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAAT GAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGAT CACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCA AGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGC TTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACC CTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAA GAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACAC CTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAA GCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCG CTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTC AGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCA TCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №14: пептидная последовательность GP67ss-H1R5cs-TEV-фолдон-10His (H1R5cs)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKS YINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQEGR MNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTS LPFQNIHPITIGKCPKYVKSTKLRLATGLRNIPRRRRRGLFGAIAGFIEGGWTGMVDGWYGYH HQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDG FLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTC MESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYV RKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №15: нуклеотидная последовательность GP67ss-H1R5cs-TEV-фолдон-10His (H1R5cs)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCG GCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATA TCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACG AGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTA AGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATG CCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACC CTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGA ATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTAT GTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCC AAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGA TAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGA GAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACC TGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCA CCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGA GAAATATCCCTAGGAGACGCAGAAGAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGG GAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGA TCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAG GTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAA CCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATA TTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACC ACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCC AAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAG TCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAG AGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACC TGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGT TCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCAT CACCATCATCACTGATAAaagctt
SEQ ID №16: пептидная последовательность GP67ss-H1IR5cs-TEV-фолдон-10His (H1IR5cs)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKS YINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQEGR MNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTS LPFQNIHPITIGKCPKYVKSTKLRLATGLRNIPSIQSRRRRRGLFGAIAGFIEGGWTGMVDGWY GYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKV DDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCD NTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQ AYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №17: нуклеотидная последовательность GP67ss-H1IR5cs-TEV-фолдон-10His (H1IR5cs)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCG GCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATA TCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACG AGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTA AGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATG CCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACC CTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGA ATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTAT GTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCC AAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGA TAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGA GAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACC TGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCA CCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGA GAAATATCCCTAGCATCCAGAGCAGGAGACGCAGAAGAGGCCTGTTTGGAGCCATCGCC GGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAG AATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGA GATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGG GCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGAC GGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGA ACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCT GAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACA ACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGG CCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAG GGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGAC GGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACC ATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №18: пептидная последовательность GP67ss-H1TEV1-TEV-фолдон-10His (H1TEV1)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKS YINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQEGR MNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTS LPFQNIHPITIGKCPKYVKSTKLRLATGLRNIENLYFQGLFGAIAGFIEGGWTGMVDGWYGYH HQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDG FLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTC MESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYV RKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №19: нуклеотидная последовательность GP67ss-H1TEV1-TEV-фолдон-10His (H1TEV1)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCG GCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATA TCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACG AGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTA AGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATG CCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACC CTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGA ATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTAT GTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCC AAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGA TAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGA GAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACC TGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCA CCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGA GAAATATCGAAAACCTGTATTTTCAAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGG GAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGA TCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAG GTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAA CCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATA TTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACC ACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCC AAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAG TCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAG AGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACC TGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGT TCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCAT CACCATCATCACTGATAAaagctt
SEQ ID №20: пептидная последовательность GP67ss-H1TEV2-TEV-фолдон-10His (H1TEV2)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKS YINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQEGR MNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTS LPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPENLYFQGLFGAIAGFIEGGWTGMVDGWYGY HHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDD GFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTC MESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYV RKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №21: нуклеотидная последовательность GP67ss-H1TEV2-TEV-фолдон-10His (H1TEV2)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCG GCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATA TCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACG AGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTA AGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATG CCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACC CTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGA ATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTAT GTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCC AAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGA TAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGA GAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACC TGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCA CCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGA GAAATAGCCCTGAAAACCTGTATTTTCAAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGA GGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGG GATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACA AGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTC AACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGA TATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTA CCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATG CCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGG AGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAAT AGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAA CCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTAC GTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACC ATCACCATCATCACTGATAAaagctt
SEQ ID №22: пептидная последовательность GP67ss-H1TEV3-TEV-фолдон-10His (H1TEV3)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKS YINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQEGR MNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTS LPFQNIHPITIGKCPKYVKSTKLRLATGLRNIPSIENLYFQGLFGAIAGFIEGGWTGMVDGWYG YHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVD DGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNT CMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAY VRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №23: нуклеотидная последовательность GP67ss-H1TEV3-TEV-фолдон-10His (H1TEV3)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCG GCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATA TCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACG AGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTA AGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATG CCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACC CTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGA ATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTAT GTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCC AAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGA TAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGA GAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACC TGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCA CCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGA GAAATATCCCTAGCATCGAAAACCTGTATTTTCAAGGCCTGTTTGGAGCCATCGCCGGCTT TATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATG AGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATC ACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAA GGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCT TCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCC TGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAG AACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACC TGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAA GCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCG CTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTC AGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCA TCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №24: пептидная последовательность GP67ss-H1H5cs-CR8020Ca-TEV-фолдон-10His (H1H5cs-CR8020Ca)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKS YINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEGMIDYEGTGQAA GRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAIN TSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPQRERRKKRGLFGAIAGFIEGGWTGMVDG WYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNK KVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHK CDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDG QAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №25: пептидная последовательность эпитопа CR8020 из остатков 15-19 HA2
EGMID
SEQ ID №26: пептидная последовательность эпитопа CR8020 из остатков 30-36 HA2
EGTGQAA
SEQ ID №27: пептидная последовательность композитного эпитопа C8020
EGMIDYEGTGQAA
SEQ ID №28: нуклеотидная последовательность GP67ss-H1H5cs-CR8020Ca-TEV-фолдон-10His (H1H5cs-CR8020Ca)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCG GCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATA TCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACG AGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTA AGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATG CCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACC CTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGA ATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTAT GTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAGGCATGATTGATTAC GAAGGCACAGGCCAGGCAGCCGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGG CGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTAT GGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATAC CACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCT ATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGT CTGAGAAATAGCCCTCAGAGGGAGAGACGCAAGAAGAGAGGCCTGTTTGGAGCCATCGC CGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCA GAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACG AGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTG GGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGA CGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAG AACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGC TGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACA ACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGG CCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAG GGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGAC GGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACC ATCATCACCACCATCACCATCATCACTGATAAAaagctt
SEQ ID №29: пептидная последовательность GP67ss-H1TEV2-CR8020Ca-TEV-фолдон-10His (H1TEV2-CR8020Ca)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKS YINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEGMIDYEGTGQAA GRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAIN TSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPENLYFQGLFGAIAGFIEGGWTGMVDGWY GYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKV DDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCD NTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQ AYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №30: нуклеотидная последовательность GP67ss-H1TEV2-CR8020Ca-TEV-фолдон-10His (H1TEV2-CR8020Ca)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCcTCTGCAcCTGGGCAAATGTAATATTGCCGG CTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATAT CGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGA GGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTAA GACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATGC CGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACCC TAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAA TCCACCACCCTAGCaCaAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTATGT GTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAGGCATGATTGATTACGA AGGCACAGGCCAGGCAGCCGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCG ATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGG AGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCAC CTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATC ACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTG AGAAATAGCCCTGAAAACCTGTATTTTCAAGGCCTGTTTGGAGCCATCGCCGGCTTTATTG AGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAG GGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAAC AAGGtGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTC AACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGA TATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTA CCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATG CCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGG AGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAAT AGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAA CCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTAC GTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACC ATCACCATCATCACTGATAAaagctt
SEQ ID №31: пептидная последовательность GP67ss-H1TEV2-CR8020Sa3-TEV-фолдон-10His (H1TEV2-CR8020Sa3)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVEGMIDYEGTGQA AYPKLSKSYINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPK VRDQEGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQT PKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPENLYFQGLFGAIAGFIEGGWTGM VDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIE NLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEF YHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEA PRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №32: нуклеотидная последовательность GP67ss-H1TEV2-CR8020Sa3-TEV-фолдон-10His (H1TEV2-CR8020Sa3)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCG GCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATA TCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACG AGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTA AGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATG CCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGGAAGGCATGATTGATTACG AAGGCACAGGCCAGGCAGCCTACCCTAAGCTGTCTAAGAGCTACATCAACGACAAGGGC AAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCACAAGCGCCGATCAGCAGAG CCTGTACCAGAATGCCGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTT CAAGCCTGAAATTGCCATTAGACCCAAAGTGAGAGATCAGGAAGGCAGAATGAATTACT ACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGG TGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATAC CCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCT GCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCAC CAAGCTGAGACTGGCTACCGGTCTGAGAAATAGCCCTGAAAACCTGTATTTTCAAGGCCT GTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTA CGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACA GAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCC AGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAAC AAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTC CTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAA GGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCT ACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTA AGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGC ACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCG GAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCT ACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAAaagctt
SEQ ID №33: пептидная последовательность GP67ss-H1TEV2-CR8020Sa4-TEV-фолдон-10His (H1TEV2-CR8020Sa4)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPEGMIDYEGTGQAAWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKK GNSYPKLSKSYINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIR PKVRDQEGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTC QTPKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPENLYFQGLFGAIAGFIEGGWTG MVDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRI ENLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCF EFYHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPE APRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №34: нуклеотидная последовательность GP67ss-H1TEV2-CR8020Sa4-TEV-фолдон-10His (H1TEV2-CR8020Sa4)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCG GCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATA TCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACG AGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTG AAGGCATGATTGATTACGAAGGCACAGGCCAGGCAGCCTGGCCTAATCACGATTCTAATA AGGGAGTGACAGCCGCCTGTCCTCATGCCGGAGCCAAGTCCTTTTACAAGAACCTGATCT GGCTGGTGAAGAAGGGCAACAGCTACCCTAAGCTGTCTAAGAGCTACATCAACGACAAG GGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCACAAGCGCCGATCAGCA GAGCCTGTACCAGAATGCCGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAA GTTCAAGCCTGAAATTGCCATTAGACCCAAAGTGAGAGATCAGGAAGGCAGAATGAATT ACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGG TGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGA TACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAG CCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGC ACCAAGCTGAGACTGGCTACCGGTCTGAGAAATAGCCCTGAAAACCTGTATTTTCAAGGC CTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGG TACGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACA CAGAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACAC CCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGA ACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGC TCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAG AAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTT CTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCC TAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAA GCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCC CGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGT CTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №35: пептидная последовательность GP67ss-H1TEV2-I1C9Ca1-TEV-фолдон-10His (H1TEV2-I1C9Ca1)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKS YINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIGIFGAIAGFIEG GRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAIN TSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPENLYFQGLFGAIAGFIEGGWTGMVDGWY GYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKV DDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCD NTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQ AYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №36: пептидная последовательность I1C9
GIFGAIAGFIEG
SEQ ID №37: нуклеотидная последовательность GP67ss-H1TEV2-I1C9Ca1-TEV-фолдон-10His (H1TEV2-I1C9Ca1)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCT TTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAG TGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATG GCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCG GCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATA TCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACG AGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTA AGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATG CCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACC CTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGA ATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTAT GTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTGGCATT TTCGGCGCTATCGCCGGCTTCATTGAGGGAGGCAGAATGAATTACTACTGGACCCTGGTG GAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCA TTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACT GTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATA TTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGG CTACCGGTCTGAGAAATAGCCCTGAAAACCTGTATTTTCAAGGCCTGTTTGGAGCCATCG CCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACC AGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGAC GAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGT GGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACG ACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGA GAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAG CTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGAC AACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAG GCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCA GGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGA CGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCAC CATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №38: пептидная последовательность GP67ss-H1TEV2-I1C9Ca2-TEV-фолдон-10His (H1TEV2-I1C9Ca2)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKH NGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEEL REQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPGIFGAIAGFIEGFYKNLIWLVKKGNSYPK LSKSYINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQ EGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAI NTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPENLYFQGLFGAIAGFIEGGWTGMVDGW YGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKK VDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKC DNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDG QAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №39: нуклеотидная последовательность GP67ss-H1TEV2-I1C9Ca2-TEV-фолдон-10His (H1TEV2-I1C9Ca2)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCTTTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAGTGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATGGCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCGGCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATATCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGAGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTAAGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTGGCATTTTCGGCGCTATCGCCGGCTTCATTGAGGGATTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACCCTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCCAAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGAGAAATAGCCCTGAAAACCTGTATTTTCAAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №40: пептидная последовательность GP67ss-H1TEV2-I1C9Sa3-TEV-фолдон-10His (H1TEV2-I1C9Sa3)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKHNGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEELREQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVGIFGAIAGFIEGYPKLSKSYINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQEGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPENLYFQGLFGAIAGFIEGGWTGMVDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №41: нуклеотидная последовательность GP67ss-H1TEV2-I1C9Sa3-TEV-фолдон-10His (H1TEV2-I1C9Sa3)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCTTTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAGTGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATGGCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCGGCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATATCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGAGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTAAGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATGCCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGGGCATTTTCGGCGCTATCGCCGGCTTCATTGAGGGATACCCTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCCAAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGAGAAATAGCCCTGAAAACCTGTATTTTCAAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №42: пептидная последовательность GP67ss-H1TEV2-I1C9Sa4-TEV-фолдон-10His (H1TEV2-I1C9Sa4)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKHNGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEELREQLSSVSSFERFEIFPGIFGAIAGFIEGWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKSYINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQEGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPENLYFQGLFGAIAGFIEGGWTGMVDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №43: нуклеотидная последовательность GP67ss-H1TEV2-I1C9Sa4-TEV-фолдон-10His (H1TEV2-I1C9Sa4)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCTTTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAGTGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATGGCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCGGCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATATCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGAGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTGGCATTTTCGGCGCTATCGCCGGCTTCATTGAGGGATGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATGCCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACCCTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCCAAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGAGAAATAGCCCTGAAAACCTGTATTTTCAAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №44: пептидная последовательность GP67ss-H1H5cs-I1C9Sb-TEV-фолдон-10His (H1H5cs-I1C9Sb)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKHNGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEELREQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKSYINDKGKEVLVLWGIHHPSGIFGAIAGFIEGDAYVFVGSSRYSKKFKPEIAIRPKVRDQEGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPQRERRKKRGLFGAIAGFIEGGWTGMVDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №45: нуклеотидная последовательность GP67ss-H1H5cs-I1C9Sb-TEV-фолдон-10His (H1H5cs-I1C9Sb)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCTTTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAGTGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATGGCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCGGCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATATCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGAGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTAAGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATGCCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACCCTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCGGCATTTTCGGCGCTATCGCCGGCTTCATtGAGGGAGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCCAAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGAGAAATAGCCCTCAGAGGGAGAGACGCAAGAAGAGAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №46: пептидная последовательность GP67ss-H1H5cs-I1C9Ca-TEV-фолдон-10His (H1H5cs-I1C9Ca)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKHNGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEELREQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKSYINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPGIFGAIAGFIEGGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPQRERRKKRGLFGAIAGFIEGGWTGMVDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №47: нуклеотидная последовательность GP67ss-H1H5cs-I1C9Ca-TEV-фолдон-10His (H1H5cs-I1C9Ca)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCTTTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAGTGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATGGCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCGGCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATATCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGAGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTAAGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATGCCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACCCTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGGCATTTTCGGCGCTATCGCCGGCTTCATTGAGGGAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGAGAAATAGCCCTCAGAGGGAGAGACGCAAGAAGAGAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGcTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCtGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №48: пептидная последовательность GP67ss-H1H5cs-FI6Sab-TEV-фолдон-10His (H1H5cs-FI6Sab)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKHNGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEELREQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVRKKRGLFGAIAGFIEYINDKGKEVLVLWGIHHPSKESTQKAIDGVTNKVNSDAYVFVGSSRYSKKFKPEIAIRPKVRDQEGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPQRERRKKRGLFGAIAGFIEGGWTGMVDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №49: пептидная последовательность сайта расщепления при созревании из эпитопа FI6
RKKRGLFGAIAGFIE
SEQ ID №50: пептидная последовательность суперспирального пептида спирали эпитопа FI6
KESTQKAIDGVTNKVNS
SEQ ID №51: нуклеотидная последовательность GP67ss-H1H5cs-FI6Sab-TEV-фолдон-10His (H1H5cs-FI6Sab)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCTTTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAGTGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATGGCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCGGCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATATCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGAGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTAAGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATGCCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAGAAAGAAGAGAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCAAGGAGTCTACACAGAAGGCCATTGATGGCGTTACAAATAAGGTCAATtCTGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCCAAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGAGAAATAGCCCTCAGAGGGAGAGACGCAAGAAGAGAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №52: пептидная последовательность GP67ss-H1WT-FI6Sab-TEV-фолдон-10His (H1WT-FI6Sab)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKHNGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEELREQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVRKKRGLFGAIAGFIEYINDKGKEVLVLWGIHHPSKESTQKAIDGVTNKVNSDAYVFVGSSRYSKKFKPEIAIRPKVRDQEGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNIPSIQSRGLFGAIAGFIEGGWTGMVDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №53: нуклеотидная последовательность GP67ss-H1WT-FI6Sab-TEV-фолдон-10His (H1WT-FI6Sab)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCTTTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAGTGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATGGCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCGGCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATATCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGAGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTAAGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATGCCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAGAAAGAAGAGAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCAAGGAGTCTACACAGAAGGCCATTGATGGCGTTACAAATAAGGTCAATTCTGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCCAAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGAGAAATATCCCTAGCATCCAGAGCAGAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №54: пептидная последовательность GP67ss-H1TEV1-FI6Sa-TEV-фолдон-10His (H1TEV1-FI6Sa)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKHNGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEELREQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVRKKRGLFGAIAGFIEGYINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPEIAIRPKVRDQEGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNIENLYFQGLFGAIAGFIEGGWTGMVDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №55: нуклеотидная последовательность GP67ss-H1TEV1-FI6Sa-TEV-фолдон-10His (H1TEV1-FI6Sa)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCTTTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAGTGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATGGCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCGGCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATATCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGAGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTAAGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATGCCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAGAAAGAAGAGAGGCCTGTTCGGCGCTATCGCCGGCTTCATTGAGGGATACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCCAAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGAGAAATATCGAAAACCTGTATTTTCAAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №56: пептидная последовательность GP67ss-H1H5cs-M2eCa2-TEV-фолдон-10His (H1H5cs-M2eCa)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKHNGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEELREQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKSYINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPSLLTEVETPTRNGWECKCSDSGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPQRERRKKRGLFGAIAGFIEGGWTGMVDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №57: пептидная последовательность пептида M2e
SLLTEVETPTRNGWECKCSDS
SEQ ID №58: нуклеотидная последовательность GP67ss-H1H5cs-M2eCa2-TEV-фолдон-10His (H1H5cs-M2eCa)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCTTTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAGTGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATGGCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCGGCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATATCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGAGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTAAGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATGCCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACCCTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTTCCCTGCTGACCGAGGTGGAGACCCCCACCAGGAACGGCTGGGAGTGCAAGTGCTCCGACTCCGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGAGAAATAGCCCTCAGAGGGAGAGACGCAAGAAGAGAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №59: пептидная последовательность GP67ss-H1H5cs-M2eSb-TEV-фолдон-10His (H1H5cs-M2eSb)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKHNGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEELREQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKSYINDKGKEVLVLWGIHHPSSLLTEVETPTRNGWECKCSDSDAYVFVGSSRYSKKFKPEIAIRPKVRDQEGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPQRERRKKRGLFGAIAGFIEGGWTGMVDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №60: нуклеотидная последовательность GP67ss-H1H5cs-M2eSb-TEV-фолдон-10His (H1H5cs-M2eSb)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCTTTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAGTGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATGGCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCGGCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATATCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGAGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTAAGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATGCCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACCCTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCTCCCTGCTGACCGAGGTGGAGACCCCCACCAGGAACGGCTGGGAGTGCAAGTGCTCCGACTCCGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTGAAATTGCCATTAGACCCAAAGTGAGAGATCAGGAAGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGAGAAATAGCCCTCAGAGGGAGAGACGCAAGAAGAGAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAGGTGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
SEQ ID №61: пептидная последовательность GP67ss-H1TEV2-M2eCa2-TEV-фолдон-10His (H1TEV2-M2eCa)
MVSAIVLYVLLAAAAHSAFADTLCIGYHANNSTDTVDTVLEKNVTVTHSVNLLEDKHNGKLCKLRGVAPLHLGKCNIAGWILGNPECESLSTASSWSYIVETPSSDNGTCYPGDFIDYEELREQLSSVSSFERFEIFPKTSSWPNHDSNKGVTAACPHAGAKSFYKNLIWLVKKGNSYPKLSKSYINDKGKEVLVLWGIHHPSTSADQQSLYQNADAYVFVGSSRYSKKFKPSLLTEVETPTRNGWECKCSDSGRMNYYWTLVEPGDKITFEATGNLVVPRYAFAMERNAGSGIIISDTPVHDCNTTCQTPKGAINTSLPFQNIHPITIGKCPKYVKSTKLRLATGLRNSPENLYFQGLFGAIAGFIEGGWTGMVDGWYGYHHQNEQGSGYAADLKSTQNAIDEITNKVNSVIEKMNTQFTAVGKEFNHLEKRIENLNKKVDDGFLDIWTYNAELLVLLENERTLDYHDSNVKNLYEKVRSQLKNNAKEIGNGCFEFYHKCDNTCMESVKNGTYDYPKYSEEAKLNREEIDGVKLESTRIYQGAENLYFQGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHHHHHH
SEQ ID №62: нуклеотидная последовательность GP67ss-H1TEV2-M2eCa2-TEV-фолдон-10His (H1TEV2-M2eCa)
ccATGGTAAGCGCTATTGTTTTATATGTGCTTTTGGCGGCGGCGGCGCATTCTGCCTTTGCGGATACACTGTGTATTGGCTACCACGCCAACAATAGCACCGATACCGTGGATACAGTGCTGGAGAAGAATGTGACCGTGACCCACTCTGTGAATCTGCTGGAGGATAAGCACAATGGCAAGCTGTGTAAGCTGAGAGGAGTTGCCCCTCTGCACCTGGGCAAATGTAATATTGCCGGCTGGATTCTGGGAAATCCTGAATGTGAAAGCCTGTCTACAGCCAGCAGCTGGTCTTATATCGTGGAAACCCCTAGCAGCGACAATGGCACCTGTTACCCTGGCGACTTCATCGATTACGAGGAGCTGAGAGAACAGCTGTCTAGCGTGTCCAGCTTCGAGAGATTCGAGATCTTCCCTAAGACAAGCAGCTGGCCTAATCACGATTCTAATAAGGGAGTGACAGCCGCCTGTCCTCATGCCGGAGCCAAGTCCTTTTACAAGAACCTGATCTGGCTGGTGAAGAAGGGCAACAGCTACCCTAAGCTGTCTAAGAGCTACATCAACGACAAGGGCAAAGAAGTGCTGGTGCTGTGGGGAATCCACCACCCTAGCACAAGCGCCGATCAGCAGAGCCTGTACCAGAATGCCGATGCCTATGTGTTTGTGGGCAGCAGCAGATACAGCAAAAAGTTCAAGCCTTCCCTGCTGACCGAGGTGGAGACCCCCACCAGGAACGGCTGGGAGTGCAAGTGCTCCGACTCCGGCAGAATGAATTACTACTGGACCCTGGTGGAACCTGGCGATAAGATCACATTTGAGGCCACCGGAAATCTGGTGGTGCCTAGATATGCATTTGCTATGGAGAGAAATGCTGGCTCTGGCATCATTATCTCTGATACCCCTGTGCACGACTGTAATACCACCTGTCAGACACCTAAGGGCGCCATTAATACCAGCCTGCCCTTCCAGAATATTCACCCTATCACCATCGGCAAGTGTCCTAAGTATGTGAAGAGCACCAAGCTGAGACTGGCTACCGGTCTGAGAAATAGCCCTGAAAACCTGTATTTTCAAGGCCTGTTTGGAGCCATCGCCGGCTTTATTGAGGGAGGATGGACCGGAATGGTGGATGGCTGGTACGGCTATCACCACCAGAATGAGCAGGGATCCGGATATGCCGCCGATCTGAAGTCTACACAGAACGCCATCGACGAGATCACAAACAAGGtGAACAGCGTGATCGAGAAGATGAACACCCAGTTTACAGCTGTGGGCAAGGAGTTCAACCACCTGGAGAAGAGAATCGAGAACCTGAACAAGAAAGTGGACGACGGCTTCCTGGATATTTGGACCTACAATGCCGAGCTGCTCGTGCTCCTGGAGAATGAGAGAACCCTGGACTACCACGACAGCAATGTGAAGAACCTGTACGAGAAGGTGAGAAGCCAGCTGAAGAACAATGCCAAGGAGATCGGCAACGGCTGCTTTGAGTTCTACCACAAGTGTGACAACACCTGTATGGAGTCTGTGAAGAACGGCACCTACGACTACCCTAAGTATAGCGAGGAGGCCAAGCTGAATAGAGAGGAGATCGACGGCGTGAAACTGGAAAGCACAAGAATCTATCAGGGCGCTGAAAACCTGTATTTTCAGGGCGGTTCTGGTTACATCCCGGAAGCTCCGCGTGACGGTCAGGCTTACGTTCGTAAAGACGGTGAATGGGTTCTGCTGTCTACCTTCCTGGGTCACCATCATCACCACCATCACCATCATCACTGATAAaagctt
--->
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> CG Discovery, Inc.
LUO, Chun
<120> КОМПОЗИЦИИ ГЕМАГГЛЮТИНИНА ГРИППА С ГЕТЕРОЛОГИЧНЫМИ ЭПИТОПАМИ И/ИЛИ
ИЗМЕНЕННЫМИ САЙТАМИ РАСЩЕПЛЕНИЯ ПРИ СОЗРЕВАНИИ
<130> 758252000140
<140> Не присвоено
<141> Одновременно с этим
<150> US 62/290,894
<151> 2016-02-03
<160> 62
<170> FastSEQ для Windows версии 4.0
<210> 1
<211> 566
<212> Белок
<213> Вирус гриппа A
<400> 1
Met Lys Ala Ile Leu Val Val Leu Leu Tyr Thr Phe Ala Thr Ala Asn
1 5 10 15
Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu Arg Gly Val
50 55 60
Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp Ile Leu Gly
65 70 75 80
Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp Ser Tyr Ile
85 90 95
Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro Gly Asp Phe
100 105 110
Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro Asn His Asp
130 135 140
Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly Ala Lys Ser
145 150 155 160
Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn Ser Tyr Pro
165 170 175
Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu Val Leu Val
180 185 190
Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln Gln Ser Leu
195 200 205
Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser Arg Tyr Ser
210 215 220
Lys Lys Phe Lys Pro Glu Ile Ala Ile Arg Pro Lys Val Arg Asp Gln
225 230 235 240
Glu Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu Pro Gly Asp Lys
245 250 255
Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro Arg Tyr Ala Phe
260 265 270
Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile Ser Asp Thr Pro
275 280 285
Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys Gly Ala Ile Asn
290 295 300
Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr Ile Gly Lys Cys
305 310 315 320
Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala Thr Gly Leu Arg
325 330 335
Asn Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly
340 345 350
Phe Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr
355 360 365
His His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser
370 375 380
Thr Gln Asn Ala Ile Asp Glu Ile Thr Asn Lys Val Asn Ser Val Ile
385 390 395 400
Glu Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn His
405 410 415
Leu Glu Lys Arg Ile Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe
420 425 430
Leu Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn
435 440 445
Glu Arg Thr Leu Asp Tyr His Asp Ser Asn Val Lys Asn Leu Tyr Glu
450 455 460
Lys Val Arg Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly
465 470 475 480
Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Thr Cys Met Glu Ser Val
485 490 495
Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu
500 505 510
Asn Arg Glu Glu Ile Asp Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr
515 520 525
Gln Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Val
530 535 540
Val Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu
545 550 555 560
Gln Cys Arg Ile Cys Ile
565
<210> 2
<211> 20
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 2
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala
20
<210> 3
<211> 49
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 3
Gly Ala Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly Tyr Ile Pro Glu
1 5 10 15
Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val
20 25 30
Leu Leu Ser Thr Phe Leu Gly His His His His His His His His His
35 40 45
His
<210> 4
<211> 7
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 4
Glu Asn Leu Tyr Phe Gln Gly
1 5
<210> 5
<211> 29
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 5
Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val
1 5 10 15
Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
20 25
<210> 6
<211> 10
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 6
His His His His His His His His His His
1 5 10
<210> 7
<211> 17
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 7
Met Lys Ala Ile Leu Val Val Leu Leu Tyr Thr Phe Ala Thr Ala Asn
1 5 10 15
Ala
<210> 8
<211> 7
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 8
Ile Pro Ser Ile Gln Ser Arg
1 5
<210> 9
<211> 581
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 9
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile Arg Pro Lys Val
225 230 235 240
Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu Pro
245 250 255
Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro Arg
260 265 270
Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile Ser
275 280 285
Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys Gly
290 295 300
Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr Ile
305 310 315 320
Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala Thr
325 330 335
Gly Leu Arg Asn Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala
340 345 350
Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp
355 360 365
Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp
370 375 380
Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr Asn Lys Val Asn
385 390 395 400
Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu
405 410 415
Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn Lys Lys Val Asp
420 425 430
Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu
435 440 445
Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser Asn Val Lys Asn
450 455 460
Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile
465 470 475 480
Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Thr Cys Met
485 490 495
Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu
500 505 510
Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys Leu Glu Ser Thr
515 520 525
Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly
530 535 540
Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp
545 550 555 560
Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His His His His His
565 570 575
His His His His His
580
<210> 10
<211> 1757
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 10
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctga aattgccatt agacccaaag 720
tgagagatca ggaaggcaga atgaattact actggaccct ggtggaacct ggcgataaga 780
tcacatttga ggccaccgga aatctggtgg tgcctagata tgcatttgct atggagagaa 840
atgctggctc tggcatcatt atctctgata cccctgtgca cgactgtaat accacctgtc 900
agacacctaa gggcgccatt aataccagcc tgcccttcca gaatattcac cctatcacca 960
tcggcaagtg tcctaagtat gtgaagagca ccaagctgag actggctacc ggtctgagaa 1020
atatccctag catccagagc agaggcctgt ttggagccat cgccggcttt attgagggag 1080
gatggaccgg aatggtggat ggctggtacg gctatcacca ccagaatgag cagggatccg 1140
gatatgccgc cgatctgaag tctacacaga acgccatcga cgagatcaca aacaaggtga 1200
acagcgtgat cgagaagatg aacacccagt ttacagctgt gggcaaggag ttcaaccacc 1260
tggagaagag aatcgagaac ctgaacaaga aagtggacga cggcttcctg gatatttgga 1320
cctacaatgc cgagctgctc gtgctcctgg agaatgagag aaccctggac taccacgaca 1380
gcaatgtgaa gaacctgtac gagaaggtga gaagccagct gaagaacaat gccaaggaga 1440
tcggcaacgg ctgctttgag ttctaccaca agtgtgacaa cacctgtatg gagtctgtga 1500
agaacggcac ctacgactac cctaagtata gcgaggaggc caagctgaat agagaggaga 1560
tcgacggcgt gaaactggaa agcacaagaa tctatcaggg cgctgaaaac ctgtattttc 1620
agggcggttc tggttacatc ccggaagctc cgcgtgacgg tcaggcttac gttcgtaaag 1680
acggtgaatg ggttctgctg tctaccttcc tgggtcacca tcatcaccac catcaccatc 1740
atcactgata aaagctt 1757
<210> 11
<211> 584
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 11
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile Arg Pro Lys Val
225 230 235 240
Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu Pro
245 250 255
Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro Arg
260 265 270
Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile Ser
275 280 285
Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys Gly
290 295 300
Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr Ile
305 310 315 320
Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala Thr
325 330 335
Gly Leu Arg Asn Ser Pro Gln Arg Glu Arg Arg Lys Lys Arg Gly Leu
340 345 350
Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met Val
355 360 365
Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly Tyr
370 375 380
Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr Asn
385 390 395 400
Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala Val
405 410 415
Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn Lys
420 425 430
Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu Leu
435 440 445
Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser Asn
450 455 460
Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn Ala
465 470 475 480
Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn
485 490 495
Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr
500 505 510
Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys Leu
515 520 525
Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln Gly
530 535 540
Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val
545 550 555 560
Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His His
565 570 575
His His His His His His His His
580
<210> 12
<211> 8
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 12
Gln Arg Glu Arg Arg Lys Lys Arg
1 5
<210> 13
<211> 1766
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 13
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctga aattgccatt agacccaaag 720
tgagagatca ggaaggcaga atgaattact actggaccct ggtggaacct ggcgataaga 780
tcacatttga ggccaccgga aatctggtgg tgcctagata tgcatttgct atggagagaa 840
atgctggctc tggcatcatt atctctgata cccctgtgca cgactgtaat accacctgtc 900
agacacctaa gggcgccatt aataccagcc tgcccttcca gaatattcac cctatcacca 960
tcggcaagtg tcctaagtat gtgaagagca ccaagctgag actggctacc ggtctgagaa 1020
atagccctca gagggagaga cgcaagaaga gaggcctgtt tggagccatc gccggcttta 1080
ttgagggagg atggaccgga atggtggatg gctggtacgg ctatcaccac cagaatgagc 1140
agggatccgg atatgccgcc gatctgaagt ctacacagaa cgccatcgac gagatcacaa 1200
acaaggtgaa cagcgtgatc gagaagatga acacccagtt tacagctgtg ggcaaggagt 1260
tcaaccacct ggagaagaga atcgagaacc tgaacaagaa agtggacgac ggcttcctgg 1320
atatttggac ctacaatgcc gagctgctcg tgctcctgga gaatgagaga accctggact 1380
accacgacag caatgtgaag aacctgtacg agaaggtgag aagccagctg aagaacaatg 1440
ccaaggagat cggcaacggc tgctttgagt tctaccacaa gtgtgacaac acctgtatgg 1500
agtctgtgaa gaacggcacc tacgactacc ctaagtatag cgaggaggcc aagctgaata 1560
gagaggagat cgacggcgtg aaactggaaa gcacaagaat ctatcagggc gctgaaaacc 1620
tgtattttca gggcggttct ggttacatcc cggaagctcc gcgtgacggt caggcttacg 1680
ttcgtaaaga cggtgaatgg gttctgctgt ctaccttcct gggtcaccat catcaccacc 1740
atcaccatca tcactgataa aagctt 1766
<210> 14
<211> 581
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 14
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile Arg Pro Lys Val
225 230 235 240
Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu Pro
245 250 255
Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro Arg
260 265 270
Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile Ser
275 280 285
Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys Gly
290 295 300
Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr Ile
305 310 315 320
Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala Thr
325 330 335
Gly Leu Arg Asn Ile Pro Arg Arg Arg Arg Arg Gly Leu Phe Gly Ala
340 345 350
Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp
355 360 365
Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp
370 375 380
Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr Asn Lys Val Asn
385 390 395 400
Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu
405 410 415
Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn Lys Lys Val Asp
420 425 430
Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu
435 440 445
Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser Asn Val Lys Asn
450 455 460
Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile
465 470 475 480
Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Thr Cys Met
485 490 495
Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu
500 505 510
Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys Leu Glu Ser Thr
515 520 525
Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly
530 535 540
Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp
545 550 555 560
Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His His His His His
565 570 575
His His His His His
580
<210> 15
<211> 1757
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 15
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctga aattgccatt agacccaaag 720
tgagagatca ggaaggcaga atgaattact actggaccct ggtggaacct ggcgataaga 780
tcacatttga ggccaccgga aatctggtgg tgcctagata tgcatttgct atggagagaa 840
atgctggctc tggcatcatt atctctgata cccctgtgca cgactgtaat accacctgtc 900
agacacctaa gggcgccatt aataccagcc tgcccttcca gaatattcac cctatcacca 960
tcggcaagtg tcctaagtat gtgaagagca ccaagctgag actggctacc ggtctgagaa 1020
atatccctag gagacgcaga agaggcctgt ttggagccat cgccggcttt attgagggag 1080
gatggaccgg aatggtggat ggctggtacg gctatcacca ccagaatgag cagggatccg 1140
gatatgccgc cgatctgaag tctacacaga acgccatcga cgagatcaca aacaaggtga 1200
acagcgtgat cgagaagatg aacacccagt ttacagctgt gggcaaggag ttcaaccacc 1260
tggagaagag aatcgagaac ctgaacaaga aagtggacga cggcttcctg gatatttgga 1320
cctacaatgc cgagctgctc gtgctcctgg agaatgagag aaccctggac taccacgaca 1380
gcaatgtgaa gaacctgtac gagaaggtga gaagccagct gaagaacaat gccaaggaga 1440
tcggcaacgg ctgctttgag ttctaccaca agtgtgacaa cacctgtatg gagtctgtga 1500
agaacggcac ctacgactac cctaagtata gcgaggaggc caagctgaat agagaggaga 1560
tcgacggcgt gaaactggaa agcacaagaa tctatcaggg cgctgaaaac ctgtattttc 1620
agggcggttc tggttacatc ccggaagctc cgcgtgacgg tcaggcttac gttcgtaaag 1680
acggtgaatg ggttctgctg tctaccttcc tgggtcacca tcatcaccac catcaccatc 1740
atcactgata aaagctt 1757
<210> 16
<211> 585
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 16
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile Arg Pro Lys Val
225 230 235 240
Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu Pro
245 250 255
Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro Arg
260 265 270
Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile Ser
275 280 285
Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys Gly
290 295 300
Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr Ile
305 310 315 320
Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala Thr
325 330 335
Gly Leu Arg Asn Ile Pro Ser Ile Gln Ser Arg Arg Arg Arg Arg Gly
340 345 350
Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met
355 360 365
Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly
370 375 380
Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr
385 390 395 400
Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala
405 410 415
Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn
420 425 430
Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu
435 440 445
Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser
450 455 460
Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn
465 470 475 480
Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp
485 490 495
Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys
500 505 510
Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys
515 520 525
Leu Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln
530 535 540
Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
545 550 555 560
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His
565 570 575
His His His His His His His His His
580 585
<210> 17
<211> 1769
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 17
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctga aattgccatt agacccaaag 720
tgagagatca ggaaggcaga atgaattact actggaccct ggtggaacct ggcgataaga 780
tcacatttga ggccaccgga aatctggtgg tgcctagata tgcatttgct atggagagaa 840
atgctggctc tggcatcatt atctctgata cccctgtgca cgactgtaat accacctgtc 900
agacacctaa gggcgccatt aataccagcc tgcccttcca gaatattcac cctatcacca 960
tcggcaagtg tcctaagtat gtgaagagca ccaagctgag actggctacc ggtctgagaa 1020
atatccctag catccagagc aggagacgca gaagaggcct gtttggagcc atcgccggct 1080
ttattgaggg aggatggacc ggaatggtgg atggctggta cggctatcac caccagaatg 1140
agcagggatc cggatatgcc gccgatctga agtctacaca gaacgccatc gacgagatca 1200
caaacaaggt gaacagcgtg atcgagaaga tgaacaccca gtttacagct gtgggcaagg 1260
agttcaacca cctggagaag agaatcgaga acctgaacaa gaaagtggac gacggcttcc 1320
tggatatttg gacctacaat gccgagctgc tcgtgctcct ggagaatgag agaaccctgg 1380
actaccacga cagcaatgtg aagaacctgt acgagaaggt gagaagccag ctgaagaaca 1440
atgccaagga gatcggcaac ggctgctttg agttctacca caagtgtgac aacacctgta 1500
tggagtctgt gaagaacggc acctacgact accctaagta tagcgaggag gccaagctga 1560
atagagagga gatcgacggc gtgaaactgg aaagcacaag aatctatcag ggcgctgaaa 1620
acctgtattt tcagggcggt tctggttaca tcccggaagc tccgcgtgac ggtcaggctt 1680
acgttcgtaa agacggtgaa tgggttctgc tgtctacctt cctgggtcac catcatcacc 1740
accatcacca tcatcactga taaaagctt 1769
<210> 18
<211> 581
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 18
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile Arg Pro Lys Val
225 230 235 240
Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu Pro
245 250 255
Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro Arg
260 265 270
Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile Ser
275 280 285
Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys Gly
290 295 300
Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr Ile
305 310 315 320
Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala Thr
325 330 335
Gly Leu Arg Asn Ile Glu Asn Leu Tyr Phe Gln Gly Leu Phe Gly Ala
340 345 350
Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp
355 360 365
Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp
370 375 380
Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr Asn Lys Val Asn
385 390 395 400
Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu
405 410 415
Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn Lys Lys Val Asp
420 425 430
Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu
435 440 445
Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser Asn Val Lys Asn
450 455 460
Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile
465 470 475 480
Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Thr Cys Met
485 490 495
Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu
500 505 510
Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys Leu Glu Ser Thr
515 520 525
Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly
530 535 540
Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp
545 550 555 560
Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His His His His His
565 570 575
His His His His His
580
<210> 19
<211> 1757
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 19
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctga aattgccatt agacccaaag 720
tgagagatca ggaaggcaga atgaattact actggaccct ggtggaacct ggcgataaga 780
tcacatttga ggccaccgga aatctggtgg tgcctagata tgcatttgct atggagagaa 840
atgctggctc tggcatcatt atctctgata cccctgtgca cgactgtaat accacctgtc 900
agacacctaa gggcgccatt aataccagcc tgcccttcca gaatattcac cctatcacca 960
tcggcaagtg tcctaagtat gtgaagagca ccaagctgag actggctacc ggtctgagaa 1020
atatcgaaaa cctgtatttt caaggcctgt ttggagccat cgccggcttt attgagggag 1080
gatggaccgg aatggtggat ggctggtacg gctatcacca ccagaatgag cagggatccg 1140
gatatgccgc cgatctgaag tctacacaga acgccatcga cgagatcaca aacaaggtga 1200
acagcgtgat cgagaagatg aacacccagt ttacagctgt gggcaaggag ttcaaccacc 1260
tggagaagag aatcgagaac ctgaacaaga aagtggacga cggcttcctg gatatttgga 1320
cctacaatgc cgagctgctc gtgctcctgg agaatgagag aaccctggac taccacgaca 1380
gcaatgtgaa gaacctgtac gagaaggtga gaagccagct gaagaacaat gccaaggaga 1440
tcggcaacgg ctgctttgag ttctaccaca agtgtgacaa cacctgtatg gagtctgtga 1500
agaacggcac ctacgactac cctaagtata gcgaggaggc caagctgaat agagaggaga 1560
tcgacggcgt gaaactggaa agcacaagaa tctatcaggg cgctgaaaac ctgtattttc 1620
agggcggttc tggttacatc ccggaagctc cgcgtgacgg tcaggcttac gttcgtaaag 1680
acggtgaatg ggttctgctg tctaccttcc tgggtcacca tcatcaccac catcaccatc 1740
atcactgata aaagctt 1757
<210> 20
<211> 582
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 20
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile Arg Pro Lys Val
225 230 235 240
Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu Pro
245 250 255
Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro Arg
260 265 270
Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile Ser
275 280 285
Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys Gly
290 295 300
Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr Ile
305 310 315 320
Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala Thr
325 330 335
Gly Leu Arg Asn Ser Pro Glu Asn Leu Tyr Phe Gln Gly Leu Phe Gly
340 345 350
Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly
355 360 365
Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala
370 375 380
Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr Asn Lys Val
385 390 395 400
Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys
405 410 415
Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn Lys Lys Val
420 425 430
Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val
435 440 445
Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser Asn Val Lys
450 455 460
Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn Ala Lys Glu
465 470 475 480
Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Thr Cys
485 490 495
Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu
500 505 510
Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys Leu Glu Ser
515 520 525
Thr Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln Gly Gly Ser
530 535 540
Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys
545 550 555 560
Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His His His His
565 570 575
His His His His His His
580
<210> 21
<211> 1760
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 21
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctga aattgccatt agacccaaag 720
tgagagatca ggaaggcaga atgaattact actggaccct ggtggaacct ggcgataaga 780
tcacatttga ggccaccgga aatctggtgg tgcctagata tgcatttgct atggagagaa 840
atgctggctc tggcatcatt atctctgata cccctgtgca cgactgtaat accacctgtc 900
agacacctaa gggcgccatt aataccagcc tgcccttcca gaatattcac cctatcacca 960
tcggcaagtg tcctaagtat gtgaagagca ccaagctgag actggctacc ggtctgagaa 1020
atagccctga aaacctgtat tttcaaggcc tgtttggagc catcgccggc tttattgagg 1080
gaggatggac cggaatggtg gatggctggt acggctatca ccaccagaat gagcagggat 1140
ccggatatgc cgccgatctg aagtctacac agaacgccat cgacgagatc acaaacaagg 1200
tgaacagcgt gatcgagaag atgaacaccc agtttacagc tgtgggcaag gagttcaacc 1260
acctggagaa gagaatcgag aacctgaaca agaaagtgga cgacggcttc ctggatattt 1320
ggacctacaa tgccgagctg ctcgtgctcc tggagaatga gagaaccctg gactaccacg 1380
acagcaatgt gaagaacctg tacgagaagg tgagaagcca gctgaagaac aatgccaagg 1440
agatcggcaa cggctgcttt gagttctacc acaagtgtga caacacctgt atggagtctg 1500
tgaagaacgg cacctacgac taccctaagt atagcgagga ggccaagctg aatagagagg 1560
agatcgacgg cgtgaaactg gaaagcacaa gaatctatca gggcgctgaa aacctgtatt 1620
ttcagggcgg ttctggttac atcccggaag ctccgcgtga cggtcaggct tacgttcgta 1680
aagacggtga atgggttctg ctgtctacct tcctgggtca ccatcatcac caccatcacc 1740
atcatcactg ataaaagctt 1760
<210> 22
<211> 584
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 22
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile Arg Pro Lys Val
225 230 235 240
Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu Pro
245 250 255
Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro Arg
260 265 270
Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile Ser
275 280 285
Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys Gly
290 295 300
Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr Ile
305 310 315 320
Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala Thr
325 330 335
Gly Leu Arg Asn Ile Pro Ser Ile Glu Asn Leu Tyr Phe Gln Gly Leu
340 345 350
Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met Val
355 360 365
Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly Tyr
370 375 380
Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr Asn
385 390 395 400
Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala Val
405 410 415
Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn Lys
420 425 430
Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu Leu
435 440 445
Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser Asn
450 455 460
Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn Ala
465 470 475 480
Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn
485 490 495
Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr
500 505 510
Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys Leu
515 520 525
Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln Gly
530 535 540
Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val
545 550 555 560
Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His His
565 570 575
His His His His His His His His
580
<210> 23
<211> 1766
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 23
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctga aattgccatt agacccaaag 720
tgagagatca ggaaggcaga atgaattact actggaccct ggtggaacct ggcgataaga 780
tcacatttga ggccaccgga aatctggtgg tgcctagata tgcatttgct atggagagaa 840
atgctggctc tggcatcatt atctctgata cccctgtgca cgactgtaat accacctgtc 900
agacacctaa gggcgccatt aataccagcc tgcccttcca gaatattcac cctatcacca 960
tcggcaagtg tcctaagtat gtgaagagca ccaagctgag actggctacc ggtctgagaa 1020
atatccctag catcgaaaac ctgtattttc aaggcctgtt tggagccatc gccggcttta 1080
ttgagggagg atggaccgga atggtggatg gctggtacgg ctatcaccac cagaatgagc 1140
agggatccgg atatgccgcc gatctgaagt ctacacagaa cgccatcgac gagatcacaa 1200
acaaggtgaa cagcgtgatc gagaagatga acacccagtt tacagctgtg ggcaaggagt 1260
tcaaccacct ggagaagaga atcgagaacc tgaacaagaa agtggacgac ggcttcctgg 1320
atatttggac ctacaatgcc gagctgctcg tgctcctgga gaatgagaga accctggact 1380
accacgacag caatgtgaag aacctgtacg agaaggtgag aagccagctg aagaacaatg 1440
ccaaggagat cggcaacggc tgctttgagt tctaccacaa gtgtgacaac acctgtatgg 1500
agtctgtgaa gaacggcacc tacgactacc ctaagtatag cgaggaggcc aagctgaata 1560
gagaggagat cgacggcgtg aaactggaaa gcacaagaat ctatcagggc gctgaaaacc 1620
tgtattttca gggcggttct ggttacatcc cggaagctcc gcgtgacggt caggcttacg 1680
ttcgtaaaga cggtgaatgg gttctgctgt ctaccttcct gggtcaccat catcaccacc 1740
atcaccatca tcactgataa aagctt 1766
<210> 24
<211> 585
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 24
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Glu Gly Met Ile Asp Tyr Glu Gly
225 230 235 240
Thr Gly Gln Ala Ala Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu
245 250 255
Pro Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro
260 265 270
Arg Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile
275 280 285
Ser Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys
290 295 300
Gly Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr
305 310 315 320
Ile Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala
325 330 335
Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Arg Arg Lys Lys Arg Gly
340 345 350
Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met
355 360 365
Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly
370 375 380
Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr
385 390 395 400
Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala
405 410 415
Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn
420 425 430
Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu
435 440 445
Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser
450 455 460
Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn
465 470 475 480
Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp
485 490 495
Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys
500 505 510
Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys
515 520 525
Leu Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln
530 535 540
Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
545 550 555 560
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His
565 570 575
His His His His His His His His His
580 585
<210> 25
<211> 5
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 25
Glu Gly Met Ile Asp
1 5
<210> 26
<211> 7
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 26
Glu Gly Thr Gly Gln Ala Ala
1 5
<210> 27
<211> 13
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 27
Glu Gly Met Ile Asp Tyr Glu Gly Thr Gly Gln Ala Ala
1 5 10
<210> 28
<211> 1770
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 28
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctga aggcatgatt gattacgaag 720
gcacaggcca ggcagccggc agaatgaatt actactggac cctggtggaa cctggcgata 780
agatcacatt tgaggccacc ggaaatctgg tggtgcctag atatgcattt gctatggaga 840
gaaatgctgg ctctggcatc attatctctg atacccctgt gcacgactgt aataccacct 900
gtcagacacc taagggcgcc attaatacca gcctgccctt ccagaatatt caccctatca 960
ccatcggcaa gtgtcctaag tatgtgaaga gcaccaagct gagactggct accggtctga 1020
gaaatagccc tcagagggag agacgcaaga agagaggcct gtttggagcc atcgccggct 1080
ttattgaggg aggatggacc ggaatggtgg atggctggta cggctatcac caccagaatg 1140
agcagggatc cggatatgcc gccgatctga agtctacaca gaacgccatc gacgagatca 1200
caaacaaggt gaacagcgtg atcgagaaga tgaacaccca gtttacagct gtgggcaagg 1260
agttcaacca cctggagaag agaatcgaga acctgaacaa gaaagtggac gacggcttcc 1320
tggatatttg gacctacaat gccgagctgc tcgtgctcct ggagaatgag agaaccctgg 1380
actaccacga cagcaatgtg aagaacctgt acgagaaggt gagaagccag ctgaagaaca 1440
atgccaagga gatcggcaac ggctgctttg agttctacca caagtgtgac aacacctgta 1500
tggagtctgt gaagaacggc acctacgact accctaagta tagcgaggag gccaagctga 1560
atagagagga gatcgacggc gtgaaactgg aaagcacaag aatctatcag ggcgctgaaa 1620
acctgtattt tcagggcggt tctggttaca tcccggaagc tccgcgtgac ggtcaggctt 1680
acgttcgtaa agacggtgaa tgggttctgc tgtctacctt cctgggtcac catcatcacc 1740
accatcacca tcatcactga taaaaagctt 1770
<210> 29
<211> 583
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 29
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Glu Gly Met Ile Asp Tyr Glu Gly
225 230 235 240
Thr Gly Gln Ala Ala Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu
245 250 255
Pro Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro
260 265 270
Arg Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile
275 280 285
Ser Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys
290 295 300
Gly Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr
305 310 315 320
Ile Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala
325 330 335
Thr Gly Leu Arg Asn Ser Pro Glu Asn Leu Tyr Phe Gln Gly Leu Phe
340 345 350
Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met Val Asp
355 360 365
Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly Tyr Ala
370 375 380
Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr Asn Lys
385 390 395 400
Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala Val Gly
405 410 415
Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn Lys Lys
420 425 430
Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu
435 440 445
Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser Asn Val
450 455 460
Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn Ala Lys
465 470 475 480
Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Thr
485 490 495
Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser
500 505 510
Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys Leu Glu
515 520 525
Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln Gly Gly
530 535 540
Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg
545 550 555 560
Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His His His
565 570 575
His His His His His His His
580
<210> 30
<211> 1763
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 30
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctga aggcatgatt gattacgaag 720
gcacaggcca ggcagccggc agaatgaatt actactggac cctggtggaa cctggcgata 780
agatcacatt tgaggccacc ggaaatctgg tggtgcctag atatgcattt gctatggaga 840
gaaatgctgg ctctggcatc attatctctg atacccctgt gcacgactgt aataccacct 900
gtcagacacc taagggcgcc attaatacca gcctgccctt ccagaatatt caccctatca 960
ccatcggcaa gtgtcctaag tatgtgaaga gcaccaagct gagactggct accggtctga 1020
gaaatagccc tgaaaacctg tattttcaag gcctgtttgg agccatcgcc ggctttattg 1080
agggaggatg gaccggaatg gtggatggct ggtacggcta tcaccaccag aatgagcagg 1140
gatccggata tgccgccgat ctgaagtcta cacagaacgc catcgacgag atcacaaaca 1200
aggtgaacag cgtgatcgag aagatgaaca cccagtttac agctgtgggc aaggagttca 1260
accacctgga gaagagaatc gagaacctga acaagaaagt ggacgacggc ttcctggata 1320
tttggaccta caatgccgag ctgctcgtgc tcctggagaa tgagagaacc ctggactacc 1380
acgacagcaa tgtgaagaac ctgtacgaga aggtgagaag ccagctgaag aacaatgcca 1440
aggagatcgg caacggctgc tttgagttct accacaagtg tgacaacacc tgtatggagt 1500
ctgtgaagaa cggcacctac gactacccta agtatagcga ggaggccaag ctgaatagag 1560
aggagatcga cggcgtgaaa ctggaaagca caagaatcta tcagggcgct gaaaacctgt 1620
attttcaggg cggttctggt tacatcccgg aagctccgcg tgacggtcag gcttacgttc 1680
gtaaagacgg tgaatgggtt ctgctgtcta ccttcctggg tcaccatcat caccaccatc 1740
accatcatca ctgataaaag ctt 1763
<210> 31
<211> 590
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 31
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Glu Gly Met Ile
165 170 175
Asp Tyr Glu Gly Thr Gly Gln Ala Ala Tyr Pro Lys Leu Ser Lys Ser
180 185 190
Tyr Ile Asn Asp Lys Gly Lys Glu Val Leu Val Leu Trp Gly Ile His
195 200 205
His Pro Ser Thr Ser Ala Asp Gln Gln Ser Leu Tyr Gln Asn Ala Asp
210 215 220
Ala Tyr Val Phe Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys Pro
225 230 235 240
Glu Ile Ala Ile Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met Asn
245 250 255
Tyr Tyr Trp Thr Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu Ala
260 265 270
Thr Gly Asn Leu Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn
275 280 285
Ala Gly Ser Gly Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys Asn
290 295 300
Thr Thr Cys Gln Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro Phe
305 310 315 320
Gln Asn Ile His Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val Lys
325 330 335
Ser Thr Lys Leu Arg Leu Ala Thr Gly Leu Arg Asn Ser Pro Glu Asn
340 345 350
Leu Tyr Phe Gln Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly
355 360 365
Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn
370 375 380
Glu Gln Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala
385 390 395 400
Ile Asp Glu Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn
405 410 415
Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg
420 425 430
Ile Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp
435 440 445
Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu
450 455 460
Asp Tyr His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser
465 470 475 480
Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe
485 490 495
Tyr His Lys Cys Asp Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr
500 505 510
Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu
515 520 525
Ile Asp Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu
530 535 540
Asn Leu Tyr Phe Gln Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg
545 550 555 560
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser
565 570 575
Thr Phe Leu Gly His His His His His His His His His His
580 585 590
<210> 32
<211> 1785
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 32
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgga aggcatgatt gattacgaag 540
gcacaggcca ggcagcctac cctaagctgt ctaagagcta catcaacgac aagggcaaag 600
aagtgctggt gctgtgggga atccaccacc ctagcacaag cgccgatcag cagagcctgt 660
accagaatgc cgatgcctat gtgtttgtgg gcagcagcag atacagcaaa aagttcaagc 720
ctgaaattgc cattagaccc aaagtgagag atcaggaagg cagaatgaat tactactgga 780
ccctggtgga acctggcgat aagatcacat ttgaggccac cggaaatctg gtggtgccta 840
gatatgcatt tgctatggag agaaatgctg gctctggcat cattatctct gatacccctg 900
tgcacgactg taataccacc tgtcagacac ctaagggcgc cattaatacc agcctgccct 960
tccagaatat tcaccctatc accatcggca agtgtcctaa gtatgtgaag agcaccaagc 1020
tgagactggc taccggtctg agaaatagcc ctgaaaacct gtattttcaa ggcctgtttg 1080
gagccatcgc cggctttatt gagggaggat ggaccggaat ggtggatggc tggtacggct 1140
atcaccacca gaatgagcag ggatccggat atgccgccga tctgaagtct acacagaacg 1200
ccatcgacga gatcacaaac aaggtgaaca gcgtgatcga gaagatgaac acccagttta 1260
cagctgtggg caaggagttc aaccacctgg agaagagaat cgagaacctg aacaagaaag 1320
tggacgacgg cttcctggat atttggacct acaatgccga gctgctcgtg ctcctggaga 1380
atgagagaac cctggactac cacgacagca atgtgaagaa cctgtacgag aaggtgagaa 1440
gccagctgaa gaacaatgcc aaggagatcg gcaacggctg ctttgagttc taccacaagt 1500
gtgacaacac ctgtatggag tctgtgaaga acggcaccta cgactaccct aagtatagcg 1560
aggaggccaa gctgaataga gaggagatcg acggcgtgaa actggaaagc acaagaatct 1620
atcagggcgc tgaaaacctg tattttcagg gcggttctgg ttacatcccg gaagctccgc 1680
gtgacggtca ggcttacgtt cgtaaagacg gtgaatgggt tctgctgtct accttcctgg 1740
gtcaccatca tcaccaccat caccatcatc actgataaaa agctt 1785
<210> 33
<211> 591
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 33
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Glu Gly Met Ile Asp Tyr
130 135 140
Glu Gly Thr Gly Gln Ala Ala Trp Pro Asn His Asp Ser Asn Lys Gly
145 150 155 160
Val Thr Ala Ala Cys Pro His Ala Gly Ala Lys Ser Phe Tyr Lys Asn
165 170 175
Leu Ile Trp Leu Val Lys Lys Gly Asn Ser Tyr Pro Lys Leu Ser Lys
180 185 190
Ser Tyr Ile Asn Asp Lys Gly Lys Glu Val Leu Val Leu Trp Gly Ile
195 200 205
His His Pro Ser Thr Ser Ala Asp Gln Gln Ser Leu Tyr Gln Asn Ala
210 215 220
Asp Ala Tyr Val Phe Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys
225 230 235 240
Pro Glu Ile Ala Ile Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met
245 250 255
Asn Tyr Tyr Trp Thr Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu
260 265 270
Ala Thr Gly Asn Leu Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg
275 280 285
Asn Ala Gly Ser Gly Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys
290 295 300
Asn Thr Thr Cys Gln Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro
305 310 315 320
Phe Gln Asn Ile His Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val
325 330 335
Lys Ser Thr Lys Leu Arg Leu Ala Thr Gly Leu Arg Asn Ser Pro Glu
340 345 350
Asn Leu Tyr Phe Gln Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu
355 360 365
Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Gln
370 375 380
Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn
385 390 395 400
Ala Ile Asp Glu Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met
405 410 415
Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn His Leu Glu Lys
420 425 430
Arg Ile Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp Ile
435 440 445
Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg Thr
450 455 460
Leu Asp Tyr His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val Arg
465 470 475 480
Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu
485 490 495
Phe Tyr His Lys Cys Asp Asn Thr Cys Met Glu Ser Val Lys Asn Gly
500 505 510
Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu
515 520 525
Glu Ile Asp Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr Gln Gly Ala
530 535 540
Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro
545 550 555 560
Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu
565 570 575
Ser Thr Phe Leu Gly His His His His His His His His His His
580 585 590
<210> 34
<211> 1787
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 34
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctgaag 420
gcatgattga ttacgaaggc acaggccagg cagcctggcc taatcacgat tctaataagg 480
gagtgacagc cgcctgtcct catgccggag ccaagtcctt ttacaagaac ctgatctggc 540
tggtgaagaa gggcaacagc taccctaagc tgtctaagag ctacatcaac gacaagggca 600
aagaagtgct ggtgctgtgg ggaatccacc accctagcac aagcgccgat cagcagagcc 660
tgtaccagaa tgccgatgcc tatgtgtttg tgggcagcag cagatacagc aaaaagttca 720
agcctgaaat tgccattaga cccaaagtga gagatcagga aggcagaatg aattactact 780
ggaccctggt ggaacctggc gataagatca catttgaggc caccggaaat ctggtggtgc 840
ctagatatgc atttgctatg gagagaaatg ctggctctgg catcattatc tctgataccc 900
ctgtgcacga ctgtaatacc acctgtcaga cacctaaggg cgccattaat accagcctgc 960
ccttccagaa tattcaccct atcaccatcg gcaagtgtcc taagtatgtg aagagcacca 1020
agctgagact ggctaccggt ctgagaaata gccctgaaaa cctgtatttt caaggcctgt 1080
ttggagccat cgccggcttt attgagggag gatggaccgg aatggtggat ggctggtacg 1140
gctatcacca ccagaatgag cagggatccg gatatgccgc cgatctgaag tctacacaga 1200
acgccatcga cgagatcaca aacaaggtga acagcgtgat cgagaagatg aacacccagt 1260
ttacagctgt gggcaaggag ttcaaccacc tggagaagag aatcgagaac ctgaacaaga 1320
aagtggacga cggcttcctg gatatttgga cctacaatgc cgagctgctc gtgctcctgg 1380
agaatgagag aaccctggac taccacgaca gcaatgtgaa gaacctgtac gagaaggtga 1440
gaagccagct gaagaacaat gccaaggaga tcggcaacgg ctgctttgag ttctaccaca 1500
agtgtgacaa cacctgtatg gagtctgtga agaacggcac ctacgactac cctaagtata 1560
gcgaggaggc caagctgaat agagaggaga tcgacggcgt gaaactggaa agcacaagaa 1620
tctatcaggg cgctgaaaac ctgtattttc agggcggttc tggttacatc ccggaagctc 1680
cgcgtgacgg tcaggcttac gttcgtaaag acggtgaatg ggttctgctg tctaccttcc 1740
tgggtcacca tcatcaccac catcaccatc atcactgata aaagctt 1787
<210> 35
<211> 586
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 35
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile Gly Ile Phe Gly
225 230 235 240
Ala Ile Ala Gly Phe Ile Glu Gly Gly Arg Met Asn Tyr Tyr Trp Thr
245 250 255
Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu
260 265 270
Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly
275 280 285
Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln
290 295 300
Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His
305 310 315 320
Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu
325 330 335
Arg Leu Ala Thr Gly Leu Arg Asn Ser Pro Glu Asn Leu Tyr Phe Gln
340 345 350
Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly
355 360 365
Met Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser
370 375 380
Gly Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile
385 390 395 400
Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr
405 410 415
Ala Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu
420 425 430
Asn Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala
435 440 445
Glu Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp
450 455 460
Ser Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn
465 470 475 480
Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys
485 490 495
Asp Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro
500 505 510
Lys Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val
515 520 525
Lys Leu Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe
530 535 540
Gln Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala
545 550 555 560
Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly
565 570 575
His His His His His His His His His His
580 585
<210> 36
<211> 12
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 36
Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly
1 5 10
<210> 37
<211> 1772
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 37
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctga aattgccatt ggcattttcg 720
gcgctatcgc cggcttcatt gagggaggca gaatgaatta ctactggacc ctggtggaac 780
ctggcgataa gatcacattt gaggccaccg gaaatctggt ggtgcctaga tatgcatttg 840
ctatggagag aaatgctggc tctggcatca ttatctctga tacccctgtg cacgactgta 900
ataccacctg tcagacacct aagggcgcca ttaataccag cctgcccttc cagaatattc 960
accctatcac catcggcaag tgtcctaagt atgtgaagag caccaagctg agactggcta 1020
ccggtctgag aaatagccct gaaaacctgt attttcaagg cctgtttgga gccatcgccg 1080
gctttattga gggaggatgg accggaatgg tggatggctg gtacggctat caccaccaga 1140
atgagcaggg atccggatat gccgccgatc tgaagtctac acagaacgcc atcgacgaga 1200
tcacaaacaa ggtgaacagc gtgatcgaga agatgaacac ccagtttaca gctgtgggca 1260
aggagttcaa ccacctggag aagagaatcg agaacctgaa caagaaagtg gacgacggct 1320
tcctggatat ttggacctac aatgccgagc tgctcgtgct cctggagaat gagagaaccc 1380
tggactacca cgacagcaat gtgaagaacc tgtacgagaa ggtgagaagc cagctgaaga 1440
acaatgccaa ggagatcggc aacggctgct ttgagttcta ccacaagtgt gacaacacct 1500
gtatggagtc tgtgaagaac ggcacctacg actaccctaa gtatagcgag gaggccaagc 1560
tgaatagaga ggagatcgac ggcgtgaaac tggaaagcac aagaatctat cagggcgctg 1620
aaaacctgta ttttcagggc ggttctggtt acatcccgga agctccgcgt gacggtcagg 1680
cttacgttcg taaagacggt gaatgggttc tgctgtctac cttcctgggt caccatcatc 1740
accaccatca ccatcatcac tgataaaagc tt 1772
<210> 38
<211> 588
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 38
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro Gly Ile Phe
145 150 155 160
Gly Ala Ile Ala Gly Phe Ile Glu Gly Phe Tyr Lys Asn Leu Ile Trp
165 170 175
Leu Val Lys Lys Gly Asn Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile
180 185 190
Asn Asp Lys Gly Lys Glu Val Leu Val Leu Trp Gly Ile His His Pro
195 200 205
Ser Thr Ser Ala Asp Gln Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr
210 215 220
Val Phe Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile
225 230 235 240
Ala Ile Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr
245 250 255
Trp Thr Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly
260 265 270
Asn Leu Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly
275 280 285
Ser Gly Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys Asn Thr Thr
290 295 300
Cys Gln Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn
305 310 315 320
Ile His Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr
325 330 335
Lys Leu Arg Leu Ala Thr Gly Leu Arg Asn Ser Pro Glu Asn Leu Tyr
340 345 350
Phe Gln Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp
355 360 365
Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln
370 375 380
Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp
385 390 395 400
Glu Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln
405 410 415
Phe Thr Ala Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu
420 425 430
Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr
435 440 445
Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr
450 455 460
His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu
465 470 475 480
Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His
485 490 495
Lys Cys Asp Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp
500 505 510
Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp
515 520 525
Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn Leu
530 535 540
Tyr Phe Gln Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly
545 550 555 560
Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe
565 570 575
Leu Gly His His His His His His His His His His
580 585
<210> 39
<211> 1778
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 39
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctggcattt 480
tcggcgctat cgccggcttc attgagggat tttacaagaa cctgatctgg ctggtgaaga 540
agggcaacag ctaccctaag ctgtctaaga gctacatcaa cgacaagggc aaagaagtgc 600
tggtgctgtg gggaatccac caccctagca caagcgccga tcagcagagc ctgtaccaga 660
atgccgatgc ctatgtgttt gtgggcagca gcagatacag caaaaagttc aagcctgaaa 720
ttgccattag acccaaagtg agagatcagg aaggcagaat gaattactac tggaccctgg 780
tggaacctgg cgataagatc acatttgagg ccaccggaaa tctggtggtg cctagatatg 840
catttgctat ggagagaaat gctggctctg gcatcattat ctctgatacc cctgtgcacg 900
actgtaatac cacctgtcag acacctaagg gcgccattaa taccagcctg cccttccaga 960
atattcaccc tatcaccatc ggcaagtgtc ctaagtatgt gaagagcacc aagctgagac 1020
tggctaccgg tctgagaaat agccctgaaa acctgtattt tcaaggcctg tttggagcca 1080
tcgccggctt tattgaggga ggatggaccg gaatggtgga tggctggtac ggctatcacc 1140
accagaatga gcagggatcc ggatatgccg ccgatctgaa gtctacacag aacgccatcg 1200
acgagatcac aaacaaggtg aacagcgtga tcgagaagat gaacacccag tttacagctg 1260
tgggcaagga gttcaaccac ctggagaaga gaatcgagaa cctgaacaag aaagtggacg 1320
acggcttcct ggatatttgg acctacaatg ccgagctgct cgtgctcctg gagaatgaga 1380
gaaccctgga ctaccacgac agcaatgtga agaacctgta cgagaaggtg agaagccagc 1440
tgaagaacaa tgccaaggag atcggcaacg gctgctttga gttctaccac aagtgtgaca 1500
acacctgtat ggagtctgtg aagaacggca cctacgacta ccctaagtat agcgaggagg 1560
ccaagctgaa tagagaggag atcgacggcg tgaaactgga aagcacaaga atctatcagg 1620
gcgctgaaaa cctgtatttt cagggcggtt ctggttacat cccggaagct ccgcgtgacg 1680
gtcaggctta cgttcgtaaa gacggtgaat gggttctgct gtctaccttc ctgggtcacc 1740
atcatcacca ccatcaccat catcactgat aaaagctt 1778
<210> 40
<211> 589
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 40
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Gly Ile Phe Gly
165 170 175
Ala Ile Ala Gly Phe Ile Glu Gly Tyr Pro Lys Leu Ser Lys Ser Tyr
180 185 190
Ile Asn Asp Lys Gly Lys Glu Val Leu Val Leu Trp Gly Ile His His
195 200 205
Pro Ser Thr Ser Ala Asp Gln Gln Ser Leu Tyr Gln Asn Ala Asp Ala
210 215 220
Tyr Val Phe Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys Pro Glu
225 230 235 240
Ile Ala Ile Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met Asn Tyr
245 250 255
Tyr Trp Thr Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu Ala Thr
260 265 270
Gly Asn Leu Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn Ala
275 280 285
Gly Ser Gly Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys Asn Thr
290 295 300
Thr Cys Gln Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro Phe Gln
305 310 315 320
Asn Ile His Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val Lys Ser
325 330 335
Thr Lys Leu Arg Leu Ala Thr Gly Leu Arg Asn Ser Pro Glu Asn Leu
340 345 350
Tyr Phe Gln Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly
355 360 365
Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu
370 375 380
Gln Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile
385 390 395 400
Asp Glu Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr
405 410 415
Gln Phe Thr Ala Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile
420 425 430
Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr
435 440 445
Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp
450 455 460
Tyr His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln
465 470 475 480
Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr
485 490 495
His Lys Cys Asp Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr
500 505 510
Asp Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile
515 520 525
Asp Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn
530 535 540
Leu Tyr Phe Gln Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp
545 550 555 560
Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr
565 570 575
Phe Leu Gly His His His His His His His His His His
580 585
<210> 41
<211> 1781
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 41
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtggg cattttcggc gctatcgccg 540
gcttcattga gggataccct aagctgtcta agagctacat caacgacaag ggcaaagaag 600
tgctggtgct gtggggaatc caccacccta gcacaagcgc cgatcagcag agcctgtacc 660
agaatgccga tgcctatgtg tttgtgggca gcagcagata cagcaaaaag ttcaagcctg 720
aaattgccat tagacccaaa gtgagagatc aggaaggcag aatgaattac tactggaccc 780
tggtggaacc tggcgataag atcacatttg aggccaccgg aaatctggtg gtgcctagat 840
atgcatttgc tatggagaga aatgctggct ctggcatcat tatctctgat acccctgtgc 900
acgactgtaa taccacctgt cagacaccta agggcgccat taataccagc ctgcccttcc 960
agaatattca ccctatcacc atcggcaagt gtcctaagta tgtgaagagc accaagctga 1020
gactggctac cggtctgaga aatagccctg aaaacctgta ttttcaaggc ctgtttggag 1080
ccatcgccgg ctttattgag ggaggatgga ccggaatggt ggatggctgg tacggctatc 1140
accaccagaa tgagcaggga tccggatatg ccgccgatct gaagtctaca cagaacgcca 1200
tcgacgagat cacaaacaag gtgaacagcg tgatcgagaa gatgaacacc cagtttacag 1260
ctgtgggcaa ggagttcaac cacctggaga agagaatcga gaacctgaac aagaaagtgg 1320
acgacggctt cctggatatt tggacctaca atgccgagct gctcgtgctc ctggagaatg 1380
agagaaccct ggactaccac gacagcaatg tgaagaacct gtacgagaag gtgagaagcc 1440
agctgaagaa caatgccaag gagatcggca acggctgctt tgagttctac cacaagtgtg 1500
acaacacctg tatggagtct gtgaagaacg gcacctacga ctaccctaag tatagcgagg 1560
aggccaagct gaatagagag gagatcgacg gcgtgaaact ggaaagcaca agaatctatc 1620
agggcgctga aaacctgtat tttcagggcg gttctggtta catcccggaa gctccgcgtg 1680
acggtcaggc ttacgttcgt aaagacggtg aatgggttct gctgtctacc ttcctgggtc 1740
accatcatca ccaccatcac catcatcact gataaaagct t 1781
<210> 42
<211> 590
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 42
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Gly Ile Phe Gly Ala Ile
130 135 140
Ala Gly Phe Ile Glu Gly Trp Pro Asn His Asp Ser Asn Lys Gly Val
145 150 155 160
Thr Ala Ala Cys Pro His Ala Gly Ala Lys Ser Phe Tyr Lys Asn Leu
165 170 175
Ile Trp Leu Val Lys Lys Gly Asn Ser Tyr Pro Lys Leu Ser Lys Ser
180 185 190
Tyr Ile Asn Asp Lys Gly Lys Glu Val Leu Val Leu Trp Gly Ile His
195 200 205
His Pro Ser Thr Ser Ala Asp Gln Gln Ser Leu Tyr Gln Asn Ala Asp
210 215 220
Ala Tyr Val Phe Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys Pro
225 230 235 240
Glu Ile Ala Ile Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met Asn
245 250 255
Tyr Tyr Trp Thr Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu Ala
260 265 270
Thr Gly Asn Leu Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn
275 280 285
Ala Gly Ser Gly Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys Asn
290 295 300
Thr Thr Cys Gln Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro Phe
305 310 315 320
Gln Asn Ile His Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val Lys
325 330 335
Ser Thr Lys Leu Arg Leu Ala Thr Gly Leu Arg Asn Ser Pro Glu Asn
340 345 350
Leu Tyr Phe Gln Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly
355 360 365
Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn
370 375 380
Glu Gln Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala
385 390 395 400
Ile Asp Glu Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn
405 410 415
Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg
420 425 430
Ile Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp
435 440 445
Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu
450 455 460
Asp Tyr His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser
465 470 475 480
Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe
485 490 495
Tyr His Lys Cys Asp Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr
500 505 510
Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu
515 520 525
Ile Asp Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu
530 535 540
Asn Leu Tyr Phe Gln Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg
545 550 555 560
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser
565 570 575
Thr Phe Leu Gly His His His His His His His His His His
580 585 590
<210> 43
<211> 1784
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 43
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctggca 420
ttttcggcgc tatcgccggc ttcattgagg gatggcctaa tcacgattct aataagggag 480
tgacagccgc ctgtcctcat gccggagcca agtcctttta caagaacctg atctggctgg 540
tgaagaaggg caacagctac cctaagctgt ctaagagcta catcaacgac aagggcaaag 600
aagtgctggt gctgtgggga atccaccacc ctagcacaag cgccgatcag cagagcctgt 660
accagaatgc cgatgcctat gtgtttgtgg gcagcagcag atacagcaaa aagttcaagc 720
ctgaaattgc cattagaccc aaagtgagag atcaggaagg cagaatgaat tactactgga 780
ccctggtgga acctggcgat aagatcacat ttgaggccac cggaaatctg gtggtgccta 840
gatatgcatt tgctatggag agaaatgctg gctctggcat cattatctct gatacccctg 900
tgcacgactg taataccacc tgtcagacac ctaagggcgc cattaatacc agcctgccct 960
tccagaatat tcaccctatc accatcggca agtgtcctaa gtatgtgaag agcaccaagc 1020
tgagactggc taccggtctg agaaatagcc ctgaaaacct gtattttcaa ggcctgtttg 1080
gagccatcgc cggctttatt gagggaggat ggaccggaat ggtggatggc tggtacggct 1140
atcaccacca gaatgagcag ggatccggat atgccgccga tctgaagtct acacagaacg 1200
ccatcgacga gatcacaaac aaggtgaaca gcgtgatcga gaagatgaac acccagttta 1260
cagctgtggg caaggagttc aaccacctgg agaagagaat cgagaacctg aacaagaaag 1320
tggacgacgg cttcctggat atttggacct acaatgccga gctgctcgtg ctcctggaga 1380
atgagagaac cctggactac cacgacagca atgtgaagaa cctgtacgag aaggtgagaa 1440
gccagctgaa gaacaatgcc aaggagatcg gcaacggctg ctttgagttc taccacaagt 1500
gtgacaacac ctgtatggag tctgtgaaga acggcaccta cgactaccct aagtatagcg 1560
aggaggccaa gctgaataga gaggagatcg acggcgtgaa actggaaagc acaagaatct 1620
atcagggcgc tgaaaacctg tattttcagg gcggttctgg ttacatcccg gaagctccgc 1680
gtgacggtca ggcttacgtt cgtaaagacg gtgaatgggt tctgctgtct accttcctgg 1740
gtcaccatca tcaccaccat caccatcatc actgataaaa gctt 1784
<210> 44
<211> 584
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 44
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Gly Ile Phe Gly Ala
195 200 205
Ile Ala Gly Phe Ile Glu Gly Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile Arg Pro Lys Val
225 230 235 240
Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu Pro
245 250 255
Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro Arg
260 265 270
Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile Ser
275 280 285
Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys Gly
290 295 300
Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr Ile
305 310 315 320
Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala Thr
325 330 335
Gly Leu Arg Asn Ser Pro Gln Arg Glu Arg Arg Lys Lys Arg Gly Leu
340 345 350
Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met Val
355 360 365
Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly Tyr
370 375 380
Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr Asn
385 390 395 400
Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala Val
405 410 415
Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn Lys
420 425 430
Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu Leu
435 440 445
Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser Asn
450 455 460
Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn Ala
465 470 475 480
Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn
485 490 495
Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr
500 505 510
Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys Leu
515 520 525
Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln Gly
530 535 540
Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val
545 550 555 560
Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His His
565 570 575
His His His His His His His His
580
<210> 45
<211> 1766
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 45
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cggcattttc ggcgctatcg ccggcttcat tgagggagat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctga aattgccatt agacccaaag 720
tgagagatca ggaaggcaga atgaattact actggaccct ggtggaacct ggcgataaga 780
tcacatttga ggccaccgga aatctggtgg tgcctagata tgcatttgct atggagagaa 840
atgctggctc tggcatcatt atctctgata cccctgtgca cgactgtaat accacctgtc 900
agacacctaa gggcgccatt aataccagcc tgcccttcca gaatattcac cctatcacca 960
tcggcaagtg tcctaagtat gtgaagagca ccaagctgag actggctacc ggtctgagaa 1020
atagccctca gagggagaga cgcaagaaga gaggcctgtt tggagccatc gccggcttta 1080
ttgagggagg atggaccgga atggtggatg gctggtacgg ctatcaccac cagaatgagc 1140
agggatccgg atatgccgcc gatctgaagt ctacacagaa cgccatcgac gagatcacaa 1200
acaaggtgaa cagcgtgatc gagaagatga acacccagtt tacagctgtg ggcaaggagt 1260
tcaaccacct ggagaagaga atcgagaacc tgaacaagaa agtggacgac ggcttcctgg 1320
atatttggac ctacaatgcc gagctgctcg tgctcctgga gaatgagaga accctggact 1380
accacgacag caatgtgaag aacctgtacg agaaggtgag aagccagctg aagaacaatg 1440
ccaaggagat cggcaacggc tgctttgagt tctaccacaa gtgtgacaac acctgtatgg 1500
agtctgtgaa gaacggcacc tacgactacc ctaagtatag cgaggaggcc aagctgaata 1560
gagaggagat cgacggcgtg aaactggaaa gcacaagaat ctatcagggc gctgaaaacc 1620
tgtattttca gggcggttct ggttacatcc cggaagctcc gcgtgacggt caggcttacg 1680
ttcgtaaaga cggtgaatgg gttctgctgt ctaccttcct gggtcaccat catcaccacc 1740
atcaccatca tcactgataa aagctt 1766
<210> 46
<211> 584
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 46
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Gly Ile Phe Gly Ala Ile Ala Gly
225 230 235 240
Phe Ile Glu Gly Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu Pro
245 250 255
Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro Arg
260 265 270
Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile Ser
275 280 285
Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys Gly
290 295 300
Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr Ile
305 310 315 320
Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala Thr
325 330 335
Gly Leu Arg Asn Ser Pro Gln Arg Glu Arg Arg Lys Lys Arg Gly Leu
340 345 350
Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met Val
355 360 365
Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly Tyr
370 375 380
Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr Asn
385 390 395 400
Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala Val
405 410 415
Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn Lys
420 425 430
Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu Leu
435 440 445
Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser Asn
450 455 460
Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn Ala
465 470 475 480
Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn
485 490 495
Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr
500 505 510
Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys Leu
515 520 525
Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln Gly
530 535 540
Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val
545 550 555 560
Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His His
565 570 575
His His His His His His His His
580
<210> 47
<211> 1766
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 47
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagcctgg cattttcggc gctatcgccg 720
gcttcattga gggaggcaga atgaattact actggaccct ggtggaacct ggcgataaga 780
tcacatttga ggccaccgga aatctggtgg tgcctagata tgcatttgct atggagagaa 840
atgctggctc tggcatcatt atctctgata cccctgtgca cgactgtaat accacctgtc 900
agacacctaa gggcgccatt aataccagcc tgcccttcca gaatattcac cctatcacca 960
tcggcaagtg tcctaagtat gtgaagagca ccaagctgag actggctacc ggtctgagaa 1020
atagccctca gagggagaga cgcaagaaga gaggcctgtt tggagccatc gccggcttta 1080
ttgagggagg atggaccgga atggtggatg gctggtacgg ctatcaccac cagaatgagc 1140
agggatccgg atatgccgcc gatctgaagt ctacacagaa cgccatcgac gagatcacaa 1200
acaaggtgaa cagcgtgatc gagaagatga acacccagtt tacagctgtg ggcaaggagt 1260
tcaaccacct ggagaagaga atcgagaacc tgaacaagaa agtggacgac ggcttcctgg 1320
atatttggac ctacaatgcc gagctgctcg tgctcctgga gaatgagaga accctggact 1380
accacgacag caatgtgaag aacctgtacg agaaggtgag aagccagctg aagaacaatg 1440
ccaaggagat cggcaacggc tgctttgagt tctaccacaa gtgtgacaac acctgtatgg 1500
agtctgtgaa gaacggcacc tacgactacc ctaagtatag cgaggaggcc aagctgaata 1560
gagaggagat cgacggcgtg aaactggaaa gcacaagaat ctatcagggc gctgaaaacc 1620
tgtattttca gggcggttct ggttacatcc cggaagctcc gcgtgacggt caggcttacg 1680
ttcgtaaaga cggtgaatgg gttctgctgt ctaccttcct gggtcaccat catcaccacc 1740
atcaccatca tcactgataa aagctt 1766
<210> 48
<211> 592
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 48
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Arg Lys Lys Arg
165 170 175
Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Tyr Ile Asn Asp Lys
180 185 190
Gly Lys Glu Val Leu Val Leu Trp Gly Ile His His Pro Ser Lys Glu
195 200 205
Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser Asp
210 215 220
Ala Tyr Val Phe Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys Pro
225 230 235 240
Glu Ile Ala Ile Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met Asn
245 250 255
Tyr Tyr Trp Thr Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu Ala
260 265 270
Thr Gly Asn Leu Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn
275 280 285
Ala Gly Ser Gly Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys Asn
290 295 300
Thr Thr Cys Gln Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro Phe
305 310 315 320
Gln Asn Ile His Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val Lys
325 330 335
Ser Thr Lys Leu Arg Leu Ala Thr Gly Leu Arg Asn Ser Pro Gln Arg
340 345 350
Glu Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile
355 360 365
Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His
370 375 380
Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser Thr Gln
385 390 395 400
Asn Ala Ile Asp Glu Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys
405 410 415
Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn His Leu Glu
420 425 430
Lys Arg Ile Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp
435 440 445
Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg
450 455 460
Thr Leu Asp Tyr His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val
465 470 475 480
Arg Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe
485 490 495
Glu Phe Tyr His Lys Cys Asp Asn Thr Cys Met Glu Ser Val Lys Asn
500 505 510
Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu Asn Arg
515 520 525
Glu Glu Ile Asp Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr Gln Gly
530 535 540
Ala Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly Tyr Ile Pro Glu Ala
545 550 555 560
Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu
565 570 575
Leu Ser Thr Phe Leu Gly His His His His His His His His His His
580 585 590
<210> 49
<211> 15
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 49
Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu
1 5 10 15
<210> 50
<211> 17
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 50
Lys Glu Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn
1 5 10 15
Ser
<210> 51
<211> 1790
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 51
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgag aaagaagaga ggcctgtttg 540
gagccatcgc cggctttatt gagtacatca acgacaaggg caaagaagtg ctggtgctgt 600
ggggaatcca ccaccctagc aaggagtcta cacagaaggc cattgatggc gttacaaata 660
aggtcaattc tgatgcctat gtgtttgtgg gcagcagcag atacagcaaa aagttcaagc 720
ctgaaattgc cattagaccc aaagtgagag atcaggaagg cagaatgaat tactactgga 780
ccctggtgga acctggcgat aagatcacat ttgaggccac cggaaatctg gtggtgccta 840
gatatgcatt tgctatggag agaaatgctg gctctggcat cattatctct gatacccctg 900
tgcacgactg taataccacc tgtcagacac ctaagggcgc cattaatacc agcctgccct 960
tccagaatat tcaccctatc accatcggca agtgtcctaa gtatgtgaag agcaccaagc 1020
tgagactggc taccggtctg agaaatagcc ctcagaggga gagacgcaag aagagaggcc 1080
tgtttggagc catcgccggc tttattgagg gaggatggac cggaatggtg gatggctggt 1140
acggctatca ccaccagaat gagcagggat ccggatatgc cgccgatctg aagtctacac 1200
agaacgccat cgacgagatc acaaacaagg tgaacagcgt gatcgagaag atgaacaccc 1260
agtttacagc tgtgggcaag gagttcaacc acctggagaa gagaatcgag aacctgaaca 1320
agaaagtgga cgacggcttc ctggatattt ggacctacaa tgccgagctg ctcgtgctcc 1380
tggagaatga gagaaccctg gactaccacg acagcaatgt gaagaacctg tacgagaagg 1440
tgagaagcca gctgaagaac aatgccaagg agatcggcaa cggctgcttt gagttctacc 1500
acaagtgtga caacacctgt atggagtctg tgaagaacgg cacctacgac taccctaagt 1560
atagcgagga ggccaagctg aatagagagg agatcgacgg cgtgaaactg gaaagcacaa 1620
gaatctatca gggcgctgaa aacctgtatt ttcagggcgg ttctggttac atcccggaag 1680
ctccgcgtga cggtcaggct tacgttcgta aagacggtga atgggttctg ctgtctacct 1740
tcctgggtca ccatcatcac caccatcacc atcatcactg ataaaagctt 1790
<210> 52
<211> 589
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 52
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Arg Lys Lys Arg
165 170 175
Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Tyr Ile Asn Asp Lys
180 185 190
Gly Lys Glu Val Leu Val Leu Trp Gly Ile His His Pro Ser Lys Glu
195 200 205
Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser Asp
210 215 220
Ala Tyr Val Phe Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys Pro
225 230 235 240
Glu Ile Ala Ile Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met Asn
245 250 255
Tyr Tyr Trp Thr Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu Ala
260 265 270
Thr Gly Asn Leu Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn
275 280 285
Ala Gly Ser Gly Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys Asn
290 295 300
Thr Thr Cys Gln Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro Phe
305 310 315 320
Gln Asn Ile His Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val Lys
325 330 335
Ser Thr Lys Leu Arg Leu Ala Thr Gly Leu Arg Asn Ile Pro Ser Ile
340 345 350
Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly
355 360 365
Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu
370 375 380
Gln Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile
385 390 395 400
Asp Glu Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr
405 410 415
Gln Phe Thr Ala Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile
420 425 430
Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr
435 440 445
Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp
450 455 460
Tyr His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln
465 470 475 480
Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr
485 490 495
His Lys Cys Asp Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr
500 505 510
Asp Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile
515 520 525
Asp Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn
530 535 540
Leu Tyr Phe Gln Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp
545 550 555 560
Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr
565 570 575
Phe Leu Gly His His His His His His His His His His
580 585
<210> 53
<211> 1781
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 53
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgag aaagaagaga ggcctgtttg 540
gagccatcgc cggctttatt gagtacatca acgacaaggg caaagaagtg ctggtgctgt 600
ggggaatcca ccaccctagc aaggagtcta cacagaaggc cattgatggc gttacaaata 660
aggtcaattc tgatgcctat gtgtttgtgg gcagcagcag atacagcaaa aagttcaagc 720
ctgaaattgc cattagaccc aaagtgagag atcaggaagg cagaatgaat tactactgga 780
ccctggtgga acctggcgat aagatcacat ttgaggccac cggaaatctg gtggtgccta 840
gatatgcatt tgctatggag agaaatgctg gctctggcat cattatctct gatacccctg 900
tgcacgactg taataccacc tgtcagacac ctaagggcgc cattaatacc agcctgccct 960
tccagaatat tcaccctatc accatcggca agtgtcctaa gtatgtgaag agcaccaagc 1020
tgagactggc taccggtctg agaaatatcc ctagcatcca gagcagaggc ctgtttggag 1080
ccatcgccgg ctttattgag ggaggatgga ccggaatggt ggatggctgg tacggctatc 1140
accaccagaa tgagcaggga tccggatatg ccgccgatct gaagtctaca cagaacgcca 1200
tcgacgagat cacaaacaag gtgaacagcg tgatcgagaa gatgaacacc cagtttacag 1260
ctgtgggcaa ggagttcaac cacctggaga agagaatcga gaacctgaac aagaaagtgg 1320
acgacggctt cctggatatt tggacctaca atgccgagct gctcgtgctc ctggagaatg 1380
agagaaccct ggactaccac gacagcaatg tgaagaacct gtacgagaag gtgagaagcc 1440
agctgaagaa caatgccaag gagatcggca acggctgctt tgagttctac cacaagtgtg 1500
acaacacctg tatggagtct gtgaagaacg gcacctacga ctaccctaag tatagcgagg 1560
aggccaagct gaatagagag gagatcgacg gcgtgaaact ggaaagcaca agaatctatc 1620
agggcgctga aaacctgtat tttcagggcg gttctggtta catcccggaa gctccgcgtg 1680
acggtcaggc ttacgttcgt aaagacggtg aatgggttct gctgtctacc ttcctgggtc 1740
accatcatca ccaccatcac catcatcact gataaaagct t 1781
<210> 54
<211> 585
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 54
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Arg Lys Lys Arg
165 170 175
Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Tyr Ile Asn Asp
180 185 190
Lys Gly Lys Glu Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr
195 200 205
Ser Ala Asp Gln Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe
210 215 220
Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile
225 230 235 240
Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr
245 250 255
Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu
260 265 270
Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly
275 280 285
Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln
290 295 300
Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His
305 310 315 320
Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu
325 330 335
Arg Leu Ala Thr Gly Leu Arg Asn Ile Glu Asn Leu Tyr Phe Gln Gly
340 345 350
Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met
355 360 365
Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly
370 375 380
Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr
385 390 395 400
Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala
405 410 415
Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn
420 425 430
Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu
435 440 445
Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser
450 455 460
Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn
465 470 475 480
Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp
485 490 495
Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys
500 505 510
Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys
515 520 525
Leu Glu Ser Thr Arg Ile Tyr Gln Gly Ala Glu Asn Leu Tyr Phe Gln
530 535 540
Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
545 550 555 560
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly His
565 570 575
His His His His His His His His His
580 585
<210> 55
<211> 1769
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 55
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgag aaagaagaga ggcctgttcg 540
gcgctatcgc cggcttcatt gagggataca tcaacgacaa gggcaaagaa gtgctggtgc 600
tgtggggaat ccaccaccct agcacaagcg ccgatcagca gagcctgtac cagaatgccg 660
atgcctatgt gtttgtgggc agcagcagat acagcaaaaa gttcaagcct gaaattgcca 720
ttagacccaa agtgagagat caggaaggca gaatgaatta ctactggacc ctggtggaac 780
ctggcgataa gatcacattt gaggccaccg gaaatctggt ggtgcctaga tatgcatttg 840
ctatggagag aaatgctggc tctggcatca ttatctctga tacccctgtg cacgactgta 900
ataccacctg tcagacacct aagggcgcca ttaataccag cctgcccttc cagaatattc 960
accctatcac catcggcaag tgtcctaagt atgtgaagag caccaagctg agactggcta 1020
ccggtctgag aaatatcgaa aacctgtatt ttcaaggcct gtttggagcc atcgccggct 1080
ttattgaggg aggatggacc ggaatggtgg atggctggta cggctatcac caccagaatg 1140
agcagggatc cggatatgcc gccgatctga agtctacaca gaacgccatc gacgagatca 1200
caaacaaggt gaacagcgtg atcgagaaga tgaacaccca gtttacagct gtgggcaagg 1260
agttcaacca cctggagaag agaatcgaga acctgaacaa gaaagtggac gacggcttcc 1320
tggatatttg gacctacaat gccgagctgc tcgtgctcct ggagaatgag agaaccctgg 1380
actaccacga cagcaatgtg aagaacctgt acgagaaggt gagaagccag ctgaagaaca 1440
atgccaagga gatcggcaac ggctgctttg agttctacca caagtgtgac aacacctgta 1500
tggagtctgt gaagaacggc acctacgact accctaagta tagcgaggag gccaagctga 1560
atagagagga gatcgacggc gtgaaactgg aaagcacaag aatctatcag ggcgctgaaa 1620
acctgtattt tcagggcggt tctggttaca tcccggaagc tccgcgtgac ggtcaggctt 1680
acgttcgtaa agacggtgaa tgggttctgc tgtctacctt cctgggtcac catcatcacc 1740
accatcacca tcatcactga taaaagctt 1769
<210> 56
<211> 593
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 56
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Ser Leu Leu Thr Glu Val Glu Thr
225 230 235 240
Pro Thr Arg Asn Gly Trp Glu Cys Lys Cys Ser Asp Ser Gly Arg Met
245 250 255
Asn Tyr Tyr Trp Thr Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu
260 265 270
Ala Thr Gly Asn Leu Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg
275 280 285
Asn Ala Gly Ser Gly Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys
290 295 300
Asn Thr Thr Cys Gln Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro
305 310 315 320
Phe Gln Asn Ile His Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val
325 330 335
Lys Ser Thr Lys Leu Arg Leu Ala Thr Gly Leu Arg Asn Ser Pro Gln
340 345 350
Arg Glu Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
355 360 365
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
370 375 380
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser Thr
385 390 395 400
Gln Asn Ala Ile Asp Glu Ile Thr Asn Lys Val Asn Ser Val Ile Glu
405 410 415
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn His Leu
420 425 430
Glu Lys Arg Ile Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu
435 440 445
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
450 455 460
Arg Thr Leu Asp Tyr His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
465 470 475 480
Val Arg Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
485 490 495
Phe Glu Phe Tyr His Lys Cys Asp Asn Thr Cys Met Glu Ser Val Lys
500 505 510
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu Asn
515 520 525
Arg Glu Glu Ile Asp Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr Gln
530 535 540
Gly Ala Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly Tyr Ile Pro Glu
545 550 555 560
Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val
565 570 575
Leu Leu Ser Thr Phe Leu Gly His His His His His His His His His
580 585 590
His
<210> 57
<211> 21
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 57
Ser Leu Leu Thr Glu Val Glu Thr Pro Thr Arg Asn Gly Trp Glu Cys
1 5 10 15
Lys Cys Ser Asp Ser
20
<210> 58
<211> 1793
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 58
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagccttc cctgctgacc gaggtggaga 720
cccccaccag gaacggctgg gagtgcaagt gctccgactc cggcagaatg aattactact 780
ggaccctggt ggaacctggc gataagatca catttgaggc caccggaaat ctggtggtgc 840
ctagatatgc atttgctatg gagagaaatg ctggctctgg catcattatc tctgataccc 900
ctgtgcacga ctgtaatacc acctgtcaga cacctaaggg cgccattaat accagcctgc 960
ccttccagaa tattcaccct atcaccatcg gcaagtgtcc taagtatgtg aagagcacca 1020
agctgagact ggctaccggt ctgagaaata gccctcagag ggagagacgc aagaagagag 1080
gcctgtttgg agccatcgcc ggctttattg agggaggatg gaccggaatg gtggatggct 1140
ggtacggcta tcaccaccag aatgagcagg gatccggata tgccgccgat ctgaagtcta 1200
cacagaacgc catcgacgag atcacaaaca aggtgaacag cgtgatcgag aagatgaaca 1260
cccagtttac agctgtgggc aaggagttca accacctgga gaagagaatc gagaacctga 1320
acaagaaagt ggacgacggc ttcctggata tttggaccta caatgccgag ctgctcgtgc 1380
tcctggagaa tgagagaacc ctggactacc acgacagcaa tgtgaagaac ctgtacgaga 1440
aggtgagaag ccagctgaag aacaatgcca aggagatcgg caacggctgc tttgagttct 1500
accacaagtg tgacaacacc tgtatggagt ctgtgaagaa cggcacctac gactacccta 1560
agtatagcga ggaggccaag ctgaatagag aggagatcga cggcgtgaaa ctggaaagca 1620
caagaatcta tcagggcgct gaaaacctgt attttcaggg cggttctggt tacatcccgg 1680
aagctccgcg tgacggtcag gcttacgttc gtaaagacgg tgaatgggtt ctgctgtcta 1740
ccttcctggg tcaccatcat caccaccatc accatcatca ctgataaaag ctt 1793
<210> 59
<211> 593
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 59
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Ser Leu Leu Thr Glu
195 200 205
Val Glu Thr Pro Thr Arg Asn Gly Trp Glu Cys Lys Cys Ser Asp Ser
210 215 220
Asp Ala Tyr Val Phe Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys
225 230 235 240
Pro Glu Ile Ala Ile Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met
245 250 255
Asn Tyr Tyr Trp Thr Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu
260 265 270
Ala Thr Gly Asn Leu Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg
275 280 285
Asn Ala Gly Ser Gly Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys
290 295 300
Asn Thr Thr Cys Gln Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro
305 310 315 320
Phe Gln Asn Ile His Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val
325 330 335
Lys Ser Thr Lys Leu Arg Leu Ala Thr Gly Leu Arg Asn Ser Pro Gln
340 345 350
Arg Glu Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
355 360 365
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
370 375 380
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser Thr
385 390 395 400
Gln Asn Ala Ile Asp Glu Ile Thr Asn Lys Val Asn Ser Val Ile Glu
405 410 415
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn His Leu
420 425 430
Glu Lys Arg Ile Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu
435 440 445
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
450 455 460
Arg Thr Leu Asp Tyr His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
465 470 475 480
Val Arg Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
485 490 495
Phe Glu Phe Tyr His Lys Cys Asp Asn Thr Cys Met Glu Ser Val Lys
500 505 510
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu Asn
515 520 525
Arg Glu Glu Ile Asp Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr Gln
530 535 540
Gly Ala Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly Tyr Ile Pro Glu
545 550 555 560
Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val
565 570 575
Leu Leu Ser Thr Phe Leu Gly His His His His His His His His His
580 585 590
His
<210> 60
<211> 1793
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 60
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag ctccctgctg accgaggtgg agacccccac caggaacggc tgggagtgca 660
agtgctccga ctccgatgcc tatgtgtttg tgggcagcag cagatacagc aaaaagttca 720
agcctgaaat tgccattaga cccaaagtga gagatcagga aggcagaatg aattactact 780
ggaccctggt ggaacctggc gataagatca catttgaggc caccggaaat ctggtggtgc 840
ctagatatgc atttgctatg gagagaaatg ctggctctgg catcattatc tctgataccc 900
ctgtgcacga ctgtaatacc acctgtcaga cacctaaggg cgccattaat accagcctgc 960
ccttccagaa tattcaccct atcaccatcg gcaagtgtcc taagtatgtg aagagcacca 1020
agctgagact ggctaccggt ctgagaaata gccctcagag ggagagacgc aagaagagag 1080
gcctgtttgg agccatcgcc ggctttattg agggaggatg gaccggaatg gtggatggct 1140
ggtacggcta tcaccaccag aatgagcagg gatccggata tgccgccgat ctgaagtcta 1200
cacagaacgc catcgacgag atcacaaaca aggtgaacag cgtgatcgag aagatgaaca 1260
cccagtttac agctgtgggc aaggagttca accacctgga gaagagaatc gagaacctga 1320
acaagaaagt ggacgacggc ttcctggata tttggaccta caatgccgag ctgctcgtgc 1380
tcctggagaa tgagagaacc ctggactacc acgacagcaa tgtgaagaac ctgtacgaga 1440
aggtgagaag ccagctgaag aacaatgcca aggagatcgg caacggctgc tttgagttct 1500
accacaagtg tgacaacacc tgtatggagt ctgtgaagaa cggcacctac gactacccta 1560
agtatagcga ggaggccaag ctgaatagag aggagatcga cggcgtgaaa ctggaaagca 1620
caagaatcta tcagggcgct gaaaacctgt attttcaggg cggttctggt tacatcccgg 1680
aagctccgcg tgacggtcag gcttacgttc gtaaagacgg tgaatgggtt ctgctgtcta 1740
ccttcctggg tcaccatcat caccaccatc accatcatca ctgataaaag ctt 1793
<210> 61
<211> 591
<212> Белок
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 61
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser
20 25 30
Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His
35 40 45
Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu
50 55 60
Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp
65 70 75 80
Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp
85 90 95
Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro
100 105 110
Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val
115 120 125
Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro
130 135 140
Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly
145 150 155 160
Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn
165 170 175
Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu
180 185 190
Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln
195 200 205
Gln Ser Leu Tyr Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser
210 215 220
Arg Tyr Ser Lys Lys Phe Lys Pro Ser Leu Leu Thr Glu Val Glu Thr
225 230 235 240
Pro Thr Arg Asn Gly Trp Glu Cys Lys Cys Ser Asp Ser Gly Arg Met
245 250 255
Asn Tyr Tyr Trp Thr Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu
260 265 270
Ala Thr Gly Asn Leu Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg
275 280 285
Asn Ala Gly Ser Gly Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys
290 295 300
Asn Thr Thr Cys Gln Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro
305 310 315 320
Phe Gln Asn Ile His Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val
325 330 335
Lys Ser Thr Lys Leu Arg Leu Ala Thr Gly Leu Arg Asn Ser Pro Glu
340 345 350
Asn Leu Tyr Phe Gln Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu
355 360 365
Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Gln
370 375 380
Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn
385 390 395 400
Ala Ile Asp Glu Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met
405 410 415
Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn His Leu Glu Lys
420 425 430
Arg Ile Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp Ile
435 440 445
Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg Thr
450 455 460
Leu Asp Tyr His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val Arg
465 470 475 480
Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu
485 490 495
Phe Tyr His Lys Cys Asp Asn Thr Cys Met Glu Ser Val Lys Asn Gly
500 505 510
Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu
515 520 525
Glu Ile Asp Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr Gln Gly Ala
530 535 540
Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro
545 550 555 560
Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu
565 570 575
Ser Thr Phe Leu Gly His His His His His His His His His His
580 585 590
<210> 62
<211> 1787
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая
<400> 62
ccatggtaag cgctattgtt ttatatgtgc ttttggcggc ggcggcgcat tctgcctttg 60
cggatacact gtgtattggc taccacgcca acaatagcac cgataccgtg gatacagtgc 120
tggagaagaa tgtgaccgtg acccactctg tgaatctgct ggaggataag cacaatggca 180
agctgtgtaa gctgagagga gttgcccctc tgcacctggg caaatgtaat attgccggct 240
ggattctggg aaatcctgaa tgtgaaagcc tgtctacagc cagcagctgg tcttatatcg 300
tggaaacccc tagcagcgac aatggcacct gttaccctgg cgacttcatc gattacgagg 360
agctgagaga acagctgtct agcgtgtcca gcttcgagag attcgagatc ttccctaaga 420
caagcagctg gcctaatcac gattctaata agggagtgac agccgcctgt cctcatgccg 480
gagccaagtc cttttacaag aacctgatct ggctggtgaa gaagggcaac agctacccta 540
agctgtctaa gagctacatc aacgacaagg gcaaagaagt gctggtgctg tggggaatcc 600
accaccctag cacaagcgcc gatcagcaga gcctgtacca gaatgccgat gcctatgtgt 660
ttgtgggcag cagcagatac agcaaaaagt tcaagccttc cctgctgacc gaggtggaga 720
cccccaccag gaacggctgg gagtgcaagt gctccgactc cggcagaatg aattactact 780
ggaccctggt ggaacctggc gataagatca catttgaggc caccggaaat ctggtggtgc 840
ctagatatgc atttgctatg gagagaaatg ctggctctgg catcattatc tctgataccc 900
ctgtgcacga ctgtaatacc acctgtcaga cacctaaggg cgccattaat accagcctgc 960
ccttccagaa tattcaccct atcaccatcg gcaagtgtcc taagtatgtg aagagcacca 1020
agctgagact ggctaccggt ctgagaaata gccctgaaaa cctgtatttt caaggcctgt 1080
ttggagccat cgccggcttt attgagggag gatggaccgg aatggtggat ggctggtacg 1140
gctatcacca ccagaatgag cagggatccg gatatgccgc cgatctgaag tctacacaga 1200
acgccatcga cgagatcaca aacaaggtga acagcgtgat cgagaagatg aacacccagt 1260
ttacagctgt gggcaaggag ttcaaccacc tggagaagag aatcgagaac ctgaacaaga 1320
aagtggacga cggcttcctg gatatttgga cctacaatgc cgagctgctc gtgctcctgg 1380
agaatgagag aaccctggac taccacgaca gcaatgtgaa gaacctgtac gagaaggtga 1440
gaagccagct gaagaacaat gccaaggaga tcggcaacgg ctgctttgag ttctaccaca 1500
agtgtgacaa cacctgtatg gagtctgtga agaacggcac ctacgactac cctaagtata 1560
gcgaggaggc caagctgaat agagaggaga tcgacggcgt gaaactggaa agcacaagaa 1620
tctatcaggg cgctgaaaac ctgtattttc agggcggttc tggttacatc ccggaagctc 1680
cgcgtgacgg tcaggcttac gttcgtaaag acggtgaatg ggttctgctg tctaccttcc 1740
tgggtcacca tcatcaccac catcaccatc atcactgata aaagctt 1787
<---
название | год | авторы | номер документа |
---|---|---|---|
САМОСОБИРАЮЩИЕСЯ НАНОСТРУКТУРНЫЕ ВАКЦИНЫ | 2019 |
|
RU2811439C2 |
СТАБИЛИЗИРОВАННЫЕ БЕЛКИ F RSV И ИХ ПРИМЕНЕНИЯ | 2019 |
|
RU2795459C2 |
МАТЕРИАЛЫ И МЕТОДЫ, ИСПОЛЬЗУЕМЫЕ ДЛЯ ЛЕЧЕНИЯ РЕСПИРАТОРНЫХ ЗАБОЛЕВАНИЙ У СОБАК | 2020 |
|
RU2811752C2 |
РЕКОМБИНАНТНЫЕ ВЕКТОРЫ, ЭКСПРЕССИРУЮЩИЕ АНТИГЕНЫ ВИРУСА ПТИЧЬЕГО ГРИППА, И ИХ ПРИМЕНЕНИЯ | 2017 |
|
RU2761869C2 |
ВАКЦИННЫЕ КОМПОЗИЦИИ, ХАРАКТЕРИЗУЮЩИЕСЯ УЛУЧШЕННОЙ СТАБИЛЬНОСТЬЮ И ИММУНОГЕННОСТЬЮ | 2016 |
|
RU2730625C2 |
ВИРУС ГРИППА, СПОСОБНЫЙ ИНФИЦИРОВАТЬ СОБАЧЬИХ, И ЕГО ПРИМЕНЕНИЕ | 2020 |
|
RU2802222C2 |
НЕЙТРАЛИЗУЮЩИЕ АНТИТЕЛА К ВИРУСУ ГРИППА А И ПУТИ ИХ ПРИМЕНЕНИЯ | 2014 |
|
RU2683498C2 |
НЕЙТРАЛИЗУЮЩИЕ АНТИТЕЛА К ВИРУСУ ГРИППА А И ПУТИ ИХ ПРИМЕНЕНИЯ | 2014 |
|
RU2803850C2 |
АНТИТЕЛА, ПОДХОДЯЩИЕ ДЛЯ ПАССИВНОЙ ИММУНИЗАЦИИ ПРОТИВ ГРИППА, И ИХ КОМПОЗИЦИИ, КОМБИНАЦИИ И СПОСОБЫ ПРИМЕНЕНИЯ | 2015 |
|
RU2720282C1 |
ВАКЦИНА К ВИРУСУ СВИНОГО ГРИППА A | 2018 |
|
RU2787596C2 |
Изобретение относится к биотехнологии. Описан модифицированный вирус гриппа, а также вирусоподобная частица, где указанный вирус или частица содержат белок HA гриппа, где его сайт расщепления при созревании (MCS) модифицирован так, что его не расщепляют никакие протеазы животных, но он может быть расщеплен протеазой, которая не присутствует в известных природных хозяевах вируса гриппа, где при расщеплении сохраняется глицин на N-конце HA2. Также описана нуклеиновая кислота, кодирующая эффективную часть белка HA указанного вируса гриппа. Также раскрыты соответствующий экспрессионный вектор и клетка-хозяин. Представлен способ приготовления вируса или вирусоподобной частицы (VLP), содержащих модифицированный белок HA. Описаны иммуногенные композиции, содержащие описанный модифицированный вирус гриппа или экспрессионный вектор. Изобретение расширяет арсенал средств борьбы с гриппом. 10 н. и 7 з.п. ф-лы, 8 ил., 2 табл., 7 пр.
1. Модифицированный вирус гриппа, где указанный вирус содержит белок HA гриппа, где его сайт расщепления при созревании (MCS) модифицирован так, что его не расщепляют никакие протеазы животных, но он может быть расщеплен протеазой, которая не присутствует в известных природных хозяевах вируса гриппа, где при расщеплении сохраняется глицин на N-конце HA2.
2. Модифицированный вирус гриппа по п. 1, где MCS модифицирован так, что он может быть расщеплен подходящей протеазой вируса гравировки табака (TEV), где весь MCS заменен сайтом расщепления TEV или несколько остатков MCS заменены сайтом расщепления TEV или только аргинин с N-конца от разрезаемой связи заменен сайтом расщепления TEV.
3. Модифицированный вирус гриппа по п. 1, где MCS расщеплен.
4. Модифицированный вирус гриппа по п. 3, где иммуногенный эпитоп, гетерологичный домену глобулярной головки белка HA, вставлен в иммунодоминантную область домена глобулярной головки белка HA или заменяет указанную область.
5. Модифицированный вирус гриппа по п. 4, где указанный гетерологичный иммуногенный эпитоп относится к опухолеассоциированному антигену или эпитопу вируса, отличного от вируса гриппа, или альтернативному эпитопу гриппа, и/или где более чем одна иммунодоминантная область указанного белка HA модифицирована так, что она содержит гетерологичный эпитоп.
6. Модифицированный вирус гриппа по п. 5, где указанный гетерологичный иммуногенный эпитоп представляет собой антигенный эпитоп стеблевого домена HA, распознаваемый нейтрализующим антителом широкого спектра (bNAb) против вирусов гриппа.
7. Нуклеиновая кислота, кодирующая эффективную часть белка HA гриппа, где нуклеотидная последовательность, кодирующая его MCS, содержит нуклеотидную последовательность, содержащую нуклеотидные положения 1026-1046 SEQ ID № 19, нуклеотидные положения 1029-1049 SEQ ID № 21, нуклеотидные положения 1035-1055 SEQ ID № 23, нуклеотидные положения 1032-1052 SEQ ID № 30, нуклеотидные положения 1053-1073 SEQ ID № 32, нуклеотидные положения 1056-1076 SEQ ID № 34, нуклеотидные положения 1041-1061 SEQ ID № 37, нуклеотидные положения 1047-1067 SEQ ID № 39, нуклеотидные положения 1050-1070 SEQ ID № 41, нуклеотидные положения 1053-1073 SEQ ID № 43, нуклеотидные положения 1038-1058 SEQ ID № 55 или нуклеотидные положения 1056-1076 SEQ ID № 62, и где его MCS модифицирован так, что его не расщепляют никакие протеазы животных, но он может быть расщеплен протеазой, которая не присутствует в известных природных хозяевах вируса гриппа, где при расщеплении сохраняется глицин на N-конце HA2.
8. Нуклеиновая кислота, кодирующая эффективную часть белка HA гриппа, где указанная нуклеиновая кислота содержит нуклеотидную последовательность, кодирующую аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID № 18, 20, 22, 29, 31, 33, 35, 38, 40, 42, 54 и 61, и где его MCS модифицирован так, что его не расщепляют никакие протеазы животных, но он может быть расщеплен протеазой, которая не присутствует в известных природных хозяевах вируса гриппа, где при расщеплении сохраняется глицин на N-конце HA2.
9. Экспрессионный вектор, содержащий последовательность нуклеиновой кислоты по п. 7 или 8.
10. Рекомбинантная клетка-хозяин, содержащая нуклеиновую кислоту по п. 7 или 8 или экспрессионный вектор по п. 9.
11. Способ приготовления вируса или вирусоподобной частицы (VLP), содержащих модифицированный белок HA, где указанный способ включает культивирование рекомбинантной клетки-хозяина по п. 10 в условиях, при которых экспрессируется указанная нуклеиновая кислота, и выделение вируса или VLP, содержащих по меньшей мере эффективную часть белка HA.
12. Иммуногенная композиция, содержащая модифицированный вирус гриппа по любому из пп. 1-6.
13. Иммуногенная композиция, содержащая экспрессионный вектор по п. 9.
14. Иммуногенная композиция по п. 12 или 13 для применения в способе генерирования антител против вирусов гриппа, где указанный способ включает введение указанной иммуногенной композиции субъекту.
15. Иммуногенная композиция по п. 12 или 13 для применения в способе генерирования антител против желаемого антигена, где указанный способ включает введение указанной иммуногенной композиции субъекту.
16. Вирус, приготовленный согласно способу по п. 11, содержащий белок HA гриппа, где его сайт расщепления при созревании (MCS) модифицирован так, что его не расщепляют никакие протеазы животных, но он может быть расщеплен протеазой, которая не присутствует в известных природных хозяевах вируса гриппа, где при расщеплении сохраняется глицин на N-конце HA2.
17. VLP, приготовленная согласно способу по п. 11, содержащая белок HA гриппа, где его сайт расщепления при созревании (MCS) модифицирован так, что его не расщепляют никакие протеазы животных, но он может быть расщеплен протеазой, которая не присутствует в известных природных хозяевах вируса гриппа, где при расщеплении сохраняется глицин на N-конце HA2.
US 5591823 A1, 07.01.1997 | |||
ИММУНОГЕННЫЙ ЭПИТОП ВИРУСА ГРИППА | 2009 |
|
RU2546872C2 |
Н.В | |||
КАВЕРИН, И.А | |||
РУДНЕВА и др., Антигенная структура гемагглютинина вируса гриппа А, ФГБУ "НИИ вирусологии им | |||
Д.И | |||
Ивановского" Минздравсоцразвития РФ, 2012, стр.149-158, найдено в нтернет 02.09.2021 |
Авторы
Даты
2022-03-31—Публикация
2017-02-02—Подача