ВАКЦИНЫ НА ОСНОВЕ ИНФОРМАЦИОННОЙ РНК ПРОТИВ ШИРОКОГО СПЕКТРА ВАРИАНТОВ КОРОНАВИРУСА Российский патент 2024 года по МПК A61K39/215 C07K14/05 C12N15/86 

Описание патента на изобретение RU2826172C2

Список последовательностей

Настоящая заявка содержит Перечень последовательностей, который представлен в электронном виде в формате ASCII и включен в настоящий документ путем отсылки во всей своей полноте. Копия ASCII, созданная 12 апреля 2022 года, называется «G4590-15000PCT_SeqListing_20220412» и имеет размер 111 килобайт.

Перекрестные ссылки на имеющие отношение заявки

Настоящая заявка претендует на все преимущества и приоритет предварительной заявки на патент США № 63/173,752, зарегистрированной 12 апреля 2021 г., и предварительной заявки на патент США № 63/264,737 зарегистрированной 1 декабря 2021 г., раскрытие которых включено в настоящий документ путем отсылки во всей своей полноте.

Область техники, к которой относится изобретение

Настоящее раскрытие в целом относится к области лечения и/или профилактики коронавирусной инфекции. В особенности, настоящее раскрытие относится к вакцинам на основе информационной РНК (мРНК) против широкого спектра вариантов коронавируса (CoV).

Уровень техники

В 1796 году Эдвард Дженнер создал первую в мире вакцину (коровьей оспы) для защиты от оспы и успешно спас миллионы людей. С тех пор вакцинация признана лучшим способом защиты от патогенов. С момента вспышки тяжелого острого респираторного синдрома коронавирус-2 (SARS-CoV-2) в декабре 2019 года, вызвавшего индуцированное коронавирусом заболевание 2019 (COVID-19), вирус распространился по всему миру и вызвал более 200 миллионов случаев инфицирования и 4 миллионов смертей за 20 месяцев. Эта пандемия стала серьезной угрозой для общественного здравоохранения.

Много усилий было направлено на разработку эффективных средств и вакцин для борьбы с этой пандемией. Трехмерный шиповидный белок (S) на поверхности вируса был ключевым иммуногеном и мишенью для разработки профилактических вакцин и терапевтических антител. По состоянию на декабрь 2020 года Управление по контролю качества пищевых продуктов и лекарственных средств США разрешило применять кандидатные мРНК-вакцины Pfizer/BioNTech и Moderna, а также антитела Regeneron в экстренных случаях; однако несколько других вакцин-кандидатов и человеческие антитела проходят клинические испытания, и некоторые из них, включая вакцины Oxford/Astrazeneca и J&J, близки к получению одобрения. Из различных вакцин, разработанных для контроля распространения SARS-CoV-2 и его вариантов, мРНК-вакцины, разработанные Moderna и BioNTech/Pfizer, представляют собой крупный прорыв благодаря их скорости и удобству. Эти вакцины были стабилизированы с помощью новой технологии мРНК и композиции липидных наночастиц (LNP) для доставки и трансляции в шиповидный белок (S) in vivo для индукции иммунного ответа (Ewen Callaway. COVID vaccine excitement builds as Moderna reports third positive result. Nature. 587 (7834):337-338 (2020); Polack P. et al. Safety and Efficacy of the BNT162b2 mRNA Covid-19 Vaccine. N Engl J Med. 383 (27):2603-2615 (2020)).

Однако, поскольку существует ряд вариантов, которые широко циркулируют в мире, и более инфекционные варианты, такие как варианты бета, дельта и омикрон, могут иметь повышенную способность повторно заражать людей, которые были вакцинированы ранее и/или выздоровели от инфекции более ранними версиями коронавируса, инфекции новыми вариантами SARS-CoV-2 могут продолжать происходить или потенциально увеличиваться по частоте. S-белок этого РНК-вируса сильно гликозилирован и часто мутирует с более чем 9 миллионами последовательностей и более чем 1000 сайтов мутации в его 1273 аминокислотных последовательностях, о чем сообщает GISAID (www.gisaid.org), включая легко передающиеся дельта и омикрон варианты, представляющие серьезную проблему в разработке широко эффективных антител и вакцин.

Соответственно, существует насущная потребность в более качественных вакцинах, а также в более качественных продуктах и способах для профилактики и лечения коронавирусных инфекций.

Раскрытие изобретения

Настоящее изобретение обеспечивает новую мРНК-вакцину против коронавируса, способы ее получения и применения. Новая вакцина разработана на основе технологии мРНК для удаления гликановых экранов шиповидного белка коронавируса (например, SARS-CoV-2), чтобы лучше обнажить консервативные области шиповидного белка. В мРНК-вакцине с шиповидным белком коронавируса делеция сайтов гликозилирования в рецептор-связывающем домене (RBD) или домене субъединицы 2 (S2) приводит к экспонированию высококонсервативных эпитопов и выработке антител и CD8 Т-клеточного ответа с более широкой защитой от альфа-, бета-, гамма, дельта, омикрон и различных вариантов по сравнению с немодифицированной мРНК. Представленная в настоящем документе мРНК-вакцина эффективна для индуцирования защитного иммунитета против SARS-CoV-2 и его вариантов (например, альфа, бета, гамма, дельта, омикрон). При применении по отдельности или в комбинации в качестве иммуногенной композиции или вакцины, мРНК-вакцина по настоящему изобретению может защищать людей от инфекции и/или уменьшать симптомы при инфицировании.

В одном аспекте настоящее изобретение обеспечивает, по меньшей мере, один иммуногенный пептид, включающий аминокислотную последовательность, выбранную из группы, состоящей из: TESIVRFPNITNL (SEQ ID NO:41), NITNLCPFGEVFNATR (SEQ ID NO:42), LYNSASFSTFK (SEQ ID NO:43), LDSKVGGNYN (SEQ ID NO:44), KSNLKPFERDIST (SEQ ID NO:45), KPFERDISTEIYQAG (SEQ ID NO:46), GPKKSTNLVKNKC (SEQ ID NO:47), NCDVVIGIVNNTVY (SEQ ID NO:48), PELDSFKEELDKYFK[N]HTS (SEQ ID NO:49), VNIQKEIDRLNEVA (SEQ ID NO:50), NLNESLIDLQ (SEQ ID NO:51) и LGKYEQYIKWP (SEQ ID NO:52) или аминокислотную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95% или 90% идентичности любой из последовательностей SEQ ID NOs: 41-52.

В некоторых воплощениях, иммуногенный пептид включает, по меньшей мере, аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 41-43 и 45-51. В некоторых воплощениях иммуногенный пептид включает, по меньшей мере, одну, две, три, четыре, пять, шесть, семь, восемь, девять, десять, одиннадцать или двенадцать аминокислот SEQ ID NO: 41-52. В некоторых воплощениях иммуногенный пептид включает, по меньшей мере, одну, две, три, четыре, пять, шесть, семь, восемь, девять, десять аминокислот SEQ ID NO:SEQ ID NO: 41-43 и 45-51.

В одном аспекте настоящее изобретение относится к молекуле модифицированной нуклеиновой кислоты, кодирующей модифицированный шиповидный белок, включающий одну или несколько аминокислотных замен в сиквонах N-связанного гликозилирования (N-X-S/T), где X представляет собой любой аминокислотный остаток, кроме пролина, и S/Т обозначает остаток серина или треонина.

В некоторых воплощениях, модифицированный шиповидный белок, описанный в настоящем документе, включает замену аспарагина (N) на глутамин (Q) в сиквонах N-связанного гликозилирования (N-X-S/T) для удаления сиквонов N-связанного гликана.

В некоторых воплощениях, модифицированный шиповидный белок, описанный в настоящем документе, включает замену одной или нескольких аминокислот в сиквонах N-связанного гликозилирования (N-X-S/T) для удаления сиквонов N-связанного гликана.

В некоторых воплощениях, модифицированный шиповидный белок, описанный в настоящем документе, включает одну или несколько аминокислотных замен S/T в O-связанных сайтах гликозилирования для устранения O-связанных сайтов гликозилирования. Один из примеров представляет собой замену S/T на аланин (А).

В одном воплощении, модифицированная молекула нуклеиновой кислоты представляет собой мРНК или двухцепочечную или одноцепочечную ДНК.

В одном воплощении, модифицированный шиповидный белок получают из шиповидного белка SARS-CoV-2. Шиповидный белок SARS-CoV-2, описанный в настоящем документе, включает аминокислотную последовательность SEQ ID NO: 2, 16, 18 или 20 или аминокислотную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности аминокислотной последовательности SEQ ID NO: 2, 16, 18 или 20.

В некоторых воплощениях, молекула нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 2, 16, 18 или 20, представляет собой мРНК, включающую нуклеотидную последовательность SEQ ID NO: 1, 15, 17 или 19, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, приблизительно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности нуклеотидной последовательности SEQ ID NO: 1, 15, 17 или 19, соответственно.

В некоторых воплощениях, модифицированный шиповидный белок, описанный в настоящем документе, включает аминокислотную последовательность SEQ ID NO: 4, 22, 24 или 26, в которой модифицированный шиповидный белок включает домен связывания рецептора (RBD), в котором отсутствуют сайты гликозилирования. Молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 4, 22, 24 или 26, включает нуклеотидную последовательность SEQ ID NO: 3, 21, 23 или 25, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности нуклеотидной последовательности SEQ ID NO: 3, 21, 23 или 25, соответственно.

В некоторых воплощениях, модифицированный шиповидный белок, описанный в настоящем документе, включает аминокислотную последовательность SEQ ID NO: 6, 28, 30 или 32, в которой модифицированный шиповидный белок включает субъединицу S2, лишенную сайтов гликозилирования. Молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 6, 28, 30 или 32, включает нуклеотидную последовательность SEQ ID NO: 5, 27, 29 или 31, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности нуклеотидной последовательности SEQ ID NO: 527, 29 или 31, соответственно.

В некоторых воплощениях, модифицированный шиповидный белок, описанный в настоящем документе, включает аминокислотную последовательность SEQ ID NO: 8 или 34, в которой модифицированный шиповидный белок включает субъединицу S2, которая состоит из одного сайта гликозилирования. В некоторых воплощениях единственный сайт гликозилирования находится в положении N1194. В некоторых воплощениях молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 8 или 34, включает нуклеотидную последовательность SEQ ID NO: 7 или 33, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичность нуклеотидной последовательности SEQ ID NO: 7 или 33, соответственно.

В некоторых воплощениях, модифицированный шиповидный белок, описанный в настоящем документе, включает аминокислотную последовательность SEQ ID NO: 10 или 36, в которой модифицированный шиповидный белок включает домен связывания рецептора (RBD), в котором отсутствуют сайты гликозилирования, и аминокислотную замену N801 на Q801. Молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 10 или 36, включает нуклеотидную последовательность SEQ ID NO: 9 или 35, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности нуклеотидной последовательности SEQ ID NO: 9 или 35 соответственно.

В некоторых воплощениях, модифицированный шиповидный белок, описанный в настоящем документе, включает аминокислотную последовательность SEQ ID NO: 12 или 38, в которой модифицированный шиповидный белок включает домен связывания рецептора (RBD), в котором отсутствуют сайты гликозилирования, и аминокислотную замену N1194 на Q1194. Молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 12 или 38, включает нуклеотидную последовательность SEQ ID NO: 11 или 37, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности нуклеотидной последовательности SEQ ID NO: 11 или 37, соответственно.

В некоторых воплощениях, модифицированный шиповидный белок, описанный в настоящем документе, включает аминокислотную последовательность SEQ ID NO: 14 или 40, в которой модифицированный шиповидный белок включает модифицированный домен связывания рецептора (RBD), лишенный сайтов гликозилирования, и аминокислотные замены N122 на Q122, N165 на Q165 и N234 на Q234. Молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 14 или 40, включает нуклеотидную последовательность SEQ ID NO: 13 или 39, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности нуклеотидной последовательности SEQ ID NO: 13 или 39 соответственно.

В некоторых воплощениях, описанный в настоящем документе модифицированный шиповидный белок включает субъединицу S1, в которой отсутствуют сайты гликозилирования.

В некоторых воплощениях, описанный в настоящем документе модифицированный шиповидный белок включает как субъединицу S1, так и S2, в которых отсутствуют сайты гликозилирования.

Настоящее изобретение относится к мРНК-вакцине шиповидного белка коронавируса с делецией сайтов гликозилирования в рецептор-связывающем домене (RBD) или домене субъединицы 2 (S2) для экспонирования высококонсервативных эпитопов и индукции антител и Т-клеточного ответа CD8 с более широкой защитой от альфа, бета, гамма, дельта, омикрон и различных вариантов по сравнению с немодифицированной мРНК.

В некоторых воплощениях, вакцина против коронавируса включает мРНК шиповидного белка коронавируса с одной или несколькими мутациями сайтов гликозилирования в RBD или S2 или других доменах с одной или несколькими заменами N на Q или S/T на A, или их комбинацией. В другом воплощении мутация сайтов N-гликозилирования заключается в изменении предполагаемой последовательности N-X-S/T на Q-X-S/T и/или изменении S/T на A в сайте О-гликозилирования.

В некоторых воплощениях, мРНК, описанные в настоящем документе, имеющие сайты гликозилирования с заменой N на Q, включают S-(deg-RBD) (белок S, в котором все 2 N-сайты гликозилирования в RBD мутированы с N на Q, а 2 O-сайты гликозилирования мутированы с S/T на A), S-(deg-S2) (белок S со всеми 9 сайтами гликозилирования в S2, мутированными с N на Q), S-(deg-S2-1194) (белок S с 8 сайтами гликозилирования в S2, мутировавшими с N на Q, кроме сайта гликозилирования 1194), S-(deg-RBD-801) (белок S, в котором все 2 N-сайты гликозилирования в RBD мутированы с N на Q, а 2 O-сайты гликозилирования мутированы с S/T на A, а сайт гликозилирования 801 мутирован с N на Q), S-(deg-RBD-1194) (белок S со всеми 2 N-сайтами гликозилирования в RBD, мутированными с N на Q, и 2 сайта О-гликозилирования, мутированными с S/T на A, и сайт гликозилирования 1194, мутированный с N на Q), и S-(deg-RBD-122-165-234) (S-белок со всеми 2 N-сайтами гликозилирования в RBD, мутированными с N на Q, и 2 сайта О-гликозилированиями, мутированными с S/T на A, и сайтами гликозилирования 122, 165 и 234, мутированными от N до Q).

В одном воплощении, иммунизация типовой коронавирусной вакциной по настоящему изобретению, как описана в настоящем документе, приводит к накоплению неправильно свернутого белка S в эндоплазматическом ретикулуме. В одном из случаев иммунизация типовой коронавирусной вакциной по настоящему изобретению, как описана в настоящем документе, вызывает активацию BiP/GRP78, XBP1 и p-eIF2α, вызывающую апоптоз клеток и CD8+ T-клеточный ответ. В одном из случаев иммунизация коронавирусной вакциной по настоящему изобретению, как описано в настоящем документе, может повышать экспрессию главного комплекса гистосовместимости класса I (MHC I).

В некоторых воплощениях, типовые CoV, описанные в настоящем документе, включают, но не ограничиваются ими, SARS-CoV, MERS-CoV и SARS-CoV-2. SARS-CoV2, бета-SARS-CoV2, гамма-SARS-CoV2, дельта-SARS-CoV2 и омикрон-SARS-CoV2 и их варианты.

В некоторых воплощениях, настоящее изобретение относится к линейной ДНК, включающей промотор, 5'-нетранслируемую область, 3'-нетранслируемую область, экспрессионную плазмиду с S-2P или без него и сигнальную последовательность поли(А)-хвоста, в которой предполагаемая последовательность N-X-S/T заменена на Q-X-S/T, а сайт О-гликозилирования был заменен с S/T на A на экспрессионной плазмиде.

В некоторых воплощениях, экспрессионная плазмида S-2P включает ген S вируса SARS-CoV-2, кодирующий S в состоянии до слияния с заменами пролина K968 и V969.

В некоторых воплощениях, настоящее изобретение обеспечивает мРНК, полученную путем трансляции in vitro из вышеупомянутой ДНК.

В другом аспекте, настоящее изобретение обеспечивает вектор, включающий модифицированную молекулу нуклеиновой кислоты, описанную выше.

В другом аспекте, настоящее изобретение относится к клетке-хозяину, включающей модифицированную молекулу нуклеиновой кислоты, описанную выше.

В другом аспекте, настоящее изобретение обеспечивает модифицированный шиповидный белок, описанный выше.

В другом аспекте, в настоящем изобретении предложен способ доставки мРНК для продукции белка in vivo, включающий: введение субъекту композиции, включающей мРНК по изобретению, которая кодирует белок, в котором мРНК инкапсулирована в липидную наночастицу, и в котором введение композиции приводит к экспрессии белка, кодируемого мРНК.

В некоторых воплощениях, описанная в настоящем документе мРНК может быть применена в качестве вакцины либо отдельно, либо в комбинации с другими вакцинами. Соответственно, настоящее изобретение обеспечивает комбинированную вакцину, включающую мРНК-вакцину по настоящему изобретению и одну или несколько дополнительных вакцин. Дополнительная вакцина выбрана из одной или нескольких вакцин против COVID-19, вакцины против гриппа, адвеновирусной вакцины, вакцины против сибирской язвы, вакцины против холеры, вакцины против дифтерии, вакцины против гепатита А или В, вакцины против HPV, вакцины против кори, вакцины против эпидемического паротита, вакцины против оспы, ротавирусной вакцины, противотуберкулезной вакцины, пневмококковой вакцины и вакцины против Haemophilus influenzae типа b и любой их комбинации.

В другом аспекте, настоящее изобретение обеспечивает наночастицу на основе гуанидина, применяемую в качестве носителя для доставки модифицированной молекулы нуклеиновой кислоты по любому из пп. 1-25 субъекту. В одном воплощении наночастица представляет собой липосому или полимерсому.

В другом аспекте, настоящее изобретение обеспечивает нанокластер мРНК, включающий мРНК-вакцину, описанную в настоящем документе, в составе липидных наночастиц. В одном воплощении липидная наночастица представляет собой биоразлагаемую липидную наночастицу.

В некоторых воплощениях, липидная наночастица, как описана в настоящем документе, представляет собой полимеры на основе гуанидина. В одном воплощении настоящее изобретение относится к нанокластеру мРНК, включающему липидные наночастицы, инкапсулированные с мРНК-вакциной, описанной в настоящем документе, при этом липидная наночастица включает полимерные звенья на основе гуанидина, где гуанидиновые, а также цвиттерионные группы полимера присоединяются к липидному хвосту полимера, и где полимеры на основе гуанидина прикрепляются к мРНК, тем самым образуя солевые мостики между гуанидиновыми группами и фосфатами в мРНК. Примеры полимеров на основе гуанидина включают, но не ограничиваются ими, P1, P2, P3, Pb и Pz, как показано ниже.

, , , и , в которых R представляет собой .

В некоторых воплощениях, полимер на основе гуанидина образует сополимер, такой как сополимер P1/P3, сополимер P2/P3, сополимер P1/Pb, сополимер P2/Pb, сополимер P1/Pz и сополимер P2/Pz.

В некоторых воплощениях, наночастицы на основе гуанидина и цвиттерионных липидов включают смесь P1 и/или P2 и Pz,,, , в которых R представляет собой или .

В некоторых воплощениях, нанокластер мРНК, описанный в настоящем документе, имеет отношение наночастица/мРНК (N/P), равное примерно 1, примерно 2, примерно 3, примерно 4, примерно 5, примерно 6, примерно 7, примерно 8, примерно 9, примерно 10, примерно 15, примерно 20, примерно 30, примерно 40, примерно 50 или примерно 100.

В некоторых воплощениях, нанокластер мРНК, описанный в настоящем документе, имеет соотношение наночастиц/мРНК (N/P), равное примерно 10 или примерно 20.

В некоторых воплощениях, настоящее изобретение относится к композиции наночастиц/нанокластеров, включающей наночастицы, присоединенные к вакцине против коронавируса согласно настоящему изобретению. В одном воплощении наночастица представляет собой липидную наночастицу, полимерную наночастицу, неорганическую наночастицу, такую как наночастица золота, липосому, иммуностимулирующий комплекс, вирусоподобную частицу или самособирающийся белок. В другом воплощении наночастица представляет собой липидную наночастицу (LNP).

В некоторых воплощениях, настоящее изобретение относится к вакцинной композиции, включающей мРНК-вакцину, нанокластер/нанокластер мРНК или композицию наночастиц, как описано в настоящем документе.

В некоторых воплощениях, настоящее изобретение относится к антителам и CD8+ Т-клеткам, индуцированным вакциной, описанной в настоящем документе, которые обладают более широкой защитой от альфа-, бета-, гамма-, дельта- и омикронных вариантов.

В некоторых воплощениях, в настоящем изобретении предложен способ иммунизации субъекта, включающий введение композиции вакцины, описанной в настоящем документе. В настоящем изобретении также предложен способ профилактики или лечения коронавирусной инфекции, включающий введение эффективного количества мРНК-вакцины, нанокластера мРНК или наночастицы мРНК или вакцинной композиции, как описаны в настоящем документе, субъекту, инфицированному или подверженному риску заражения коронавирусом. В одном воплощении мРНК-вакцина, нанокластер мРНК или наночастица мРНК или вакцинная композиция, как описаны в настоящем документе, могут быть применены в способе усиления адаптивного иммунного ответа.

В некоторых воплощениях, РНК-вакцину, нанокластер мРНК или наночастицу мРНК или вакцинную композицию, как описаны в настоящем документе, вводят в виде начальной дозы и двух, трех или четырех бустерных доз. В некоторых воплощениях мРНК-вакцину, нанокластер мРНК или наночастицу мРНК или вакцинную композицию вводят в начальной дозе и, по меньшей мере, в одной бустерной дозе в течение примерно одного месяца, примерно двух месяцев, примерно трех месяцев, примерно четырех месяцев, примерно пяти месяцев или примерно через шесть месяцев после первоначальной дозы. В некоторых воплощениях обеспечиваемую композицию вводят во второй бустерной дозе приблизительно через шесть месяцев, приблизительно через семь месяцев, приблизительно через восемь месяцев, приблизительно через девять месяцев, приблизительно через десять месяцев, приблизительно через одиннадцать месяцев или приблизительно через год после введения начальной дозы.

В некоторых воплощениях, мРНК-вакцину, нанокластер мРНК или наночастицу мРНК или вакцинную композицию вводят в виде одной или нескольких доз. В одном воплощении доза может включать или исключать от 5 мкг до 50 мкг мРНК. В некоторых воплощениях доза составляет примерно 5 мкг, 10 мкг, 15 мкг, 20 мкг, 25 мкг, 30 мкг, 35 мкг, 40 мкг, 45 мкг или 50 мкг.

В некоторых воплощениях, мРНК-вакцину, нанокластер мРНК или наночастицу мРНК или вакцинную композицию вводят внутривенно, внутримышечно, внутрикожно или подкожно, или путем инфузии или назального спрея.

В некоторых воплощениях, в настоящем изобретении предложен способ получения вакцин и антител с широким спектром защиты против SARS-CoV-2. В одном воплощении способ включает создание вакцины с применением РНК или ДНК нативного S-белка или S-белка, полученного с помощью гликоинженерии, тогда как белок, экспрессируемый в антиген-презентирующих клетках, включая свернутые или развернутые формы, обрабатывается и презентируется Т-клеткам.

Эти и другие аспекты станут очевидными из следующего описания предпочтительного воплощения, взятого в сочетании со следующими чертежами, хотя возможны изменения и модификации, не отступающие от сущности и объема новых концепций раскрытия.

Краткое описание чертежей

Следующие чертежи составляют часть настоящего описания и включены для дополнительной демонстрации определенных аспектов настоящего раскрытия, изобретения которого можно лучше понять, обратившись к одному или нескольким из этих чертежей в сочетании с подробным описанием конкретных воплощений, представленных в настоящем документе.

Фиг. 1. Консервативные эпитопы вариантов S-белка, 10 из которых экранированы гликанами.

Фиг. 2. Идентификация N- и O-сайтов гликозилирования и мутаций в вариантах. Все 24 сайта гликозилирования высококонсервативны среди 6 миллионов последовательностей белков S.

Фиг. 3. Анализ экспрессии белка S после трансфекции мРНК через 48 часов с помощью вестерн-блоттинга. Фильтр исследовали с помощью моноклональных антител против S и против β-актина.

Фиг. 4A-4F. Гуморальный иммунный ответ у мышей BALB/c был показан как титр в сыворотке крови конечной точки IgG, специфичного к белку анти-S WT (A), S2 (B), RBD (C), дегликозилированного S (D), дегликозилированного S2 (E) и дегликозилированного белка RBD (F), полученный с помощью ELISA. Среднее ± SD для пяти независимых экспериментов. *P < 0,001.

Фиг. 5А-5D. Гликозилирование регулировало специфичность индуцированных антител и влияло на степень защиты мРНК-вакцины. Конечная точка определенного с помощью ELISA титра антител IgG, специфичных к альфа (А), бета (В), гамма (С) и дельта (D) S-белку. Среднее ± SD для пяти независимых экспериментов. *P < 0,001, **P < 0,05.

Фиг. 6А-6F. Кривые нейтрализации вариантов псевдовируса показаны в WT (A), альфа (B), бета (C), гамма (D), дельта (E) и омикрон (F). Среднее ± SD для пяти независимых экспериментов. *P < 0,001, **P < 0,05.

Фиг. 7A-7E. Гликозилирование влияло на ответ CD8+ T-клеток. Спленоциты, выделенные из иммунизированных мышей, инкубировали с пулами полноразмерных пептидов WT S (A), RBD (B) и S2 (C), затем измеряли GrzB-секретирующие клетки с помощью Elispot. CD4+ (D) и CD8+ (E) Т-клетки выделяли и инкубировали с дендритными клетками костного мозга и пулом полноразмерных пептидов WTS для измерения IFNγ-секретирующих Т-клеток с помощью проточной цитометрии. (A-E) Среднее ± SD для пяти независимых экспериментов. *P < 0,001.

Фиг. 8A-8F. Гликозилирование влияет на продукцию цитокинов. После инкубации спленоцитов, выделенных из мышей, иммунизированных мРНК-вакциной, с пулом полноразмерных пептидов WTS S, определяли (A) IFNγ, (B) IL-2, (C) IL-4, (D) IL-6, (E) IL-12 и (F) IL-13. (A-F) Среднее ± SD для пяти независимых экспериментов. *P < 0,001, **P < 0,05.

Фиг. 9. Делеция сайтов гликозилирования в мРНК с образованием дегликозилированного S-белка и реакция развернутого белка. Анализ экспрессии дегликозилированного белка S с помощью клеток HEK293T, трансфицированных плазмидами и обработкой MG132, с помощью вестерн-блоттинга. Фильтр анализировали с помощью моноклональных антител против S и против GAPDH.

Фиг. 10. In vitro транслированные дегликозилированные варианты S в разное время инкубации, как показано на фигуре, контролировали с помощью ELISA. Среднее ± SD для трех независимых экспериментов. *P < 0,001.

Фиг. 11A-11C. После того как клетки HEK293 трансфицировали мРНК-вакциной через 48 часов, выделяли плазматическую мембрану (A), цитозоль (без ER) (B) и ER (C) для анализа количества белка S с помощью вестерн-блоттинга. Фильтр анализировали с помощью моноклональных антител против S, против Na/K-АТФазы, против SERCA2 и против GAPDH.

Фиг. 12. Анализ маркерных белков UPR BiP/GRP78, XBP1 и p-eIF2α с помощью вестерн-блоттинга после трансфекции клеток HEK293 мРНК-вакциной дегликозилированных вариантов белка S через 48 часов. Фильтр анализировали с помощью моноклональных антител анти-BiP, анти-XBP1, анти-p-eIF2α и анти-β-актин.

Фиг. 13. Для анализа апоптотических клеток с помощью анализа APO-BrdU TUNEL после того, как клетки HEK293 были трансфицированы мРНК-вакциной в разное время, как показано на рисунке. Среднее ± SD для трех независимых экспериментов. *P < 0,001.

Фиг. 14. Анализ экспрессии MHC I с помощью проточной цитометрии DC после инкубации с вариантами мРНК-вакцин. Среднее ± SD для трех независимых экспериментов. *P < 0,001.

Фиг. 15A-15G. Схематическое изображение шиповидного белка SARS-CoV-2 и конструкции вакцины: WT (A); S-(deg-RBD) (B); S-(deg-S2) (C); S-(deg-S2-1194) (D); S-(deg-RBD-801) (E); S-(deg-RBD-1194) (F); S-(deg-RBD-122-165-234) (G). NTD, N-концевой домен (14-305 остатков). RBD, рецептор-связывающий домен (319-541 остатков). FP, слитый пептид (788-806 остатков). HR1, последовательность 1 гептапептидного повтора (912-984 остатка). HR2, последовательность 2 гептапептидного повтора (1163-1213 остатков). TM, трансмембранный домен (1213-1237 остатков). CT, цитоплазматический домен (1237-1273 остатка). субъединица S2 (686-1273 остатка). 2P, (K986P и V987P). Ψ - сайт N-гликозилирования; ϕ - сайт O-гликозилирования.

Фиг. 16. Гликозилирование S2 регулировало секрецию растворимого шиповидного белка SARS-CoV-2 перед слиянием. После того как клетки HEK293 трансфицировали мРНК-вакциной, которая кодировала растворимую версию варианта S до слияния, местоположение S определяли вестерн-блоттингом. Фильтр анализировали с помощью моноклональных антител против S и против GAPDH.

Фиг. 17. мРНК-вакцина влияла на экспрессию MHC II на DC. Анализ экспрессии MHC II с помощью проточной цитометрии DC после инкубации с вариантами мРНК-вакцин. Среднее ± SD для трех независимых экспериментов. *P < 0,001.

Фиг. 18A-18C. Характеристика иммунного ответа на мРНК-вакцину с делецией специфического сайта гликозилирования в S. Гуморальный иммунный ответ у мышей BALB/c был продемонстрирован как белок-специфический титр IgG из сыворотки против S WT (A), RBD (B) и дегликозилированного RBD (C), проанализированный с помощью ELISA.

Фиг. 19A-19E. Характеристика иммунного ответа на мРНК-вакцину с делецией специфического сайта гликозилирования в S. Кривые нейтрализации вариантов псевдовируса показаны с WT (A), альфа (B), бета (C), гамма (D) и дельта (E).

Фиг. 20A-20B. Характеристика иммунного ответа на мРНК-вакцину с делецией специфического сайта гликозилирования в S. (A) После инкубации спленоцитов, выделенных от иммунизированных мышей, с пулами полноразмерных пептидов WTS, GrzB-секретирующие клетки измеряли с помощью Elispot. (B) CD8+ Т-клетки от иммунизированных мышей выделяли и инкубировали с DC костного мозга и пулом полноразмерных пептидов WTS для измерения IFNγ-секретирующих Т-клеток с помощью проточной цитометрии. (A-J) Среднее ± SD для пяти независимых экспериментов. *P < 0,001.

Фиг. 21A и 21B. Уровень экспрессии белка с делецией специфического сайта гликозилирования в S. (A) Анализ экспрессии различных белков S с помощью клеток HEK293T, трансфицированных плазмидами, и обработки MG132 с помощью вестерн-блоттинга. (B) Анализ экспрессии белка S в клетках HEK293T после трансфекции мРНК-LNP через 48 часов с помощью вестерн-блоттинга. Фильтр анализировали с помощью моноклональных антител против S и против GAPDH.

Фиг. 22A-22C. Характеристика иммунного ответа на мРНК-вакцину с делецией специфического сайта гликозилирования в S. После инкубации спленоцитов, выделенных от иммунизированных мышей, с пулами пептидов RBD (A) и S2 (B), GrzB-секретирующие клетки измеряли с помощью Elispot. (C) CD4+ T-клетки выделяли из иммунизированных мышей и инкубировали с DC костного мозга и пулом полноразмерных пептидов WTS для измерения IFNγ-секретирующих T-клеток с помощью проточной цитометрии. (A-C) Среднее ± SD для пяти независимых экспериментов. *P < 0,001.

Фиг. 23. Пропагатор P1, содержащий гуанидиновые группы, и мультивалентный дисплейный пропагатор P2 облегчают сцепление мРНК с полимерами за счет образования прочных солевых мостиков между гуанидинами и фосфатами в мРНК.

Фиг. 24. Разработанная структура инициаторов (I0), пропагаторов (P1, P2, Pb, P3, Pz) и процесс полимерной реакции.

Фиг. 25A и 25B. (A) Анализ электрофореза сополимеров с мРНК GFP в агарозном геле при соотношении N/P = 10. (B) Размер частиц комплексов мРНК, визуализированный с помощью TEM.

Фиг. 26A-26C. Флуоресцентное изображение GFP-экспрессии мРНК GFP, трансфицированной поли(дисульфидами) в клетках HEK293T. (A) мРНК GFP в комплексе с P1, P3, P1/P3 и PEI в соотношении N/P = 10 (B) мРНК GFP в комплексе с P1/P3, P2/P3, P1/Pb и P2/Pb P1/Pz в соотношении N/P = 10 (C) мРНК GFP в комплексе с различным соотношением N/P.

Фиг. 27. Анализ электрофореза в агарозном геле комплексов мРНК шиповидного белка-полимер при различных соотношениях N/P.

Фиг. 28. Хемилюминесцентная визуализация экспрессии шиповидного белка, опосредованной комплексами мРНК шиповидного белка-полимер в клетках HEK293T.

Фиг. 29. Анализ клеточной жизнеспособности клеток HEK293T после обработки различными количествами комплексов полиГу/мРНК шиповидного белка. Соотношение варьировали от 0,01 до 1. Планка погрешности представляет собой стандартную ошибку (среднее ± S.D., n=3).

Осуществление изобретения

Термины, применяемые в этом описании, обычно имеют свои обычные значения в данной области техники, в контексте изобретения и в конкретном контексте, в котором применяют каждый термин. Определенные термины, которые применяют для описания изобретения, обсуждаются ниже или в другом месте описания, чтобы обеспечить практикующему врачу дополнительные указания относительно описания изобретения. Для удобства некоторые термины могут быть выделены, например, курсивом и/или кавычками. Применение выделения не влияет на объем и значение термина; объем и значение термина остаются теми же в одном и том же контексте, независимо от того, выделен он или нет. Следует понимать, что одно и то же можно сказать более чем одним способом. Следовательно, для любого одного или нескольких обсуждаемых в настоящем документе терминов могут применяться альтернативные формулировки и синонимы, и не следует придавать особого значения тому, разрабатывается или обсуждается ли термин в данном документе. Обеспечены синонимы к некоторым терминам. Упоминание одного или нескольких синонимов не исключает применения других синонимов. Применение примеров в любом месте данного описания, включая примеры любых обсуждаемых в настоящем документе терминов, носит исключительно иллюстративный характер и никоим образом не ограничивает объем и значение изобретения или любого приведенного в качестве примера термина. Точно так же изобретение не ограничено различными воплощениями, приведенными в данном описании.

Следует отметить, что термины в единственном числе, применяемые в данном описании и прилагаемой формуле изобретения, охватывают и множественное число, если содержание явно не требует иного.

Как применены в настоящем документе, термины «шиповидный белок» и «шиповидный гликопротеин» и «шиповидный белок коронавируса» применяют как взаимозаменяемые.

Как применены в настоящем документе, термины «дикого типа (нативный) шиповидный белок коронавируса», «дикого типа (нативный) шиповидный гликопротеин коронавируса», «дикого типа (нативный)шиповидный гликопротеин» и «дикого типа (нативный)шиповидный белок» применяют взаимозаменяемо.

Как применены в настоящем документе, термины «лечить», «лечение» и «проведение лечения» относятся к подходу для получения полезных или желаемых результатов, например, клинических результатов. Для целей настоящего описания благоприятные или желаемые результаты могут включать ингибирование или подавление возникновения или прогрессирования инфекции или заболевания; облегчение или уменьшение развития симптомов инфекции или заболевания; или их комбинация.

Как применены в настоящем документе, термины «предупреждение» и «превенция» применяют взаимозаменяемо с термином «профилактика», и они могут означать полное предотвращение инфекции или предотвращение развития симптомов этой инфекции; задержку начала инфекции или ее симптомов; или уменьшение тяжести впоследствии развившейся инфекции или ее симптомов.

Как применено в настоящем документе, «эффективное количество» относится к количеству иммуногена, достаточному для индукции иммунного ответа, который уменьшает, по меньшей мере, один симптом патогенной инфекции. Эффективную дозу или эффективное количество можно определить, например, путем измерения количества нейтрализующих секреторных и/или сывороточных антител, например, путем нейтрализации бляшек, фиксации комплемента, твердофазного иммуноферментного анализа (ELISA) или анализа микронейтрализации.

Как применен в настоящем документе, термин «вакцина» относится к иммуногенному средству (с адъювантом или без него), такому как иммуноген, полученный из коронавируса, который применяют для индукции иммунного ответа против коронавируса, который обеспечивает защитный иммунитет (например, иммунитет, который защищает субъекта против заражения коронавирусом и/или уменьшает тяжесть состояния, вызванного заражением коронавирусом). Защитный иммунный ответ может включать образование антител и/или клеточно-опосредованный ответ. В зависимости от контекста термин «вакцина» может также относиться к суспензии или раствору иммуногена, который вводят субъекту для выработки защитного иммунитета.

Как применен в настоящем документе, термин «субъект» включает людей и других животных. Как правило, субъект представляет собой человека. Например, субъект может представлять собой взрослого, подростка, ребенка (от 2 до 14 лет), младенца (от рождения до 2 лет) или новорожденного (до 2 месяцев). В конкретных аспектах возраст субъекта составляет до 4-х месяцев или до 6-ти месяцев. В некоторых аспектах взрослые представляют собой пожилых людей в возрасте примерно 65 лет или старше или примерно 60 лет или старше. В некоторых аспектах субъект представляет собой беременную женщину или женщину, намеревающуюся забеременеть. В других аспектах субъект не представляет собой человека; например, субъект представляет собой примата, не являющегося человеком; например, павиана, шимпанзе, гориллу или макаку. В некоторых аспектах субъект может представлять собой домашнее животное, такое как собака или кошка.

Как применен в настоящем документе, термин «фармацевтически приемлемый» означает, что он одобрен регулирующим органом федерального правительства США или правительства штата или включен в фармакопею США, Европейскую фармакопею или другую общепризнанную фармакопею для применения у млекопитающих и, более конкретно, у людей. Эти композиции могут быть применены в качестве вакцин и/или антигенных композиций для индуцирования защитного иммунного ответа у позвоночных.

Вспышка SARS-CoV-2, вызывающая COVID-19, привела к глобальной пандемии. Текущее клиническое ведение инфекции SARS-CoV-2 включает профилактику, меры контроля и поддерживающую помощь. Чтобы сдержать текущую пандемию и возможные повторения в будущем, важно лучше понять этот вирус и разработать методы быстрой диагностики, терапевтические методы лечения и профилактические вакцины для борьбы с такими опасными патогенами. Большая часть усилий по разработке вакцины и антител в основном сосредоточена на сильно гликозилированном S-белке SARS-CoV-2, важном посреднике проникновения вируса в клетку-хозяин путем связывания с рецептором ангиотензинпревращающего фермента 2 (ACE2) на поверхности клетки-хозяина. Как и многие другие вирусные слитые белки, S-белок SARS-CoV-2 использует гликановую оболочку для защиты остова S-белка как в конформации до слияния, так и после слияния и уклоняется от иммунного ответа хозяина. Однако до сих пор неизвестно, как посттрансляционная модификация влияет на транслируемый иммуноген после вакцинации мРНК, и среди событий посттрансляционной модификации гликозилирование играет важную роль в регуляции фолдинга, структуры и функции белка. Настоящее раскрытие направлено на разработку моно-GlcNAc-декорированных и сконструированных с помощью сайтов гликозилирования (удаление несущественного сайта гликозилирования с помощью обратной генетики для замены Asn на Gln) вариантов полноразмерного белка S и его субъединиц, включая S1 или S2, и домен RBD в качестве вакцин-кандидатов для исследований иммунизации с целью получения антиген-специфических нейтрализующих антител.

Считается, что разработка инновационных стратегий и защитных вакцин в широком смысле для борьбы с CoV-инфекцией может привести к важным открытиям, имеющим медицинское значение, но не подчеркивалось иное. Принципы и стратегии, разработанные в настоящем описании, обеспечивают универсальные вакцины на основе коронавирусной мРНК против различных CoV и их вариантов.

Иммуногенный пептид, полученный из шиповидного белка коронавируса

На сегодняшний день известно более 8 миллионов последовательностей белка S с более чем 1000 участками мутации в его 1273 аминокислотных последовательностях, включая высококонтагиозный мутант D614G, а также мутант из Великобритании и Южной Африки. Кроме того, все сайты гликозилирования на S-белке высококонсервативны, а консервативные пептидные эпитопы на S-белке в значительной степени экранированы гликанами. Это представляет серьезную проблему в разработке широко эффективных антител и вакцин для борьбы с новыми вирусными штаммами. В настоящем изобретении разработана более эффективная стратегия конструирования вакцины с применением S-белка со сконструированным гликозилированием в качестве иммуногенов для лучшего экспонирования высококонсервативных эпитопов для конструирования вакцины, чтобы вызывать широкие защитные иммунные ответы.

Настоящее раскрытие показало, что удаление гликановых экранов на вирусных поверхностных гликопротеинах для воздействия на более консервативные эпитопы представляет собой очень эффективный подход к разработке вакцины против SARS-CoV-2. Поскольку один остаток GlcNAc, связанный с Asn, представляет собой минимальный компонент N-гликана, необходимого для сворачивания и стабилизации гликопротеина, предполагается, что обрезка N-гликанов, чтобы оставить один GlcNAc на S-белке SARS-CoV-2, не повлияет его складывание, но будет способствовать максимальному раскрытию белкового остова, чтобы вызвать сильный и специфичный к белку иммунный ответ при сохранении его структурной целостности.

Путем удаления гликановых экранов на шиповидном белке SARS-CoV-2 настоящее изобретение обеспечивает иммуногенный пептид, включающий, по меньшей мере, одну аминокислотную последовательность, выбранную из группы, состоящей из: TESIVRFPNITNL (SEQ ID NO:41), NITNLCPFGEVFNATR (SEQ ID NO:42), LYNSASFSTFK (SEQ ID NO:43), LDSKVGGNYN (SEQ ID NO:44), KSNLKPFERDIST (SEQ ID NO:45), KPFERDISTEIYQAG (SEQ ID NO:46), GPKKSTNLVKNKC (SEQ ID NO:47), NCDVVIGIV[N]NTVY (SEQ ID NO:48), PELDSFKEELDKYFK[N]HTS (SEQ ID NO:49), VNIQKEIDRLNEVA (SEQ ID NO:50), NL[N]ESLIDLQ (SEQ ID NO:51) и LGKYEQYIKWP (SEQ ID NO:52) или аминокислотной последовательности, имеющей, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95% или 90% идентичности любой из SEQ ID NO: 41-52.

В некоторых воплощениях, иммуногенный пептид включает, по меньшей мере, одну аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 41-43 и 45-51.

Аминокислотная последовательность SEQ ID NO: 41-52, по отдельности или в комбинации, может быть применена в качестве антигена(антигенов), способного(способных) стимулировать иммунный ответ против коронавирусов.

Обычные способы, например, химический синтез или рекомбинантная технология, могут быть применены для получения иммуногенного пептида, как описано в настоящем документе.

Иммуногенный пептид или вектор экспрессии, способный экспрессировать иммуногенный пептид, можно смешивать с фармацевтически приемлемым носителем с образованием иммуногенной композиции. Композицию можно вводить субъекту, нуждающемуся в этом, для профилактики или лечения коронавирусной инфекции.

Композиция может быть составлена с фармацевтически приемлемым носителем, таким как фосфатно-солевой буфер, раствор бикарбоната и/или адъювант. Подходящие фармацевтические носители и разбавители, а также необходимые фармацевтические средства для их применения известны в данной области техники. Эта композиция может быть приготовлена в виде инъекций, жидкого раствора, эмульсии или другой подходящей композиции.

Примеры адъювантов включают, но не ограничиваются ими, преципитат квасцов, полный адъювант Фрейнда, неполный адъювант Фрейнда, CpG, QS21, адъювант монофосфорил-липид A/трегалоза дикориномиколат, эмульсию вода в масле, содержащую Corynebacterium parvum и тРНК, и другие вещества, которые выполняют задачу усиления иммунного ответа, имитируя определенные наборы эволюционно консервативных молекул, включая липосомы, липополисахариды (LPS), молекулярные контейнеры для антигена, компоненты стенок бактериальных клеток и эндоцитированные нуклеиновые кислоты, такие как двухцепочечная РНК, одноцепочечная ДНК, и неметилированная ДНК, включающая динуклеотид CpG. Другие примеры включают холерный токсин, термолабильный энтеротоксин E. coli, липосомы, иммуностимулирующий комплекс (ISCOM), иммуностимулирующие последовательности олигодезоксинуклеотидов и гидроксид алюминия. Композиция также может включать полимер, облегчающий доставку in vivo.

Коронавирусные мРНК-вакцины

Коронавирусы (CoV) заражают людей и животных и вызывают различные заболевания, включая респираторные, кишечные, почечные и неврологические заболевания. CoV использует свой шиповидный гликопротеин (S), основную мишень для нейтрализующих антител, для связывания своего рецептора и обеспечения слияния мембран и проникновения вируса. Спайковый белок коронавируса высоко консервативен среди всех коронавирусов человека (CoV) и участвует в распознавании рецепторов, прикреплении вируса и проникновении в клетки-хозяева. Точно так же S-белок SARS-CoV-2 также высоко консервативен по сравнению с CoV. S-белок SARS-CoV-2 имеет три основных иммуногенных домена: N-концевой домен (NTD), домен связывания рецептора (RBD) и домен субъединицы 2 (S2). Предыдущие исследования показали, что нейтрализующие антитела (NAb), которые распознают RBD, обладают высокой степенью защиты от SARS-CoV-2 и других коронавирусов, а белок S сильно гликозилирован (24 сайта гликозилирования на мономер) и часто мутирует с миллионами последовательностей, о которых сообщает GISAID. Наиболее консервативные области S-белка SARS-CoV-2 расположены в доменах RBD и S2, которые в значительной степени экранированы гликанами (Han-Yi Huang, et al. Impact of glycosylation on a broad-spectrum vaccine against SARS-CoV-2. bioRxiv preprint. doi: www.biorxiv.org/content/10.1101/2021.05.25.445523v2.full), антитела, распознающие эти области, могут обеспечить широкую защиту от вариантов SARS-CoV-2 (Maximilian M Sauer. et al. Structural basis for broad coronavirus neutralization. Nat Struct Mol Biol. 28(6):478-486 (2021)1314; C.; Wang. et al. A conserved immunogenic and vulnerable site on the coronavirus spike protein delineated by cross-reactive monoclonal antibodies. Nat Commun. 12 (1):1715 (2021)). Гликозилирование антигенов-мишеней или патогенов регулировало индукцию антител, но до сих пор неизвестно, влияет ли гликозилирование на Т-клеточный ответ. Фактически трудно или невозможно экспрессировать белок S из плазмиды с делецией некоторых сайтов гликозилирования (Han-Yi Huang, et al. Impact of glycosylation on a broad-spectrum vaccine against SARS-CoV-2. bioRxiv preprint. doi: www.biorxiv.org/content/10.1101/2021.05.25.445523v2.full).

Настоящее раскрытие неожиданно показало, что применение технологии мРНК для удаления гликановых экранов для лучшего экспонирования консервативных областей представляет собой эффективную стратегию разработки вакцины широкого спектра действия. В настоящем изобретении мРНК шиповидного белка коронавируса (такого как S-белок SARS-CoV-2) с мутацией специфических сайтов гликозилирования применяют в качестве модели для иммунизации, чтобы исследовать, как мРНК с мутацией сайта гликозилирования влияет на экспрессию белка и иммунный ответ.

Соответственно, настоящее изобретение относится к молекуле модифицированной нуклеиновой кислоты, кодирующей модифицированный спайковый белок, включающий одну или несколько аминокислотных замен аспарагина (N) на глутамин (Q) в последовательностях N-связанного гликозилирования (N-X-S/T), где X представляет собой любой аминокислотный остаток, кроме пролина, а S/T обозначает сериновый или треониновый остаток.

Молекула модифицированной нуклеиновой кислоты может представлять собой мРНК или одноцепочечную или двухцепочечную ДНК и применяться в качестве иммуногена или вакцины против патогена. В одном воплощении возбудитель представляет собой CoV. Примеры CoV включают, помимо прочего, SARS-CoV, MERS-CoV и SARS-CoV-2. Примеры SARS-CoV-2 включают, помимо прочего, альфа-SARS-CoV2, бета-SARS-CoV2, гамма-SARS-CoV2, дельта-SARS-CoV2 и омикрон-SARS-CoV2 и их варианты.

По сравнению с шиповидным белком дикого типа штаммов Wuhan и дельта-штаммов (таких как SEQ ID NO: 2, 16, 18 и 20), модифицированный шиповидный белок, описанный в настоящем документе, включает одну или несколько аминокислотных делеций или добавлений в сиквонах N-связанного гликозилирования (N-X-S/T) для устранения сиквонов N-связанного гликана. Альтернативно, описанный в настоящем документе модифицированный спайковый белок включает одну или несколько аминокислотных замен S/T на аланин (А) в сайтах O-связанного гликозилирования для устранения сайтов O-связанного гликозилирования.

мРНК шиповидного белка коронавируса может быть применена в качестве вакцины против коронавируса, которая имеет мутацию одного или нескольких сайтов гликозилирования в рецептор-связывающем домене (RBD), домене субъединицы 1 (S1) или субъединицы 2 (S2) или их варианте.

Мутация CoV или его варианта, как описано в настоящем документе, может представлять собой делецию, добавление или замену. В некоторых воплощениях, мРНК шиповидного белка коронавируса имеет одну или несколько мутаций сайтов гликозилирования в RBD, S1 или S2 с одной или несколькими заменами N на Q или S/T на A или их комбинацией. Мутация сайтов N-гликозилирования заключается в изменении предполагаемой последовательности N-X-S/T на Q-X-S/T и/или изменении S/T на A в сайте О-гликозилирования.

Сайты гликозилирования с заменой N на Q включают, но не ограничиваются ими, следующие:

S-(deg-RBD), который представляет собой белок S, в котором все 2 N-сайты гликозилирования в RBD мутированы с N на Q, а 2 O-сайты гликозилирования мутированы с S/T на A (например, SEQ ID NO: 4, 22, 24 или 26);

S-(deg-S2), который представляет собой белок S со всеми 9 сайтами гликозилирования в S2, мутировавшими с N на Q (например, SEQ ID NO: 6, 28, 30 или 32);

S-(deg-S2-1194, который представляет собой белок S с 8 сайтами гликозилирования в S2, мутировавшими с N на Q, за исключением сайта гликозилирования 1194) (например, SEQ ID NO: 8 или 34);

S-(deg-RBD-801), который представляет собой белок S, в котором все 2 N-сайты гликозилирования в RBD мутированы с N на Q, а 2 O-сайты гликозилирования мутированы с S/T на A, а сайт гликозилирования 801 мутирован с N на Q (например, SEQ ID NO: 10 или 36);

S-(deg-RBD-1194), который представляет собой белок S, в котором все 2 N-сайты гликозилирования в RBD мутированы с N на Q, а 2 O-сайты гликозилирования мутированы с S/T на A, а сайт гликозилирования 1194 мутирован с N на Q (например, SEQ ID NO: 12 или 38); и

S-(deg-RBD-122-165-234), который представляет собой белок S, в котором все 2 N-сайты гликозилирования в RBD мутированы с N на Q, а 2 O-сайты гликозилирования мутированы с S/T на A, а сайты гликозилирования 122, 165 и 234 мутировали с N на Q (например, SEQ ID NO: 14 или 40).

В дополнительном воплощении, мРНК или ДНК для S-(deg-RBD) имеет последовательность SEQ ID NO: 3, 21, 23 или 25, мРНК или ДНК для S-(deg-S2) имеет последовательность SEQ ID NO: 5, 27 , 29 или 31, мРНК или ДНК для S-(deg-S2-1194) имеет последовательность SEQ ID NO: 7 или 33, мРНК или ДНК для S-(deg-RBD-801) имеет последовательность SEQ ID NO: 9 или 35, мРНК или ДНК для S-(deg-RBD-1194) имеет последовательность SEQ ID NO: 11 или 37, мРНК или ДНК для S-(deg-RBD-122-165-234) имеет последовательность SEQ ID NO: 13 или 39.

В настоящем изобретении предложена линейная ДНК, включающая промотор, 5'-нетранслируемую область, 3'-нетранслируемую область, экспрессионную плазмиду с S-2P или без нее и сигнальную последовательность поли(А)-хвоста, в которой предполагаемая последовательность N-X-S/T заменена на Q-X-S/T, а сайт О-гликозилирования был заменен с S/T на A на экспрессионной плазмиде. В одном воплощении, экспрессионная плазмида S-2P включает ген S вируса SARS-CoV-2, кодирующий состояние перед слиянием S, имеющего пролиновые замены K968 и V969.

мРНК может быть получена трансляцией in vitro из вышеупомянутой ДНК с применением вектора, содержащего модифицированную молекулу нуклеиновой кислоты, и клетки-хозяина, содержащей вектор, как описано в настоящем документе. Ген целевого шиповидного белка изготавливают синтетическим путем и вставляют в плазмиду или небольшой кольцевой фрагмент ДНК. Плазмиды применяют в производстве мРНК-вакцин, потому что их легко реплицировать (копировать) и они надежно содержат последовательность целевого гена. Две нити плазмидной ДНК разделяются. Затем РНК-полимераза, молекула, транскрибирующая РНК из ДНК, использует ген спайкового белка для создания одной молекулы мРНК. Наконец, другие молекулы расщепляют остальную часть плазмиды, чтобы в качестве вакцины была упакована только мРНК. Скорость и эффективность этого процесса позволяют производить большое количество мРНК за короткий период времени.

В настоящем изобретении было обнаружено, что иммунизация S-белком дикого типа с гликанами на всех N-сайтах гликозилирования, урезанными до N-ацетилглюкозамина (GlcNAc), в качестве моно-GlcNAc-декорированного S-белка (Smg) индуцировала антитело широкой защитой и CD4+, а также CD8+ Т-клеточные ответы против рассматриваемых вариантов, включая варианты альфа, бета, гамма, дельта и омикрон. Дальнейшие исследования показывают, что большинство консервативных эпитопов на белке S расположены в RBD и домене HR2 субъединицы S2, но эти консервативные эпитопы в значительной степени защищены гликанами, чтобы ускользнуть от иммунного ответа. Таким образом, удаление экранированных гликанов экспонирует более консервативные эпитопы и вызовет более широкий и сильный иммунный ответ. В настоящем изобретении также применяют технология одиночных В-клеток для скрининга В-клеток от мышей, иммунизированных Smg, для идентификации широко нейтрализующего моноклонального антитела, которое нацелено на высококонсервативную область в RBD, которая не индуцируется при иммунизации полностью гликозилированным белком S, дополнительно демонстрируя, что удаление гликановых экранов из S-белка представляет собой эффективную стратегию разработки вакцины с широким защитным действием против вариантов SARS-CoV-2. Чтобы применить этот вывод к дизайну мРНК-вакцины, в настоящем документе мы сосредоточились на изучении мРНК шиповидного белка SARS-CoV-2 с мутацией специфических сайтов гликозилирования в RBD, S1 или S2 или их комбинации с заменой N на Q и S/T на A и исследовании экспрессии их белков и иммунного ответа, а также степени защиты.

Иммунизация такой мРНК приводит к накоплению неправильно свернутого шиповидного белка в эндоплазматическом ретикулуме и вызывает активацию BiP/GRP78, XBP1 и p-eIF2α, вызывая клеточный апоптоз и CD8 Т-клеточный ответ. Кроме того, дендритные клетки (DC), инкубированные с мРНК-вакциной с делецией сайта гликозилирования в S2, увеличивали экспрессию главного комплекса гистосовместимости класса I (MHC I). Кроме того, удаление сайтов гликозилирования, влияющих на стабильность шиповидного белка, снижает выработку антител и увеличивает ответ CD8+ Т-клеток. В настоящем изобретении предложены мРНК-вакцины широкого спектра действия, которые не могут быть получены с применением экспрессированных белков в качестве антигенов.

Нанокластер мРНК и наночастицы

В одном аспекте настоящее изобретение относится к нанокластеру мРНК, содержащему мРНК-вакцину, описанную в настоящем документе, в составе липидной наночастицы.

В качестве липидной наночастицы можно применять биоразлагаемую липидную наночастицу. В одном воплощении биоразлагаемая липидная наночастица представляет собой полимеры на основе гуанидина.

В другом воплощении настоящее изобретение относится к нанокластеру мРНК, включающему биоразлагаемые липидные наночастицы, инкапсулированные с мРНК-вакциной, описанной в настоящем документе, в которой биоразлагаемые липидные наночастицы содержат гуанидиновые и цвиттерионные звенья, в которых группы на основе гуанидина, а также цвиттерионные группы присоединяются к липидному хвосту полимера, и в которых группы на основе гуанидина прикрепляются к мРНК, тем самым образуя солевые мостики между группами гуанидиния и фосфатами в мРНК. Примеры полимеров на основе гуанидина включают, но не ограничиваются ими, P1, P2, P3, Pb и Pz, как описано в настоящем документе.

В описании обеспечены липидные наночастицы на основе гуанидина в качестве носителя для композиции мРНК-нановакцины. Полимеры генерируют эффективную доставку мРНК к антигенпрезентирующим клеткам, демонстрируя сильную способность к эндосомальному высвобождению. Своевременная деградация поли(дисульфидов) внутриклеточным глутатионом также сводит к минимуму цитотоксичность по сравнению с другими неразлагаемыми наноносителями.

В другом воплощении нанокластер мРНК имеет соотношение наночастиц/мРНК (N/P), равное примерно 10 или примерно 20.

мРНК-вакцина против коронавируса по настоящему изобретению также может быть присоединена к наночастице.

Нанокластер мРНК и наночастицы представляют собой частицы размером от 1 до 100 нанометров (нм), которые можно применять в качестве субстрата для иммобилизации лигандов. Наночастица может представлять собой, например, липидную наночастицу, полимерную наночастицу, неорганическую наночастицу, такую как наночастица золота, липосома, иммуностимулирующий комплекс (ISCOM), вирусоподобная частица (VLP) или самособирающийся белок.

В одном воплощении, композиции липидных наночастиц обычно содержат один или несколько липидов. В некоторых воплощениях, липид представляет собой катионный или ионизируемый липид. В некоторых воплощениях, композиции липидных наночастиц (LNP) дополнительно содержат другие компоненты, включая фосфолипид, структурный липид, соединение четвертичного амина и молекулу, способную уменьшать агрегацию частиц, например, ПЭГ или ПЭГ-модифицированный липид.

Описанная в настоящем документе мРНК-вакцина может быть инкапсулирована в липосому или полимерсому.

Обычная липосома изготавливается путем формирования липидной бимолекулярной мембраны в одну стадию, поэтому обычно как внутреннюю, так и внешнюю мембрану липосомы изготавливают из одного и того же составляющего компонента. Примеры ингредиента липосомы включают, но не ограничиваются ими, DSPC, DOTAP, DMG, пегилированный DMG, холестерин и их комбинация. В одном воплощении мРНК-липосому получают путем смешивания мРНК и липидного ингредиента в соотношении, как описано в настоящем документе, при комнатной температуре.

Полимерсомы, как описано в настоящем документе, представляют собой оболочки, самособирающиеся из амфифильных блок-сополимеров. Эти амфифильные блок-сополимеры представляют собой макромолекулы, включающие, по меньшей мере, один блок гидрофобного полимера и, по меньшей мере, один блок гидрофильного полимера. При гидратации эти амфифильные блок-сополимеры самособираются в оболочки, так что гидрофобные блоки имеют тенденцию связываться друг с другом, чтобы свести к минимуму прямое воздействие воды и образовывать внутреннюю поверхность оболочки, а гидрофильные блоки обращены наружу, образуя внешнюю поверхность корпуса. Гидрофобное ядро этих водорастворимых полимерсом может обеспечивать среду для солюбилизации дополнительных гидрофобных молекул. Как таковые, эти водорастворимые полимерсомы могут действовать как полимеры-носители для гидрофобных молекул, инкапсулированных внутри полимерсом. Более того, самосборка амфифильных блок-полимеров происходит в отсутствие стабилизаторов, которые в противном случае обеспечивали бы коллоидную стабильность и предотвращали агрегацию. В одном воплощении липосомы мРНК получают путем смешивания мРНК и полимера в соотношении, как описано в настоящем документе, при комнатной температуре.

Вакцина, комбинированная вакцина, вакцинная композиция, способы и терапевтическое применение

Описанная в настоящем документе мРНК может быть применена в качестве вакцины либо отдельно, либо в комбинации с другими вакцинами. Соответственно, настоящее изобретение обеспечивает комбинированную вакцину, содержащую мРНК-вакцину по настоящему изобретению и одну или несколько дополнительных вакцин. Дополнительная вакцина выбрана из одной или нескольких вакцин против COVID-19, вакцины против гриппа, адвеновирусной вакцины, вакцины против сибирской язвы, вакцины против холеры, вакцины против дифтерии, вакцины против гепатита А или В, вакцины против ВПЧ, вакцины против кори, вакцины против эпидемического паротита, вакцины против оспы, ротавирусной вакцины, противотуберкулезной вакцины, пневмококковой вакцины и вакцины против Haemophilus influenzae типа b и любой их комбинации.

Настоящее раскрытие также относится к вакцинной композиции, включающей мРНК-вакцину, нанокластер мРНК или наночастицу мРНК, как описано в настоящем документе. В настоящем изобретении также обеспечен способ профилактики или лечения коронавирусной инфекции, включающий введение субъекту мРНК-вакцины, нанокластера мРНК или наночастицы мРНК или композиции вакцины, как описано в настоящем документе. В одном воплощении субъект инфицирован или подвержен риску заражения коронавирусом.

Вакцину мРНК, нанокластер мРНК или наночастицу мРНК или композицию вакцины, как описано в настоящем документе, можно вводить в виде начальной дозы и двух, трех или четырех бустерных доз. В некоторых воплощениях мРНК-вакцину, нанокластер мРНК или наночастицу мРНК или вакцинную композицию вводят в начальной дозе и, по меньшей мере, в одной бустерной дозе в течение примерно одного месяца, примерно двух месяцев, примерно трех месяцев, примерно четырех месяцев, примерно пяти месяцев или примерно через шесть месяцев после первоначальной дозы. В некоторых воплощениях обеспечиваемую композицию вводят во второй бустерной дозе приблизительно через шесть месяцев, приблизительно через семь месяцев, приблизительно через восемь месяцев, приблизительно через девять месяцев, приблизительно через десять месяцев, приблизительно через одиннадцать месяцев или приблизительно через год после введения начальной дозы.

Вакцину мРНК, нанокластер мРНК или наночастицу мРНК или вакцинную композицию вводят в виде одной или нескольких доз. В одном воплощении доза может включать или исключать от 5 мкг до 50 мкг. В некоторых воплощениях доза составляет примерно 5 мкг, 10 мкг, 15 мкг, 20 мкг, 25 мкг, 30 мкг, 35 мкг, 40 мкг, 45 мкг или 50 мкг.

Вакцинная композиция предпочтительно включает фармацевтически приемлемую вакцину, носитель или разбавитель. Вакцинная композиция может быть получена любым подходящим способом. Композиция со стандартными фармацевтически приемлемыми носителями и/или вспомогательными веществами может быть осуществлена с применением обычных методов в области фармацевтики. Точная природа препарата будет зависеть от нескольких факторов, включая вводимую вакцину и желаемый способ введения. Подходящие типы композиций полностью описаны в руководстве Remington's Pharmaceutical Sciences, 19th Edition, Mack Publishing Company, Eastern Pennsylvania, USA.

Композицию вакцины или фармацевтическую композицию, как описаны в настоящем документе, можно вводить любым путем. Подходящие пути введения включают, но не ограничиваются ими, назальный, внутривенный, внутримышечный, внутрибрюшинный, подкожный, внутрикожный, трансдермальный и пероральный/буккальный пути введения.

Композиции могут быть приготовлены вместе с физиологически приемлемым носителем или разбавителем. Обычно такие композиции готовят в виде жидких суспензий наночастиц. Наночастицы могут быть смешаны с наполнителем, который представляет собой фармацевтически приемлемый и совместимый с активным ингредиентом наполнитель. Подходящие вспомогательные вещества представляют собой, например, воду, физиологический раствор, декстрозу, глицерин и т.п. и их комбинации.

Подходящие композиции, в которых носитель представляет собой жидкость, для введения, например, в виде назального спрея или назальных капель, включают водные или масляные растворы активного ингредиента. Препараты, подходящие для аэрозольного введения, могут быть приготовлены в соответствии с обычными способами и могут быть доставлены с другими терапевтическими средствами.

Кроме того, при желании фармацевтические композиции могут содержать незначительные количества вспомогательных веществ, таких как смачивающие или эмульгирующие средства и/или рН-буферные средства.

Без намерения ограничить объем изобретения ниже приведены примеры приборов, устройств, способов и связанных с ними результатов согласно воплощениям настоящего изобретения. Обратите внимание, что в примерах могут быть применены заголовки или подзаголовки для удобства читателя, что никоим образом не должно ограничивать объем изобретения. Кроме того, в настоящем документе предлагают и раскрывают определенные теории; однако они никоим образом, правы они или нет, не должны ограничивать объем изобретения, пока изобретение осуществляется в соответствии с изобретением без учета какой-либо конкретной теории или схемы действия.

Примеры

Материалы и методы

Клеточные линии. Клетки эмбриональной почки человека (HEK293) поддерживали в модифицированной Дульбекко среде Игла (DMEM) («Invitrogen», Rockville, MD) с 10% термоинактивированной фетальной бычьей сывороткой (FBS) («Thermo Scientific») и антибиотиками (100 ед./мл пенициллина G и 100 мкг/мл стрептомицина).

Антитела и белки. Кроличье поликлональное антитело S против SARS-CoV-2 и полноразмерные белки S, S2, RBD и варианты SARS-CoV-2 (экспрессированные клетками 293T) были приобретены у «Sino Biologicals» (Пекин, Китай). Мышиные моноклональные антитела против β-актина, GAPDH и кроличьи моноклональные антитела против MHCII были приобретены у «Millipore». Кроличья моноклональная анти-Na/K-АТФаза была получена от «ABcan». Моноклональные антитела мыши против SERCA2 и моноклональные антитела кролика против MHC I были получены от «Invitrogen». Кроличьи моноклональные антитела против BiP/GRP78, XBP1 и p-eIF2α были приобретены у «ABclonal». Все коммерческие антитела были проверены на специфичность компаниями и нами с помощью вестерн-блоттинга. Для получения дегликозилированного белка белок S, RBD, S1 или S2 дегликозилировали в буферном растворе с помощью PNGase F («Sigma») при 37°С в течение 24 часов в темноте. После дегликозилирования образцы очищали и проверяли вестерн-блоттингом.

мРНК-вакцина из дегликозилированного белка S и композиция. Состояние до слияния S, кодон-оптимизированный ген S SARS-CoV-2 был синтезирован с помощью GenScript и клонирован в pcDNA3.1 или pVax, а в одном воплощении был стабилизирован заменами пролина K968 и V969 (S-2P). Была сконструирована растворимая версия S, оканчивающаяся глутамином Q1208 S-2P, за которым следовал мотив тримеризации фибрина (фолдона) T4, сайт расщепления тромбином и метка 6xHis на С-конце. Чтобы мутировать N-сайты гликозилирования, предполагаемая последовательность N-X-S/T была изменена на Q-X-S/T, а сайт О-гликозилирования был изменен с S/T на A с помощью сайт-направленного мутагенеза на экспрессионной плазмиде S-2P. Для получения мРНК-вакцины линейную ДНК, содержащую промотор Т7, 5'-нетранслируемую область, 3'-нетранслируемую область, S-2P и сигнальную последовательность поли(А)-хвоста, амплифицировали с применением ДНК-полимеразы TOOLS Ultra High Fidelity (BIOTOOLS Co., Ltd., Тайбэй, Тайвань) с 1 мкл матрицы ДНК в наборе mMESSAGE mMACHINE® Kit («Thermo Scientific») при 37°C в течение 1-го часа в соответствии с протоколом производителя. мРНК очищали с помощью набора для очистки РНК («BioLabs») в соответствии с протоколом производителя и хранили при температуре -80°С до дальнейшего применения. Для композиции мРНК-LNP, мРНК инкапсулировали в LNP с применением процесса самосборки, в котором водный раствор мРНК при рН 4,0 быстро смешивали с этанольной смесью липидов, содержащей ионизируемый катионный липид, фосфатидилхолин, холестерин и полиэтиленгликоль-липид. В композицию LNP входили DSPC («Sigma»), холестерин («Sigma»), DOTAP («Sigma») и DMG-PEG 2000 («Sigma»). мРНК-LNP охарактеризовали и впоследствии хранили при -80°С в концентрации 1 мг/мл. После трансфекции клеток HEK293 10 мкг мРНК-LNP в шести лунках планшета, через 48 часов собирали общий клеточный лизат для мониторинга экспрессии S с помощью вестерн-блоттинга.

Животные и иммунизация. Мышей BALB/c в возрасте 6-8 недель (n = 5) иммунизировали внутримышечно 50 мкг мРНК-LNP в PBS с 300 мМ сахарозы. Животных иммунизировали на 0-й неделе, ревакцинировали второй вакцинацией на 2-й неделе, а образцы сыворотки и селезенки собирали у каждой мыши через одну неделю после ревакцинации. Эксперименты на животных были оценены и одобрены Институциональным комитетом по содержанию и применению лабораторных животных Academia Sinica.

Измерение титра IgG в сыворотке. Для определения титра IgG применяли ELISA против белка S. Планшеты покрывали 50 нг/лунку варианта белка S, как показано на фиг. 4 и 5, а затем перекрыли 5% обезжиренным молоком. Последовательно добавляли сыворотку иммунизированных мышей и вторичное антитело, конъюгированное с HRP. Применяли раствор субстрата пероксидазы (TMB) и стоп-раствор 1M H2SO4, и оптическую плотность (OD 450 нм) считывали с помощью устройства для считывания микропланшетов.

Анализ нейтрализации псевдовируса для исследования сыворотки. Псевдовирус был сконструирован в профильном центре RNAi в Academia Sinica. Вкратце, псевдотипированный лентивирус, несущий S-белок SARS-CoV-2 или его вариант, получали путем временной трансфекции клеток HEK-293T с помощью pCMV-ΔR8.91, pLAS2w.Fluc. Ppuro и pcDNA3.1-nCoV-SΔ18. Клетки HEK-293T высевали за сутки до трансфекции с последующей доставкой плазмид в клетки с помощью реагента для трансфекции TransITR-LT1 («Mirus»). Культуральную среду обновляли через 16 часов и собирали через 48 и 72 часа после трансфекции. Клеточный дебрис удаляли центрифугированием, а супернатант пропускали через шприцевой фильтр 0,45 мкм («Pall Corporation»). Псевдотипированный лентивирус затем хранили при -80°C. Для оценки титра лентивируса с помощью анализа AlarmaBlue («Thermo Scientific») определяли единицу трансдукции (TU) псевдотипированного лентивируса с помощью анализа жизнеспособности клеток. Клетки HEK-293T, экспрессирующие ген ACE2 человека, высевали на 96-луночный планшет за один день до трансдукции лентивируса. Для определения титра псевдотипированного лентивируса в культуральную среду, содержащую полибрен (конечная концентрация 8 мкг/мл) («Sigma») добавляли различные количества лентивируса и проводили спиновое заражение при 1100 мкг в 96-луночном планшете в течение 30 мин. при 37°С. После инкубации в течение 16 ч культуральную среду, содержащую вирус и полибрен, удаляли и заменяли свежей полной DMEM, содержащей 2,5 мкг/мл пуромицина («Sigma»). После обработки пуромицином в течение 48 ч культуральную среду удаляли и определяли жизнеспособность клеток с помощью реагентов AlarmaBlue в соответствии с инструкцией производителя. Выживаемость неинфицированных клеток принимали за 100%, а титр вируса определяли путем построения графика выживаемости клеток в зависимости от разбавленной дозы вируса.

Для анализа нейтрализации инактивированные нагреванием сыворотки или антитела серийно разбавляли до желаемого разведения и инкубировали с 1000 ТЕ псевдотипированного лентивируса SARS-CoV-2 в среде DMEM в течение 1-го часа при 37°C. Затем в смесь в 96-луночном планшете инокулировали 10000 клеток HEK-293T, стабильно экспрессирующих человеческий ген ACE2. Через 16 часов после инфицирования культуральную среду заменяли свежей полной DMEM (с добавлением 10% FBS и 100 ед./мл пенициллина/стрептомицина) и непрерывно культивировали в течение еще 48 часов. Уровень экспрессии гена люциферазы определяли с применением системы анализа люциферазы Bright-Glo™ («Promega»). Относительную единицу освещенности (RLU) определяли с помощью Tecan i-control («Infinite 500»). Процент ингибирования рассчитывали как отношение снижения RLU в присутствии разбавленной сыворотки к значению RLU контроля без сыворотки, и формула расчета приведена ниже: (RLU контроль - RLU Сыворотка) / RLU контроль.

Информационный анализ S-белка SARS-CoV-2. 1 117 474 последовательности S-белка SARS-CoV-2 и их варианты были извлечены из базы данных Глобальной инициативы по совместному использованию данных по птичьему гриппу (версия GISAID: 18 апреля 2021 г.). Трехмерная модель структуры S-белка с репрезентативным профилем гликанов была построена с помощью программ CHARMM-GUI и OpenMM. В этом исследовании применяли трансмембранную область шиповидного белка, определенная UniProt. Ввод CHARMM-GUI включает файл PDB 6VSB_1_1_1, репрезентативный профиль гликанов и настройки параметров. Относительную доступность растворителя (RSA) шиповидного белка с репрезентативными гликанами и без них рассчитывали с помощью программы FreeSASA. Радиус зонда 7,2 Å применяли в программе FreeSASA для имитации среднего размера гипервариабельных петель в определяющей комплементарность области (CDR) антитела. Значение RSA для каждого остатка, применяемого в этом исследовании, представляло собой среднее значение RSA для трех белковых цепей. Определение доступных/скрытых остатков было таким же, как и в исследовании, проведенном Kajander, T. et al.

Анализ клеток, секретирующих GrzB и IFNγ. В общей сложности 5×105 спленоцитов иммунизированных мышей рестимулировали ex vivo смесью полноразмерных пептидов S, RBD и S2 (конечная концентрация 0,1 мкг/мл на пептид), («Sino Biologicals») в тестах GrzBELISpot («R&D Systems») в соответствии с инструкцией производителя и подсчитывали пятна. Для Т-клеточного субтипирования Т-клетки CD8+ и Т-клетки CD4+ выделяли из суспензии спленоцитов с помощью набора для магнитной сеперации клеток Dynabeads Untouched Mouse CD4 and CD8 Cells («Invitrogen») в соответствии с инструкциями производителя. Затем CD4+ или CD8+ Т-клетки (1×105) повторно стимулировали 5×104 сингенных DC, происходящих из костного мозга, нагруженных полноразмерной смесью пептидов WTS S (конечная концентрация 0,1 мкг/мл) («Sino Biologicals»). Чистоту выделенных субпопуляций Т-клеток определяли с помощью проточной цитометрии для расчета количества пятен на 1×105 CD4+ или CD8+ Т-клеток. Для проточной цитометрии клетки суспендировали в FACS-буфере [2% (об./об.) FBS в PBS] с плотностью 106 клеток/мл, и в этом исследовании применяли антитело против IFNγ (abcam). Интенсивность клеточной флуоресценции анализировали с помощью FACS Canto («BD Biosciences») и программного обеспечения FCS Express 3.0.

Измерение IFNγ и других цитокинов. IFNγ, IL-2, IL-4, IL-6, IL-12 и IL-13 измеряли с помощью набора ELISA в соответствии с протоколом производителя (IFN-γ: «Boster Biological Technology Co., Ltd»; IL-2, IL-4, IL-6, IL-12 и IL-13: «R&D Systems»).

Трансфекция ДНК-плазмидой и обработка MG132. После посева клеток HEK293 в 6-луночный планшет клетки трансфицировали 3 мкг каждой плазмиды с помощью трансфекционного реагента TransIT®-LT1 («Mirus»), а затем инкубировали с 1 мкМ MG-132 («MedChemExpress») или ДМСО при 37°С в течение 24 часов. Собирали общий лизат и экспрессию варианта S анализировали вестерн-блоттингом.

Трансляция in vitro. Трансляцию in vitro выполняли с помощью плазмиды, кодирующей S-2P, с применением экспрессии гликопротеина в системе IVT человека («Thermo») в соответствии с инструкциями производителя. Экспрессию белка S в разные периоды времени инкубации контролировали с помощью набора ELISA для шиповидных белков SARS-COV-2 («ABclonal») в соответствии с протоколом производителя.

Обнаружение ответа несвернутого белка. После трансфекции клеток HEK293 10 мкг мРНК S с помощью набора для трансфекции TransIT®-mRNA Transfection Kit («Mirus») в течение 48 часов, плазматическую мембрану и ER выделяли с помощью набора для обогащения ER Minute™ («Invent Biotech») в соответствии с протоколом производителя. Белок S в плазматической мембране, цитозоле и ER анализировали вестерн-блоттингом. Собирали общий лизат и определяли маркеры UPR XBP1, BiP/GRP78 и p-eIF2α с помощью вестерн-блоттинга. Клетки апоптоза измеряли с помощью набора для анализа APO™-BrdU TUNEL («Thermo») в соответствии с инструкциями производителя.

Растворимая версия экспрессии S-2P. Клетки HEK293 трансфицировали 10 мкг мРНК, кодирующей растворимую версию варианта S-2P, с помощью набора TransIT®-mRNA Transfection Kit («Mirus») в течение 72 часов, белок S очищали из супернатантов клеток с применением аффинной колонки Ni-NTA («GE Healthcare»). Очищенный белок и общий лизат контролировали на уровень белка S с помощью вестерн-блоттинга.

мРНК-вакцина индуцировала экспрессию MHC I/II на DC. DC выделяли у мышей с помощью набора M-pluriBead Cell Separation (pluriSelect) в соответствии с процедурой компании и инкубировали с 10 мкг мРНК-LNP в культуральной среде ДК (RPMI 1640 с добавлением 20 нг/мл мышиного GM-CSF («R&D Systems»), 10% FBS, 50 мкМ 2-ME, 100 единиц/мл пенициллина и 100 мкг/мл стрептомицина) при 37°С в течение 48 ч, затем анализировали экспрессию MHC I и MHC II с помощью проточной цитометрии.

Статистика и воспроизводимость. Все данные были представлены как среднее ± стандартная ошибка среднего. Номера проб и повторов экспериментов указаны так, как указано в подписях к рисункам. Сравнения между группами определяли с применением t-критерия Стьюдента. Различия считались достоверными при *P < 0,001, **P < 0,05. Все данные были проанализированы с применением программного обеспечения GraphPad Prism 6.

Пример 1. Гликозилирование белка S влияет на выработку антител

В рамках наших усилий по выявлению возможных консервативных эпитопов в качестве мишеней для разработки антител и разработки вакцин следующего поколения, а также для разработки универсальной вакцины с широкими защитными иммунными реакциями, мы провели анализ мутаций белка S из 218 516 доступных последовательностей S-белка SARS-CoV-2. Белок S имеет 1273 аминокислоты, и среди 218 516 проанализированных последовательностей имеется 1149 вариабельных аминокислотных положений, в том числе 613 в домене S1 (672 аминокислоты), 524 в домене S2 (588 аминокислот) и 134 в RBD (152 аминокислоты); однако частота мутаций составляет менее 0,1% в 1076 сайтах и более 0,1% в 73 сайтах. Консервативные последовательности можно найти в областях S1, S2 и RBD, а самая длинная из R983-I1013 находится рядом с доменом HR1 в области S2. Все 22 сайта N-гликозилирования высококонсервативны среди вариантов SARS-CoV-2. Дальнейший анализ большего количества последовательностей (около 6 миллионов) показывает аналогичное распределение консервативных эпитопов, 7 из которых находятся в RBD и 5 в HR2, а 10 консервативных эпитопов экранированы гликанами (фиг. 1). Мы считаем, что удаление гликановых экранов на поверхностных гликопротеинах вируса для воздействия на более консервативные эпитопы представляет собой очень эффективный и общий подход к разработке вакцины против SARS-CoV-2. Поскольку один остаток GlcNAc, связанный с Asn, представляет собой минимальный компонент N-гликана, необходимого для сворачивания и стабилизации гликопротеина, предполагается, что такая обрезка N-гликанов, оставляющая один GlcNAc на S-белке SARS-CoV-2, не повлияет на его сворачивание, но будет способствовать максимальному раскрытию белкового остова, чтобы вызвать сильный и специфичный к белку иммунный ответ при сохранении его структурной целостности.

Основываясь на наших предварительных результатах, полностью гликозилированные (немодифицированные) и моно-GlcNAc-декорированные (по всем N-сайтам гликозилирования) полноразмерные S, S1, S2 и RBD применяют в качестве иммуногенов для исследований иммунизации. Мы производим субъединицы S, S1, S2 и RBD с сохранением основных сайтов гликозилирования, обнаруженных в нашем предварительном исследовании, как описано выше, и делецией специфических сайтов гликозилирования и их декорированных моно-GlcNAc вариантов в качестве иммуногенов для иммунизации. Антисыворотки тестируют на их взаимодействие с репрезентативными вариантами S-белка и нейтрализующую активность против инфекции, опосредованной псевдовирусом, а сыворотки с широкой защитной активностью дополнительно исследуют, включая картирование эпитопов и адъювантное действие на ответы CD4+ и CD8+ Т-клеток. Моно-GlcNAc-декорированные варианты получают путем удаления гетерогенного гликанового слоя на N-сайтах гликозилирования полноразмерных S, S1, S2 и RBD, которые производят с применением более универсальных и хорошо зарекомендовавших себя систем экспрессии клеточных линий CHO, HEK293 или Gnt1-дефицитных HEK293. Гликаны экспрессии S-белка в этих клеточных линиях могут быть обработаны эндогликозидазами для получения желаемого белка с моно-GlcNAc во всех сайтах N-гликозилирования, а белок из последнего (Gnt1-дефицитный HEK293) относится к типам с высоким содержанием маннозы и может быть расщеплен с применением эндогликозидазы H (Endo-H) для получения желаемого белка с моно-GlcNAc во всех сайтах N-гликозилирования. Поскольку О-гликаны важны для проникновения вируса, никаких модификаций не проводили; но при необходимости их можно обработать коктейлями экзогликозидаз. Этот моно-GlcNAc, декорированный полноразмерный и укороченный S-белки, изучают на предмет их структурной целостности. Иммуногены, содержащие полностью гликозилированные и моно-GlcNAc белки, а также сконструированный с помощью сайтов гликозилирования S-белок (путем замены Asn на Gln, как показано в исследовании обратной генетики), применяют для иммунизации мышей для идентификации антител, которые нацелены на различные домены S-белка с широкой нейтрализующей активностью. Специфичность сывороточных антител проверяют с помощью полностью и моно-GlcNAc декорированного, а также S-белка, сконструированного с помощью сайта гликозилирования, и его укороченных форм. Кроме того, для изучения специфичности связывания и CD8+ Т-клеточного ответа у трансгенных мышей с гуманизированным рецептором ACE2 применяют набор синтетических пептидов с декорированным моно-GlcNAc или без него или гликопептидов, полученных в результате расщепления протеазами декорированного моно-GlcNAc S-белка. Сыворотки иммунизированных мышей дополнительно оценивали на нейтрализующую активность с помощью анализов нейтрализации псевдовирусов, разработанных в нашей лаборатории. На фиг. 2 представлена идентификация N- и O-сайтов гликозилирования и мутаций в вариантах. Все 24 сайта гликозилирования высококонсервативны среди 6 миллионов последовательностей S-белка.

Белок S часто мутирует и сильно гликозилируется с помощью 22 N- и 2 O-сайтов гликозилирования (2 N- и 2 O-сайта гликозилирования в RBD и 6 сайтов N-гликозилирования в S2), чтобы избежать иммунного ответа хозяина (фиг. 16). Чтобы изучить, влияет ли и как мРНК-вакцина S-белка с мутантными сайтами гликозилирования на экспрессию S-белка и иммунный ответ, мы мутировали несколько сайтов N-гликозилирования (с N на Q в последовательности N-X-S/T) и сайтов O-гликозилирования (с S/T на А) в области RBD или S2 мРНК, соответственно. После подтверждения экспрессии варианта S-белка до сияния в клеточной линии HEK293 (фиг. 3), мРНК, которая кодирует S-белок или S-белок с мутацией сайтов гликозилирования, инкапсулировали в LNP с образованием мРНК-LNP для иммунизации мышей. Сыворотки мышей, иммунизированных мРНК со всеми мутированными N-сайтами гликозилирования S2 (S-(deg-S2)) или со всеми мутированными N-сайтами гликозилирования S2, кроме N-1194 (S-(S2-1194)), показали меньший титр IgG против полностью гликозилированный белок S WT (фиг. 4A), S2 (фиг. 4B), RBD (фиг. 4C) или дегликозилированный белок S (фиг. 4D), но имел более высокий титр IgG против дегликозилированного антигена S2 (фиг. 4E) в анализе ELISA по сравнению с немодифицированной мРНК. Однако мыши, иммунизированные мРНК со всеми делетированными сайтами гликозилирования RBD (S-(deg-RBD)) вызывали несколько меньший титр IgG против полностью гликозилированного RBD, но более высокий титр IgG для распознавания дегликозилированного антигена RBD (фиг. 4F), предполагая, что гликозилирование S-белка влияет на продукцию антител и специфичность их связывания. Кроме того, иммунизация S-(deg-RBD), S-(deg-S2) или S-(S2-1194) мРНК вызывала более высокий титр IgG против альфа (фиг. 5A), бета (фиг. 5B), гамма (фиг. 5C) дельта и варианты омикрон (фиг. 5D), что свидетельствует о том, что гликозилирование белка S регулирует специфичность антител, генерируемых мРНК-вакциной. Чтобы проанализировать влияние мутации сайта гликозилирования на нейтрализующую активность антител, полученных от иммунизированных мышей, был проведен анализ нейтрализации псевдовируса, и результат показал, что мРНК-вакцина с делецией сайтов гликозилирования в RBD или S2 генерировала антитела со сниженной нейтрализующей активностью против псевдовируса WT (фиг. 5), но с лучшей нейтрализующей активностью в отношении четырех рассматриваемых вариантов, чем у WT (фиг. 6 и табл. 1). Чтобы лучше понять это наблюдение, анализ последовательности показал, что мутация сайтов гликозилирования в RBD или S2 обнажает более консервативные эпитопы, вызывающие иммунные ответы (фиг. 6), и что домены RBD и S2 содержат большинство высококонсервативных последовательностей в белке S (7 в RBD, 5 в HR2 S2). Эти результаты позволяют предположить, что мутация определенных сайтов гликозилирования в мРНК вакцины с S-белком будет влиять на выработку антител и их специфичность, а также на иммунный ответ.

Последовательность ДНК или РНК WT S (штамм Wuhan) (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccaaccgagtctatcgtgcgctttcctaatatcacaaacctgtgcccatttggcgaggtgttcaacgcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtgctgaatgacatcctgagccggctggacaaggtggaggcagaggtgcagatcgaccggctgatcaccggccggctccagagcctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa (SEQ ID NO: 1).

Белковая последовательность WT S (штамм Wuhan) (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT (SEQ ID NO: 2).

Последовательность ДНК или РНК WT S (штамм дельта) (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgcgaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctatcgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctggacgtgtactatcacaagaacaataagagctggatggagtccggagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccaaccgagtctatcgtgcgctttcctaatatcacaaacctgtgcccatttggcgaggtgttcaacgcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatcggtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaagccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcagggcgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcgcagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccagaatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtgctgaatgacatcctgagccggctggacaaggtggaggcagaggtgcagatcgaccggctgatcaccggccggctccagagcctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa (SEQ ID NO: 15).

Белковая последовательность WT S (штамм дельта) (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLRTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASIEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLDVYYHKNNKSWMESGVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYRYRLFRKSNLKPFERDISTEIYQAGSKPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQGVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSRRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQNVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT (SEQ ID NO: 16).

Последовательность ДНК или РНК WT S (штамм Wuhan S-2P) (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccaaccgagtctatcgtgcgctttcctaatatcacaaacctgtgcccatttggcgaggtgttcaacgcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgt

gacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa(SEQ ID NO: 17).

Белковая последовательность WT S (штамм Wuhan S-2P) (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVN AAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT(SEQ ID NO: 18)

Последовательность ДНК или РНК WT S (штамм дельта S-2P) (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgcgaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctatcgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctggacgtgtactatcacaagaacaataagagctggatggagtccggagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccaaccgagtctatcgtgcgctttcctaatatcacaaacctgtgcccatttggcgaggtgttcaacgcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatcggtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaagccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcagggcgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcgcagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccagaatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtg

cctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa(SEQ ID NO: 19).

Белковая последовательность WT S (штамм дельта S-2P) (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLRTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASIEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLDVYYHKNNKSWMESGVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYRYRLFRKSNLKPFERDISTEIYQAGSKPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQGVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSRRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQNVVNQN

EIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT (SEQ ID NO: 20).

Последовательность ДНК или РНК S-(deg-RBD) штамма Wuhan (от 5'-конца к 3'-концу):

Atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttac

gctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtgctgaatgacatcctgagccggctggacaaggtggaggcagaggtgcagatcgaccggctgatcaccggccggctccagagcctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa (SEQ ID NO: 3).

Белковая последовательность S-(deg-RBD) для штамма Wuhan (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALD

RKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT (SEQ ID NO: 4).

Последовательность ДНК или РНК S-(deg-RBD) штамма дельта (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgcgaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctatcgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctggacgtgtactatcacaagaacaataagagctggatggagtccggagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccagccgaggcgatcgtgcgctttcctgaaatcacaaacctgtgcccatttggcgaggtgttcgaggcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatcggtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaagccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcagggcgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcgcagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccagaatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtgctgaatgacatcctgagccggctggacaaggtggaggcagaggtgcagatcgaccggctgatcaccggccggctccagagcctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa (SEQ ID NO: 21)

Белковая последовательность S-(deg-RBD) для штамма дельта (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLRTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASIEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLDVYYHKNNKSWMESGVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPAEAIVRFPQITNLCPFGEVFQATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYRYRLFRKSNLKPFERDISTEIYQAGSKPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQGVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSRRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQNVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT (SEQ ID NO: 22)

Последовательность ДНК или РНК S-(deg-RBD) штамма Wuhan S-2P (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccagccgaggcgatcgtgcgctttcctgaaatcacaaacctgtgcccatttggcgaggtgttcgaggcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctct

ctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa(SEQ ID NO: 23)

Белковая последовательность S-(deg-RBD) для штамма Wuhan S-2P (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPAEAIVRFPQITNLCPFGEVFQATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVV

RAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT(SEQ ID NO: 24)

Последовательность ДНК или РНК S-(deg-RBD) для штамма дельта S-2P (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgcgaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctatcgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctggacgtgtactatcacaagaacaataagagctggatggagtccggagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccagccgaggcgatcgtgcgctttcctgaaatcacaaacctgtgcccatttggcgaggtgttcgaggcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatcggtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaagccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcagggcgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcgcagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccagaatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctct

ctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa(SEQ ID NO: 25)

Белковая последовательность S-(deg-RBD) для штамма дельта S-2P (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLRTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASIEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLDVYYHKNNKSWMESGVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPAEAIVRFPQITNLCPFGEVFQATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYRYRLFRKSNLKPFERDISTEIYQAGSKPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQGVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSRRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQNVVNAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT (SEQ ID NO: 26)

Последовательность ДНК или РНК S-(deg-S2) для штамма Wuhan (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccaaccgagtctatcgtgcgctttcctaatatcacaaacctgtgcccatttggcgaggtgttcaacgcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgag

gtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtgctgaatgacatcctgagccggctggacaaggtggaggcagaggtgcagatcgaccggctgatcaccggccggctccagagcctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacc

ggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa (SEQ ID NO: 5)

Белковая последовательность S-(deg-S2) для штамма Wuhan (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIG

QYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQE

SCCKFDEDDSEPVLKGVKLHYT (SEQ ID NO: 6)

Последовательность ДНК или РНК S-(deg-S2) для штамма дельта (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgcgaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctatcgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctggacgtgtactatcacaagaacaataagagctggatggagtccggagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccaaccgagtctatcgtgcgctttcctaatatcacaaacctgtgcccatttggcgaggtgttcaacgcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatcggtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaagccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcagggcgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcgcagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctcagaatagcatcgccatcccaacccagttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttccaattttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccagaatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtgctgaatgacatcctgagccggctggacaaggtggaggcagaggtgcagatcgaccggctgatcaccggccggctccagagcctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagcagttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtcccagggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgcagaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagcaacacacctcccctgacgtggatctgggcgacatcagcggcatccaagcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgcaggagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa(SEQ ID NO: 27)

Белковая последовательность S-(deg-S2) для штамма дельта (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLRTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASIEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLDVYYHKNNKSWMESGVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYRYRLFRKSNLKPFERDISTEIYQAGSKPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQGVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSRRRARSVASQSIIAYTMSLGAENSVAYSQNSIAIPTQFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFQFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQNVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKQFTTAPAICHDGKAHFPREGVFVSQGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVQNTVYDPLQPELDSFKEELDKYFKQHTSPDVDLGDISGIQASVVNIQKEIDRLNEVAKNLQESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT(SEQ ID NO: 28)

Последовательность ДНК или РНК S-(deg-S2) для Wuhan S-2P (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccaaccgagtctatcgtgcgctttcctaatatcacaaacctgtgcccatttggcgaggtgttcaacgcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctcagaatagcatcgccatcccaacccagttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttccaattttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgt

gacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagcagttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtcccagggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgcagaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagcaacacacctcccctgacgtggatctgggcgacatcagcggcatccaagcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgcaggagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa(SEQ ID NO: 29)

Белковая последовательность S-(deg-S2) для Wuhan S-2P (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSQNSIAIPTQFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFQFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVN

AAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKQFTTAPAICHDGKAHFPREGVFVSQGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVQNTVYDPLQPELDSFKEELDKYFKQHTSPDVDLGDISGIQASVVNIQKEIDRLNEVAKNLQESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT(SEQ ID NO: 30)

Последовательность ДНК или РНК S-(deg-S2) для штамма дельта S-2P (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgcgaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctatcgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctggacgtgtactatcacaagaacaataagagctggatggagtccggagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccaaccgagtctatcgtgcgctttcctaatatcacaaacctgtgcccatttggcgaggtgttcaacgcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatcggtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaagccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcagggcgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcgcagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctcagaatagcatcgccatcccaacccagttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttccaattttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccagaatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtg

acctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagcagttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtcccagggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgcagaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagcaacacacctcccctgacgtggatctgggcgacatcagcggcatccaagcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgcaggagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa(SEQ ID NO: 31)

Белковая последовательность S-(deg-S2) для штамма дельта S-2P (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLRTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASIEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLDVYYHKNNKSWMESGVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYRYRLFRKSNLKPFERDISTEIYQAGSKPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQGVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSRRRARSVASQSIIAYTMSLGAENSVAYSQNSIAIPTQFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFQFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQNVVNQN

EIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKQFTTAPAICHDGKAHFPREGVFVSQGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVQNTVYDPLQPELDSFKEELDKYFKQHTSPDVDLGDISGIQASVVNIQKEIDRLNEVAKNLQESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT(SEQ ID NO: 32)

Последовательность ДНК или РНК S-(S2-1194) для штамма Wuhan (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccaaccgagtctatcgtgcgctttcctaatatcacaaacctgtgcccatttggcgaggtgttcaacgcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgag

Gacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctat

Gtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtgctgaatgacatcctgagccggctggacaaggtggaggcagaggtgcagatcgaccggctgatcaccggccggctccagagcctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacc

acgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa (SEQ ID NO: 7)

Белковая последовательность S-(S2-1194) для штамма Wuhan (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIG

QYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQE

NLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCCGSCCKFDEDDSEPVLKGVKLHYT (SEQ ID NO: 8)

Последовательность ДНК или РНК S-(S2-1194) штамма Wuhan S-2P (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccaaccgagtctatcgtgcgctttcctaatatcacaaacctgtgcccatttggcgaggtgttcaacgcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctcagaatagcatcgccatcccaacccagttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttccaattttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgt

gacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagcagttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtcccagggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgcagaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagcaacacacctcccctgacgtggatctgggcgacatcagcggcatccaagcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa(SEQ ID NO: 33)

Белковая последовательность S-(S2-1194) для штамма Wuhan S-2P (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSQNSIAIPTQFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFQFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVN

AAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKQFTTAPAICHDGKAHFPREGVFVSQGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVQNTVYDPLQPELDSFKEELDKYFKQHTSPDVDLGDISGIQASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT(SEQ ID NO: 34)

Последовательность ДНК или РНК S-(deg-RBD-801) для штамма Wuhan (от 5'-конца к 3'-концу):

Atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttac

gctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccc

caaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtgctgaatgacatcctgagccggctggacaaggtggaggcagaggtgcagatcgaccggctgatcaccggccggctccagagcctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa (SEQ ID NO: 9)

Белковая последовательность S-(deg-RBD-801) для штамма Wuhan (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALD

RKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVE

KQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT (SEQ ID NO: 10)

Последовательность ДНК или РНК S-(deg-RBD-801) для штамма Wuhan S-2P (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccagccgaggcgatcgtgcgctttcctgaaatcacaaacctgtgcccatttggcgaggtgttcgaggcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttccaattttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctct

ctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa(SEQ ID NO: 35)

Белковая последовательность S-(deg-RBD-801) для штамма Wuhan S-2P (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPAEAIVRFPQITNLCPFGEVFQATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFQFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVV

RAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT(SEQ ID NO: 36)

Последовательность ДНК или РНК S-(deg-RBD-1194) штамма Wuhan (от 5'-конца к 3'-концу):

Atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttac

gctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtgctgaatgacatcctgagccggctggacaaggtggaggcagaggtgcagatcgaccggctgatcaccggccggctccagagcctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgc

catctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa (SEQ ID NO: 11)

Белковая последовательность S-(deg-RBD-1194) для штамма Wuhan (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALD

RKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAK

SCCKFDEDDSEPVLKGVKLHYT (SEQ ID NO: 12)

Последовательность ДНК или РНК S-(deg-RBD-1194) штамма Wuhan S-2P (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaacaatgccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaacaactgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatcaacatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccagccgaggcgatcgtgcgctttcctgaaatcacaaacctgtgcccatttggcgaggtgttcgaggcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctct

ctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgcaggagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa(SEQ ID NO: 37)

Белковая последовательность S-(deg-RBD-1194) для штамма Wuhan S-2P (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPAEAIVRFPQITNLCPFGEVFQATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVV

RAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLQESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT(SEQ ID NO: 38)

Последовательность ДНК или РНК S-(deg-RBD-122-165-234) штамма Wuhan (от 5'-конца к 3'-концу):

Atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcg

cgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctctagcgtgctgaatgacatcctgagccggctggacaaggtggaggcagaggtgcagatcgaccggctgatcaccggccggctccagagcctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa (SEQ ID NO: 13)

Белковая последовательность S-(deg-RBD-122-165-234) штамма Wuhan (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQS

NRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT (SEQ ID NO: 14)

Последовательность ДНК или РНК S-(deg-RBD-122-165-234) штамма Wuhan S-2P (от 5'-конца к 3'-концу):

atgttcgtcttcctggtcctgctgcctctggtctcctcacagtgcgtcaatctgacaactcggactcagctgccacctgcttatactaatagcttcaccagaggcgtgtactatcctgacaaggtgtttagaagctccgtgctgcactctacacaggatctgtttctgccattctttagcaacgtgacctggttccacgccatccacgtgagcggcaccaatggcacaaagcggttcgacaatcccgtgctgccttttaacgatggcgtgtacttcgcctctaccgagaagagcaacatcatcagaggctggatctttggcaccacactggactccaagacacagtctctgctgatcgtgaaccaagccaccaacgtggtcatcaaggtgtgcgagttccagttttgtaatgatcccttcctgggcgtgtactatcacaagaacaataagagctggatggagtccgagtttagagtgtattctagcgccaaccagtgcacatttgagtacgtgagccagcctttcctgatggacctggagggcaagcagggcaatttcaagaacctgagggagttcgtgtttaagaatatcgacggctacttcaaaatctactctaagcacacccccatcaacctggtgcgcgacctgcctcagggcttcagcgccctggagcccctggtggatctgcctatcggcatccagatcacccggtttcagacactgctggccctgcacagaagctacctgacacccggcgactcctctagcggatggaccgccggcgctgccgcctactatgtgggctacctccagccccggaccttcctgctgaagtacaacgagaatggcaccatcacagacgcagtggattgcgccctggaccccctgagcgagacaaagtgtacactgaagtcctttaccgtggagaagggcatctatcagacatccaatttcagggtgcagccagccgaggcgatcgtgcgctttcctgaaatcacaaacctgtgcccatttggcgaggtgttcgaggcaacccgcttcgccagcgtgtacgcctggaataggaagcggatcagcaactgcgtggccgactatagcgtgctgtacaactccgcctctttcagcacctttaagtgctatggcgtgtcccccacaaagctgaatgacctgtgctttaccaacgtctacgccgattctttcgtgatcaggggcgacgaggtgcgccagatcgcccccggccagacaggcaagatcgcagactacaattataagctgccagacgatttcaccggctgcgtgatcgcctggaacagcaacaatctggattccaaagtgggcggcaactacaattatctgtaccggctgtttagaaagagcaatctgaagcccttcgagagggacatctctacagaaatctaccaggccggcagcaccccttgcaatggcgtggagggctttaactgttatttcccactccagtcctacggcttccagcccacaaacggcgtgggctatcagccttaccgcgtggtggtgctgagctttgagctgctgcacgccccagcaacagtgtgcggccccaagaagtccaccaatctggtgaagaacaagtgcgtgaacttcaacttcaacggcctgaccggcacaggcgtgctgaccgagtccaacaagaagttcctgccatttcagcagttcggcagggacatcgcagataccacagacgccgtgcgcgacccacagaccctggagatcctggacatcacaccctgctctttcggcggcgtgagcgtgatcacacccggcaccaatacaagcaaccaggtggccgtgctgtatcaggacgtgaattgtaccgaggtgcccgtggctatccacgccgatcagctgaccccaacatggcgggtgtacagcaccggctccaacgtcttccagacaagagccggatgcctgatcggagcagagcacgtgaacaattcctatgagtgcgacatcccaatcggcgccggcatctgtgcctcttaccagacccagacaaactctcccagaagagcccggagcgtggcctcccagtctatcatcgcctataccatgtccctgggcgccgagaacagcgtggcctactctaacaatagcatcgccatcccaaccaacttcacaatctctgtgaccacagagatcctgcccgtgtccatgaccaagacatctgtggactgcacaatgtatatctgtggcgattctaccgagtgcagcaacctgctgctccagtacggcagcttttgtacccagctgaatagagccctgacaggcatcgccgtggagcaggataagaacacacaggaggtgttcgcccaggtgaagcaaatctacaagaccccccctatcaaggactttggcggcttcaatttttcccagatcctgcctgatccatccaagccttctaagcggagctttatcgaggacctgctgttcaacaaggtgaccctggccgatgccggcttcatcaagcagtatggcgattgcctgggcgacatcgcagccagggacctgatctgcgcccagaagtttaatggcctgaccgtgctgccacccctgctgacagatgagatgatcgcacagtacacaagcgccctgctggccggcaccatcacatccggatggaccttcggcgcaggagccgccctccagatcccctttgccatgcagatggcctataggttcaacggcatcggcgtgacccagaatgtgctgtacgagaaccagaagctgatcgccaatcagtttaactccgccatcggcaagatccaggacagcctgtcctctacagccagcgccctgggcaagctccaggatgtggtgaatcagaacgcccaggccctgaataccctggtgaagcagctgagcagcaacttcggcgccatctc

ctccagacctatgtgacacagcagctgatcagggccgccgagatcagggccagcgccaatctggcagcaaccaagatgtccgagtgcgtgctgggccagtctaagagagtggacttttgtggcaagggctatcacctgatgtccttccctcagtctgccccacacggcgtggtgtttctgcacgtgacctacgtgcccgcccaggagaagaacttcaccacagcccctgccatctgccacgatggcaaggcccactttccaagggagggcgtgttcgtgtccaacggcacccactggtttgtgacacagcgcaatttctacgagccccagatcatcaccacagacaacaccttcgtgagcggcaactgtgacgtggtcatcggcatcgtgaacaataccgtgtatgatccactccagcccgagctggacagctttaaggaggagctggataagtatttcaagaatcacacctcccctgacgtggatctgggcgacatcagcggcatcaatgcctccgtggtgaacatccagaaggagatcgaccgcctgaacgaggtggctaagaatctgaacgagagcctgatcgacctccaggagctgggcaagtatgagcagtacatcaagtggccctggtacatctggctgggcttcatcgccggcctgatcgccatcgtgatggtgaccatcatgctgtgctgtatgacatcctgctgttcttgcctgaagggctgctgtagctgtggctcctgctgtaagtttgacgaggatgactctgaacctgtgctgaagggcgtgaagctgcattacacctaa(SEQ ID NO: 39)

Белковая последовательность S-(deg-RBD-122-165-234) для штамма Wuhan S-2P (от N-конца к C-концу):

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNQATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANQCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGIQITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPAEAIVRFPQITNLCPFGEVFQATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVV

RAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT(SEQ ID NO: 40)

Таблица 1. IG50 для анализа нейтрализации вариантов псевдовируса IC50 разведения сыворотки WT B.1.1.7 B.1.351 P1 B.1.617.2 WT 7658,4 1250,1 710,6 776,5 835,7 S-(deg-RBD) 6496,2 1926,5 1108,3 1523,6 1868,3 S-(deg-S2) 4825,6 4035,9 4568,3 4235,3 4786,3 S-(S2-1194) 5767,8 4628,6 5287,5 4989,6 5103,4

Пример 5. Гликозилирование влияет на клеточный и цитокиновый ответ

Чтобы охарактеризовать ответ Т-клеток, спленоциты от иммунизированных мышей выделяли и инкубировали с пулом пептидов S-белка для измерения с помощью анализа Elispot Т-клеток, секретирующих гранзим B (GrzB). Было показано, что S-(deg-S2) и S-(S2-1194) индуцировали больше клеток, секретирующих GrzB, чем WT и S-(deg-RBD) после инкубации с полноразмерным WT S (фиг. 7A), RBD (фиг. 7B) и пептиды S2 (фиг. 7C), что свидетельствует о том, что гликозилирование S2 регулирует Т-клеточный ответ. Для дальнейшего изучения влияния на CD4+ и CD8+ Т-клетки, выделенные Т-клетки инкубировали с дендритными клетками костного мозга (DC) и пулом пептидов WTS для измерения с помощью проточной цитометрии Т-клеток, секретирующих IFNγ. Не было существенной разницы в количестве IFNγ-секретирующих CD4+ T-клеток среди всех вакцинированных мышей (фиг. 7D), но мРНК-вакцина S-(deg-S2) или S-(S2-1194) индуцировала больше IFNγ-секретирующие CD8+ Т-клетки, предполагая, что гликозилирование в S2 регулирует ответ CD8+ Т-клеток (фиг. 7E).

Для анализа экспрессии цитокинов среду от спленоцитов, инкубированных с пулом полноразмерных пептидов WTS, анализировали с помощью ELISA. Было показано, что спленоциты мышей, иммунизированных S-(deg-S2) и S-(S2-1194), секретировали более высокие уровни цитокинов T-хелпер-1 (TH1) (IFNγ, IL-2 и IL-12) (фиг. 8 A, B и E), тогда как спленоциты мышей, иммунизированных WT и S-(deg-RBD), секретировали более высокие уровни цитокинов Т-хелперов-2 (TH2) (IL-4, IL-6 и IL-13) (фиг. 8 C, D и F). В целом, все РНК-вакцины с мутацией сайтов гликозилирования индуцировали ответы антител и CD4+ и CD8+ Т-клеток и соответствующие цитокины с более сильным IFNγ-продуцирующим ответом CD8+ Т-клеток у мышей, иммунизированных S-(deg-S2) и S-(S2-1194). Эти результаты позволяют предположить, что гликозилирование S2 регулирует ответ Т-клеток и экспрессию цитокинов.

Пример 6. Дегликозилирование S2-индуцированного ответа развернутого белка

Чтобы исследовать, как гликозилирование на S2 влияет на иммунный ответ, клетки HEK293 трансфицировали плазмидой вариантов экспрессии S-белка, стабилизированной до слияния. Было показано, что S-(deg-S2) и S-(S2-1194) плохо экспрессировались, но уровни белков S-(deg-S2) и S-(S2-1194) в некоторой степени восстанавливались после обработки MG132, ингибитором протеасом (фиг. 9). Анализ трансляции in vitro показал, что мутация сайтов гликозилирования в последовательности мРНК не влияет на эффективность трансляции (фиг. 10). Эти результаты предполагают, что удаление гликозилирования из S2 вызывает деградацию транслируемого белка in vivo. Чтобы определить, приводит ли удаление гликозилирования на S2 к экспрессии неправильно свернутого или развернутого белка, плазматическую мембрану и эндоплазматический ретикулум (ER) изолировали для изучения распределения S-белка, поскольку неправильно свернутые или развернутые S-белки могли быть уложены в стопку в ER для рефолдинга или разрушиться в результате деградации, связанной с ER. После того, как клетки HEK293 были трансфицированы мРНК через 48 часов, все варианты белков S существовали в плазматической мембране, цитозоле и ER. Однако в плазматической мембране было больше белков WT и S-(deg-RBD), тогда как в ЭР было больше белков S-(deg-S2) и S-(S2-1194) (фиг. 11). Кроме того, клетки HEK293 были трансфицированы мРНК, которая кодировала растворимую версию S-(deg-S2) до слияния, и белок S-(S2-1194) не мог секретироваться в среду (фиг. 16), что позволяет предположить, что дегликозилирование в S2 повлияло на укладку S-белка. Поскольку повышенное содержание развернутого белка S в ER должно запускать ответ развернутого белка (UPR), маркерные белки UPR BiP/GRP78, XBP1 и p-eIF2α исследовали в клетках HEK293, трансфицированных РНК, через 48 часов. Результаты показали, что уровень BiP/GRP78 и XBP1 повышался, а уровень p-eIF2α был выше, чем в группах WT и S-(deg-RBD) в группах в клетках, трансфицированных S-(deg-S2) и S-(S2-1194) (фиг. 12). Кроме того, удаление гликозилирования на S2 индуцировало больше клеток апоптоза, чем WT и S-(deg-RBD) (фиг. 13), что свидетельствует о том, что дегликозилирование S2 индуцировало более высокий уровень стресса ER, чем WT и S-(deg-RBD) белок, а гликозилирование на S2 влияло на фолдинг белка, чтобы регулировать экспрессию UPR.

Пример 7. Гликозилирование S2 влияло на экспрессию MHC I на дендритных клетках (DC)

Чтобы изучить, приводит ли UPR к смещенному иммунному ответу, с помощью проточной цитометрии измеряли главный комплекс гистосовместимости класса I (MHC I) и класса II (MHC II) на DC, которые необходимы для презентации интернализованных молекул после процессинга. После того, как DC инкубировали с вариантами мРНК-вакцины, происходили активация МНС I/II среди всех вакцин, а мРНК-вакцина S-(deg-S2) или S-(S2-1194) индуцировала большее количество DC с экспрессией МНС I, чем WT и S-(deg-RBD) (фиг. 14 и фиг. 17), предполагая, что UPR регулирует экспрессию MHC I на DC.

Пример 8. Сайты гликозилирования в шиповидном белке влияют на стабильность S-белка и, следовательно, на ответ CD8+ Т-клеток

Чтобы изучить, какие сайты гликозилирования регулируют иммунный ответ хозяина, мы применяли вакцину S-(deg-RBD) в качестве модельной системы, поскольку она индуцировала такой же уровень антител, что и дикий тип, и обладала лучшей нейтрализующей активностью в отношении четырех рассматриваемых вариантов, чем дикий тип. В настоящем документе мы удалили сайты гликозилирования RBD и сайт гликозилирования N-801 (S-(deg-RBD-801)) или сайт гликозилирования N-1194 (S-(deg-RBD-1194)) в S2, поскольку эти сайты гликозилирования участвовали в экспрессии белка S, особенно сайт гликозилирования N-1194, который участвует в целостности S-белка и его аффинности связывания. Поскольку сайты гликозилирования N-122, N-165 и N-234 регулировали структуру RBD и влияли на нейтрализующую активность антител, мы удалили эти сайты гликозилирования для создания вакцины S-(deg-RBD-122-165-234) (фиг. 15). После того, как клетки HEK293 были трансфицированы экспрессионной плазмидой, стабилизированной до слияния вариантов S-белка, было показано, что S-(deg-RBD-801) и S-(deg-RBD-122-165-234) плохо экспрессируются, а S-(deg-RBD-1194) резко снижали экспрессию белка, но уровни этих вариантов белков восстанавливались до некоторой степени после обработки MG132, что свидетельствует о том, что вариант вакцины индуцировал деградацию транслируемого белка (фиг. 21А). После подтверждения экспрессии варианта белка S до слияния в форме мРНК-LNP в клеточной линии HEK293 (фиг. 21B) мышей иммунизировали различными вакцинами. Было показано, что S-(deg-RBD-801), S-(deg-RBD-1194) и S-(deg-RBD-122-165-234) индуцируют меньший титр IgG против полностью гликозилированного WT S (фиг. 18 A) и белка RBD (фиг. 18 B), но S-(deg-RBD-801) и S-(deg-RBD-122-165-234) имели в анализе ELISA более высокий титр IgG против дегликозилированного антигена RBD (фиг. 18 C) по сравнению с немодифицированной мРНК, что позволяет предположить, что гликозилирование этих сайтов гликозилирования регулирует продукцию антител. Для анализа нейтрализующей активности антител, полученных от иммунизированных мышей, анализ нейтрализации псевдовируса показал, что S-(deg-RBD-801), S-(deg-RBD-1194) и S-(deg-RBD-122-165-234) мРНК-вакцины генерировали антитела с пониженной нейтрализующей активностью против псевдовируса дикого типа (фиг. 19), но с более высокой нейтрализующей активностью в отношении четырех вызывающих озабоченность вариантов, по сравнению с диким типом (фиг. 19 и таблица 2).

Таблица 2. IG50 для анализа нейтрализации вариантного псевдовируса IC50 разведения сыворотки WT B.1.1.7 B.1.351 P1 B.1.617.2 WT 7430,8 1024,5 680,4 790,4 880,4 S-(deg-RBD-801) 5020,6 2680,4 1098,5 1640,5 1850,5 S-(deg-RBD-1194) 3480,5 1120,5 780,5 910,6 1040,3 S-(deg-RBD-122-165-234) 5240,8 3168,8 1820,8 2140,5 2040,5

Чтобы охарактеризовать Т-клеточный ответ, спленоциты иммунизированных мышей инкубировали с пулом пептидов белка S, RBD и S2, затем определяли гранзим B (GrzB)-секретирующие Т-клетки с помощью анализа ELISpot. Было показано, что S-(deg-RBD-801), S-(deg-RBD-1194) и S-(deg-RBD-122-165-234) индуцируют больше GrzB-секретирующих Т-клеток, чем WT, во всех пулах пептидов, в особенности, в S-(deg-RBD-1194) (фиг. 20 и фиг. 22А, 22В). После инкубации выделенных CD4+ и CD8+ Т-клеток с костномозговыми дендритными клетками и пулом пептидов WTS для измерения IFNγ-секретирующих Т-клеток с помощью проточной цитометрии не было выявлено существенной разницы в количестве IFNγ-секретирующих CD4+ Т-клеток среди всех вакцинированных мышей (фиг. 22C), но S-(deg-RBD-801), S-(deg-RBD-1194) и S-(deg-RBD-122-165-234) мРНК-вакцины индуцировали больше IFNγ-секретирующие CD8+ Т-клетки, что позволяет предположить, что эти вакцины индуцировали более сильный ответ CD8+ Т-клеток (фиг. 20). В целом, S-(deg-RBD-801), S-(deg-RBD-1194) и S-(deg-RBD-122-165-234) снижали уровень экспрессии белка в плазмидной системе и индуцировали меньше антител, но увеличил ответ CD8+ Т-клеток, особенно в S-(deg-RBD-1194). Эти результаты позволяют предположить, что гликозилирование сайтов гликозилирования, участвующих в укладке или стабилизации S, регулирует иммунный ответ хозяина.

Пример 9. Дизайн и синтез поли(дисульфидов) на основе гуанидина

Мы разработали серию полимеров и групп на основе гуанидина и/или цвиттерионных головок, прикрепленных к липидному хвосту, и исследовали их способность доставлять мРНК шиповидного белка. Как показано на фиг. 23, пропагатор P1, включающий гуанидиновые группы, и пропагатор мультивалентного дисплея P2 облегчают сцепление мРНК с полимерами за счет образования прочных солевых мостиков между гуанидинами и фосфатами в мРНК. Как только мРНК, инкапсулированная в полимер, достигает цитоплазмы, дисульфид линкеры могут расщепляться внутриклеточным глутатионом с высвобождением мРНК. Кроме того, деградированные дисульфидные мономеры также снижают цитотоксичность, предотвращая накопление высокомолекулярных полимеров внутри клетки.

Для получения полимеров моногуанидин-содержащий дисульфидный мономер синтезировали в соответствии с ранее опубликованными процедурами (Gasparini, G.; Bang, E.-K.; Molinard, G.; Tulumello, D. V.; Ward, S.; Kelley, S. O.; Roux, A.; Sakai, N.; Matile, S., J. Am. Chem. Soc. 2014, 136, 6069-6074), и мономер тригуанидиндисульфида синтезировали из линкера нитрилотриуксусной кислоты с получением настоящего мономера тримерного гуанидина. Пропагатор Pb, содержащий два напряженных дисульфида помимо гуанидиновой группы, был разработан для образования разветвленной конфигурации полимера. Пропагаторы P3 и Pz были сконструированы как спейсер, который может способствовать выходу захваченной молекулы из эндосомы.

На фиг. 24 показана сконструированная структура инициаторов (I0), пропагаторов (P1, P2) и процесс полимеризации/деполимеризации.

Полимеризацию P1, P2, P3 и Pb проводили в дегазированном водном растворе при комнатной температуре. Вкратце, в присутствии 5 мМ инициатора 1 и 200 мМ пропагатора Р в 1 М буфере TEOA с рН 7 энергично перемешивали в течение 30 минут. Терминацию проводили добавлением 0,5 М йодацетамида. Для скрининга оптимального полимера для эффективной внутриклеточной доставки мРНК проводили сополимеризацию различных пропагаторов и оценивали их способность к инкапсуляции и эффективность трансфекции с помощью кодирующей GFP мРНК в клетках HEK293T. Сополимер (P1/P3) и (P2/P3) готовили в соотношении 2:1, (P1/Pb) и (P2/Pb) готовили в соотношении 4:1.

Чтобы выбрать оптимальный полимер для лучшей инкапсуляции и эффективной внутриклеточной доставки мРНК, 8 типов синтезированных гомополимеров и гетеросополимеров исследовали на их способность инкапсулировать мРНК GFP. Как показано на фиг. 25А, все сополимеры, содержащие гуанидиновые группы, были способны ингибировать миграцию мРНК GFP с отношением N/P = 10. В особенности, сополимер P2/P3 и P2/Pb с тригуанидиновым фрагментом приводил к более высокой способности образовывать комплексы с мРНК, которая была сравнима с результатом, опосредованным традиционно используемым агентом трансфекции полиэтиленимином (PEI). Средний размер полученного нанокластерного комплекса P2/P3-мРНК составлял примерно 90 нм с помощью ПЭМ (фиг. 25В). Кроме того, разветвленные полимеры P1/Pb и P2/Pb также показали сходную способность инкапсулировать мРНК. Разветвленные гуанидинии привлекли внимание своей хорошей доступностью и гибкостью для функциональных материалов.

Затем мы оценили эффективность трансфекции GFP-мРНК в клетках HEK293T с применением различных сополимеров. Во-первых, мы обнаружили, что сополимер P1/P3 проявляет хорошую способность к трансфекции мРНК при N/P = 10, что более эффективно, чем P1 или P3 по отдельности и PEI (фиг. 26A). Результат показал, что полимер P1 или P3 не подходит для внутриклеточной доставки, в то время как бифункциональный сополимер P1/P3 в значительной степени трансфицировал мРНК. Случайное расположение гуанидиновой группы путем сополимеризации со спейсером из диэтилентриамина может быть подходящим для соответствия фосфатному заряду нуклеотида. Затем мы изучили влияние различных сополимеров на активность трансфекции. На фиг. 26B комбинация P2/P3 показала повышенную экспрессию GFP, что указывает на то, что тригуанидиновая группа усиливала инкапсуляцию мРНК, а также могла высвобождать мРНК после доставки в цитоплазму. Однако разветвленные поли(дисульфиды) P1/Pb и P2/Pb не обнаруживали удовлетворительного высвобождения грузов мРНК, хотя полное комплексообразование с мРНК осуществлялось с применением P2/Pb (фиг. 26A). Мы дополнительно оптимизировали соотношение N/P (1, 5, 10 и 20), применяя выдающийся сополимер P2/P3. Обнаружено, что наилучшая эффективность для трансфекции составляет 10 (фиг. 26C).

На основании результатов мРНК GFP была получена мРНК шиповидного белка дикого типа, которая была инкапсулирована с помощью полиГу при различных соотношениях N/P (фиг. 27). ПолиГу продемонстрировал хорошую способность нейтрализовать заряд мРНК шиповидного белка и успешно захватил его при соотношении N/P, равном 1.

Затем мы трансфицировали мРНК шиповидного белка в клетки HEK293T и провели вестерн-блоттинг. Клетки HEK293T трансфицировали 3 мкг мРНК шиповидного белка. Через 48 часов после трансфекции клетки анализировали на экспрессию шиповидных белков с помощью вестерн-блоттинга с применением специфичных для шиповидных белков антител. Результат показал значительную полосу шиповидного белка SARS-Cov-2 примерно 250 кДа, и буфер PBS с мРНК шиповидного белка был применен в качестве отрицательного контроля (фиг. 28), что подтвердило возможность применения полигуанина в качестве наноносителя для трансфекции мРНК in vitro. Кроме того, полиГу не проявлял явной цитотоксичности до 10 мкг (50 мкг/мл) (фиг. 29). В то время как липидные наночастицы (LNP) проявляли гораздо более высокую токсичность по отношению к клеткам с высокой нагрузкой комплексов.

В заключение, мы разработали серию поли(дисульфидов) и продемонстрировали, что комбинация гуанидильной группы и цвиттер-ионного спейсера демонстрирует высокую эффективность доставки мРНК in vitro. Эффективная внутриклеточная доставка через тиол-опосредованный путь поглощения штаммами дисульфидов расщепляется внутриклеточным глутатионом. Кроме того, деградация полимеров также минимизирует цитотоксичность по сравнению с обычно применяемыми LNP против SARS-Cov-2.

Все публикации и патентные заявки, цитируемые в данном описании, включены сюда в качестве отсылки, как если бы каждая отдельная публикация или патентная заявка были конкретно и отдельно указаны для включения в качестве отсылки.

Хотя вышеизложенное изобретение было описано довольно подробно посредством иллюстрации и примера в целях ясности понимания, специалистам в данной области техники будет очевидно, что в свете положений настоящего изобретения в него могут быть внесены определенные изменения и модификации без отклонения от сущности или объема прилагаемой формулы изобретения.

--->

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> ACADEMIA SINICA

WONG, CHI-HUEY

WU, CHUNG-YI

MA, CHE

FAN, CHEN-YU

<120> MESSENGER RNA VACCINES AGAINST WIDE SPECTRUM OF CORONAVIRUS

VARIANTS

<130> G4590-15000PCT

<150> US 63/173,752

<151> 2021-04-12

<150> US 63/264,737

<151> 2021-12-01

<160> 52

<170> PatentIn version 3.5

<210> 1

<211> 3822

<212> DNA

<213> SARS-CoV-2 (Wuhan strain)

<400> 1

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccaaccg agtctatcgt gcgctttcct aatatcacaa acctgtgccc atttggcgag 1020

gtgttcaacg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctaacaat agcatcgcca tcccaaccaa cttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

aatttttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacaaggt ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc caacggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gaatcacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatcaatg cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctga acgagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 2

<211> 1273

<212> PRT

<213> SARS-CoV-2 (Wuhan strain)

<400> 2

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 3

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-RBD)

<400> 3

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccagccg aggcgatcgt gcgctttcct gaaatcacaa acctgtgccc atttggcgag 1020

gtgttcgagg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctaacaat agcatcgcca tcccaaccaa cttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

aatttttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacaaggt ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc caacggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gaatcacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatcaatg cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctga acgagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 4

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-RBD)

<400> 4

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Ala Glu Ala Ile Val Arg Phe Pro Gln Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Gln Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 5

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-S2)

<400> 5

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccaaccg agtctatcgt gcgctttcct aatatcacaa acctgtgccc atttggcgag 1020

gtgttcaacg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctcagaat agcatcgcca tcccaaccca gttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

caattttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacaaggt ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaagc agttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc ccagggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtgc agaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gcaacacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatccaag cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctgc aggagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 6

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-S2)

<400> 6

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Gln Asn Ser Ile Ala Ile Pro Thr Gln Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Gln Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Gln Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Gln

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Gln Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Gln

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Gln

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Gln Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 7

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(S2-1194)

<400> 7

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccaaccg agtctatcgt gcgctttcct aatatcacaa acctgtgccc atttggcgag 1020

gtgttcaacg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctcagaat agcatcgcca tcccaaccca gttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

caattttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacaaggt ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaagc agttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc ccagggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtgc agaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gcaacacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatccaag cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctga acgagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 8

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(S2-1194)

<400> 8

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Gln Asn Ser Ile Ala Ile Pro Thr Gln Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Gln Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Gln Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Gln

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Gln Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Gln

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Gln

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 9

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-801)

<400> 9

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccagccg aggcgatcgt gcgctttcct gaaatcacaa acctgtgccc atttggcgag 1020

gtgttcgagg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctaacaat agcatcgcca tcccaaccaa cttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

caattttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacaaggt ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc caacggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gaatcacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatcaatg cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctga acgagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 10

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-801)

<400> 10

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Ala Glu Ala Ile Val Arg Phe Pro Gln Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Gln Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Gln Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 11

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-1194)

<400> 11

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccagccg aggcgatcgt gcgctttcct gaaatcacaa acctgtgccc atttggcgag 1020

gtgttcgagg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctaacaat agcatcgcca tcccaaccaa cttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

aatttttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacaaggt ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc caacggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gaatcacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatcaatg cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctgc aggagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 12

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-1194)

<400> 12

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Ala Glu Ala Ile Val Arg Phe Pro Gln Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Gln Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Gln Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 13

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-122-165-234)

<400> 13

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aaccaagcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca accagtgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatcc agatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccagccg aggcgatcgt gcgctttcct gaaatcacaa acctgtgccc atttggcgag 1020

gtgttcgagg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctaacaat agcatcgcca tcccaaccaa cttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

aatttttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacaaggt ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc caacggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gaatcacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatcaatg cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctga acgagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 14

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-122-165-234)

<400> 14

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Gln Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Gln Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Gln Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Ala Glu Ala Ile Val Arg Phe Pro Gln Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Gln Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 15

<211> 3816

<212> DNA

<213> SARS-CoV-2 (Delta strain)

<400> 15

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgcgaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctatcgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctggacgtgt actatcacaa gaacaataag agctggatgg agtccggagt gtattctagc 480

gccaacaact gcacatttga gtacgtgagc cagcctttcc tgatggacct ggagggcaag 540

cagggcaatt tcaagaacct gagggagttc gtgtttaaga atatcgacgg ctacttcaaa 600

atctactcta agcacacccc catcaacctg gtgcgcgacc tgcctcaggg cttcagcgcc 660

ctggagcccc tggtggatct gcctatcggc atcaacatca cccggtttca gacactgctg 720

gccctgcaca gaagctacct gacacccggc gactcctcta gcggatggac cgccggcgct 780

gccgcctact atgtgggcta cctccagccc cggaccttcc tgctgaagta caacgagaat 840

ggcaccatca cagacgcagt ggattgcgcc ctggaccccc tgagcgagac aaagtgtaca 900

ctgaagtcct ttaccgtgga gaagggcatc tatcagacat ccaatttcag ggtgcagcca 960

accgagtcta tcgtgcgctt tcctaatatc acaaacctgt gcccatttgg cgaggtgttc 1020

aacgcaaccc gcttcgccag cgtgtacgcc tggaatagga agcggatcag caactgcgtg 1080

gccgactata gcgtgctgta caactccgcc tctttcagca cctttaagtg ctatggcgtg 1140

tcccccacaa agctgaatga cctgtgcttt accaacgtct acgccgattc tttcgtgatc 1200

aggggcgacg aggtgcgcca gatcgccccc ggccagacag gcaagatcgc agactacaat 1260

tataagctgc cagacgattt caccggctgc gtgatcgcct ggaacagcaa caatctggat 1320

tccaaagtgg gcggcaacta caattatcgg taccggctgt ttagaaagag caatctgaag 1380

cccttcgaga gggacatctc tacagaaatc taccaggccg gcagcaagcc ttgcaatggc 1440

gtggagggct ttaactgtta tttcccactc cagtcctacg gcttccagcc cacaaacggc 1500

gtgggctatc agccttaccg cgtggtggtg ctgagctttg agctgctgca cgccccagca 1560

acagtgtgcg gccccaagaa gtccaccaat ctggtgaaga acaagtgcgt gaacttcaac 1620

ttcaacggcc tgaccggcac aggcgtgctg accgagtcca acaagaagtt cctgccattt 1680

cagcagttcg gcagggacat cgcagatacc acagacgccg tgcgcgaccc acagaccctg 1740

gagatcctgg acatcacacc ctgctctttc ggcggcgtga gcgtgatcac acccggcacc 1800

aatacaagca accaggtggc cgtgctgtat cagggcgtga attgtaccga ggtgcccgtg 1860

gctatccacg ccgatcagct gaccccaaca tggcgggtgt acagcaccgg ctccaacgtc 1920

ttccagacaa gagccggatg cctgatcgga gcagagcacg tgaacaattc ctatgagtgc 1980

gacatcccaa tcggcgccgg catctgtgcc tcttaccaga cccagacaaa ctctcgcaga 2040

agagcccgga gcgtggcctc ccagtctatc atcgcctata ccatgtccct gggcgccgag 2100

aacagcgtgg cctactctaa caatagcatc gccatcccaa ccaacttcac aatctctgtg 2160

accacagaga tcctgcccgt gtccatgacc aagacatctg tggactgcac aatgtatatc 2220

tgtggcgatt ctaccgagtg cagcaacctg ctgctccagt acggcagctt ttgtacccag 2280

ctgaatagag ccctgacagg catcgccgtg gagcaggata agaacacaca ggaggtgttc 2340

gcccaggtga agcaaatcta caagaccccc cctatcaagg actttggcgg cttcaatttt 2400

tcccagatcc tgcctgatcc atccaagcct tctaagcgga gctttatcga ggacctgctg 2460

ttcaacaagg tgaccctggc cgatgccggc ttcatcaagc agtatggcga ttgcctgggc 2520

gacatcgcag ccagggacct gatctgcgcc cagaagttta atggcctgac cgtgctgcca 2580

cccctgctga cagatgagat gatcgcacag tacacaagcg ccctgctggc cggcaccatc 2640

acatccggat ggaccttcgg cgcaggagcc gccctccaga tcccctttgc catgcagatg 2700

gcctataggt tcaacggcat cggcgtgacc cagaatgtgc tgtacgagaa ccagaagctg 2760

atcgccaatc agtttaactc cgccatcggc aagatccagg acagcctgtc ctctacagcc 2820

agcgccctgg gcaagctcca gaatgtggtg aatcagaacg cccaggccct gaataccctg 2880

gtgaagcagc tgagcagcaa cttcggcgcc atctctagcg tgctgaatga catcctgagc 2940

cggctggaca aggtggaggc agaggtgcag atcgaccggc tgatcaccgg ccggctccag 3000

agcctccaga cctatgtgac acagcagctg atcagggccg ccgagatcag ggccagcgcc 3060

aatctggcag caaccaagat gtccgagtgc gtgctgggcc agtctaagag agtggacttt 3120

tgtggcaagg gctatcacct gatgtccttc cctcagtctg ccccacacgg cgtggtgttt 3180

ctgcacgtga cctacgtgcc cgcccaggag aagaacttca ccacagcccc tgccatctgc 3240

cacgatggca aggcccactt tccaagggag ggcgtgttcg tgtccaacgg cacccactgg 3300

tttgtgacac agcgcaattt ctacgagccc cagatcatca ccacagacaa caccttcgtg 3360

agcggcaact gtgacgtggt catcggcatc gtgaacaata ccgtgtatga tccactccag 3420

cccgagctgg acagctttaa ggaggagctg gataagtatt tcaagaatca cacctcccct 3480

gacgtggatc tgggcgacat cagcggcatc aatgcctccg tggtgaacat ccagaaggag 3540

atcgaccgcc tgaacgaggt ggctaagaat ctgaacgaga gcctgatcga cctccaggag 3600

ctgggcaagt atgagcagta catcaagtgg ccctggtaca tctggctggg cttcatcgcc 3660

ggcctgatcg ccatcgtgat ggtgaccatc atgctgtgct gtatgacatc ctgctgttct 3720

tgcctgaagg gctgctgtag ctgtggctcc tgctgtaagt ttgacgagga tgactctgaa 3780

cctgtgctga agggcgtgaa gctgcattac acctaa 3816

<210> 16

<211> 1271

<212> PRT

<213> SARS-CoV-2 (Delta strain)

<400> 16

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Arg Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Gly Val Tyr Ser Ser

145 150 155 160

Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp

165 170 175

Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe

180 185 190

Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile

195 200 205

Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu

210 215 220

Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu

225 230 235 240

Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp

245 250 255

Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr

260 265 270

Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp

275 280 285

Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe

290 295 300

Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro

305 310 315 320

Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe

325 330 335

Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn

340 345 350

Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn

355 360 365

Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys

370 375 380

Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile

385 390 395 400

Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile

405 410 415

Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile

420 425 430

Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn

435 440 445

Tyr Arg Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg

450 455 460

Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Lys Pro Cys Asn Gly

465 470 475 480

Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln

485 490 495

Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser

500 505 510

Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser

515 520 525

Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu

530 535 540

Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe

545 550 555 560

Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp

565 570 575

Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly

580 585 590

Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val

595 600 605

Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala

610 615 620

Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val

625 630 635 640

Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn

645 650 655

Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr

660 665 670

Gln Thr Gln Thr Asn Ser Arg Arg Arg Ala Arg Ser Val Ala Ser Gln

675 680 685

Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala

690 695 700

Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val

705 710 715 720

Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys

725 730 735

Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu

740 745 750

Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile

755 760 765

Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys

770 775 780

Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe

785 790 795 800

Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile

805 810 815

Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile

820 825 830

Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile

835 840 845

Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr

850 855 860

Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile

865 870 875 880

Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe

885 890 895

Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn

900 905 910

Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala

915 920 925

Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly

930 935 940

Lys Leu Gln Asn Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu

945 950 955 960

Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn

965 970 975

Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp

980 985 990

Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln

995 1000 1005

Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala

1010 1015 1020

Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val

1025 1030 1035

Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser

1040 1045 1050

Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala

1055 1060 1065

Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly

1070 1075 1080

Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr

1085 1090 1095

His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile

1100 1105 1110

Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile

1115 1120 1125

Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu

1130 1135 1140

Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr

1145 1150 1155

Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser

1160 1165 1170

Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala

1175 1180 1185

Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys

1190 1195 1200

Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe

1205 1210 1215

Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys

1220 1225 1230

Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys

1235 1240 1245

Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu

1250 1255 1260

Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 17

<211> 3822

<212> DNA

<213> SARS-CoV-2 (Wuhan strain S-2P strain)

<400> 17

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccaaccg agtctatcgt gcgctttcct aatatcacaa acctgtgccc atttggcgag 1020

gtgttcaacg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctaacaat agcatcgcca tcccaaccaa cttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

aatttttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacccgcc ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc caacggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gaatcacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatcaatg cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctga acgagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 18

<211> 1273

<212> PRT

<213> SARS-CoV-2 (Wuhan strain S-2P strain)

<400> 18

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 19

<211> 3816

<212> DNA

<213> SARS-CoV-2 (Delta S-2P strain)

<400> 19

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgcgaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctatcgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctggacgtgt actatcacaa gaacaataag agctggatgg agtccggagt gtattctagc 480

gccaacaact gcacatttga gtacgtgagc cagcctttcc tgatggacct ggagggcaag 540

cagggcaatt tcaagaacct gagggagttc gtgtttaaga atatcgacgg ctacttcaaa 600

atctactcta agcacacccc catcaacctg gtgcgcgacc tgcctcaggg cttcagcgcc 660

ctggagcccc tggtggatct gcctatcggc atcaacatca cccggtttca gacactgctg 720

gccctgcaca gaagctacct gacacccggc gactcctcta gcggatggac cgccggcgct 780

gccgcctact atgtgggcta cctccagccc cggaccttcc tgctgaagta caacgagaat 840

ggcaccatca cagacgcagt ggattgcgcc ctggaccccc tgagcgagac aaagtgtaca 900

ctgaagtcct ttaccgtgga gaagggcatc tatcagacat ccaatttcag ggtgcagcca 960

accgagtcta tcgtgcgctt tcctaatatc acaaacctgt gcccatttgg cgaggtgttc 1020

aacgcaaccc gcttcgccag cgtgtacgcc tggaatagga agcggatcag caactgcgtg 1080

gccgactata gcgtgctgta caactccgcc tctttcagca cctttaagtg ctatggcgtg 1140

tcccccacaa agctgaatga cctgtgcttt accaacgtct acgccgattc tttcgtgatc 1200

aggggcgacg aggtgcgcca gatcgccccc ggccagacag gcaagatcgc agactacaat 1260

tataagctgc cagacgattt caccggctgc gtgatcgcct ggaacagcaa caatctggat 1320

tccaaagtgg gcggcaacta caattatcgg taccggctgt ttagaaagag caatctgaag 1380

cccttcgaga gggacatctc tacagaaatc taccaggccg gcagcaagcc ttgcaatggc 1440

gtggagggct ttaactgtta tttcccactc cagtcctacg gcttccagcc cacaaacggc 1500

gtgggctatc agccttaccg cgtggtggtg ctgagctttg agctgctgca cgccccagca 1560

acagtgtgcg gccccaagaa gtccaccaat ctggtgaaga acaagtgcgt gaacttcaac 1620

ttcaacggcc tgaccggcac aggcgtgctg accgagtcca acaagaagtt cctgccattt 1680

cagcagttcg gcagggacat cgcagatacc acagacgccg tgcgcgaccc acagaccctg 1740

gagatcctgg acatcacacc ctgctctttc ggcggcgtga gcgtgatcac acccggcacc 1800

aatacaagca accaggtggc cgtgctgtat cagggcgtga attgtaccga ggtgcccgtg 1860

gctatccacg ccgatcagct gaccccaaca tggcgggtgt acagcaccgg ctccaacgtc 1920

ttccagacaa gagccggatg cctgatcgga gcagagcacg tgaacaattc ctatgagtgc 1980

gacatcccaa tcggcgccgg catctgtgcc tcttaccaga cccagacaaa ctctcgcaga 2040

agagcccgga gcgtggcctc ccagtctatc atcgcctata ccatgtccct gggcgccgag 2100

aacagcgtgg cctactctaa caatagcatc gccatcccaa ccaacttcac aatctctgtg 2160

accacagaga tcctgcccgt gtccatgacc aagacatctg tggactgcac aatgtatatc 2220

tgtggcgatt ctaccgagtg cagcaacctg ctgctccagt acggcagctt ttgtacccag 2280

ctgaatagag ccctgacagg catcgccgtg gagcaggata agaacacaca ggaggtgttc 2340

gcccaggtga agcaaatcta caagaccccc cctatcaagg actttggcgg cttcaatttt 2400

tcccagatcc tgcctgatcc atccaagcct tctaagcgga gctttatcga ggacctgctg 2460

ttcaacaagg tgaccctggc cgatgccggc ttcatcaagc agtatggcga ttgcctgggc 2520

gacatcgcag ccagggacct gatctgcgcc cagaagttta atggcctgac cgtgctgcca 2580

cccctgctga cagatgagat gatcgcacag tacacaagcg ccctgctggc cggcaccatc 2640

acatccggat ggaccttcgg cgcaggagcc gccctccaga tcccctttgc catgcagatg 2700

gcctataggt tcaacggcat cggcgtgacc cagaatgtgc tgtacgagaa ccagaagctg 2760

atcgccaatc agtttaactc cgccatcggc aagatccagg acagcctgtc ctctacagcc 2820

agcgccctgg gcaagctcca gaatgtggtg aatcagaacg cccaggccct gaataccctg 2880

gtgaagcagc tgagcagcaa cttcggcgcc atctctagcg tgctgaatga catcctgagc 2940

cggctggacc cgccggaggc agaggtgcag atcgaccggc tgatcaccgg ccggctccag 3000

agcctccaga cctatgtgac acagcagctg atcagggccg ccgagatcag ggccagcgcc 3060

aatctggcag caaccaagat gtccgagtgc gtgctgggcc agtctaagag agtggacttt 3120

tgtggcaagg gctatcacct gatgtccttc cctcagtctg ccccacacgg cgtggtgttt 3180

ctgcacgtga cctacgtgcc cgcccaggag aagaacttca ccacagcccc tgccatctgc 3240

cacgatggca aggcccactt tccaagggag ggcgtgttcg tgtccaacgg cacccactgg 3300

tttgtgacac agcgcaattt ctacgagccc cagatcatca ccacagacaa caccttcgtg 3360

agcggcaact gtgacgtggt catcggcatc gtgaacaata ccgtgtatga tccactccag 3420

cccgagctgg acagctttaa ggaggagctg gataagtatt tcaagaatca cacctcccct 3480

gacgtggatc tgggcgacat cagcggcatc aatgcctccg tggtgaacat ccagaaggag 3540

atcgaccgcc tgaacgaggt ggctaagaat ctgaacgaga gcctgatcga cctccaggag 3600

ctgggcaagt atgagcagta catcaagtgg ccctggtaca tctggctggg cttcatcgcc 3660

ggcctgatcg ccatcgtgat ggtgaccatc atgctgtgct gtatgacatc ctgctgttct 3720

tgcctgaagg gctgctgtag ctgtggctcc tgctgtaagt ttgacgagga tgactctgaa 3780

cctgtgctga agggcgtgaa gctgcattac acctaa 3816

<210> 20

<211> 1271

<212> PRT

<213> SARS-CoV-2 (Delta S-2P strain)

<400> 20

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Arg Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Gly Val Tyr Ser Ser

145 150 155 160

Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp

165 170 175

Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe

180 185 190

Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile

195 200 205

Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu

210 215 220

Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu

225 230 235 240

Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp

245 250 255

Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr

260 265 270

Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp

275 280 285

Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe

290 295 300

Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro

305 310 315 320

Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe

325 330 335

Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn

340 345 350

Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn

355 360 365

Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys

370 375 380

Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile

385 390 395 400

Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile

405 410 415

Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile

420 425 430

Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn

435 440 445

Tyr Arg Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg

450 455 460

Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Lys Pro Cys Asn Gly

465 470 475 480

Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln

485 490 495

Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser

500 505 510

Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser

515 520 525

Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu

530 535 540

Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe

545 550 555 560

Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp

565 570 575

Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly

580 585 590

Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val

595 600 605

Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala

610 615 620

Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val

625 630 635 640

Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn

645 650 655

Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr

660 665 670

Gln Thr Gln Thr Asn Ser Arg Arg Arg Ala Arg Ser Val Ala Ser Gln

675 680 685

Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala

690 695 700

Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val

705 710 715 720

Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys

725 730 735

Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu

740 745 750

Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile

755 760 765

Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys

770 775 780

Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe

785 790 795 800

Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile

805 810 815

Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile

820 825 830

Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile

835 840 845

Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr

850 855 860

Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile

865 870 875 880

Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe

885 890 895

Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn

900 905 910

Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala

915 920 925

Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly

930 935 940

Lys Leu Gln Asn Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu

945 950 955 960

Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn

965 970 975

Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp

980 985 990

Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln

995 1000 1005

Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala

1010 1015 1020

Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val

1025 1030 1035

Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser

1040 1045 1050

Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala

1055 1060 1065

Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly

1070 1075 1080

Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr

1085 1090 1095

His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile

1100 1105 1110

Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile

1115 1120 1125

Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu

1130 1135 1140

Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr

1145 1150 1155

Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser

1160 1165 1170

Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala

1175 1180 1185

Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys

1190 1195 1200

Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe

1205 1210 1215

Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys

1220 1225 1230

Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys

1235 1240 1245

Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu

1250 1255 1260

Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 21

<211> 3816

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-RBD) for Delta strain

<400> 21

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgcgaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctatcgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctggacgtgt actatcacaa gaacaataag agctggatgg agtccggagt gtattctagc 480

gccaacaact gcacatttga gtacgtgagc cagcctttcc tgatggacct ggagggcaag 540

cagggcaatt tcaagaacct gagggagttc gtgtttaaga atatcgacgg ctacttcaaa 600

atctactcta agcacacccc catcaacctg gtgcgcgacc tgcctcaggg cttcagcgcc 660

ctggagcccc tggtggatct gcctatcggc atcaacatca cccggtttca gacactgctg 720

gccctgcaca gaagctacct gacacccggc gactcctcta gcggatggac cgccggcgct 780

gccgcctact atgtgggcta cctccagccc cggaccttcc tgctgaagta caacgagaat 840

ggcaccatca cagacgcagt ggattgcgcc ctggaccccc tgagcgagac aaagtgtaca 900

ctgaagtcct ttaccgtgga gaagggcatc tatcagacat ccaatttcag ggtgcagcca 960

gccgaggcga tcgtgcgctt tcctgaaatc acaaacctgt gcccatttgg cgaggtgttc 1020

gaggcaaccc gcttcgccag cgtgtacgcc tggaatagga agcggatcag caactgcgtg 1080

gccgactata gcgtgctgta caactccgcc tctttcagca cctttaagtg ctatggcgtg 1140

tcccccacaa agctgaatga cctgtgcttt accaacgtct acgccgattc tttcgtgatc 1200

aggggcgacg aggtgcgcca gatcgccccc ggccagacag gcaagatcgc agactacaat 1260

tataagctgc cagacgattt caccggctgc gtgatcgcct ggaacagcaa caatctggat 1320

tccaaagtgg gcggcaacta caattatcgg taccggctgt ttagaaagag caatctgaag 1380

cccttcgaga gggacatctc tacagaaatc taccaggccg gcagcaagcc ttgcaatggc 1440

gtggagggct ttaactgtta tttcccactc cagtcctacg gcttccagcc cacaaacggc 1500

gtgggctatc agccttaccg cgtggtggtg ctgagctttg agctgctgca cgccccagca 1560

acagtgtgcg gccccaagaa gtccaccaat ctggtgaaga acaagtgcgt gaacttcaac 1620

ttcaacggcc tgaccggcac aggcgtgctg accgagtcca acaagaagtt cctgccattt 1680

cagcagttcg gcagggacat cgcagatacc acagacgccg tgcgcgaccc acagaccctg 1740

gagatcctgg acatcacacc ctgctctttc ggcggcgtga gcgtgatcac acccggcacc 1800

aatacaagca accaggtggc cgtgctgtat cagggcgtga attgtaccga ggtgcccgtg 1860

gctatccacg ccgatcagct gaccccaaca tggcgggtgt acagcaccgg ctccaacgtc 1920

ttccagacaa gagccggatg cctgatcgga gcagagcacg tgaacaattc ctatgagtgc 1980

gacatcccaa tcggcgccgg catctgtgcc tcttaccaga cccagacaaa ctctcgcaga 2040

agagcccgga gcgtggcctc ccagtctatc atcgcctata ccatgtccct gggcgccgag 2100

aacagcgtgg cctactctaa caatagcatc gccatcccaa ccaacttcac aatctctgtg 2160

accacagaga tcctgcccgt gtccatgacc aagacatctg tggactgcac aatgtatatc 2220

tgtggcgatt ctaccgagtg cagcaacctg ctgctccagt acggcagctt ttgtacccag 2280

ctgaatagag ccctgacagg catcgccgtg gagcaggata agaacacaca ggaggtgttc 2340

gcccaggtga agcaaatcta caagaccccc cctatcaagg actttggcgg cttcaatttt 2400

tcccagatcc tgcctgatcc atccaagcct tctaagcgga gctttatcga ggacctgctg 2460

ttcaacaagg tgaccctggc cgatgccggc ttcatcaagc agtatggcga ttgcctgggc 2520

gacatcgcag ccagggacct gatctgcgcc cagaagttta atggcctgac cgtgctgcca 2580

cccctgctga cagatgagat gatcgcacag tacacaagcg ccctgctggc cggcaccatc 2640

acatccggat ggaccttcgg cgcaggagcc gccctccaga tcccctttgc catgcagatg 2700

gcctataggt tcaacggcat cggcgtgacc cagaatgtgc tgtacgagaa ccagaagctg 2760

atcgccaatc agtttaactc cgccatcggc aagatccagg acagcctgtc ctctacagcc 2820

agcgccctgg gcaagctcca gaatgtggtg aatcagaacg cccaggccct gaataccctg 2880

gtgaagcagc tgagcagcaa cttcggcgcc atctctagcg tgctgaatga catcctgagc 2940

cggctggaca aggtggaggc agaggtgcag atcgaccggc tgatcaccgg ccggctccag 3000

agcctccaga cctatgtgac acagcagctg atcagggccg ccgagatcag ggccagcgcc 3060

aatctggcag caaccaagat gtccgagtgc gtgctgggcc agtctaagag agtggacttt 3120

tgtggcaagg gctatcacct gatgtccttc cctcagtctg ccccacacgg cgtggtgttt 3180

ctgcacgtga cctacgtgcc cgcccaggag aagaacttca ccacagcccc tgccatctgc 3240

cacgatggca aggcccactt tccaagggag ggcgtgttcg tgtccaacgg cacccactgg 3300

tttgtgacac agcgcaattt ctacgagccc cagatcatca ccacagacaa caccttcgtg 3360

agcggcaact gtgacgtggt catcggcatc gtgaacaata ccgtgtatga tccactccag 3420

cccgagctgg acagctttaa ggaggagctg gataagtatt tcaagaatca cacctcccct 3480

gacgtggatc tgggcgacat cagcggcatc aatgcctccg tggtgaacat ccagaaggag 3540

atcgaccgcc tgaacgaggt ggctaagaat ctgaacgaga gcctgatcga cctccaggag 3600

ctgggcaagt atgagcagta catcaagtgg ccctggtaca tctggctggg cttcatcgcc 3660

ggcctgatcg ccatcgtgat ggtgaccatc atgctgtgct gtatgacatc ctgctgttct 3720

tgcctgaagg gctgctgtag ctgtggctcc tgctgtaagt ttgacgagga tgactctgaa 3780

cctgtgctga agggcgtgaa gctgcattac acctaa 3816

<210> 22

<211> 1271

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-RBD) for Delta strain

<400> 22

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Arg Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Gly Val Tyr Ser Ser

145 150 155 160

Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp

165 170 175

Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe

180 185 190

Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile

195 200 205

Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu

210 215 220

Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu

225 230 235 240

Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp

245 250 255

Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr

260 265 270

Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp

275 280 285

Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe

290 295 300

Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro

305 310 315 320

Ala Glu Ala Ile Val Arg Phe Pro Gln Ile Thr Asn Leu Cys Pro Phe

325 330 335

Gly Glu Val Phe Gln Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn

340 345 350

Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn

355 360 365

Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys

370 375 380

Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile

385 390 395 400

Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile

405 410 415

Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile

420 425 430

Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn

435 440 445

Tyr Arg Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg

450 455 460

Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Lys Pro Cys Asn Gly

465 470 475 480

Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln

485 490 495

Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser

500 505 510

Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser

515 520 525

Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu

530 535 540

Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe

545 550 555 560

Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp

565 570 575

Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly

580 585 590

Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val

595 600 605

Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala

610 615 620

Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val

625 630 635 640

Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn

645 650 655

Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr

660 665 670

Gln Thr Gln Thr Asn Ser Arg Arg Arg Ala Arg Ser Val Ala Ser Gln

675 680 685

Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala

690 695 700

Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val

705 710 715 720

Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys

725 730 735

Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu

740 745 750

Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile

755 760 765

Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys

770 775 780

Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe

785 790 795 800

Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile

805 810 815

Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile

820 825 830

Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile

835 840 845

Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr

850 855 860

Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile

865 870 875 880

Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe

885 890 895

Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn

900 905 910

Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala

915 920 925

Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly

930 935 940

Lys Leu Gln Asn Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu

945 950 955 960

Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn

965 970 975

Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp

980 985 990

Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln

995 1000 1005

Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala

1010 1015 1020

Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val

1025 1030 1035

Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser

1040 1045 1050

Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala

1055 1060 1065

Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly

1070 1075 1080

Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr

1085 1090 1095

His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile

1100 1105 1110

Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile

1115 1120 1125

Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu

1130 1135 1140

Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr

1145 1150 1155

Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser

1160 1165 1170

Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala

1175 1180 1185

Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys

1190 1195 1200

Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe

1205 1210 1215

Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys

1220 1225 1230

Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys

1235 1240 1245

Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu

1250 1255 1260

Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 23

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-RBD) for Wuhan S-2P strain

<400> 23

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccagccg aggcgatcgt gcgctttcct gaaatcacaa acctgtgccc atttggcgag 1020

gtgttcgagg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctaacaat agcatcgcca tcccaaccaa cttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

aatttttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacccgcc ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc caacggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gaatcacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatcaatg cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctga acgagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 24

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> Protein sequence of S-(deg-RBD) for Wuhan S-2P strain

<400> 24

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Ala Glu Ala Ile Val Arg Phe Pro Gln Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Gln Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 25

<211> 3816

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-RBD) for Delta S-2P strain

<400> 25

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgcgaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctatcgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctggacgtgt actatcacaa gaacaataag agctggatgg agtccggagt gtattctagc 480

gccaacaact gcacatttga gtacgtgagc cagcctttcc tgatggacct ggagggcaag 540

cagggcaatt tcaagaacct gagggagttc gtgtttaaga atatcgacgg ctacttcaaa 600

atctactcta agcacacccc catcaacctg gtgcgcgacc tgcctcaggg cttcagcgcc 660

ctggagcccc tggtggatct gcctatcggc atcaacatca cccggtttca gacactgctg 720

gccctgcaca gaagctacct gacacccggc gactcctcta gcggatggac cgccggcgct 780

gccgcctact atgtgggcta cctccagccc cggaccttcc tgctgaagta caacgagaat 840

ggcaccatca cagacgcagt ggattgcgcc ctggaccccc tgagcgagac aaagtgtaca 900

ctgaagtcct ttaccgtgga gaagggcatc tatcagacat ccaatttcag ggtgcagcca 960

gccgaggcga tcgtgcgctt tcctgaaatc acaaacctgt gcccatttgg cgaggtgttc 1020

gaggcaaccc gcttcgccag cgtgtacgcc tggaatagga agcggatcag caactgcgtg 1080

gccgactata gcgtgctgta caactccgcc tctttcagca cctttaagtg ctatggcgtg 1140

tcccccacaa agctgaatga cctgtgcttt accaacgtct acgccgattc tttcgtgatc 1200

aggggcgacg aggtgcgcca gatcgccccc ggccagacag gcaagatcgc agactacaat 1260

tataagctgc cagacgattt caccggctgc gtgatcgcct ggaacagcaa caatctggat 1320

tccaaagtgg gcggcaacta caattatcgg taccggctgt ttagaaagag caatctgaag 1380

cccttcgaga gggacatctc tacagaaatc taccaggccg gcagcaagcc ttgcaatggc 1440

gtggagggct ttaactgtta tttcccactc cagtcctacg gcttccagcc cacaaacggc 1500

gtgggctatc agccttaccg cgtggtggtg ctgagctttg agctgctgca cgccccagca 1560

acagtgtgcg gccccaagaa gtccaccaat ctggtgaaga acaagtgcgt gaacttcaac 1620

ttcaacggcc tgaccggcac aggcgtgctg accgagtcca acaagaagtt cctgccattt 1680

cagcagttcg gcagggacat cgcagatacc acagacgccg tgcgcgaccc acagaccctg 1740

gagatcctgg acatcacacc ctgctctttc ggcggcgtga gcgtgatcac acccggcacc 1800

aatacaagca accaggtggc cgtgctgtat cagggcgtga attgtaccga ggtgcccgtg 1860

gctatccacg ccgatcagct gaccccaaca tggcgggtgt acagcaccgg ctccaacgtc 1920

ttccagacaa gagccggatg cctgatcgga gcagagcacg tgaacaattc ctatgagtgc 1980

gacatcccaa tcggcgccgg catctgtgcc tcttaccaga cccagacaaa ctctcgcaga 2040

agagcccgga gcgtggcctc ccagtctatc atcgcctata ccatgtccct gggcgccgag 2100

aacagcgtgg cctactctaa caatagcatc gccatcccaa ccaacttcac aatctctgtg 2160

accacagaga tcctgcccgt gtccatgacc aagacatctg tggactgcac aatgtatatc 2220

tgtggcgatt ctaccgagtg cagcaacctg ctgctccagt acggcagctt ttgtacccag 2280

ctgaatagag ccctgacagg catcgccgtg gagcaggata agaacacaca ggaggtgttc 2340

gcccaggtga agcaaatcta caagaccccc cctatcaagg actttggcgg cttcaatttt 2400

tcccagatcc tgcctgatcc atccaagcct tctaagcgga gctttatcga ggacctgctg 2460

ttcaacaagg tgaccctggc cgatgccggc ttcatcaagc agtatggcga ttgcctgggc 2520

gacatcgcag ccagggacct gatctgcgcc cagaagttta atggcctgac cgtgctgcca 2580

cccctgctga cagatgagat gatcgcacag tacacaagcg ccctgctggc cggcaccatc 2640

acatccggat ggaccttcgg cgcaggagcc gccctccaga tcccctttgc catgcagatg 2700

gcctataggt tcaacggcat cggcgtgacc cagaatgtgc tgtacgagaa ccagaagctg 2760

atcgccaatc agtttaactc cgccatcggc aagatccagg acagcctgtc ctctacagcc 2820

agcgccctgg gcaagctcca gaatgtggtg aatcagaacg cccaggccct gaataccctg 2880

gtgaagcagc tgagcagcaa cttcggcgcc atctctagcg tgctgaatga catcctgagc 2940

cggctggacc cgccggaggc agaggtgcag atcgaccggc tgatcaccgg ccggctccag 3000

agcctccaga cctatgtgac acagcagctg atcagggccg ccgagatcag ggccagcgcc 3060

aatctggcag caaccaagat gtccgagtgc gtgctgggcc agtctaagag agtggacttt 3120

tgtggcaagg gctatcacct gatgtccttc cctcagtctg ccccacacgg cgtggtgttt 3180

ctgcacgtga cctacgtgcc cgcccaggag aagaacttca ccacagcccc tgccatctgc 3240

cacgatggca aggcccactt tccaagggag ggcgtgttcg tgtccaacgg cacccactgg 3300

tttgtgacac agcgcaattt ctacgagccc cagatcatca ccacagacaa caccttcgtg 3360

agcggcaact gtgacgtggt catcggcatc gtgaacaata ccgtgtatga tccactccag 3420

cccgagctgg acagctttaa ggaggagctg gataagtatt tcaagaatca cacctcccct 3480

gacgtggatc tgggcgacat cagcggcatc aatgcctccg tggtgaacat ccagaaggag 3540

atcgaccgcc tgaacgaggt ggctaagaat ctgaacgaga gcctgatcga cctccaggag 3600

ctgggcaagt atgagcagta catcaagtgg ccctggtaca tctggctggg cttcatcgcc 3660

ggcctgatcg ccatcgtgat ggtgaccatc atgctgtgct gtatgacatc ctgctgttct 3720

tgcctgaagg gctgctgtag ctgtggctcc tgctgtaagt ttgacgagga tgactctgaa 3780

cctgtgctga agggcgtgaa gctgcattac acctaa 3816

<210> 26

<211> 1271

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-RBD) for Delta S-2P strain

<400> 26

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Arg Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Gly Val Tyr Ser Ser

145 150 155 160

Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp

165 170 175

Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe

180 185 190

Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile

195 200 205

Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu

210 215 220

Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu

225 230 235 240

Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp

245 250 255

Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr

260 265 270

Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp

275 280 285

Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe

290 295 300

Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro

305 310 315 320

Ala Glu Ala Ile Val Arg Phe Pro Gln Ile Thr Asn Leu Cys Pro Phe

325 330 335

Gly Glu Val Phe Gln Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn

340 345 350

Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn

355 360 365

Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys

370 375 380

Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile

385 390 395 400

Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile

405 410 415

Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile

420 425 430

Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn

435 440 445

Tyr Arg Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg

450 455 460

Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Lys Pro Cys Asn Gly

465 470 475 480

Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln

485 490 495

Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser

500 505 510

Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser

515 520 525

Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu

530 535 540

Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe

545 550 555 560

Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp

565 570 575

Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly

580 585 590

Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val

595 600 605

Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala

610 615 620

Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val

625 630 635 640

Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn

645 650 655

Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr

660 665 670

Gln Thr Gln Thr Asn Ser Arg Arg Arg Ala Arg Ser Val Ala Ser Gln

675 680 685

Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala

690 695 700

Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val

705 710 715 720

Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys

725 730 735

Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu

740 745 750

Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile

755 760 765

Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys

770 775 780

Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe

785 790 795 800

Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile

805 810 815

Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile

820 825 830

Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile

835 840 845

Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr

850 855 860

Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile

865 870 875 880

Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe

885 890 895

Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn

900 905 910

Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala

915 920 925

Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly

930 935 940

Lys Leu Gln Asn Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu

945 950 955 960

Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn

965 970 975

Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp

980 985 990

Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln

995 1000 1005

Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala

1010 1015 1020

Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val

1025 1030 1035

Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser

1040 1045 1050

Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala

1055 1060 1065

Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly

1070 1075 1080

Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr

1085 1090 1095

His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile

1100 1105 1110

Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile

1115 1120 1125

Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu

1130 1135 1140

Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr

1145 1150 1155

Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser

1160 1165 1170

Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala

1175 1180 1185

Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys

1190 1195 1200

Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe

1205 1210 1215

Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys

1220 1225 1230

Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys

1235 1240 1245

Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu

1250 1255 1260

Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 27

<211> 3816

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-S2) for Delta strain

<400> 27

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgcgaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctatcgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctggacgtgt actatcacaa gaacaataag agctggatgg agtccggagt gtattctagc 480

gccaacaact gcacatttga gtacgtgagc cagcctttcc tgatggacct ggagggcaag 540

cagggcaatt tcaagaacct gagggagttc gtgtttaaga atatcgacgg ctacttcaaa 600

atctactcta agcacacccc catcaacctg gtgcgcgacc tgcctcaggg cttcagcgcc 660

ctggagcccc tggtggatct gcctatcggc atcaacatca cccggtttca gacactgctg 720

gccctgcaca gaagctacct gacacccggc gactcctcta gcggatggac cgccggcgct 780

gccgcctact atgtgggcta cctccagccc cggaccttcc tgctgaagta caacgagaat 840

ggcaccatca cagacgcagt ggattgcgcc ctggaccccc tgagcgagac aaagtgtaca 900

ctgaagtcct ttaccgtgga gaagggcatc tatcagacat ccaatttcag ggtgcagcca 960

accgagtcta tcgtgcgctt tcctaatatc acaaacctgt gcccatttgg cgaggtgttc 1020

aacgcaaccc gcttcgccag cgtgtacgcc tggaatagga agcggatcag caactgcgtg 1080

gccgactata gcgtgctgta caactccgcc tctttcagca cctttaagtg ctatggcgtg 1140

tcccccacaa agctgaatga cctgtgcttt accaacgtct acgccgattc tttcgtgatc 1200

aggggcgacg aggtgcgcca gatcgccccc ggccagacag gcaagatcgc agactacaat 1260

tataagctgc cagacgattt caccggctgc gtgatcgcct ggaacagcaa caatctggat 1320

tccaaagtgg gcggcaacta caattatcgg taccggctgt ttagaaagag caatctgaag 1380

cccttcgaga gggacatctc tacagaaatc taccaggccg gcagcaagcc ttgcaatggc 1440

gtggagggct ttaactgtta tttcccactc cagtcctacg gcttccagcc cacaaacggc 1500

gtgggctatc agccttaccg cgtggtggtg ctgagctttg agctgctgca cgccccagca 1560

acagtgtgcg gccccaagaa gtccaccaat ctggtgaaga acaagtgcgt gaacttcaac 1620

ttcaacggcc tgaccggcac aggcgtgctg accgagtcca acaagaagtt cctgccattt 1680

cagcagttcg gcagggacat cgcagatacc acagacgccg tgcgcgaccc acagaccctg 1740

gagatcctgg acatcacacc ctgctctttc ggcggcgtga gcgtgatcac acccggcacc 1800

aatacaagca accaggtggc cgtgctgtat cagggcgtga attgtaccga ggtgcccgtg 1860

gctatccacg ccgatcagct gaccccaaca tggcgggtgt acagcaccgg ctccaacgtc 1920

ttccagacaa gagccggatg cctgatcgga gcagagcacg tgaacaattc ctatgagtgc 1980

gacatcccaa tcggcgccgg catctgtgcc tcttaccaga cccagacaaa ctctcgcaga 2040

agagcccgga gcgtggcctc ccagtctatc atcgcctata ccatgtccct gggcgccgag 2100

aacagcgtgg cctactctca gaatagcatc gccatcccaa cccagttcac aatctctgtg 2160

accacagaga tcctgcccgt gtccatgacc aagacatctg tggactgcac aatgtatatc 2220

tgtggcgatt ctaccgagtg cagcaacctg ctgctccagt acggcagctt ttgtacccag 2280

ctgaatagag ccctgacagg catcgccgtg gagcaggata agaacacaca ggaggtgttc 2340

gcccaggtga agcaaatcta caagaccccc cctatcaagg actttggcgg cttccaattt 2400

tcccagatcc tgcctgatcc atccaagcct tctaagcgga gctttatcga ggacctgctg 2460

ttcaacaagg tgaccctggc cgatgccggc ttcatcaagc agtatggcga ttgcctgggc 2520

gacatcgcag ccagggacct gatctgcgcc cagaagttta atggcctgac cgtgctgcca 2580

cccctgctga cagatgagat gatcgcacag tacacaagcg ccctgctggc cggcaccatc 2640

acatccggat ggaccttcgg cgcaggagcc gccctccaga tcccctttgc catgcagatg 2700

gcctataggt tcaacggcat cggcgtgacc cagaatgtgc tgtacgagaa ccagaagctg 2760

atcgccaatc agtttaactc cgccatcggc aagatccagg acagcctgtc ctctacagcc 2820

agcgccctgg gcaagctcca gaatgtggtg aatcagaacg cccaggccct gaataccctg 2880

gtgaagcagc tgagcagcaa cttcggcgcc atctctagcg tgctgaatga catcctgagc 2940

cggctggaca aggtggaggc agaggtgcag atcgaccggc tgatcaccgg ccggctccag 3000

agcctccaga cctatgtgac acagcagctg atcagggccg ccgagatcag ggccagcgcc 3060

aatctggcag caaccaagat gtccgagtgc gtgctgggcc agtctaagag agtggacttt 3120

tgtggcaagg gctatcacct gatgtccttc cctcagtctg ccccacacgg cgtggtgttt 3180

ctgcacgtga cctacgtgcc cgcccaggag aagcagttca ccacagcccc tgccatctgc 3240

cacgatggca aggcccactt tccaagggag ggcgtgttcg tgtcccaggg cacccactgg 3300

tttgtgacac agcgcaattt ctacgagccc cagatcatca ccacagacaa caccttcgtg 3360

agcggcaact gtgacgtggt catcggcatc gtgcagaata ccgtgtatga tccactccag 3420

cccgagctgg acagctttaa ggaggagctg gataagtatt tcaagcaaca cacctcccct 3480

gacgtggatc tgggcgacat cagcggcatc caagcctccg tggtgaacat ccagaaggag 3540

atcgaccgcc tgaacgaggt ggctaagaat ctgcaggaga gcctgatcga cctccaggag 3600

ctgggcaagt atgagcagta catcaagtgg ccctggtaca tctggctggg cttcatcgcc 3660

ggcctgatcg ccatcgtgat ggtgaccatc atgctgtgct gtatgacatc ctgctgttct 3720

tgcctgaagg gctgctgtag ctgtggctcc tgctgtaagt ttgacgagga tgactctgaa 3780

cctgtgctga agggcgtgaa gctgcattac acctaa 3816

<210> 28

<211> 1271

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-S2) for Delta strain

<400> 28

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Arg Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Gly Val Tyr Ser Ser

145 150 155 160

Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp

165 170 175

Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe

180 185 190

Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile

195 200 205

Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu

210 215 220

Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu

225 230 235 240

Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp

245 250 255

Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr

260 265 270

Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp

275 280 285

Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe

290 295 300

Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro

305 310 315 320

Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe

325 330 335

Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn

340 345 350

Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn

355 360 365

Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys

370 375 380

Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile

385 390 395 400

Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile

405 410 415

Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile

420 425 430

Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn

435 440 445

Tyr Arg Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg

450 455 460

Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Lys Pro Cys Asn Gly

465 470 475 480

Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln

485 490 495

Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser

500 505 510

Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser

515 520 525

Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu

530 535 540

Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe

545 550 555 560

Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp

565 570 575

Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly

580 585 590

Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val

595 600 605

Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala

610 615 620

Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val

625 630 635 640

Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn

645 650 655

Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr

660 665 670

Gln Thr Gln Thr Asn Ser Arg Arg Arg Ala Arg Ser Val Ala Ser Gln

675 680 685

Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala

690 695 700

Tyr Ser Gln Asn Ser Ile Ala Ile Pro Thr Gln Phe Thr Ile Ser Val

705 710 715 720

Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys

725 730 735

Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu

740 745 750

Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile

755 760 765

Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys

770 775 780

Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Gln Phe

785 790 795 800

Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile

805 810 815

Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile

820 825 830

Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile

835 840 845

Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr

850 855 860

Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile

865 870 875 880

Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe

885 890 895

Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn

900 905 910

Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala

915 920 925

Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly

930 935 940

Lys Leu Gln Asn Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu

945 950 955 960

Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn

965 970 975

Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp

980 985 990

Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln

995 1000 1005

Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala

1010 1015 1020

Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val

1025 1030 1035

Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser

1040 1045 1050

Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala

1055 1060 1065

Gln Glu Lys Gln Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly

1070 1075 1080

Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Gln Gly Thr

1085 1090 1095

His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile

1100 1105 1110

Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile

1115 1120 1125

Gly Ile Val Gln Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu

1130 1135 1140

Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Gln His Thr

1145 1150 1155

Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Gln Ala Ser

1160 1165 1170

Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala

1175 1180 1185

Lys Asn Leu Gln Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys

1190 1195 1200

Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe

1205 1210 1215

Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys

1220 1225 1230

Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys

1235 1240 1245

Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu

1250 1255 1260

Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 29

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-S2) for Wuhan S-2P

<400> 29

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccaaccg agtctatcgt gcgctttcct aatatcacaa acctgtgccc atttggcgag 1020

gtgttcaacg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctcagaat agcatcgcca tcccaaccca gttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

caattttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacccgcc ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaagc agttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc ccagggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtgc agaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gcaacacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatccaag cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctgc aggagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 30

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-S2) for Wuhan S-2P

<400> 30

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Gln Asn Ser Ile Ala Ile Pro Thr Gln Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Gln Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Gln Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Gln

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Gln Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Gln

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Gln

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Gln Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 31

<211> 3816

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-S2) for Delta S-2P strain

<400> 31

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgcgaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctatcgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctggacgtgt actatcacaa gaacaataag agctggatgg agtccggagt gtattctagc 480

gccaacaact gcacatttga gtacgtgagc cagcctttcc tgatggacct ggagggcaag 540

cagggcaatt tcaagaacct gagggagttc gtgtttaaga atatcgacgg ctacttcaaa 600

atctactcta agcacacccc catcaacctg gtgcgcgacc tgcctcaggg cttcagcgcc 660

ctggagcccc tggtggatct gcctatcggc atcaacatca cccggtttca gacactgctg 720

gccctgcaca gaagctacct gacacccggc gactcctcta gcggatggac cgccggcgct 780

gccgcctact atgtgggcta cctccagccc cggaccttcc tgctgaagta caacgagaat 840

ggcaccatca cagacgcagt ggattgcgcc ctggaccccc tgagcgagac aaagtgtaca 900

ctgaagtcct ttaccgtgga gaagggcatc tatcagacat ccaatttcag ggtgcagcca 960

accgagtcta tcgtgcgctt tcctaatatc acaaacctgt gcccatttgg cgaggtgttc 1020

aacgcaaccc gcttcgccag cgtgtacgcc tggaatagga agcggatcag caactgcgtg 1080

gccgactata gcgtgctgta caactccgcc tctttcagca cctttaagtg ctatggcgtg 1140

tcccccacaa agctgaatga cctgtgcttt accaacgtct acgccgattc tttcgtgatc 1200

aggggcgacg aggtgcgcca gatcgccccc ggccagacag gcaagatcgc agactacaat 1260

tataagctgc cagacgattt caccggctgc gtgatcgcct ggaacagcaa caatctggat 1320

tccaaagtgg gcggcaacta caattatcgg taccggctgt ttagaaagag caatctgaag 1380

cccttcgaga gggacatctc tacagaaatc taccaggccg gcagcaagcc ttgcaatggc 1440

gtggagggct ttaactgtta tttcccactc cagtcctacg gcttccagcc cacaaacggc 1500

gtgggctatc agccttaccg cgtggtggtg ctgagctttg agctgctgca cgccccagca 1560

acagtgtgcg gccccaagaa gtccaccaat ctggtgaaga acaagtgcgt gaacttcaac 1620

ttcaacggcc tgaccggcac aggcgtgctg accgagtcca acaagaagtt cctgccattt 1680

cagcagttcg gcagggacat cgcagatacc acagacgccg tgcgcgaccc acagaccctg 1740

gagatcctgg acatcacacc ctgctctttc ggcggcgtga gcgtgatcac acccggcacc 1800

aatacaagca accaggtggc cgtgctgtat cagggcgtga attgtaccga ggtgcccgtg 1860

gctatccacg ccgatcagct gaccccaaca tggcgggtgt acagcaccgg ctccaacgtc 1920

ttccagacaa gagccggatg cctgatcgga gcagagcacg tgaacaattc ctatgagtgc 1980

gacatcccaa tcggcgccgg catctgtgcc tcttaccaga cccagacaaa ctctcgcaga 2040

agagcccgga gcgtggcctc ccagtctatc atcgcctata ccatgtccct gggcgccgag 2100

aacagcgtgg cctactctca gaatagcatc gccatcccaa cccagttcac aatctctgtg 2160

accacagaga tcctgcccgt gtccatgacc aagacatctg tggactgcac aatgtatatc 2220

tgtggcgatt ctaccgagtg cagcaacctg ctgctccagt acggcagctt ttgtacccag 2280

ctgaatagag ccctgacagg catcgccgtg gagcaggata agaacacaca ggaggtgttc 2340

gcccaggtga agcaaatcta caagaccccc cctatcaagg actttggcgg cttccaattt 2400

tcccagatcc tgcctgatcc atccaagcct tctaagcgga gctttatcga ggacctgctg 2460

ttcaacaagg tgaccctggc cgatgccggc ttcatcaagc agtatggcga ttgcctgggc 2520

gacatcgcag ccagggacct gatctgcgcc cagaagttta atggcctgac cgtgctgcca 2580

cccctgctga cagatgagat gatcgcacag tacacaagcg ccctgctggc cggcaccatc 2640

acatccggat ggaccttcgg cgcaggagcc gccctccaga tcccctttgc catgcagatg 2700

gcctataggt tcaacggcat cggcgtgacc cagaatgtgc tgtacgagaa ccagaagctg 2760

atcgccaatc agtttaactc cgccatcggc aagatccagg acagcctgtc ctctacagcc 2820

agcgccctgg gcaagctcca gaatgtggtg aatcagaacg cccaggccct gaataccctg 2880

gtgaagcagc tgagcagcaa cttcggcgcc atctctagcg tgctgaatga catcctgagc 2940

cggctggacc gccgggaggc agaggtgcag atcgaccggc tgatcaccgg ccggctccag 3000

agcctccaga cctatgtgac acagcagctg atcagggccg ccgagatcag ggccagcgcc 3060

aatctggcag caaccaagat gtccgagtgc gtgctgggcc agtctaagag agtggacttt 3120

tgtggcaagg gctatcacct gatgtccttc cctcagtctg ccccacacgg cgtggtgttt 3180

ctgcacgtga cctacgtgcc cgcccaggag aagcagttca ccacagcccc tgccatctgc 3240

cacgatggca aggcccactt tccaagggag ggcgtgttcg tgtcccaggg cacccactgg 3300

tttgtgacac agcgcaattt ctacgagccc cagatcatca ccacagacaa caccttcgtg 3360

agcggcaact gtgacgtggt catcggcatc gtgcagaata ccgtgtatga tccactccag 3420

cccgagctgg acagctttaa ggaggagctg gataagtatt tcaagcaaca cacctcccct 3480

gacgtggatc tgggcgacat cagcggcatc caagcctccg tggtgaacat ccagaaggag 3540

atcgaccgcc tgaacgaggt ggctaagaat ctgcaggaga gcctgatcga cctccaggag 3600

ctgggcaagt atgagcagta catcaagtgg ccctggtaca tctggctggg cttcatcgcc 3660

ggcctgatcg ccatcgtgat ggtgaccatc atgctgtgct gtatgacatc ctgctgttct 3720

tgcctgaagg gctgctgtag ctgtggctcc tgctgtaagt ttgacgagga tgactctgaa 3780

cctgtgctga agggcgtgaa gctgcattac acctaa 3816

<210> 32

<211> 1271

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-S2) for Delta S-2P strain

<400> 32

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Arg Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Gly Val Tyr Ser Ser

145 150 155 160

Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp

165 170 175

Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe

180 185 190

Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile

195 200 205

Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu

210 215 220

Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu

225 230 235 240

Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp

245 250 255

Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr

260 265 270

Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp

275 280 285

Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe

290 295 300

Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro

305 310 315 320

Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe

325 330 335

Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn

340 345 350

Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn

355 360 365

Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys

370 375 380

Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile

385 390 395 400

Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile

405 410 415

Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile

420 425 430

Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn

435 440 445

Tyr Arg Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg

450 455 460

Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Lys Pro Cys Asn Gly

465 470 475 480

Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln

485 490 495

Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser

500 505 510

Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser

515 520 525

Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu

530 535 540

Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe

545 550 555 560

Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp

565 570 575

Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly

580 585 590

Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val

595 600 605

Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala

610 615 620

Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val

625 630 635 640

Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn

645 650 655

Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr

660 665 670

Gln Thr Gln Thr Asn Ser Arg Arg Arg Ala Arg Ser Val Ala Ser Gln

675 680 685

Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala

690 695 700

Tyr Ser Gln Asn Ser Ile Ala Ile Pro Thr Gln Phe Thr Ile Ser Val

705 710 715 720

Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys

725 730 735

Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu

740 745 750

Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile

755 760 765

Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys

770 775 780

Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Gln Phe

785 790 795 800

Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile

805 810 815

Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile

820 825 830

Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile

835 840 845

Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr

850 855 860

Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile

865 870 875 880

Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe

885 890 895

Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn

900 905 910

Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala

915 920 925

Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly

930 935 940

Lys Leu Gln Asn Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu

945 950 955 960

Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn

965 970 975

Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp

980 985 990

Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln

995 1000 1005

Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala

1010 1015 1020

Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val

1025 1030 1035

Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser

1040 1045 1050

Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala

1055 1060 1065

Gln Glu Lys Gln Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly

1070 1075 1080

Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Gln Gly Thr

1085 1090 1095

His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile

1100 1105 1110

Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile

1115 1120 1125

Gly Ile Val Gln Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu

1130 1135 1140

Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Gln His Thr

1145 1150 1155

Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Gln Ala Ser

1160 1165 1170

Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala

1175 1180 1185

Lys Asn Leu Gln Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys

1190 1195 1200

Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe

1205 1210 1215

Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys

1220 1225 1230

Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys

1235 1240 1245

Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu

1250 1255 1260

Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 33

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(S2-1194) for Wuhan S-2P strain

<400> 33

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccaaccg agtctatcgt gcgctttcct aatatcacaa acctgtgccc atttggcgag 1020

gtgttcaacg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctcagaat agcatcgcca tcccaaccca gttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

caattttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacccgcc ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaagc agttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc ccagggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtgc agaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gcaacacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatccaag cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctga acgagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 34

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(S2-1194) for Wuhan S-2P strain

<400> 34

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Gln Asn Ser Ile Ala Ile Pro Thr Gln Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Gln Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Gln Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Gln

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Gln Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Gln

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Gln

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 35

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-801) for Wuhan S-2P strain

<400> 35

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccagccg aggcgatcgt gcgctttcct gaaatcacaa acctgtgccc atttggcgag 1020

gtgttcgagg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctaacaat agcatcgcca tcccaaccaa cttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

caattttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacccgcc ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc caacggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gaatcacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatcaatg cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctga acgagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 36

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-801) for Wuhan S-2P strain

<400> 36

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Ala Glu Ala Ile Val Arg Phe Pro Gln Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Gln Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Gln Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 37

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-1194) for Wuhan S-2P strain

<400> 37

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aacaatgcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca acaactgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatca acatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccagccg aggcgatcgt gcgctttcct gaaatcacaa acctgtgccc atttggcgag 1020

gtgttcgagg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctaacaat agcatcgcca tcccaaccaa cttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

aatttttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacccgcc ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc caacggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gaatcacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatcaatg cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctgc aggagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 38

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-1194) for Wuhan S-2P strain

<400> 38

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Ala Glu Ala Ile Val Arg Phe Pro Gln Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Gln Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Gln Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 39

<211> 3822

<212> DNA

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-122-165-234) for Wuhan S-2P strain

<400> 39

atgttcgtct tcctggtcct gctgcctctg gtctcctcac agtgcgtcaa tctgacaact 60

cggactcagc tgccacctgc ttatactaat agcttcacca gaggcgtgta ctatcctgac 120

aaggtgttta gaagctccgt gctgcactct acacaggatc tgtttctgcc attctttagc 180

aacgtgacct ggttccacgc catccacgtg agcggcacca atggcacaaa gcggttcgac 240

aatcccgtgc tgccttttaa cgatggcgtg tacttcgcct ctaccgagaa gagcaacatc 300

atcagaggct ggatctttgg caccacactg gactccaaga cacagtctct gctgatcgtg 360

aaccaagcca ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgatcccttc 420

ctgggcgtgt actatcacaa gaacaataag agctggatgg agtccgagtt tagagtgtat 480

tctagcgcca accagtgcac atttgagtac gtgagccagc ctttcctgat ggacctggag 540

ggcaagcagg gcaatttcaa gaacctgagg gagttcgtgt ttaagaatat cgacggctac 600

ttcaaaatct actctaagca cacccccatc aacctggtgc gcgacctgcc tcagggcttc 660

agcgccctgg agcccctggt ggatctgcct atcggcatcc agatcacccg gtttcagaca 720

ctgctggccc tgcacagaag ctacctgaca cccggcgact cctctagcgg atggaccgcc 780

ggcgctgccg cctactatgt gggctacctc cagccccgga ccttcctgct gaagtacaac 840

gagaatggca ccatcacaga cgcagtggat tgcgccctgg accccctgag cgagacaaag 900

tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagggtg 960

cagccagccg aggcgatcgt gcgctttcct gaaatcacaa acctgtgccc atttggcgag 1020

gtgttcgagg caacccgctt cgccagcgtg tacgcctgga ataggaagcg gatcagcaac 1080

tgcgtggccg actatagcgt gctgtacaac tccgcctctt tcagcacctt taagtgctat 1140

ggcgtgtccc ccacaaagct gaatgacctg tgctttacca acgtctacgc cgattctttc 1200

gtgatcaggg gcgacgaggt gcgccagatc gcccccggcc agacaggcaa gatcgcagac 1260

tacaattata agctgccaga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320

ctggattcca aagtgggcgg caactacaat tatctgtacc ggctgtttag aaagagcaat 1380

ctgaagccct tcgagaggga catctctaca gaaatctacc aggccggcag caccccttgc 1440

aatggcgtgg agggctttaa ctgttatttc ccactccagt cctacggctt ccagcccaca 1500

aacggcgtgg gctatcagcc ttaccgcgtg gtggtgctga gctttgagct gctgcacgcc 1560

ccagcaacag tgtgcggccc caagaagtcc accaatctgg tgaagaacaa gtgcgtgaac 1620

ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680

ccatttcagc agttcggcag ggacatcgca gataccacag acgccgtgcg cgacccacag 1740

accctggaga tcctggacat cacaccctgc tctttcggcg gcgtgagcgt gatcacaccc 1800

ggcaccaata caagcaacca ggtggccgtg ctgtatcagg acgtgaattg taccgaggtg 1860

cccgtggcta tccacgccga tcagctgacc ccaacatggc gggtgtacag caccggctcc 1920

aacgtcttcc agacaagagc cggatgcctg atcggagcag agcacgtgaa caattcctat 1980

gagtgcgaca tcccaatcgg cgccggcatc tgtgcctctt accagaccca gacaaactct 2040

cccagaagag cccggagcgt ggcctcccag tctatcatcg cctataccat gtccctgggc 2100

gccgagaaca gcgtggccta ctctaacaat agcatcgcca tcccaaccaa cttcacaatc 2160

tctgtgacca cagagatcct gcccgtgtcc atgaccaaga catctgtgga ctgcacaatg 2220

tatatctgtg gcgattctac cgagtgcagc aacctgctgc tccagtacgg cagcttttgt 2280

acccagctga atagagccct gacaggcatc gccgtggagc aggataagaa cacacaggag 2340

gtgttcgccc aggtgaagca aatctacaag acccccccta tcaaggactt tggcggcttc 2400

aatttttccc agatcctgcc tgatccatcc aagccttcta agcggagctt tatcgaggac 2460

ctgctgttca acaaggtgac cctggccgat gccggcttca tcaagcagta tggcgattgc 2520

ctgggcgaca tcgcagccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580

ctgccacccc tgctgacaga tgagatgatc gcacagtaca caagcgccct gctggccggc 2640

accatcacat ccggatggac cttcggcgca ggagccgccc tccagatccc ctttgccatg 2700

cagatggcct ataggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760

aagctgatcg ccaatcagtt taactccgcc atcggcaaga tccaggacag cctgtcctct 2820

acagccagcg ccctgggcaa gctccaggat gtggtgaatc agaacgccca ggccctgaat 2880

accctggtga agcagctgag cagcaacttc ggcgccatct ctagcgtgct gaatgacatc 2940

ctgagccggc tggacccgcc ggaggcagag gtgcagatcg accggctgat caccggccgg 3000

ctccagagcc tccagaccta tgtgacacag cagctgatca gggccgccga gatcagggcc 3060

agcgccaatc tggcagcaac caagatgtcc gagtgcgtgc tgggccagtc taagagagtg 3120

gacttttgtg gcaagggcta tcacctgatg tccttccctc agtctgcccc acacggcgtg 3180

gtgtttctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac agcccctgcc 3240

atctgccacg atggcaaggc ccactttcca agggagggcg tgttcgtgtc caacggcacc 3300

cactggtttg tgacacagcg caatttctac gagccccaga tcatcaccac agacaacacc 3360

ttcgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtatgatcca 3420

ctccagcccg agctggacag ctttaaggag gagctggata agtatttcaa gaatcacacc 3480

tcccctgacg tggatctggg cgacatcagc ggcatcaatg cctccgtggt gaacatccag 3540

aaggagatcg accgcctgaa cgaggtggct aagaatctga acgagagcct gatcgacctc 3600

caggagctgg gcaagtatga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660

atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgtat gacatcctgc 3720

tgttcttgcc tgaagggctg ctgtagctgt ggctcctgct gtaagtttga cgaggatgac 3780

tctgaacctg tgctgaaggg cgtgaagctg cattacacct aa 3822

<210> 40

<211> 1273

<212> PRT

<213> Artificial Sequence

<220>

<223> S-(deg-RBD-122-165-234) for Wuhan S-2P strain

<400> 40

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Gln Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Gln Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Gln Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Ala Glu Ala Ile Val Arg Phe Pro Gln Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Gln Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn

1010 1015 1020

Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys

1025 1030 1035

Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro

1040 1045 1050

Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1055 1060 1065

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His

1070 1075 1080

Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn

1085 1090 1095

Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln

1100 1105 1110

Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val

1115 1120 1125

Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro

1130 1135 1140

Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1145 1150 1155

His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn

1160 1165 1170

Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu

1175 1180 1185

Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu

1205 1210 1215

Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met

1220 1225 1230

Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro

1250 1255 1260

Val Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 41

<211> 13

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 41

Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu

1 5 10

<210> 42

<211> 16

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 42

Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg

1 5 10 15

<210> 43

<211> 11

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 43

Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys

1 5 10

<210> 44

<211> 10

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 44

Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn

1 5 10

<210> 45

<211> 13

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 45

Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr

1 5 10

<210> 46

<211> 15

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 46

Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly

1 5 10 15

<210> 47

<211> 13

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 47

Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys

1 5 10

<210> 48

<211> 14

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 48

Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr

1 5 10

<210> 49

<211> 19

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 49

Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn

1 5 10 15

His Thr Ser

<210> 50

<211> 14

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 50

Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala

1 5 10

<210> 51

<211> 10

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 51

Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln

1 5 10

<210> 52

<211> 11

<212> PRT

<213> Artificial Sequence

<220>

<223> immunogenic peptide

<400> 52

Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro

1 5 10

<---

Похожие патенты RU2826172C2

название год авторы номер документа
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 2020
  • Прокофьев Александр Владимирович
  • Гершович Павел Михайлович
  • Стрелкова Анна Николаевна
  • Спирина Наталья Александровна
  • Кондинская Диана Александровна
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2783313C1
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 2021
  • Прокофьев Александр Владимирович
  • Гершович Павел Михайлович
  • Стрелкова Анна Николаевна
  • Спирина Наталья Александровна
  • Кондинская Диана Александровна
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2761879C1
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 2020
  • Гершович Павел Михайлович
  • Прокофьев Александр Владимирович
  • Стрелкова Анна Николаевна
  • Спирина Наталья Александровна
  • Шугаева Татьяна Евгеньевна
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2760301C1
УСОВЕРШЕНСТВОВАННАЯ КОРОНАВИРУСНАЯ ВАКЦИНА 2022
  • Вон, Чи-Хуэй
  • Ма, Чэ
  • Хуан, Хань-И
RU2816182C2
БЕЛОК И ВАКЦИНА ПРОТИВ ИНФЕКЦИИ SARS-CoV-2 2020
  • Вэй, Сявэй
  • Лу, Гуанвэнь
  • Ван, Вэй
  • Ян, Цзиньлян
  • Ян, Ли
  • Ли, Цзюн
  • Ян, Цзинюнь
  • Вэй, Юйцюань
  • Ван, Чжэньлин
  • Чжао, Чживэй
  • Шэнь, Гобо
RU2815060C1
Генная конструкция для экспрессии рекомбинантных белков на основе участка S-белка SARS-CoV-2, включающего RBD и SD1, слитого с Fc фрагментом IgG, способ получения рекомбинантных белков, антигены и антигенные композиции для индукции длительного антительного и клеточного иммунитета против вируса SARS-CoV-2 2021
  • Исаев Артур Александрович
  • Кудрявцев Александр Викторович
  • Фролова Мария Евгеньевна
  • Вахрушева Анна Владимировна
  • Иванов Александр Викторович
  • Джонович Милана
  • Иванишин Тарас Владимирович
  • Красильников Игорь Викторович
RU2802825C2
Однодоменное антитело и его модификации, специфически связывающиеся с RBD S белка вируса SARS-CoV-2, и способ их применения для терапии и экстренной профилактики заболеваний, вызываемых вирусом SARS-CoV-2 2021
  • Фаворская Ирина Алексеевна
  • Щебляков Дмитрий Викторович
  • Есмагамбетов Ильяс Булатович
  • Деркаев Артем Алексеевич
  • Алексеева Ирина Александровна
  • Рябова Екатерина Игоревна
  • Воронина Дарья Владимировна
  • Прокофьев Владимир Владимирович
  • Должикова Инна Вадимовна
  • Зорков Илья Дмитриевич
  • Илюхина Анна Алексеевна
  • Ботиков Андрей Геннадьевич
  • Гроусова Дарья Михайловна
  • Егорова Дарья Андреевна
  • Народицкий Борис Савельевич
  • Логунов Денис Юрьевич
  • Гинцбург Александр Леонидович
RU2763001C1
СЛИТЫЙ ПОЛИПЕПТИД, ВКЛЮЧАЮЩИЙ GDF15 И ПОЛИПЕПТИДНУЮ ОБЛАСТЬ, СПОСОБНУЮ К О-ГЛИКОЗИЛИРОВАНИЮ 2020
  • Ким, Йеончул
  • Сон, Янг Док
  • На, Киубонг
  • Хонг, Дзи Хо
  • Дзунг, Саем
  • Дзин, Миунг Вон
  • Парк, Дзи А
  • Нох, Соомин
  • Парк, Хиунтаек
RU2812049C1
АНТИГЕННЫЕ ПОЛИПЕПТИДЫ НА ОСНОВЕ ПОСЛЕДОВАТЕЛЬНОСТИ РЕСПИРАТОРНО-СИНЦИТИАЛЬНОГО ВИРУСА 2019
  • Нейбел, Гари Дж.
  • Вэй, Чих-Джен
  • Свенсон, Курт
  • Дхал, Прадип
  • Дхаранипрагада, Рам
  • Бесев, Магнус
RU2807992C2
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ЛЕЧЕНИЯ ХОРЕИ ГЕНТИНГТОНА 2017
  • Сах Динах Вен-Йи
  • Хоу Цзиньчжао
  • Чжоу Пэнчэн
  • Ван Синь
  • Деккерт Йохен
  • Хоссбах Маркус
RU2764587C2

Иллюстрации к изобретению RU 2 826 172 C2

Реферат патента 2024 года ВАКЦИНЫ НА ОСНОВЕ ИНФОРМАЦИОННОЙ РНК ПРОТИВ ШИРОКОГО СПЕКТРА ВАРИАНТОВ КОРОНАВИРУСА

Изобретение относится к биотехнологии. Описана молекула модифицированной нуклеиновой кислоты, кодирующая модифицированный шиповидный белок, полученный из шиповидного белка SARS-CoV-2, имеющего делецию сайтов гликозилирования в рецептор-связывающем домене (RBD), домене субъединицы 1 (S1) или домене субъединицы 2 (S2). Также описан способ профилактики или лечения коронавирусной инфекции, включающий введение композиции с эффективным количеством модифицированной молекулы нуклеиновой кислоты субъекту, инфицированному или подверженному риску заражения коронавирусом. Вакцина вызывает широкий защитный иммунный ответ против коронавируса и его вариантов. 2 н. и 17 з.п. ф-лы, 29 ил., 2 табл., 1 пр.

Формула изобретения RU 2 826 172 C2

1. Молекула модифицированной нуклеиновой кислоты, кодирующая модифицированный шиповидный белок, полученный из шиповидного белка SARS-CoV-2, имеющего делецию сайтов гликозилирования в рецептор-связывающем домене (RBD), домене субъединицы 1 (S1) или домене субъединицы 2 (S2);

где в указанном модифицированном шиповидном белке все 2 N-сайты гликозилирования в RBD мутированы с N на Q, а 2 O-сайты гликозилирования мутированы с S/T на A;

где в указанном модифицированном шиповидном белке все 8 сайтов гликозилирования в S2 мутированы с N на Q, кроме сайта гликозилизования 1194, где модифицированный шиповидный белок содержит аминокислотную последовательность согласно SEQ ID NO: 2 или 18; или

где в указанном модифицированном шиповидном белке один или несколько сайтов гликозилирования 801, 1194, 122, 165 и 234 в S2 мутированы с N на Q, где модифицированный шиповидный белок содержит аминокислотную последовательность согласно SEQ ID NO: 2 или 18;

где указанный модифицированный шиповидный белок содержит аминокислотную последовательность согласно SEQ ID NO: 2, 16, 18 или 20, или аминокислотную последовательность, имеющую по меньшей мере примерно 95% идентичности с аминокислотной последовательностью SEQ ID NO: 2, 16, 18 или 20;

где модифицированная молекула нуклеиновой кислоты представляет собой мРНК или двухцепочечную или одноцепочечную ДНК.

2. Молекула модифицированной нуклеиновой кислоты по п. 1, в которой модифицированный шиповидный белок содержит аминокислотную последовательность SEQ ID NO: 2, 16, 18 или 20 или аминокислотную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97% или 96% идентичности с аминокислотной последовательностью SEQ ID NO: 2, 16, 18 или 20.

3. Молекула модифицированной нуклеиновой кислоты по п. 2, в которой молекула нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 2, 16, 18 или 20, представляет собой мРНК, содержащую нуклеотидную последовательность SEQ ID NO: 1, 15, 17 или 19, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с нуклеотидной последовательностью SEQ ID NO: 1, 15, 17 или 19, соответственно.

4. Молекула модифицированной нуклеиновой кислоты по п. 1, в которой модифицированный шиповидный белок содержит аминокислотную последовательность SEQ ID NO: 4, 22, 24 или 26, при этом модифицированный шиповидный белок содержит рецептор-связывающий домен (RBD), в котором отсутствуют сайты гликозилирования.

5. Молекула модифицированной нуклеиновой кислоты по п. 4, в которой молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 4, 22, 24 или 26, содержит нуклеотидную последовательность SEQ ID NO: 3, 21, 23 или 25, соответственно, или нуклеотидную последовательность, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с нуклеотидной последовательностью SEQ ID NO: 3, 21, 23 или 25, соответственно.

6. Молекула модифицированной нуклеиновой кислоты по п. 1, в которой модифицированный шиповидный белок содержит аминокислотную последовательность SEQ ID NO: 6, 28, 30 или 32, в которой модифицированный шиповидный белок содержит субъединицу S2, лишенную сайтов гликозилирования.

7. Молекула модифицированной нуклеиновой кислоты по п. 6, в которой молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 6, 28, 30 или 32, включает нуклеотидную последовательность SEQ ID NO: 5, 27, 29 или 31, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с нуклеотидной последовательностью SEQ ID NO: 5, 27, 29 или 31, соответственно.

8. Молекула модифицированной нуклеиновой кислоты по п. 1, в которой модифицированный шиповидный белок, описанный в настоящем документе, содержит аминокислотную последовательность SEQ ID NO: 8 или 34, в которой модифицированный шиповидный белок содержит субъединицу S2, содержащую единственный сайт гликозилирования, где единственный сайт гликозилирования находится в положении N1194.

9. Молекула модифицированной нуклеиновой кислоты по п. 8, в которой молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 8 или 34, содержит нуклеотидную последовательность SEQ ID NO: 7 или 33, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с нуклеотидной последовательностью SEQ ID NO: 7 или 33, соответственно.

10. Молекула модифицированной нуклеиновой кислоты по п. 1, в которой модифицированный шиповидный белок содержит аминокислотную последовательность SEQ ID NO: 10 или 36, при этом модифицированный шиповидный белок содержит рецептор-связывающий домен (RBD), в котором отсутствуют сайты гликозилирования, и аминокислотную замену N801 на Q801.

11. Молекула модифицированной нуклеиновой кислоты по п. 10, в которой молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 10 или 36, содержит нуклеотидную последовательность SEQ ID NO: 9 или 35, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с нуклеотидной последовательностью SEQ ID NO: 9 или 35, соответственно.

12. Молекула модифицированной нуклеиновой кислоты по п. 1, в которой модифицированный шиповидный белок содержит аминокислотную последовательность SEQ ID NO: 12 или 38, при этом модифицированный шиповидный белок содержит рецептор-связывающий домен (RBD), в котором отсутствуют сайты гликозилирования, и аминокислотную замену N1194 на Q1194.

13. Молекула модифицированной нуклеиновой кислоты по п. 12, в которой молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 12 или 38, содержит нуклеотидную последовательность SEQ ID NO: 11 или 37, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с нуклеотидной последовательностью SEQ ID NO: 11 или 37, соответственно.

14. Молекула модифицированной нуклеиновой кислоты по п. 1, в которой модифицированный шиповидный белок, описанный в настоящем документе, содержит аминокислотную последовательность SEQ ID NO: 14 или 40, при этом модифицированный шиповидный белок содержит модифицированный рецептор-связывающий домен (RBD), в котором отсутствуют сайты гликозилирования, и аминокислотные замены N122 на Q122, N165 на Q165 и N234 на Q234.

15. Молекула модифицированной нуклеиновой кислоты по п. 14, в которой молекула модифицированной нуклеиновой кислоты, кодирующая аминокислотную последовательность SEQ ID NO: 14 или 40, содержит нуклеотидную последовательность SEQ ID NO: 13 или 39, соответственно, или нуклеотидную последовательность, имеющую, по меньшей мере, примерно 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с нуклеотидной последовательностью SEQ ID NO: 13 или 39, соответственно.

16. Молекула модифицированной нуклеиновой кислоты по п. 1, в которой мРНК для S-(deg-RBD) имеет последовательность SEQ ID NO: 3, 21, 23 или 25, мРНК или ДНК для S-(deg-S2) имеет последовательность SEQ ID NO: 5, 27, 29 или 31, мРНК или ДНК для S-(deg-S2-1194) имеет последовательность SEQ ID NO: 7 или 33, мРНК или ДНК для S-(deg-RBD-801) имеет последовательность SEQ ID NO: 9 или 35, мРНК или ДНК для S-(deg-RBD-1194) имеет последовательность SEQ ID NO: 11 или 37, мРНК или ДНК для S-(deg-RBD-122-165-234) имеет последовательность SEQ ID NO: 13 или 39.

17. Молекула модифицированной нуклеиновой кислоты по любому из пп. 1-16, которую можно применять в качестве мРНК-вакцины против коронавируса.

18. Способ профилактики или лечения коронавирусной инфекции, включающий введение композиции с эффективным количеством молекулы модифицированной нуклеиновой кислоты по любому из пп. 1-17, субъекту, инфицированному или подверженному риску заражения коронавирусом.

19. Способ по п. 18, в котором вакцина сформулирована в виде комбинации, содержащей одну или несколько дополнительных вакцин, где каждый член комбинации содержит эффективное количество молекулы модифицированной нуклеиновой кислоты, в диапазоне от 5 мкг до 50 мкг.

Документы, цитированные в отчете о поиске Патент 2024 года RU2826172C2

Jie Zheng, Yoshiyuki Yamada et al
Identification of N-linked glycosylation sites in the spike protein and their functional impact on the replication and infectivity of coronavirus infectious bronchitis virus in cell culture, Virology, 2018 Jan 1:513:65-74
CN 112626124 A, 09.04.2021
СПОСОБ ИСПОЛЬЗОВАНИЯ РЕКОМБИНАНТНЫХ БЕЛКОВ SARS-COV-2 В СОСТАВЕ ТЕСТ-СИСТЕМЫ ДЛЯ ИММУНОФЕРМЕНТНОГО АНАЛИЗА С ОПРЕДЕЛЕНИЕМ УРОВНЕЙ АНТИТЕЛ КЛАССОВ IgM, IgG, IgA В СЫВОРОТКЕ/ПЛАЗМЕ КРОВИ БОЛЬНЫХ COVID-19 2020
  • Костин Никита Николаевич
  • Бобик Татьяна Владимировна
  • Цабай Полина Николаевна
  • Скрябин Георгий Андреевич
  • Балмасова Ирина Петровна
  • Симонова Мария Александровна
  • Мокрушина Юлиана Анатольевна
  • Смирнов Иван Витальевич
  • Алешенко Наталья Леонидовна
  • Никитин Алексей Эдуардович
  • Быков Андрей Юрьевич
  • Чехонин Владимир Павлович
  • Габибов Александр Габибович
RU2730897C1

RU 2 826 172 C2

Авторы

Вон, Чи-Хуэй

Ву, Чун-Йи

Ма, Чэ

Фань, Чэнь-Ю

Даты

2024-09-05Публикация

2022-04-12Подача