ПРИОРИТЕТ
Эта заявка заявляет приоритет в соответствии с 35 U.S.C. § 119 каждой из следующих заявок, раскрытие которых настоящим полностью включено ссылкой: Международная заявка № PCT/EP20/61239, подана 22 апреля 2020 г.; и международная заявка № PCT/EP20/66968, подана 18 июня 2020 г.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
Применение полинуклеотидов РНК в качестве терапевтических средств является новой и развивающейся областью.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Настоящее раскрытие рассматривает определенные проблемы, которые могут быть связаны с РНК-терапевтическими средствами.
Например, в некоторых воплощениях настоящее раскрытие определяет источник определенных проблем, с которыми можно столкнуться при экспрессии полипептидов, кодируемых терапевтическими средствами на основе РНК. Помимо прочего, в настоящем изобретении предлагаются технологии для повышения эффективности трансляции РНК, кодирующей полезную нагрузку, и/или экспрессии полезной нагрузки-полипептида, кодируемого РНК. В некоторых воплощениях эффективность трансляции и/или экспрессия полезной нагрузки, кодируемой РНК, можно улучшить с помощью полинуклеотида РНК, содержащего: структуру Cap1 (например, кэп m27,3’-OGppp(m12’-O)ApG); 5’-UTR-содержащую проксимальную к кэпу последовательность, раскрытую в настоящей заявке, и последовательность, кодирующую полезную нагрузку. Не желая быть связанными какой-либо теорией, в настоящем раскрытии предполагаем, что улучшенная эффективность трансляции и/или экспрессия полезной нагрузки полипептида могут быть достигнуты за счет предпочтительного связывания эукариотического фактора инициации трансляции 4E (eIF4E), а не IFN-индуцированного белка с тетратрикопептидными повторами-1 (IFIT1) на РНК, содержащую структуру Cap1, например, кэп m27,3’-OGppp(m12’-O)ApG, и/или 5'-UTR, содержащую проксимальную у кэпу последовательность, описанную в настоящей заявке. Например, в некоторых воплощениях предполагается, что eIF4E может конкурировать с IFIT1 за связывание с полинуклеотидом РНК на основе структуры 5'-кэпа. Помимо прочего, настоящее раскрытие обеспечивает определенные технологии, которые могут способствовать связыванию eIF4E, по меньшей мере, относительно связывания IFIT1, и/или могут иным образом улучшать трансляцию.
В некоторых воплощениях настоящее раскрытие показывает, что идентичность конкретной(ых) последовательности(ей), проксимальной(ых) к 5’-кэпу (например, 5’-структуры Cap1), может влиять на эффективность трансляции связанной полезной нагрузки. Не желая быть связанными какой-либо конкретной теорией, в настоящем раскрытии предполагаем, что eIF4E конкурирует с IFIT1 за связывание с полинуклеотидом РНК на основе идентичности одного или нескольких нуклеотидов ниже 5'-кэпа, например, проксимальной последовательности кэпа, как описано в настоящей заявке. В некоторых воплощениях настоящее раскрытие демонстрирует, что последовательность AGAAU или AGCAC ниже 5’-кэпа (например, структура 5’-кэпа 1) может улучшать трансляцию. В настоящем раскрытии предполагается, что присутствие такой последовательности (например, AGAAU или AGCAC) может увеличить связывание eIF4E, по меньшей мере, по сравнению с IFIT1.
В качестве альтернативы или дополнительно настоящее раскрытие документирует определенные преимущества исключения (например, обеспечения отсутствия) самогибридизирующейся последовательности (которая в некоторых случаях может называться самокомплементарной последовательностью) в полинуклеотиде РНК, кодирующем полезную нагрузку. Например, настоящее раскрытие демонстрирует, что такое отсутствие может улучшать и/или быть необходимым для трансляции (например, эффективности трансляции) ассоциированной (например, РНК-кодируемой) полезной нагрузки, и/или иным образом для экспрессии кодируемого полипептида. Не желая быть связанными какой-либо теорией, считаем, что самогибридизирующаяся последовательность (и, в частности, последовательность, которая гибридизируется с последовательностями внутри или включающими одну или несколько последовательностей Козак, элемент 5'UTR и/или 3' элемент UTR) мешают одному или нескольким аспектам трансляции. Например, в некоторых воплощениях предполагается, что такая самогибридизация может ингибировать связывание факторов транскрипции и/или трансляции с полинуклеотидом РНК путем самогибридизации с комплементарной последовательностью в указанном полинуклеотиде РНК.
Кроме того, альтернативно или дополнительно, в некоторых воплощениях настоящее раскрытие определяет конкретные липидные компоненты и/или их соотношения, которые могут быть особенно полезными или эффективными для доставки нуклеиновых кислот и, в частности, РНК (например, терапевтических РНК или других РНК, кодирующих полипептид) при введении (например, путем инъекции, такой как внутримышечная инъекция или внутривенная инъекция) субъекту. Например, в некоторых воплощениях настоящее раскрытие демонстрирует, что липид ALC-0315 необычайно и особенно полезен для доставки, как описано в настоящей заявке.
В настоящей заявке, среди прочего, раскрыта композиция или медицинский препарат, включающие полинуклеотид РНК, содержащий: (i) 5'-кэп, который представляет собой или содержит структуру cap1, например, как раскрыто в настоящей заявке; (ii) последовательность 5’-UTR, содержащую проксимальную к кэпу последовательность, например, как раскрыто в настоящей заявке; и (iii) последовательность, кодирующая полезную нагрузку. Также в настоящей заявке раскрыты способы их изготовления и применения, например, для индуцирования иммунного ответа у субъекта.
В настоящей заявке предлагается композиция или медицинский препарат, включающие полинуклеотид РНК, содержащий:
5’-кэп, содержащий структуру Cap1; проксимальную к кэпу последовательность, включающую положения +1, +2, +3, +4 и +5 полинуклеотида РНК; и последовательность, кодирующую полезную нагрузку, где:
(i) структура Cap1 содержит m7G(5')ppp(5')(2'OMeN1)pN2, где N1 представляет собой положение +1 полинуклеотида РНК, а N2 представляет собой положение +2 полинуклеотида РНК, и где N1 и N2 каждый независимо выбран из: A, C, G или U; и
(ii) проксимальная к кэпу последовательность содержит N1 и N2 структуры Cap1, и:
(а) последовательность, выбранную из группы, состоящей из: A3A4X5 (SEQ ID NO: 1); C3A4X5 (SEQ ID NO: 2); A3C4A5 (SEQ ID NO: 3) и A3U4G5 (SEQ ID NO: 4); или
(b) последовательность, включающую: X3Y4X5 (SEQ ID NO: 7);
где каждый из X3 (нуклеотид X в положении +3 в SEQ ID NO: 7) или X5 (нуклеотид X в положении +5 в SEQ ID NO: 1 или SEQ ID NO: 2) независимо выбраны из A, G, C или U; и
где Y4 (нуклеотид Y в положении +4 в SEQ ID NO: 7) не является C.
В этом раскрытии также предложена композиция или медицинский препарат, включающие полинуклеотид РНК, содержащий: 5'-кэп; проксимальную к кэпу последовательность, содержащую положения +1, +2, +3, +4 и +5 полинуклеотида РНК; и последовательность, кодирующую полезную нагрузку, где:
(i) 5’-кэп включает структуру Cap1, содержащую G*ppp(m12'-O)N1pN2, где:
N1 представляет собой положение +1 полинуклеотида РНК, а N2 представляет собой положение +2 полинуклеотида РНК, и где каждый из N1 и N2 независимо выбран из: A, C, G или U; и
G* включает следующую структуру:
где представляет собой связь, посредством которой G* связан с первым атомом фосфора группы ррр, R1 представляет собой СН3, R2 представляет собой ОН или O-CH3, а R3 представляет собой O-CH3; и
(ii) проксимальная к кэпу последовательность содержит N1 и N2 структуры Cap1, и:
(а) последовательность, выбранную из группы, состоящей из: A3A4X5 (SEQ ID NO: 1); C3A4X5 (SEQ ID NO: 2); A3C4A5 (SEQ ID NO: 3) и A3U4G5 (SEQ ID NO: 4); или
(b) последовательность, включающую: X3Y4X5 (SEQ ID NO: 7);
где каждый из X3 (нуклеотид X в положении +3 в SEQ ID NO: 7) или X5 (нуклеотид X в положении +5 в SEQ ID NO: 1 или SEQ ID NO: 2) независимо выбраны из A, G, C или U; и
где Y4 (нуклеотид Y в положении +4 в SEQ ID NO: 7) не является C.
Также в настоящей заявке предлагается композиция или медицинский препарат, включающие полинуклеотид РНК, содержащий:
5’-кэп, содержащий структуру Cap1; проксимальную к кэпу последовательность, включающую положения +1, +2, +3, +4 и +5 полинуклеотида РНК; и последовательность, кодирующую полезную нагрузку, где:
(i) структура Cap1 содержит m7(3'OMeG)(5')ppp(5')(2'OMeA1)pG2, где A1 представляет собой положение +1 полинуклеотида РНК, а G2 представляет собой положение +2 полинуклеотида РНК; и
(ii) проксимальная к кэпу последовательность содержит A1 и G2 структуры Cap1 и последовательность, включающую: A3A4U5 в положениях +3, +4 и +5 соответственно полинуклеотида РНК.
В данном раскрытии предлагается композиция или медицинский препарат, содержащий кэпированный полинуклеотид РНК, кодирующий генный продукт, причем полинуклеотид РНК имеет формулу:
где R1 представляет собой CH3, R2 представляет собой OH или O-CH3, и R3 представляет собой O-CH3,
где B1 представляет собой любое азотистое основание, предпочтительно А; B2 представляет собой любое азотистое основание, предпочтительно G; B3 представляет собой любое азотистое основание, предпочтительно A или C; B4 представляет собой любое азотистое основание; и B5 представляет собой любое азотистое основание, и
где, когда полинуклеотид РНК вводят субъекту, уровни экспрессии кодируемого генного продукта примерно через 6 часов после введения и примерно через 48 часов после введения не различаются более чем в 5 раз.
В настоящей заявке предлагается фармацевтическая композиция, содержащая описанный в данном документе полинуклеотид РНК. В некоторых воплощениях фармацевтическая композиция содержит композицию или медицинский препарат, раскрытые в настоящей заявке.
В настоящей заявке также предлагается способ изготовления фармацевтической композиции, например, содержащей полинуклеотид РНК, раскрытый в настоящей заявке, путем объединения полинуклеотида РНК с липидами с образованием липидных наночастиц, которые инкапсулируют указанную РНК.
В данном раскрытии предлагается матричная нуклеиновая кислота, пригодная для получения РНК, кэпированной cap1, в которой первые пять нуклеотидов, транскрибированные с матричной цепи матрицы нуклеиновой кислоты, содержат последовательность N1pN2pN3pN4pN5, где N1 представляет собой любой нуклеотид, предпочтительно Т; N2 представляет собой любой нуклеотид, предпочтительно С; N3 представляет собой любой нуклеотид, предпочтительно T или G; N4 представляет собой любой нуклеотид; и N5 представляет собой любой нуклеотид. В некоторых воплощениях матрица ДНК содержит: 5’-UTR, последовательность, кодирующую полезную нагрузку, 3’-UTR и поли-А-последовательность.
В настоящей заявке предлагается in vitro реакция транскрипции, включающая:
(i) матричную ДНК, содержащую полинуклеотидную последовательность, комплементарную описанной в данном документе полинуклеотидной последовательности РНК;
(ii) полимеразу; и
(iii) полинуклеотид РНК.
Также в настоящей заявке предлагается полинуклеотид РНК, выделенный в результате предлагаемой реакции транскрипции in vitro.
В данном раскрытии предлагается способ получения кэпированной РНК, включающий транскрипцию матричной нуклеиновой кислоты в присутствии кэп-структуры, где кэп-структура содержит G*ppp(m12'-O)N1pN2,
где N1 комплементарен положению +1 матрицы нуклеиновой кислоты, а N2 комплементарен положению +2 матрицы нуклеиновой кислоты, и N1 и N2 независимо выбраны из A, C, G или U,
где положение +3 матрицы нуклеиновой кислоты представляет собой любой нуклеотид, предпочтительно T или G; положение +4 матрицы нуклеиновой кислоты представляет собой любой нуклеотид; и положение +5 матрицы нуклеиновой кислоты представляет собой любой нуклеотид,
где G* имеет следующую структуру:
где представляет собой связь, посредством которой G* связан с первым атомом фосфора группы ppp, R1 представляет собой CH3, R2 представляет собой OH или O-CH3, а R3 представляет собой O-CH3.
Также в настоящей заявке предлагается композиция, содержащая полинуклеотид ДНК, содержащий последовательность, комплементарную предоставленной последовательности полинуклеотида РНК. В некоторых воплощениях полинуклеотид ДНК, раскрытый в настоящей заявке, можно использовать для транскрипции полинуклеотида РНК, раскрытого в настоящей заявке.
В данном раскрытии предлагается способ, включающий: введение субъекту фармацевтической композиции, содержащей полинуклеотид РНК, раскрытый в настоящей заявке, в составе липидной наночастицы (ЛНЧ) или частицы липоплекса (ЛП), например, как раскрыто в настоящей заявке.
В настоящей заявке также предлагается способ индукции иммунного ответа у субъекта, включающий введение субъекту фармацевтической композиции, содержащей полинуклеотид РНК, раскрытый в настоящей заявке, в виде липидной наночастицы (ЛНЧ) или частицы липоплекса (ЛП), например, как раскрыто в данном документе.
В настоящей заявке предлагается способ вакцинации субъекта путем введения фармацевтической композиции, содержащей полинуклеотид РНК, раскрытый в настоящей заявке, в составе липидной наночастицы (ЛНЧ) или частицы липоплекса (ЛП), например, как раскрыто в настоящей заявке.
В данном раскрытии предлагается способ уменьшения взаимодействия с IFIT1 полинуклеотида РНК, который содержит 5'-кэп и проксимальную к кэпу последовательность, включающую положения +1, +2, +3, +4 и +5 полинуклеотида РНК, способ включающий стадию:
предоставление варианта полинуклеотида РНК, который отличается от исходного полинуклеотида РНК заменой одного или нескольких остатков в проксимальной к кэпу последовательности, и
определения того, что взаимодействие варианта с IFIT1 снижено по сравнению с исходным полинуклеотидом РНК.
В настоящей заявке также предлагается способ получения полипептида, включающий стадию:
предоставление полинуклеотида РНК, который содержит 5'-кэп, проксимальную к кэпу последовательность, которая содержит положения +1, +2, +3, +4 и +5 полинуклеотида РНК, и последовательность, кодирующую полезную нагрузку;
при этом полинуклеотид РНК характеризуется тем, что при оценке в организме, которому вводят полинуклеотид РНК или композицию, содержащую его, можно наблюдать повышенную экспрессию и/или повышенную продолжительность экспрессии полезной нагрузки по сравнению с соответствующим референсным компаратором.
В настоящей заявке предлагается способ повышения трансляционной способности полинуклеотида РНК, который содержит 5'-кэп, проксимальную к кэпу последовательность, которая содержит положения +1, +2, +3, +4 и +5 полинуклеотида РНК, и последовательность, кодирующую полезную нагрузку, причем способ включает стадию:
предоставления варианта полинуклеотида РНК, который отличается от исходного полинуклеотида РНК заменой одного или нескольких остатков в проксимальной к кэпу последовательности; и
определения того, что экспрессия варианта повышена по сравнению с исходным полинуклеотидом РНК.
В настоящей заявке предлагается терапевтическая РНК, содержащая 5’-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, улучшение, которое включает:
включая один или несколько из следующих остатков в проксимальной к кэпу последовательности: X в положении +1 полинуклеотида РНК, X в положении +2 полинуклеотида РНК, A в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида полинуклеотид РНК и X в положении +5 полинуклеотида РНК, продемонстрировала увеличение экспрессии РНК при введении субъекту в составе ЛНЧ. В некоторых воплощениях X выбран из A, C, G или U.
В этом раскрытии предлагается терапевтическая РНК, содержащая 5'-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, улучшение, которое включает: включение одного или нескольких из следующих остатков в проксимальную к кэпу последовательность: X в положении +1 полинуклеотида РНК, X в положении +2 полинуклеотида РНК, C в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида РНК и X в положении +5 полинуклеотида РНК, которая продемонстрировала увеличение экспрессии РНК при введении субъекту в составе ЛНЧ. В некоторых воплощениях X выбран из A, C, G или U.
В настоящей заявке также предложена терапевтическая РНК, содержащая 5'-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, улучшение, которое включает: включение одного или нескольких из следующих остатков в проксимальную к кэпу последовательность: А в положении +1 полинуклеотида РНК, G в положении +2 полинуклеотида РНК, A в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида РНК и U в положении +5 полинуклеотида РНК, продемонстрировали увеличивать экспрессию РНК при введении субъекту в составе ЛНЧ.
В этом документе предложен способ увеличения трансляции полинуклеотида РНК, содержащего 5'-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, улучшение, которое включает: включение одного или нескольких из следующих остатков в проксимальной к последовательности: X в положении +1 полинуклеотида РНК, X в положении +2 полинуклеотида РНК, A в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида РНК и X в положении +5 полинуклеотида РНК. В некоторых воплощениях X выбран из A, C, G или U.
В настоящей заявке предлагается способ увеличения трансляции полинуклеотида РНК, содержащего 5'-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, причем улучшение включает: включение одного или нескольких из следующих остатков в кэп проксимальная последовательность: X в положении +1 полинуклеотида РНК, X в положении +2 полинуклеотида РНК, C в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида РНК и X в положении +5 полинуклеотида РНК. В некоторых воплощениях X выбран из A, C, G или U.
В настоящей заявке также предлагается способ увеличения трансляции полинуклеотида РНК, содержащего 5'-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, улучшение, которое включает: включение одного или нескольких из следующих остатков в проксимальную к кэпу последовательность: A в положении +1 полинуклеотида РНК, G в положении +2 полинуклеотида РНК, A в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида РНК и U в положении +5 полинуклеотида РНК.
В настоящей заявке также предлагается способ получения каркаса для полинуклеотида РНК, который содержит 5'-кэп, проксимальную к кэпу последовательность и последовательность полезной нагрузки, причем способ включает стадию:
оценки по меньшей мере двух вариантов полинуклеотида РНК, где:
каждый вариант включает одинаковый 5’-кэп и последовательность полезной нагрузки; и
варианты отличаются друг от друга одним или несколькими специфическими остатками проксимальной к кэпу последовательности;
при этом оценка включает определение уровней экспрессии и/или продолжительности экспрессии последовательности полезной нагрузки; и
выбор по меньшей мере одной комбинации 5’-кэпа и проксимальной к кэпу последовательности, которая демонстрирует повышенную экспрессию по сравнению по меньшей мере с одной другой комбинацией.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
На фигуре 1 показаны уровни EPO в плазме через 6, 24, 48 и 72 часа после внутривенного введения мышам конструкций мРНК мышиного EPO (mEPO) с присутствием или без присутствия Lig3 в последовательности 3’UTR. Кровь собирали через 6, 24, 48 и 72 часа после введения и образцы анализировали на уровни mEPO с помощью ELISA.
Фигуры 2A-2C представляют собой схематическое изображение самогибридизации последовательности Lig3 с 5'-UTR (фигура 2A-2B) или 3'-UTR (фигура 2C).
Фигуры 3A-3I представляют собой структуры 5'-кэпов, которые могут быть включены в мРНК.
На фигуре 4 показаны уровни mEPO в плазме через 6, 24, 48 и 72 часа после внутривенного введения мышам конструкций мРНК mEPO, имеющих разные нуклеотиды в положениях +3, +4 или +5. Кровь собирали через 6, 24, 48 и 72 часа после введения и образцы анализировали на уровни mEPO с помощью ELISA.
На фигуре 5 показан ответ IgG против протеина S через 7, 14, 21 и 28 дней после иммунизации BNT162a1. Мышей BALB/c однократно в/м иммунизировали 1, 5 или 10 мкг препарата RBL063.3, содержащего ЛНЧ. На 7, 14, 21 и 28 день после иммунизации у животных брали кровь и образцы сыворотки анализировали на общее количество анти-S1 (слева) и анти-RBD (справа) антигенспецифического иммуноглобулина G (IgG), измеренное с помощью ELISA. На 7-й, 14-й, 21-й и 28-й день на график были включены значения для разведения сыворотки 1:100. Одна точка на графике соответствует одной мыши, каждый образец мыши был измерен в двух повторах (размер группы n=8; для групп включено среднее значение + стандартная ошибка среднего).
На фигуре 6 показан ответ IgG против протеина S через 7, 14, 21 и 28 дней после иммунизации BNT162b1. Мышей BALB/c однократно иммунизировали в/м 0,2, 1 или 5 мкг RBP020.3 в составе ЛНЧ. На 7, 14, 21 и 28 день после иммунизации у животных брали кровь и образцы сыворотки анализировали на общее количество анти-S1 (слева) и анти-RBD (справа) антигенспецифического иммуноглобулина G (IgG), измеренное с помощью ELISA. На 7-й день (1:100), 14-й день (1:300), 21-й день (1:900) и 28-й день (1:2700) на график были включены различные разведения сыворотки. Одна точка на графике соответствует одной мыши, каждый образец мыши был измерен в двух повторах (размер группы n=8; для групп включено среднее значение + стандартная ошибка среднего).
На фигуре 7 показана нейтрализация псевдовируса SARS-CoV-2 через 14, 21 и 28 дней после иммунизации BNT162b1. Мышей BALB/c однократно в/м иммунизировали 0,2, 1 или 5 мкг RBP020.3 в составе ЛНЧ. Через 14, 21 и 28 дней после иммунизации у животных брали кровь и сыворотку крови исследовали на нейтрализацию псевдовируса SARS-CoV-2. На графиках показаны разведения сыворотки pVN50 (снижение инфекционных событий на 50% по сравнению с положительным контролем без сыворотки). Одна точка на графиках соответствует одной мыши. Каждый образец мыши измеряли в двух повторах. Размер группы n=8. Среднее значение + SEM показано горизонтальными планками с «усами» для каждой группы. LLOQ, нижний предел количественного определения. ULOQ, верхний предел количественного определения.
На фигуре 8 показан ответ IgG против протеина S через 7, 14 и 21 день после иммунизации BNT162c1. Мышей BALB/c однократно иммунизировали в/м 0,2, 1 или 5 мкг RBS004.3 в составе ЛНЧ. На 7, 14 и 21 день после иммунизации у животных брали кровь и образцы сыворотки анализировали на общее количество анти-S1 (слева) и анти-RBD (справа) антигенспецифического иммуноглобулина G (IgG), измеренное с помощью ELISA. На 7-й день (1:100), 14-й день (1:300) и 21-й день (1:900) на график были включены различные разведения сыворотки. Одна точка на графике соответствует одной мыши, каждый образец мыши был измерен в двух повторах (размер группы n=8; для групп включено среднее значение + стандартная ошибка среднего).
На фигуре 9 показана нейтрализация псевдовируса SARS-CoV-2 через 14 и 21 день после иммунизации BNT162c1. Мышей BALB/c однократно иммунизировали в/м 0,2, 1 или 5 мкг RBS004.3 в составе ЛНЧ. На 14 и 21 день после иммунизации у животных брали кровь и сыворотку тестировали на нейтрализацию псевдовируса SARS-CoV-2. На графиках показаны разведения сыворотки pVN50 (снижение инфекционных событий на 50% по сравнению с положительным контролем без сыворотки). Одна точка на графиках соответствует одной мыши. Каждый образец мыши измеряли в двух повторах. Размер группы n=8. Среднее значение + SEM показано горизонтальными планками с «усами» для каждой группы. LLOQ, нижний предел количественного определения. ULOQ, верхний предел количественного определения.
На фигуре 10 показан ответ IgG против протеина S через 7, 14, 21 и 28 дней после иммунизации RBL063.1 в составе ЛНЧ. Мышей BALB/c однократно в/м иммунизировали 1, 5 или 10 мкг RBL063.1 в составе ЛНЧ. На 7, 14, 21 и 28 день после иммунизации у животных брали кровь и образцы сыворотки анализировали на общее количество анти-S1 (слева) и анти-RBD (справа) антигенспецифического иммуноглобулина G (IgG), измеренное с помощью ELISA. На 7-й день (1:100), 14-й день (1:100), 21-й день (1:300) и 28-й день (1:900) на график были включены различные разведения сыворотки. Одна точка на графике соответствует одной мыши, каждый образец мыши был измерен в двух повторах (размер группы n=8; для групп включено среднее значение + стандартная ошибка среднего).
На фигуре 11 показана нейтрализация псевдовируса SARS-CoV-2 через 14, 21 и 28 дней после иммунизации RBL063.1 в составе ЛНЧ. Мышей BALB/c однократно в/м иммунизировали 1, 5 или 10 мкг RBL063.1 в составе ЛНЧ. Через 14, 21 и 28 дней после иммунизации у животных брали кровь и тестировали сыворотку на нейтрализацию псевдовируса SARS-CoV-2. На графиках показаны разведения сыворотки pVN50 (снижение инфекционных событий на 50% по сравнению с положительным контролем без сыворотки). Одна точка на графиках соответствует одной мыши. Каждый образец мыши измеряли в двух повторах. Размер группы n=8. Среднее значение + SEM показано горизонтальными планками с «усами» для каждой группы. LLOQ, нижний предел количественного определения. ULOQ, верхний предел количественного определения.
На фигуре 12 показан ответ IgG против протеина S через 7, 14 и 21 день после иммунизации BNT162b2 (состав ЛНЧ RBP020.1). Мышей BALB/c однократно в/м иммунизировали 0,2, 1 или 5 мкг RBP020.1 в составе ЛНЧ. На 7, 14 и 21 день после иммунизации у животных брали кровь и образцы сыворотки анализировали на общее количество анти-S1 (слева) и анти-RBD (справа) антигенспецифического иммуноглобулина G (IgG), измеренное с помощью ELISA. На 7-й день (1:100), 14-й день (1:300) и 21-й день (1:1100) на график были включены различные разведения сыворотки. Одна точка на графике соответствует одной мыши, каждый образец мыши был измерен в двух повторах (размер группы n=8; для групп включено среднее значение + стандартная ошибка среднего).
На фигуре 13 показана нейтрализация псевдовирусов SARS-CoV-2 14 и 21 после иммунизации BNT162b2 (RBP020.1 в составе ЛНЧ). Мышей BALB/c однократно в/м иммунизировали 0,2, 1 или 5 мкг RBP020.1 в составе ЛНЧ. На 14 и 21 день после иммунизации у животных брали кровь и тестировали сыворотку на нейтрализацию псевдовируса SARS-CoV-2. На графиках показаны разведения сыворотки pVN50 (снижение инфекционных событий на 50% по сравнению с положительным контролем без сыворотки). Одна точка на графиках соответствует одной мыши. Каждый образец мыши измеряли в двух повторах. Размер группы n=8. Среднее значение + SEM показано горизонтальными планками с «усами» для каждой группы. LLOQ, нижний предел количественного определения. ULOQ, верхний предел количественного определения.
На фигуре 14 показан ответ IgG против протеина S через 7, 14 и 21 день после иммунизации RBS004.2 в составе ЛНЧ. Мышей BALB/c однократно в/м иммунизировали 0,2, 1 или 5 мкг RBS004.2 в составе ЛНЧ. На 7, 14 и 21 день после иммунизации у животных брали кровь и образцы сыворотки анализировали на общее количество анти-S1 (слева) и анти-RBD (справа) антигенспецифического иммуноглобулина G (IgG), измеренное с помощью ELISA. На 7-й день (1:100), 14-й день (1:300) и 21-й день (1:900) на график были включены различные разведения сыворотки. Одна точка на графике соответствует одной мыши, каждый образец мыши был измерен в двух повторах (размер группы n=8; для групп включено среднее значение + стандартная ошибка среднего).
На фигуре 15 показана нейтрализация псевдовирусов SARS-CoV-2 14 и 21 после иммунизации RBS004.2 в составе ЛНЧ. Мышей BALB/c однократно в/м иммунизировали 0,2, 1 или 5 мкг RBS004.2 в составе ЛНЧ. На 14 и 21 день после иммунизации у животных брали кровь и сыворотку тестировали на нейтрализацию псевдовируса SARS-CoV-2. На графиках показаны разведения сыворотки pVN50 (снижение инфекционных событий на 50% по сравнению с положительным контролем без сыворотки). Одна точка на графиках соответствует одной мыши. Каждый образец мыши измеряли в двух повторах. Размер группы n=8. Среднее значение + SEM показано горизонтальными планками с «усами» для каждой группы. LLOQ, нижний предел количественного определения. ULOQ, верхний предел количественного определения.
На фигуре 16 показана активность ALC-0315 в процессе скрининга.
На фигуре 17 показано, как экспрессию люциферазы отслеживали на правой (место инъекции), дорсальной (место инъекции) и вентральной (дренаж в печень) сторонах животного после внутримышечного введения в диком типе (WT) или с нокаутом мышей ApoE C57Bl/6 в присутствии или в отсутствие ApoE3. Экспрессию люциферазы определяли с помощью Xenolight D-Luciferin Rediject через 4, 24, 72 и 96 часов после введения.
На фигуре 18 показана активность люциферазы после внутривенного (в.в.) и внутримышечного (в.м.) введения мышам дикого типа (WT) или мышам C57Bl/6 с нокаутом ApoE в присутствии (KO+) или отсутствии (KO) ApoE3. Экспрессию люциферазы определяли с помощью Xenolight D-Luciferin Rediject через 4 часа после введения.
НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ
Хотя настоящее раскрытие подробно описано ниже, следует понимать, что это раскрытие не ограничивается конкретными методологиями, протоколами и реагентами, описанными в данном документе, поскольку они могут варьировать. Также следует понимать, что используемая в данном документе терминология предназначена только для описания конкретных воплощений и не предназначена для ограничения объема настоящего раскрытия, которое будет ограничено только прилагаемой формулой изобретения. Если иное не определено, все технические и научные термины, использованные в данном документе, имеют те же смыслы, которые вкладываются в них обычным специалистом в данной области.
Предпочтительно, чтобы используемые в данном документе термины были определены, как описано в «A multilingual glossary of biotechnological terms: (IUPAC Recommendations)", H.G.W. Leuenberger, B. Nagel, and H. Kölbl, Eds., Helvetica Chimica Acta, CH-4010 Basel, Switzerland, (1995).
При осуществлении настоящего раскрытия на практике будут использоваться, если не указано иное, обычные способы химии, биохимии, клеточной биологии, иммунологии и методы рекомбинантных ДНК, которые объяснены в литературе в данной области (см., например, Molecular Cloning: A Laboratory Manual, 2nd Edition, J. Sambrook et al. eds., Cold Spring Harbor Laboratory Press, Cold Spring Harbor 1989).
Далее будут описаны элементы настоящего раскрытия. Эти элементы перечислены с конкретными воплощениями, однако следует понимать, что они могут объединяться любым способом и в любом количестве с созданием дополнительных воплощений. Различно описанные примеры и воплощения не должны толковаться как ограничение настоящего раскрытия только явно описанными воплощениями. Следует понимать, что это описание раскрывает и охватывает воплощения, которые объединяют явно описанные воплощения с любым количеством раскрытых элементов. Более того, любые перестановки и комбинации всех описанных элементов следует считать раскрытыми в этом описании, если контекст не указывает иное. Термин «около» означает приблизительно или почти, а в контексте числового значения или диапазона, изложенного в настоящей заявке, в некоторых воплощениях означает ± 20%, ± 10%, ± 5% или ± 3% от приведенного или заявленного числового значения или диапазона.
Термины в единственном числе используемые в контексте описания раскрытия (особенно в контексте формулы изобретения), должны толковаться как охватывающие как единственное, так и множественное число, если в данном документе не указано иное или явно не противоречит контексту. Перечисление интервалов в данном документе предназначено всего лишь для того, чтобы служить в качестве способа сокращения для индивидуального обозначения каждого отдельного значения, попадающего в интервал. Если в данном документе не указано иное, каждое отдельное значение включено в описание, как если бы оно было отдельно указано в данном документе. Все способы, описанные в данном документе, могут осуществляться в любом подходящем порядке до тех пор, пока в данном документе не указано иное или иное очевидно не следует из контекста. Использование любых и всех примеров или вводного слова перед примером (например, «такой как»), представленных в данном документе, предназначено просто для лучшей иллюстрации раскрытия и не налагает ограничения на объем формулы изобретения. Никакие формулировки в описании не должны толковаться как указывающие на какой-либо незаявленный элемент, существенный для практического осуществления раскрытия.
Если специально не указано иное, термин «содержащий» используется в контексте настоящего документа для обозначения того, что дополнительные элементы могут необязательно присутствовать в дополнение к элементам перечня, введенным словом «содержащий». Однако в качестве конкретного воплощения настоящего изобретения предполагается, что термин «содержащий» охватывает возможность отсутствия дополнительных элементов, т.е. для целей данного воплощения «содержащий» следует понимать как имеющий значение «состоящий из» или «состоящий в основном из».
Несколько документов цитируется по всему тексту данного описания. Каждый из документов, процитированных в данном документе (включая все патенты, патентные заявки, научные публикации, описании производителя, инструкции и т.д.), будь то выше или ниже, настоящим полностью включен ссылкой. Ничто в данном документе не должно толковаться как признание того, что настоящее раскрытие не может претендовать на более раннюю дату такого раскрытия.
Далее будут предоставлены определения, которые применяются ко всем аспектам настоящего раскрытия. Следующие термины имеют следующие значения если не указано иное. Любой из неопределенных терминов имеет свое признанное в области значение.
Агент: Используемый в данном документе термин «агент» может относиться к физическому объекту или явлению. В некоторых воплощениях агент может характеризоваться конкретным признаком и/или эффектом. В некоторых воплощениях агент может представлять собой соединение, молекулу или объект любого химического класса, включая, например, небольшую молекулу, полипептид, нуклеиновую кислоту, сахарид, липид, металл или их комбинацию или комплекс. В некоторых воплощениях термин «агент» может относиться к соединению, молекуле или объекту, который содержит полимер. В некоторых воплощениях термин может относиться к соединению или объекту, который содержит один или несколько полимерных фрагментов. В некоторых воплощениях термин «агент» может относиться к соединению, молекуле или объекту, который практически не содержит определенного полимера или полимерной части. В некоторых воплощениях термин может относиться к соединению, молекуле или объекту, который не содержит или практически не содержит какого-либо полимера или полимерной части.
Аминокислота: в самом широком смысле термин «аминокислота», используемый в данном документе, относится к соединению и/или веществу, которое может быть включено, включено или было включено в полипептидную цепь, например, путем образования одного или нескольких пептидных связей. В некоторых воплощениях аминокислота имеет общую структуру H2N-C(H)(R)-COOH. В некоторых воплощениях аминокислота представляет собой встречающуюся в природе аминокислоту. В некоторых воплощениях аминокислота представляет собой неприродную аминокислоту; в некоторых воплощениях аминокислота представляет собой D-аминокислоту; в некоторых воплощениях аминокислота представляет собой L-аминокислоту. «Стандартная аминокислота» относится к любой из двадцати стандартных L-аминокислот, обычно встречающихся в природных пептидах. «Нестандартная аминокислота» относится к любой аминокислоте, кроме стандартных аминокислот, независимо от того, получена ли она синтетическим путем или получена из природного источника. В некоторых воплощениях аминокислота, включая карбокси- и/или аминоконцевую аминокислоту в полипептиде, может содержать структурную модификацию по сравнению с общей структурой, указанной выше. Например, в некоторых воплощениях аминокислота может быть модифицирована метилированием, амидированием, ацетилированием, ПЭГилированием, гликозилированием, фосфорилированием и/или заменой (например, аминогруппой, карбоксильной группой, одним или несколькими протонами и/или гидроксильной группой) по сравнению с общей структурой. В некоторых воплощениях такая модификация может, например, изменять период полувыведения в кровотоке полипептида, содержащего модифицированную аминокислоту, по сравнению с полипептидом, содержащим идентичную в остальном немодифицированную аминокислоту. В некоторых воплощениях такая модификация существенно не изменяет соответствующую активность полипептида, содержащего модифицированную аминокислоту, по сравнению с полипептидом, содержащим идентичную в остальном немодифицированную аминокислоту. Как будет понятно из контекста, в некоторых воплощениях термин «аминокислота» может использоваться для обозначения свободной аминокислоты; в некоторых воплощениях его можно использовать для обозначения аминокислотного остатка полипептида.
Аналог: Используемый в настоящей заявке термин «аналог» относится к веществу, которое имеет одну или несколько общих структурных особенностей, элементов, компонентов или фрагментов с референсным веществом. Как правило, «аналог» демонстрирует значительное структурное сходство с референсным веществом, например, имеет общую структуру ядра или консенсуса, но также имеет некоторые отличия. В некоторых воплощениях аналог представляет собой вещество, которое может быть получено из референсного вещества, например, путем химической обработки референсного вещества. В некоторых воплощениях аналог представляет собой вещество, которое может быть получено путем выполнения синтетического процесса, по существу аналогичного (например, совпадающего с множеством стадий) процесса, в котором производится референсное вещество. В некоторых воплощениях аналог создается или может быть получен путем выполнения синтетического процесса, отличного от того, который используется для получения референсного вещества.
Антительный агент: Используемый в данном документе термин «антительный агент» относится к агенту, который специфически связывается с конкретным антигеном. В некоторых воплощениях термин охватывает полипептид или полипептидный комплекс, который включает структурные элементы иммуноглобулина, достаточные для обеспечения специфического связывания. Например, в некоторых воплощениях антительный агент представляет собой или содержит полипептид, аминокислотная последовательность которого включает один или несколько структурных элементов, признанных специалистами в данной области техники как определяющая комплементарность область (CDR); в некоторых воплощениях антительный агент представляет собой или содержит полипептид, аминокислотная последовательность которого включает по меньшей мере одну CDR (например, по меньшей мере одну CDR тяжелой цепи и/или по меньшей мере одну CDR легкой цепи), которая по существу идентична CDR, обнаруженной в референсном антителе. В некоторых воплощениях включенная CDR по существу идентичен референсной CDR в том смысле, что он либо идентичен по последовательности, либо содержит от 1 до 5 аминокислотных замен по сравнению с референсной CDR. В некоторых воплощениях включенная CDR практически идентичен референсной CDR в том, что он показывает по меньшей мере 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%%, 96%, 97%, 98%, 99% или 100% идентичность последовательности с референсной CDR. В некоторых воплощениях включенная CDR по существу идентичен референсной CDR в том, что он демонстрирует по меньшей мере 96%, 96%, 97%, 98%, 99% или 100% идентичности последовательности с референсной CDR. В некоторых воплощениях включенная CDR по существу идентичен референсной CDR в том, что по меньшей мере одна аминокислота во включенной CDR удалена, добавлена или заменена по сравнению с референсной CDR, но включенная CDR имеет аминокислотную последовательность, которая в остальном идентична референсной CDR. В некоторых воплощениях включенная CDR по существу идентичен референсной CDR в том, что 1-5 аминокислот во включенной CDR удалены, добавлены или заменены по сравнению с референсной CDR, но включенная CDR имеет аминокислотную последовательность, которая в остальном идентична референсной CDR. В некоторых воплощениях включенная CDR по существу идентичен референсной CDR в том, что по меньшей мере одна аминокислота во включенной CDR заменена по сравнению с референсной CDR, но включенная CDR имеет аминокислотную последовательность, которая в остальном идентична последовательности референсной CDR. В некоторых воплощениях включенная CDR по существу идентичен референсной CDR в том, что 1-5 аминокислот во включенной CDR удалены, добавлены или заменены по сравнению с референсной CDR, но включенная CDR имеет аминокислотную последовательность, которая в остальном идентична референсной CDR. В некоторых воплощениях антитело представляет собой или содержит полипептид, аминокислотная последовательность которого включает структурные элементы, известные специалистам в данной области как вариабельный домен иммуноглобулина. В некоторых воплощениях антительный агент представляет собой или содержит полипептид, аминокислотная последовательность которого включает структурные элементы, признанные специалистами в данной области техники соответствующими CDR1, 2 и 3 вариабельного домена антитела; в некоторых таких воплощениях изобретения антитело в составе полипептида или набора полипептидов, аминокислотные последовательности которых вместе включают структурные элементы, признанные специалистами в данной области техники, соответствующими CDR вариабельной области как тяжелой, так и легкой цепи, например, CDR 1, 2 и/или 3 тяжелой цепи и CDR 1, 2 и/или 3 легкой цепи. В некоторых воплощениях антитело представляет собой полипептидный белок, имеющий домен связывания, гомологичный или в значительной степени гомологичный домену связывания иммуноглобулина. В некоторых воплощениях антительный агент может представлять собой препарат поликлонального антитела или содержать препарат поликлонального антитела. В некоторых воплощениях антительный агент может представлять собой препарат моноклонального антитела или содержать препарат поликлонального антитела. В некоторых воплощениях антительный агент может включать одну или несколько последовательностей константной области, характерных для конкретного организма, такого как верблюд, человек, мышь, примат, кролик, крыса; во многих воплощениях антитело может включать одну или несколько последовательностей константной области, характерных для человека. В некоторых воплощениях антительный агент может включать один или несколько элементов последовательности, которые специалист в данной области может распознать как гуманизированную последовательность, приматизированную последовательность, химерную последовательность и т.д. В некоторых воплощениях антитело может представлять собой каноническое антитело (например, может содержать две тяжелые цепи и две легкие цепи). В некоторых воплощениях антитело может быть в формате, выбранном, без ограничения указанным, из интактных антител IgA, IgG, IgE или IgM; би- или мультиспецифических антител (например, Zybodies® и т.д.); фрагментов антител, таких как Fab-фрагменты, Fab’-фрагменты, F(ab’)2-фрагменты, Fd’-фрагменты, Fd-фрагменты и выделенных CDR или их наборов; одноцепочечных FV; гибридов полипептид-Fc; однодоменных антител (например, однодоменных антител акулы, такие как IgNAR или их фрагменты); верблюжьих антител; маскированных антител (например, Probodies®); Small Modular ImmunoPharmaceuticals («SMIPsTM»); одноцепочечных или тандемных диатела (TandAb®); VHH; Anticalins®; минител Nanobody®; BiTE®; белков анкириновых повторов или DARPINs®; Avimers®; DARTs; TCR-подобных антител; Adnectins®; Affilins®; Trans-bodies®; Affibodies®; TrimerX®; MicroProteins; Fynomers®, Centyrins®; и KALBITOR®. В некоторых воплощениях у антитела может отсутствовать ковалентная модификация (например, присоединение гликана), которую оно имело бы, если бы продуцировалось естественным образом. В некоторых воплощениях антитело может содержать ковалентную модификацию (например, присоединение гликана, полезную нагрузку [например, детектируемый фрагмент, терапевтический фрагмент, каталитический фрагмент и т.д.] или другую боковую группу [например, полиэтиленгликоль и т.д.].
Ассоциированные: два события или сущности «ассоциируются» друг с другом, как этот термин используется в настоящей заявке, если присутствие, уровень, степень, тип и/или форма одного коррелируют с присутствием другого. Например, конкретный объект (например, полипептид, генетическая сигнатура, метаболит, микроб и т.д.) считается связанным с конкретным заболеванием, расстройством или состоянием, если его присутствие, уровень и/или форма коррелируют с заболеваемостью, восприимчивостью к, тяжести, стадии и т.д. заболевания, расстройства или состояния (например, в соответствующей популяции). В некоторых воплощениях два или более объектов физически «связаны» друг с другом, если они взаимодействуют, прямо или косвенно, так что они находятся и/или остаются в физической близости друг к другу. В некоторых воплощениях два или более объекта, которые физически связаны друг с другом, ковалентно связаны друг с другом; в некоторых воплощениях два или более объекта, которые физически связаны друг с другом, не связаны ковалентно друг с другом, но связаны нековалентно, например, посредством водородных связей, взаимодействия Ван-дер-Ваальса, гидрофобных взаимодействий, магнетизма и их комбинаций.
Связывание: следует понимать, что термин «связывание», используемый в настоящей заявке, обычно относится к нековалентной ассоциации между двумя или более объектами. «Прямое» связывание предполагает физический контакт между сущностями или половинками; непрямое связывание включает физическое взаимодействие посредством физического контакта с одним или несколькими промежуточными объектами. Связывание между двумя или более объектами обычно можно оценить в любом из множества контекстов, в том числе там, где взаимодействующие объекты или части изучаются изолированно или в контексте более сложных систем (например, когда они ковалентно или иным образом связаны с объектом-носителем и/или в биологической системе или клетке). Связывание между двумя объектами может считаться «специфическим», если в оцениваемых условиях соответствующие объекты с большей вероятностью будут связаны друг с другом, чем с другими доступными партнерами по связыванию.
Биологический образец: Используемый в настоящей заявке термин «биологический образец» обычно относится к образцу, полученному или извлеченному из интересующего биологического источника (например, ткани, организма или клеточной культуры), как описано в настоящей заявке. В некоторых воплощениях интересующий источник включает организм, такой как животное или человек. В некоторых воплощениях биологический образец представляет собой или содержит биологическую ткань или жидкость. В некоторых воплощениях биологический образец может представлять собой костный мозг или содержать его; кровь; клетки крови; асцит; образцы ткани или тонкоигольной биопсии; содержащие клетки жидкости организма; свободно плавающие нуклеиновые кислоты; мокрота; слюна; моча; спинномозговая жидкость, перитонеальная жидкость; плевральная жидкость; фекалии; лимфа; гинекологические жидкости; кожные мазки; вагинальные мазки; мазки из полости рта; мазки из носа; промывания или промывания, такие как протоковый лаваж или бронхоальвеолярный лаваж; аспирации; соскобы; образцы костного мозга; образцы биопсии тканей; хирургические образцы; фекалии, другие биологические жидкости, выделения и/или экскреции; и/или клетки из них и т.д. В некоторых воплощениях биологический образец представляет собой или содержит клетки, полученные от индивидуума. В некоторых воплощениях полученные клетки представляют собой или включают клетки индивидуума, от которого получен образец. В некоторых воплощениях образец представляет собой «первичный образец», полученный непосредственно из интересующего источника любым подходящим способом. Например, в некоторых воплощениях первичный биологический образец получают способами, выбранными из группы, состоящей из биопсии (например, тонкоигольной аспирации или биопсии ткани), хирургического вмешательства, сбора жидкости организма (например, крови, лимфы, кала и т.д. В некоторых воплощениях, как будет ясно из контекста, термин «образец» относится к препарату, полученному путем обработки (например, путем удаления одного или нескольких компонентов и/или путем добавления одного или нескольких агентов) к первичному образцу. Например, фильтрация с использованием полупроницаемой мембраны. Такой «обработанный образец» может содержать, например, нуклеиновые кислоты или белки, выделенные из образца или полученные путем применения к первичному образцу таких методов, как амплификация или обратная транскрипция мРНК, выделение и/или очистка определенных компонентов и т.д.
Комбинированная терапия: Используемый в настоящей заявке термин «комбинированная терапия» относится к тем ситуациям, в которых субъект одновременно подвергается двум или более терапевтическим схемам (например, двум или более терапевтическим агентам). В некоторых воплощениях две или более схем можно вводить одновременно; в некоторых воплощениях такие схемы могут вводиться последовательно (например, все «дозы» первой схемы вводятся до введения любых доз второй схемы); в некоторых воплощениях такие агенты вводят в перекрывающихся режимах дозирования. В некоторых воплощениях «введение» комбинированной терапии может включать введение одного или нескольких агентов или модальностей субъекту, получающему другие агенты или модальности в комбинации. Для ясности, комбинированная терапия не требует, чтобы отдельные агенты вводились вместе в одной композиции (или даже обязательно одновременно), хотя в некоторых воплощениях два или более агента или их активные фрагменты могут вводиться вместе в комбинации, композиции или даже в комбинированном соединении (например, как часть одного химического комплекса или ковалентного соединения).
Сравнимые: Используемый в данном документе термин «сравнимые» относится к двум или более агентам, объектам, ситуациям, наборам условий и т.д., которые могут быть не идентичными друг другу, но достаточно сходны, чтобы можно было провести сравнение между ними, чтобы специалист в данной области понял, что выводы могут быть обоснованно сделаны на основе наблюдаемых различий или сходств. В некоторых воплощениях сравнимые наборы условий, обстоятельств, индивидуумов или популяций характеризуются множеством по существу идентичных признаков и одним или небольшим числом различных признаков. Специалисты в данной области техники поймут в контексте, какая степень идентичности требуется в любых данных обстоятельствах, чтобы два или более таких агентов, субъектов, ситуаций, наборов условий и т.д. считались сопоставимыми. Например, специалистам в данной области будет понятно, что наборы обстоятельств, индивидуумов или популяций сравнимы друг с другом, если они характеризуются достаточным количеством и типом по существу идентичных признаков, чтобы гарантировать разумный вывод о том, что различия в полученных результатах или явлениях наблюдаемые при или с различными обстоятельствами, индивидуумами или популяциями вызваны или указывают на вариации этих признаков.
Соответствует: Используемый в данном документе термин «соответствует» относится к отношениям между двумя или более объектами. Например, термин «соответствует» может использоваться для обозначения положения/идентичности структурного элемента в соединении или композиции по отношению к другому соединению или композиции (например, к соответствующим референсным соединению или композиции). Например, в некоторых воплощениях мономерный остаток в полимере (например, аминокислотный остаток в полипептиде или остаток нуклеиновой кислоты в полинуклеотиде) может быть идентифицирован как «соответствующий» остатку в соответствующем референсном полимере. Например, специалистам должно быть понятно, что для простоты остатки в полипептиде часто обозначают с использованием канонической системы нумерации, основанной на референсном родственном полипептиде, так что аминокислота, «соответствующая» остатку в положении 190, например, на самом деле не обязательно должна быть 190-я аминокислота в конкретной цепи аминокислот, а скорее соответствует остатку, обнаруженному на 190-й позиции в референсном полипептиде; специалисты в данной области легко поймут, как идентифицировать «соответствующие» аминокислоты. Например, специалистам в данной области известны различные стратегии выравнивания последовательностей, включая такие программы, как, например, BLAST, CS-BLAST, CUSASW++, DIAMOND, FASTA, GGSEARCH/GLSEARCH, Genoogle, HMMER, HHpred/HHsearch, IDF, Infernal, KLAST, USEARCH, parasail, PSI-BLAST, PSI-Search, ScalaBLAST, Sequilab, SAM, SSEARCH, SWAPHI, SWAPHI-LS, SWIMM или SWIPE, которые можно использовать, например, для идентификации «соответствующих» остатков в полипептидах и/или нуклеиновых кислотах в соответствии с настоящим изобретением. Специалистам в данной области техники также будет понятно, что в некоторых случаях термин «соответствующий» может использоваться для описания события или субъекта, имеющего сходство с другим событием или объектом (например, соответствующим референсным событием или объектом). Чтобы привести только один пример, ген или белок в одном организме может быть описан как «соответствующий» гену или белку из другого организма, чтобы указать, в некоторых воплощениях, что он играет аналогичную роль или выполняет аналогичную функцию и/или или что он демонстрирует определенную степень идентичности последовательности или гомологии, или имеет общий характерный элемент последовательности.
Разработанный: Используемый в данном документе термин «разработанный» относится к агенту (i), структура которого выбирается или была выбрана с участием человека; (ii) которые производятся в процессе, требующем участия человека; и/или (iii) который отличается от природных веществ и других известных агентов.
Режим дозирования: специалистам в данной области техники понятно, что термин «режим дозирования» может использоваться для обозначения набора стандартных доз (обычно более одной), которые вводятся индивидуально субъекту, обычно разделенных периодами времени. В некоторых воплощениях для данного терапевтического средства предусмотрен рекомендуемый режим дозирования, который может включать одну или несколько доз. В некоторых воплощениях режим дозирования включает множество доз, каждая из которых отделена во времени от других доз. В некоторых воплощениях отдельные дозы отделены друг от друга периодом времени одинаковой продолжительности; в некоторых воплощениях режим дозирования включает множество доз и по меньшей мере два разных периода времени, разделяющих отдельные дозы. В некоторых воплощениях все дозы в режиме дозирования представляют собой одно и то же количество разовой дозы. В некоторых воплощениях разные дозы в режиме дозирования представляют собой разные количества. В некоторых воплощениях схема дозирования включает первую дозу в количестве первой дозы, за которой следуют одна или более дополнительных доз в количестве второй дозы, отличном от количества первой дозы. В некоторых воплощениях схема дозирования включает первую дозу в количестве первой дозы, за которой следуют одна или более дополнительных доз в количестве второй дозы, равном количеству первой дозы. В некоторых воплощениях режим дозирования коррелирует с желаемым или благоприятным результатом при введении в соответствующей популяции (т.е. является терапевтическим режимом дозирования).
Сконструированный: В общем, термин «сконструированный» относится к аспекту манипуляций с участием человека. Например, полинуклеотид считается «сконструированным», когда две или более последовательностей, которые не связаны друг с другом в таком порядке в природе, обрабатываются с участием человека, чтобы быть непосредственно связанными друг с другом в сконструированном полинуклеотиде, и/или когда конкретный остаток в полинуклеотиде не встречается в природе и/или вызван действием с участием человека, чтобы быть связанным с объектом или фрагментом, с которым он не связан в природе.
Эпитоп: используемый в настоящей заявке термин «эпитоп» относится к фрагменту, который специфически распознается компонентом, связывающим иммуноглобулин (например, антитело или рецептор). В некоторых воплощениях эпитоп состоит из множества химических атомов или групп антигена. В некоторых воплощениях такие химические атомы или группы экспонируются на поверхности, когда антиген принимает соответствующую трехмерную конформацию. В некоторых воплощениях такие химические атомы или группы находятся физически рядом друг с другом в пространстве, когда антиген принимает такую конформацию. В некоторых воплощениях по меньшей мере некоторые такие химические атомы представляют собой группы, которые физически отделены друг от друга, когда антиген принимает альтернативную конформацию (например, линеаризуется).
Экспрессия: Используемый в данном документе термин «экспрессия» последовательности нуклеиновой кислоты относится к получению любого генного продукта из последовательности нуклеиновой кислоты. В некоторых воплощениях продукт гена может представлять собой транскрипт. В некоторых воплощениях продукт гена может представлять собой полипептид. В некоторых воплощениях экспрессия последовательности нуклеиновой кислоты включает одно или несколько из следующих действий: (1) получение матрицы РНК из последовательности ДНК (например, путем транскрипции); (2) процессирование транскрипта РНК (например, путем сплайсинга, редактирования и т.д.); (3) трансляцию РНК в полипептид или белок; и/или (4) посттрансляционную модификацию полипептида или белка.
Фармацевтическая композиция: Используемый в данном документе термин «фармацевтическая композиция» относится к активному агенту, составленному вместе с одним или несколькими фармацевтически приемлемыми носителями. В некоторых воплощениях активный агент присутствует в количестве разовой дозы, подходящем для введения по терапевтической схеме, которая показывает статистически значимую вероятность достижения заранее определенного терапевтического эффекта при введении соответствующей популяции. В некоторых воплощениях фармацевтические композиции могут быть специально приготовлены для парентерального введения, например, путем подкожной, внутримышечной, внутривенной или эпидуральной инъекции в виде, например, стерильного раствора или суспензии или состава с замедленным высвобождением.
Полипептид: Используемый в данном документе термин относится к полимерной цепи аминокислот. В некоторых воплощениях полипептид имеет аминокислотную последовательность, которая встречается в природе. В некоторых воплощениях полипептид имеет аминокислотную последовательность, не встречающуюся в природе. В некоторых воплощениях полипептид имеет аминокислотную последовательность, сконструированную таким образом, что он сконструирован и/или произведен с участием человека. В некоторых воплощениях полипептид может содержать или состоять из природных аминокислот, неприродных аминокислот или из того и другого. В некоторых воплощениях полипептид может содержать или состоять только из природных аминокислот или только из неприродных аминокислот. В некоторых воплощениях полипептид может содержать D-аминокислоты, L-аминокислоты или и то, и другое. В некоторых воплощениях полипептид может содержать только D-аминокислоты. В некоторых воплощениях полипептид может содержать только L-аминокислоты. В некоторых воплощениях полипептид может включать одну или несколько боковых групп или другие модификации, например модификацию или присоединение к одной или нескольким боковым цепям аминокислот, на N-конце полипептида, на С-конце полипептида или любую их комбинацию. В некоторых воплощениях такие боковые группы или модификации могут быть выбраны из группы, состоящей из ацетилирования, амидирования, липидирования, метилирования, ПЭГилирования и т.д., включая их комбинации. В некоторых воплощениях полипептид может быть циклическим и/или может содержать циклическую часть. В некоторых воплощениях полипептид не является циклическим и/или не содержит какой-либо циклической части. В некоторых воплощениях полипептид является линейным. В некоторых воплощениях полипептид может представлять собой сшитый полипептид или содержать его. В некоторых воплощениях термин «полипептид» может быть добавлен к названию референсных полипептида, активности или структуры; в таких случаях термин используется в данном документе для обозначения полипептидов, которые обладают соответствующей активностью или структурой и, таким образом, могут рассматриваться как представители одного и того же класса или семейства полипептидов. Для каждого такого класса настоящее описание обеспечивает и/или специалистам в данной области техники будут известны примерные полипептиды в пределах класса, аминокислотные последовательности и/или функции которых известны; в некоторых воплощениях такие примерные полипептиды представляют собой референсные полипептиды для класса или семейства полипептидов. В некоторых воплощениях член класса или семейства полипептидов проявляет значительную гомологию или идентичность последовательности, имеет общий мотив последовательности (например, характерный элемент последовательности) и/или обладает общей активностью (в некоторых воплощениях на сравнимом уровне) или в пределах указанного диапазона) с референсным полипептидом этого класса; в некоторых воплощениях со всеми полипептидами в пределах класса). Например, в некоторых воплощениях полипептид-представитель демонстрирует общую степень гомологии последовательности или идентичности с референсным полипептидом, которая составляет по меньшей мере около 30-40% и часто больше чем около 50%, 60%, 70%, 80%., 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более и/или включает по меньшей мере одну область (например, консервативную область, которая может в некоторых воплощениям представлять собой или содержать характерный элемент последовательности), который демонстрирует очень высокую идентичность последовательности, часто более 90% или даже 95%, 96%, 97%, 98% или 99%. Такая консервативная область обычно включает по меньшей мере 3-4, а часто до 20 и более аминокислот; в некоторых воплощениях консервативная область включает по меньшей мере один участок по меньшей мере из 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 или более смежных аминокислот. В некоторых воплощениях соответствующий полипептид может содержать или состоять из фрагмента исходного полипептида.
Предотвращение или профилактика: используемый в данном документе термин в связи с возникновением заболевания, расстройства и/или состояния относится к снижению риска развития заболевания, расстройства и/или состояния и/или к отсрочке наступления одного или нескольких характеристик или симптомов заболевания, расстройства или состояния. Профилактика может считаться завершенной, когда начало заболевания, расстройства или состояния отсрочено на заранее определенный период времени.
Референс: используемый в данном документе термин описывает стандарт или контроль, относительно которого проводится сравнение. Например, в некоторых воплощениях представляющий интерес агент, животное, индивидуум, популяция, образец, последовательность или значение сравнивается с референсным или контрольным агентом, животным, индивидуумом, популяцией, образцом, последовательностью или значением. В некоторых воплощениях референс или контроль тестируют и/или определяют по существу одновременно с представляющим интерес тестированием или определением. В некоторых воплощениях референс или контроль представляет собой исторический референс или контроль, необязательно воплощенный в материальном носителе. Как правило, как должно быть понятно специалистам в данной области, референс или контроль определяют или характеризуют в условиях или обстоятельствах, сравнимых с оцениваемыми. Специалистам в данной области будет понятно, когда присутствуют достаточные сходства, чтобы оправдать доверие и/или сравнение с конкретным возможным референсом или контролем.
Риск: как будет понятно из контекста, «риск» заболевания, расстройства и/или состояния относится к вероятности того, что у конкретного человека разовьется заболевание, расстройство и/или состояние. В некоторых воплощениях риск выражается в процентах. В некоторых воплощениях риск составляет от 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90 до вплоть 100%. В некоторых воплощениях риск выражается как риск относительно риска, связанного с референсным образцом или группой референсным образцов. В некоторых воплощениях референсный образец или группа референсных образцов имеют известный риск заболевания, расстройства, состояния и/или события. В некоторых воплощениях референсный образец или группа референсных образцов получены из индивидуумов, сопоставимых с конкретным индивидуумом. В некоторых воплощениях относительный риск составляет 0,1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более. В некоторых воплощениях риск может отражать один или несколько генетических признаков, например, которые могут служить (или не служить) предрасположением у индивидуума к развитию конкретного заболевания, расстройства и/или состояния. В некоторых воплощениях риск может отражать одно или несколько эпигенетических событий или атрибутов и/или одно или несколько событий или атрибутов образа жизни или окружающей среды.
Восприимчивость: лицо, «восприимчивое» к заболеванию, расстройству и/или состоянию, имеет более высокий риск развития заболевания, расстройства и/или состояния, чем представитель основной части населения. В некоторых воплощениях у индивидуума, предрасположенного к заболеванию, расстройству и/или патологическому состоянию, может не быть диагностировано заболевание, расстройство и/или патологическое состояние. В некоторых воплощениях у индивидуума, предрасположенного к заболеванию, расстройству и/или состоянию, могут проявляться симптомы заболевания, расстройства и/или состояния. В некоторых воплощениях у индивидуума, предрасположенного к заболеванию, расстройству и/или состоянию, могут не проявляться симптомы заболевания, расстройства и/или состояния. В некоторых воплощениях у индивидуума, предрасположенного к заболеванию, нарушению и/или состоянию, разовьется заболевание, расстройство и/или состояние. В некоторых воплощениях у индивидуума, предрасположенного к заболеванию, расстройству и/или патологическому состоянию, не разовьется заболевание, расстройство и/или патологическое состояние.
Вакцинация: Используемый в данном документе термин «вакцинация» относится к введению композиции, предназначенной для создания иммунного ответа, например, на ассоциированный с заболеванием (например, вызывающий заболевание) агент. В некоторых воплощениях вакцинацию можно проводить до, во время и/или после воздействия агента, ассоциированного с заболеванием, а в некоторых воплощениях - до, во время и/или вскоре после воздействия агента. В некоторых воплощениях вакцинация включает многократные введения вакцинной композиции через соответствующие промежутки времени. В некоторых воплощениях вакцинация вызывает иммунный ответ на инфекционный агент. В некоторых воплощениях вакцинация вызывает иммунный ответ на опухоль; в некоторых таких воплощениях вакцинация является «персонализированной» в том смысле, что она частично или полностью направлена на эпитоп(ы) (например, которые могут представлять собой или включать один или несколько неоэпитопов), присутствие которых определено в опухолях конкретного индивидуума.
Вариант: Используемый в данном документе в контексте молекул, например, нуклеиновых кислот, белков или малых молекул, термин «вариант» относится к молекуле, которая демонстрирует значительную структурную идентичность с референсной молекулой, но структурно отличается от референсной молекулы, например, в присутствии или отсутствии или на уровне одного или нескольких химических фрагментов по сравнению с референсным субъектом. В некоторых воплощениях вариант также функционально отличается от своей референсной молекулы. В целом, правильность того, считается ли конкретная молекула «вариантом» референсной молекулы, зависит от степени ее структурной идентичности с референсной молекулой. Как будет понятно специалистам в данной области, любая биологическая или химическая референсная молекула имеет определенные характерные структурные элементы. Вариант, по определению, представляет собой отдельную молекулу, которая имеет один или несколько таких характерных структурных элементов, но отличается по меньшей мере в одном аспекте от референсной молекулы. В некоторых воплощениях вариант полипептида или нуклеиновой кислоты может отличаться от референсного полипептида или нуклеиновой кислоты в результате одного или нескольких различий в аминокислотной или нуклеотидной последовательности и/или одного или нескольких различий в химических фрагментах (например, углеводах, липидах, фосфатных группах), которые являются ковалентными компонентами полипептида или нуклеиновой кислоты (например, которые присоединены к основной цепи полипептида или нуклеиновой кислоты). В некоторых воплощениях вариант полипептида или нуклеиновой кислоты демонстрирует общую идентичность последовательности с референсным полипептидом или нуклеиновой кислотой, которая составляет по меньшей мере 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% или 99%. В некоторых воплощениях вариант полипептида или нуклеиновой кислоты не имеет по меньшей мере одного общего характерного элемента последовательности с референсным полипептидом или нуклеиновой кислотой. В некоторых воплощениях референсный полипептид или нуклеиновая кислота обладают одной или несколькими биологическими активностями. В некоторых воплощениях вариант полипептида или нуклеиновой кислоты обладает одной или несколькими биологическими активностями референсного полипептида или нуклеиновой кислоты. В некоторых воплощениях вариант полипептида или нуклеиновой кислоты лишен одной или нескольких биологических активностей референсного полипептида или нуклеиновой кислоты. В некоторых воплощениях вариант полипептида или нуклеиновой кислоты демонстрирует пониженный уровень одной или нескольких биологических активностей по сравнению с референсным полипептидом или нуклеиновой кислотой. В некоторых воплощениях представляющий интерес полипептид или нуклеиновая кислота считается «вариантом» референсного полипептида или нуклеиновой кислоты, если вариант имеет аминокислотную или нуклеотидную последовательность, идентичную последовательности референса, но с небольшим числом изменений последовательности в определенных положениях. Обычно менее, чем около 20%, около 15%, около 10%, около 9%, около 8%, около 7%, около 6%, около 5%, около 4%, около 3% или около 2% остатков в варианте заменены, вставлены или удалены по сравнению с референсом. В некоторых воплощениях вариант полипептида или нуклеиновой кислоты содержит около 10, около 9, около 8, около 7, около 6, около 5, около 4, около 3, около 2 или около 1 замещенного остатка по сравнению с референсом. Часто вариант полипептида или нуклеиновой кислоты содержит очень небольшое количество (например, менее, чем около 5, около 4, около 3, около 2 или около 1) замещенных, вставленных или делетированных функциональных остатков (т.е. остатков, которые участвуют в определенной биологической активности) по отношению к референсу. В некоторых воплощениях вариант полипептида или нуклеиновой кислоты содержит не более чем около 5, около 4, около 3, около 2 или около 1 добавления или делеции и, в некоторых воплощениях, не содержит добавлений или делеций по сравнению с референсом. В некоторых воплощениях вариант полипептида или нуклеиновой кислоты содержит менее, чем около 25, около 20, около 19, около 18, около 17, около 16, около 15, около 14, около 13, около 10, около 9, около 8, около 7, около 6 и обычно менее, чем около 5, около 4, около 3 или около 2 добавлений или удалений по сравнению с референсом. В некоторых воплощениях референсный полипептид или нуклеиновая кислота встречаются в природе.
ПОДРОБНОЕ ОПИСАНИЕ НЕКОТОРЫХ ВОПЛОЩЕНИЙ
В настоящем раскрытии предлагается, среди прочего, полинуклеотид РНК, содержащий (i) 5'-кэп, который представляет собой или содержит структуру cap1, например, как раскрыто в настоящей заявке; (ii) последовательность 5’-UTR, содержащую проксимальную к кэпу последовательность, например, как раскрыто в настоящей заявке; и (iii) последовательность, кодирующая полезную нагрузку. Также в настоящей заявке предусмотрены композиции и медицинские препараты, включающие их, а также способы их получения и применения. В некоторых воплощениях эффективность трансляции РНК, кодирующей полезную нагрузку, и/или экспрессию полезной нагрузки, кодируемой РНК, можно улучшить с помощью полинуклеотида РНК, содержащего 5'-кэп, содержащий описанную в данном документе структуру Cap1, например, m27,3’-OGppp(m12’-O)ApG кэп, содержащий проксимальную к кэпу последовательность, раскрытую в настоящей заявке, и последовательность, кодирующую полезную нагрузку. В некоторых воплощениях отсутствие самогибридизирующейся последовательности в полинуклеотиде РНК, кодирующем полезную нагрузку, может дополнительно улучшить эффективность трансляции РНК, кодирующей полезную нагрузку, и/или экспрессию полезной нагрузки, кодируемой полезной нагрузкой РНК.
Полинуклеотид РНК
Термин «полинуклеотид» или «нуклеиновая кислота», используемый в данном документе, относится к ДНК и РНК, таким как геномная ДНК, кДНК, мРНК, рекомбинантно полученным и химически синтезированным молекулам. Нуклеиновая кислота может быть одноцепочечной или двухцепочечной. РНК включает транскрибируемую in vitro РНК (IVT РНК) или синтетическую РНК. Согласно изобретению полинуклеотид предпочтительно выделяют.
В некоторых воплощениях нуклеиновые кислоты могут быть включены в вектор. Используемый в данном документе термин «вектор» включает любые векторы, известные специалисту, включая плазмидные векторы, космидные векторы, фаговые векторы, такие как фаг лямбда, вирусные векторы, такие как ретровирусные, аденовирусные или бакуловирусные векторы, или векторы- искусственные хромосомы, такие как бактериальные искусственные хромосомы (BAC), искусственные хромосомы дрожжей (YAC) или искусственные хромосомы P1 (PAC). В некоторых воплощениях вектор может представлять собой экспрессирующий вектор; альтернативно или дополнительно, в некоторых воплощениях вектор может представлять собой клонирующий вектор. Специалистам в данной области техники понятно, что в некоторых воплощениях экспрессирующий вектор может представлять собой, например, плазмиду; альтернативно или дополнительно, в некоторых воплощениях экспрессирующий вектор может представлять собой вирусный вектор. Как правило, экспрессирующий вектор будет содержать искомую кодирующую последовательность и соответствующие другие последовательности, необходимые для экспрессии функционально связанной кодирующей последовательности в конкретном организме-хозяине (например, бактериях, дрожжах, растениях, насекомых или млекопитающих) или в системах экспрессии in vitro. Клонирующие векторы обычно используются для конструирования и амплификации определенного желаемого фрагмента (обычно фрагмента ДНК), и в них могут отсутствовать функциональные последовательности, необходимые для экспрессии желаемого(ых) фрагмента(ов).
В некоторых воплощениях нуклеиновая кислота, описанная и/или используемая в настоящей заявке, может представлять собой или содержать рекомбинантные и/или выделенные молекулы.
Специалисты в данной области, прочитав настоящее раскрытие, поймут, что термин «РНК» обычно относится к молекуле нуклеиновой кислоты, которая включает остатки рибонуклеотидов. В некоторых воплощениях РНК содержит все или большинство остатков рибонуклеотидов. Используемый в данном документе термин «рибонуклеотид» относится к нуклеотиду с гидроксильной группой в 2'-положении β-D-рибофуранозильной группы. В некоторых воплощениях РНК может быть частично или полностью двухцепочечной РНК; в некоторых воплощениях РНК может содержать две или более отдельных нитей нуклеиновой кислоты (например, отдельные молекулы), которые частично или полностью гибридизованы друг с другом. Во многих воплощениях РНК представляет собой одноцепочечную цепь, которая в некоторых воплощениях может самогибридизироваться или иным образом складываться во вторичные и/или третичные структуры. В некоторых воплощениях РНК, описанная и/или используемая в настоящей заявке, не подвергается самогибридизации, по меньшей мере, в отношении определенных последовательностей, описанных в настоящей заявке. В некоторых воплощениях РНК может представлять собой выделенную РНК, такую как частично очищенная РНК, по существу чистая РНК, синтетическая РНК, рекомбинантно полученная РНК и/или модифицированная РНК (где термин «модифицированный» понимается как означающий, что один или несколько остатков или другие структурные элементы РНК отличаются от встречающихся в природе РНК; например, в некоторых воплощениях модифицированная РНК отличается добавлением, делецией, заменой и/или изменением одного или нескольких нуклеотидов и/или одной или несколькими частями или характеристиками нуклеотида, например, нуклеозида или скелетной структуры или связи). В некоторых воплощениях модификация может представлять собой или включать добавление ненуклеотидного материала к внутренним нуклеотидам РНК или к концу(ам) РНК. В данном документе также предполагается, что нуклеотиды в РНК (например, в модифицированной РНК) могут быть нестандартными нуклеотидами, такими как химически синтезированные нуклеотиды или дезоксинуклеотиды. Для настоящего раскрытия эти измененные РНК считаются аналогами природной РНК.
В некоторых воплощениях настоящего изобретения РНК представляет собой или содержит информационную РНК (мРНК), которая относится к транскрипту РНК, кодирующему полипептид.
В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит: 5’-кэп, содержащий 5’-кэп, раскрытый в настоящей заявке; 5'-нетранслируемая область, содержащая проксимальную последовательность кэпа (5'-UTR), последовательность, кодирующую полезную нагрузку (например, полипептид); 3'-нетранслируемая область (3'-UTR); и/или последовательность полиаденилата (ПолиА).
В некоторых воплощениях раскрытая в настоящей заявке РНК содержит следующие компоненты в ориентации от 5’ к 3’: 5’-кэп, содержащий описанный в настоящей заявке 5’-кэп; 5'-нетранслируемая область, содержащая проксимальную последовательность кэпа (5'-UTR), последовательность, кодирующую полезную нагрузку (например, полипептид); 3'-нетранслируемая область (3'-UTR); и последовательность ПолиА.
В некоторых воплощениях РНК получают транскрипцией in vitro или химическим синтезом. В некоторых воплощениях мРНК получают путем транскрипции in vitro с использованием ДНК-матрицы, где ДНК относится к нуклеиновой кислоте, содержащей дезоксирибонуклеотиды.
В некоторых воплощениях РНК, описанная в настоящей заявке, представляет собой РНК, транскрибируемую in vitro (IVT-РНК), и может быть получена путем транскрипции in vitro соответствующей ДНК-матрицы. Промотор для контроля транскрипции может представлять собой любой промотор для любой РНК-полимеразы. Матрица ДНК для транскрипции in vitro может быть получена путем клонирования нуклеиновой кислоты, в частности кДНК, и введения ее в соответствующий вектор для транскрипции in vitro. кДНК может быть получена путем обратной транскрипции РНК.
В некоторых воплощениях РНК представляет собой «репликон РНК» или просто «репликон», в частности «самореплицирующуюся РНК» или «самоамплифицирующуюся РНК». В некоторых воплощениях репликон или самореплицирующаяся РНК происходит из или содержит элементы, происходящие из оцРНК-вируса, в частности, оцРНК-вируса с положительной цепью, такого как альфа-вирус. Альфавирусы являются типичными представителями вирусов с положительной цепью РНК. Альфавирусы реплицируются в цитоплазме инфицированных клеток (обзор жизненного цикла альфа-вирусов см. в José et al., Future Microbiol., 2009, vol. 4, pp. 837-856). Общая длина генома многих альфа-вирусов обычно составляет от 11 000 до 12 000 нуклеотидов, а геномная РНК обычно имеет 5’-кэп и 3’-поли(А) хвост. Геном альфа-вирусов кодирует неструктурные белки (участвующие в транскрипции, модификации и репликации вирусной РНК и в модификации белков) и структурные белки (формирующие вирусную частицу). Обычно в геноме есть две открытые рамки считывания (ORF). Четыре неструктурных белка (nsP1-nsP4) обычно кодируются вместе первой ORF, начинающейся вблизи 5'-конца генома, в то время как структурные белки альфа-вируса вместе кодируются второй ORF, которая находится ниже первой ORF и распространяется вблизи 3'-конца генома. Как правило, первая ORF больше второй ORF, причем соотношение составляет приблизительно 2:1. В клетках, инфицированных альфа-вирусом, с геномной РНК транслируется только последовательность нуклеиновой кислоты, кодирующая неструктурные белки, в то время как генетическая информация, кодирующая структурные белки, транслируется с субгеномного транскрипта, который представляет собой полинуклеотид РНК, напоминающий матричную РНК эукариот (мРНК; Gould et al., 2010, Antiviral Res., vol. 87 pp. 111-124). После заражения, т.е. на ранних стадиях жизненного цикла вируса, (+)-цепочечная геномная РНК непосредственно действует как информационная РНК для трансляции открытой рамки считывания, кодирующей неструктурный полипротеин (nsP1234). Были предложены векторы, полученные из альфа-вирусов, для доставки чужеродной генетической информации в клетки-мишени или организмы-мишени. В простых подходах открытая рамка считывания, кодирующая структурные белки альфа-вируса, заменяется открытой рамкой считывания, кодирующей представляющий интерес белок. Системы трансрепликации на основе альфа-вирусов основаны на элементах нуклеотидной последовательности альфа-вируса на двух отдельных молекулах нуклеиновых кислот: одна молекула нуклеиновой кислоты кодирует вирусную репликазу, а другая молекула нуклеиновой кислоты способна реплицироваться указанной репликазой in trans (отсюда и название транс-система репликации). Трансрепликация требует присутствия обеих этих молекул нуклеиновых кислот в данной клетке-хозяине. Молекула нуклеиновой кислоты, способная реплицироваться репликазой in trans, должна содержать определенные элементы альфавирусной последовательности, чтобы сделать возможной распознавание и синтез РНК альфавирусной репликазой.
В некоторых воплощениях РНК, описанная в настоящей заявке, может содержать модифицированные нуклеозиды. В некоторых воплощениях РНК содержит модифицированный нуклеозид вместо по меньшей мере одного (например, каждого) уридина.
Используемый в данном документе термин «урацил» описывает одно из азотистых оснований, которое может встречаться в нуклеиновой кислоте РНК. Структура урацила представляет собой:
.
Используемый в данном документе термин «уридин» описывает один из нуклеозидов, который может встречаться в РНК. Структура уридина представляет собой:
.
УТФ (уридин-5’-трифосфат) имеет следующую структуру:
.
Псевдо-УТФ (псевдоуридин-5’-трифосфат) имеет следующую структуру:
.
«Псевдоуридин» представляет собой один пример модифицированного нуклеозида, который является изомером уридина, где урацил присоединен к пентозному кольцу через углерод-углеродную связь вместо азот-углеродной гликозидной связи.
Другим типичным модифицированным нуклеозидом является N1-метилпсевдоуридин (m1Ψ), который имеет структуру:
.
N1-метилпсевдоуридин-5’-трифосфат (m1ΨTP) имеет следующую структуру:
.
Другим типичным модифицированным нуклеозидом является 5-метилуридин (m5U), который имеет структуру:
.
В некоторых воплощениях один или несколько уридинов в РНК, описанной в настоящей заявке, заменены модифицированным нуклеозидом. В некоторых воплощениях модифицированный нуклеозид представляет собой модифицированный уридин.
В некоторых воплощениях РНК содержит модифицированный нуклеозид вместо по меньшей мере одного уридина. В некоторых воплощениях РНК содержит модифицированный нуклеозид вместо каждого уридина.
В некоторых воплощениях модифицированный нуклеозид независимо выбирают из псевдоуридина (Ψ), N1-метилпсевдоуридина (m1Ψ) и 5-метилуридина (m5U). В некоторых воплощениях модифицированный нуклеозид содержит псевдоуридин (Ψ). В некоторых воплощениях модифицированный нуклеозид содержит N1-метил-псевдоуридин (m1Ψ). В некоторых воплощениях модифицированный нуклеозид содержит 5-метилуридин (m5U). В некоторых воплощениях РНК может содержать более одного типа модифицированного нуклеозида, и модифицированные нуклеозиды независимо выбирают из псевдоуридина (Ψ), N1-метилпсевдоуридина (m1Ψ) и 5-метилуридина (m5U). В некоторых воплощениях модифицированные нуклеозиды включают псевдоуридин (Ψ) и N1-метилпсевдоуридин (m1Ψ). В некоторых воплощениях модифицированные нуклеозиды включают псевдоуридин (Ψ) и 5-метилуридин (m5U). В некоторых воплощениях модифицированные нуклеозиды включают N1-метилпсевдоуридин (m1Ψ) и 5-метилуридин (m5U). В некоторых воплощениях модифицированные нуклеозиды включают псевдоуридин (Ψ), N1-метилпсевдоуридин (m1Ψ) и 5-метилуридин (m5U).
В некоторых воплощениях модифицированный нуклеозид, заменяющий один или несколько, например, все уридины в РНК, может представлять собой любой один или несколько из числа 3-метилуридина (m3U), 5-метоксиуридина (mo5U), 5-азауридина, 6-азауридина, 2-тио-5-азауридина, 2-тиоуридина (s2U), 4-тиоуридина (s4U), 4-тио-псевдоуридина, 2-тио-псевдоуридина, 5-гидрокси-уридина (ho5U), 5-аминоаллилуридина, 5-галогенуридина (например, 5-йодуридина или 5-бромуридина), уридин-5-оксиуксусной кислоты (cmo5U), метилового эфира уридин-5-оксиуксусной кислоты (mcmo5U), 5-карбоксиметилуридина (cm5U), 1-карбоксиметилпсевдоуридина, 5-карбоксигидроксиметилуридина (chm5U), метилового эфира 5-карбоксигидроксиметилуридина (mchm5U), 5-метоксикарбонилметилуридина (mcm5U), 5-метоксикарбонилметил-2-тиоуридина (mcm5s2U), 5-аминометил-2-тиоуридина (nm5s2U), 5-метиламинометил-уридина (mnm5U), 1-этил-псевдоуридина, 5-метиламинометил-2-тиоуридина (mnm5s2U), 5-метиламинометил-2-селеноуридина (mnm5se2U), 5-карбамоилметилуридина (ncm5U), 5-карбоксиметиламинометил-уридина (cmnm5U), 5-карбоксиметиламинометил-2-тиоуридина (cmnm5s2U), 5-пропинил-уридина, 1-пропинил-псевдоуридина, 5-тауринометил-уридина (τm5U), 1-тауринометил-псевдоуридина, 5-тауринометил-2-тиоуридина (τm5s2U), 1-тауринометил-4-тио-псевдоуридина), 5-метил-2-тио-уридина (m5s2U), 1-метил-4-тио-псевдоуридина (m1s4Ψ), 4-тио-1-метил-псевдоуридина, 3-метил-псевдоуридина (m3Ψ), 2-тио-1-метил-псевдоуридина, 1-метил-1-деаза-псевдоуридина, 2-тио-1-метил-1-деаза-псевдоуридина, дигидроуридина (D), дигидропсевдоуридина, 5,6-дигидроуридина, 5-метил-дигидроуридина (m5D), 2-тио-дигидроуридина, 2-тио-дигидропсевдоуридина, 2-метоксиуридина, 2-метокси-4-тиоуридина, 4-метокси-псевдоуридина, 4-метокси-2-тио-псевдоуридина, N1-метил-псевдоуридина, 3-(3-амино-3-карбоксипропил)уридина (acp3U), 1-метил-3-(3-амино-3-карбоксипропил)псевдоуридина (acp3 Ψ), 5-(изопентениламинометил)уридина (inm5U), 5-(изопентениламинометил)-2-тиоуридина (inm5s2U), α-тиоуридина, 2'-O-метил-уридина (Um), 5,2'-O-диметилуридина (m5Um), 2'-O-метил-псевдоуридина (Ψm), 2-тио-2'-O-метилуридина (s2Um), 5-метоксикарбонилметил-2'-O-метил-уридина (mcm5Um), 5-карбамоилметил-2'-O-метил-уридина (ncm5Um), 5-карбоксиметиламинометил-2'-O-метил-уридина (cmnm5Um), 3,2'- О-диметилуридина (m3Um), 5-(изопентениламинометил)-2'-O-метил-уридина (inm5Um), 1-тиоуридина, дезокситимидина, 2'-F-ара-уридина, 2'-F-уридина, 2'-ОН-ара-уридина, 5-(2-карбометоксивинил)уридина, 5-[3-(1-E-пропениламино)уридина или любого другого модифицированного уридина, известного в данной области.
В некоторых воплощениях РНК содержит другие модифицированные нуклеозиды или содержит дополнительно модифицированные нуклеозиды, например, модифицированный цитидин. Например, в некоторых воплощениях в РНК 5-метилцитидин частично или полностью, предпочтительно полностью, заменяет цитидин. В некоторых воплощениях РНК содержит 5-метилцитидин и одно или несколько соединений, выбранных из псевдоуридина (Ψ), N1-метилпсевдоуридина (m1Ψ) и 5-метилуридина (m5U). В некоторых воплощениях РНК содержит 5-метилцитидин и N1-метил-псевдоуридин (m1Ψ). В некоторых воплощениях РНК содержит 5-метилцитидин вместо каждого цитидина и N1-метил-псевдоуридин (m1Ψ) вместо каждого уридина.
В некоторых воплощениях РНК, кодирующая полезную нагрузку, например, вакцинный антиген, экспрессируется в клетках субъекта, получающего лечение для обеспечения полезной нагрузки, например, вакцинного антигена. В некоторых воплощениях РНК временно экспрессируется в клетках субъекта. В некоторых воплощениях РНК представляет собой РНК, транскрибируемую in vitro. В некоторых воплощениях экспрессия полезной нагрузки, например, вакцинного антигена, происходит на поверхности клетки. В некоторых воплощениях полезная нагрузка, например вакцинный антиген, экспрессируется и презентируется в контексте MHC. В некоторых воплощениях экспрессия полезной нагрузки, например, вакцинного антигена, осуществляется во внеклеточное пространство, т.е. секретируется вакцинный антиген.
В контексте настоящего раскрытия термин «транскрипция» относится к процессу, в котором генетический код в последовательности ДНК транскрибируется в РНК. Впоследствии РНК можно транслировать в пептид или белок.
В соответствии с настоящим изобретением термин «транскрипция» включает «транскрипцию in vitro», где термин «транскрипция in vitro» относится к процессу, при котором РНК, в частности мРНК, синтезируют in vitro в бесклеточной системе, предпочтительно с использованием соответствующие клеточные экстракты. Предпочтительно, клонирующие векторы применяются для генерирования транскриптов. Эти клонирующие векторы, как правило, спроектированы как транскрипционные вектор и согласно изобретением охвачены термином «вектор». Согласно настоящему изобретению РНК, используемая в настоящем изобретении, предпочтительно представляет собой РНК, транскрибируемую in vitro (IVT-РНК), и может быть получена путем транскрипции in vitro соответствующей ДНК-матрицы. Промотор для контроля транскрипции может представлять собой любой промотор для любой РНК-полимеразы. Конкретные примеры РНК-полимераз представляют собой T7, T3, и SP6 РНК-полимеразы. Предпочтительно транскрипция in vitro по изобретению контролируется промотором T7 или SP6. Матрица ДНК для транскрипции in vitro может быть получена путем клонирования нуклеиновой кислоты, в частности кДНК, и введения ее в соответствующий вектор для транскрипции in vitro. кДНК может быть получена путем обратной транскрипции РНК.
Что касается РНК, термин «экспрессия» или «трансляция» относится к процессу в рибосомах клетки, посредством которого цепь мРНК направляет сборку последовательности аминокислот с образованием пептида или белка.
В некоторых воплощениях после введения РНК, описанной в настоящей заявке, например, в виде липидных частиц РНК, по меньшей мере часть РНК доставляется в клетку-мишень. В некоторых воплощениях по меньшей мере часть РНК доставляется в цитозоль клетки-мишени. В некоторых воплощениях РНК транслируется клеткой-мишенью с образованием пептида или белка, который она кодирует. В некоторых воплощениях клетка-мишень представляет собой клетку селезенки. В некоторых воплощениях клетка-мишень представляет собой антигенпрезентирующую клетку, такую как профессиональная антигенпрезентирующая клетка в селезенке. В некоторых воплощениях клетка-мишень представляет собой дендритную клетку или макрофаг. Частицы РНК, такие как липидные частицы РНК, описанные в настоящей заявке, можно использовать для доставки РНК в такую клетку-мишень. Соответственно, настоящее раскрытие также относится к способу доставки РНК в клетку-мишень у субъекта, включающему введение субъекту РНК-частиц, описанных в настоящей заявке. В некоторых воплощениях РНК доставляется в цитозоль клетки-мишени. В некоторых воплощениях РНК транслируется клеткой-мишенью с образованием пептида или белка, кодируемого РНК.
«Кодирование» относится к неотъемлемому свойству определенных последовательностей нуклеотидов в полинуклеотиде, таком как ген, кДНК или мРНК, служить в качестве матрицы для синтеза других полимеров и макромолекул в биологических процессах, имеющих определенную последовательность нуклеотидов (т.е. рРНК, тРНК и мРНК) или определенную последовательность аминокислот и вытекающие из этого биологические свойства. Таким образом, ген кодирует белок, если транскрипция и трансляция мРНК, соответствующей этому гену, приводит к образованию белка в клетке или другой биологической системе. Как кодирующая цепь, нуклеотидная последовательность которой идентична последовательности мРНК и обычно указывается в перечнях последовательностей, так и некодирующая цепь, используемая в качестве матрицы для транскрипции гена или кДНК, могут упоминаться как кодирующие белок или другой продукт этого гена или кДНК.
В некоторых воплощениях композиции нуклеиновых кислот, описанные в настоящей заявке, например, композиции, содержащие мРНК, инкапсулированную в липидные наночастицы, характеризуются (например, при введении субъекту) устойчивой экспрессией кодируемого полипептида. Например, в некоторых воплощениях такие композиции характеризуются тем, что при введении человеку они обеспечивают детектируемую экспрессию полипептида в биологическом образце (например, сыворотке) такого человека, и в некоторых воплощениях такая экспрессия сохраняется в течение периода времени, которое составляет не менее 36 часов или более, включая, например, не менее 48 часов, не менее 60 часов, не менее 72 часов, не менее 96 часов, не менее 120 часов, не менее 148 часов или более.
В некоторых воплощениях РНК, кодирующая вакцинный антиген, подлежащий введению в соответствии с изобретением, является неиммуногенной. РНК, кодирующая иммуностимулятор, может быть введена согласно изобретению для обеспечения адъювантного эффекта. РНК, кодирующая иммуностимулятор, может представлять собой стандартную РНК или неиммуногенную РНК.
Термин «неиммуногенная РНК», используемый в данном документе, относится к РНК, которая не индуцирует ответ иммунной системы при введении, например, млекопитающему, или индуцирует более слабый ответ, чем та же РНК, которая отличается только в том, что РНК не подвергалась модификациям и обработкам, которые делают неиммуногенную РНК неиммуногенной, т.е. такой, которая была бы индуцирована стандартной РНК (стдРНК). В одном предпочтительном воплощении неиммуногенная РНК, которую в данном документе также называют модифицированной РНК (модРНК), становится неиммуногенной за счет включения в РНК модифицированных нуклеозидов, подавляющих РНК-опосредованную активацию рецепторов врожденного иммунитета, и удаления двухцепочечной РНК (дцРНК).
Для превращения неиммуногенной РНК в неиммуногенную путем включения модифицированных нуклеозидов можно использовать любой модифицированный нуклеозид, если нуклеозид снижает или подавляет иммуногенность РНК. Особенно предпочтительными являются модифицированные нуклеозиды, которые подавляют РНК-опосредованную активацию рецепторов врожденного иммунитета. В некоторых воплощениях модифицированные нуклеозиды включают замену одного или нескольких уридинов нуклеозидом, содержащим модифицированное азотистое основание. В некоторых воплощениях модифицированное азотистое основание представляет собой модифицированный урацил. В некоторых воплощениях нуклеозид, содержащий модифицированное азотистое основание, выбран из группы, состоящей из 3-метилуридина (m3U), 5-метоксиуридина (mo5U), 5-азауридина, 6-азауридина, 2-тио-5-аза-уридина, 2-тиоуридина (s2U), 4-тиоуридина (s4U), 4-тио-псевдоуридина, 2-тио-псевдоуридина, 5-гидроксиуридина (ho5U), 5-аминоаллил-уридина, 5-галогенуридина (например, 5-йодоуридина или 5-бромуридина), уридин-5-оксиуксусной кислоты (cmo5U), метилового эфира уридин-5-оксиуксусной кислоты (mcmo5U), 5-карбоксиметилуридина (cm5U), 1-карбоксиметилпсевдоуридина, 5-карбоксигидроксиметилуридина (chm5U), метилового эфира 5-карбоксигидроксиметилуридина (mchm5U), 5-метоксикарбонилметилуридина (mcm5U), 5-метоксикарбонилметил-2-тиоуридина (mcm5s2U), 5-аминометил-2-тиоуридина (nm5s2U), 5-метиламинометил-уридина (mnm5U), 1-этил-псевдоуридина, 5-метиламинометил-2-тиоуридина (mnm5s2U), 5-метиламинометил-2-селеноуридина (mnm5se2U), 5-карбамоилметилуридина (ncm5U), 5-карбоксиметиламинометилуридина (cmnm5U), 5-карбоксиметиламинометил-2-тиоуридина (cmnm5s2U), 5-пропинилуридина, 1-пропинилпсевдоуридина, 5-тауринометил-уридина (τm5U), 1-тауринометил-псевдоуридина, 5-тауринометил-2-тиоуридина (τm5s2U), 1-тауринометил-4-тио-псевдоуридина), 5-метил-2-тио-уридина (m5s2U), 1-метил-4-тио-псевдоуридина (m1s4Ψ), 4-тио-1-метил-псевдоуридина, 3-метил-псевдоуридина (m3Ψ), 2-тио-1-метил-псевдоуридина, 1-метил-1-деаза-псевдоуридина, 2-тио-1-метил-1-деаза-псевдоуридина, дигидроуридина (D ), дигидропсевдоуридина, 5,6-дигидроуридина, 5-метил-дигидроуридина (m5D), 2-тио-дигидроуридина, 2-тио-дигидропсевдоуридина, 2-метоксиуридина, 2-метокси-4-тиоуридина, 4-метокси -псевдоуридина, 4-метокси-2-тио-псевдоуридина, N1-метил-псевдоуридина, 3-(3-амино-3-карбоксипропил)уридина (acp3U), 1-метил-3-(3-амино-3-карбоксипропил) псевдоуридина (acp3Ψ), 5-(изопентениламинометил)уридина (inm5U), 5-(изопентениламинометил)-2-тиоуридина (inm5s2U), α-тиоуридина, 2'-O-метилуридина (Um), 5,2′-O-диметилуридина (m5Um), 2′-O-метил-псевдоуридина (Ψm), 2-тио-2′-O-метилуридина (s2Um), 5-метоксикарбонилметил-2′-O-метил-уридина (mcm5Um), 5-карбамоилметил-2'-O-метил-уридина (ncm5Um), 5-карбоксиметиламинометил-2'-O-метил-уридина (cmnm5Um), 3,2'-O-диметил-уридина (m3Um), 5-(изопентениламинометил)-2'-O-метил-уридина (inm5Um), 1-тиоуридина, дезокситимидина, 2'-F-ара-уридина, 2'-F-уридина, 2'-OH -ара-уридина, 5-(2-карбометоксивинил)уридина и 5-[3-(1-E-пропениламино)уридина. В одном особенно предпочтительном воплощении нуклеозид, содержащий модифицированное азотистое основание, представляет собой псевдоуридин (Ψ), N1-метилпсевдоуридин (m1Ψ) или 5-метилуридин (m5U), в частности N1-метилпсевдоуридин.
В некоторых воплощениях замена одного или нескольких уридинов нуклеозидом, содержащим модифицированное азотистое основание, включает замену по меньшей мере 1%, по меньшей мере 2%, по меньшей мере 3%, по меньшей мере 4%, по меньшей мере 5%, по меньшей мере 10%, по меньшей мере 25%, по меньшей мере 50%, по меньшей мере 75%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% уридинов.
При синтезе мРНК методом транскрипции in vitro (IVT) с использованием РНК-полимеразы Т7 образуется значительное количество аберрантных продуктов, в том числе двухцепочечной РНК (дцРНК), за счет нестандартной активности фермента. дцРНК индуцирует воспалительные цитокины и активирует эффекторные ферменты, что приводит к ингибированию синтеза белка. дцРНК можно удалить из РНК, такой как IVT РНК, например, с помощью ионно-парной ВЭЖХ с обращенной фазой с использованием непористой или пористой полистиролдивинилбензоловой (PS-DVB) матрицы C-18. В качестве альтернативы можно использовать ферментативный способ с использованием РНКазы III E. coli, которая специфически гидролизует дцРНК, но не оцРНК, тем самым удаляя примеси дцРНК из препаратов РНК IVT. Кроме того, дцРНК можно отделить от оцРНК с помощью целлюлозного материала. В некоторых воплощениях препарат РНК приводит в контакт с целлюлозным материалом, и оцРНК отделяют от целлюлозного материала в условиях, которые позволяют связывание дцРНК с целлюлозным материалом и не допускают связывания оцРНК с целлюлозным материалом.
Используемый в данном документе термин «удалять» или «удаление» относится к свойству популяции первых веществ, таких как неиммуногенная РНК, быть отделенной от соседства с популяцией вторых веществ, таких как дцРНК, где совокупность первых веществ не обязательно лишена второго вещества, а совокупность вторых веществ не обязательно лишена первого вещества. Однако совокупность первых веществ, характеризующаяся удалением совокупности вторых веществ, имеет значительно более низкое содержание вторых веществ по сравнению с неразделенной смесью первых и вторых веществ.
В некоторых воплощениях удаление дцРНК из неиммуногенной РНК включает удаление дцРНК таким образом, что менее 10%, менее 5%, менее 4%, менее 3%, менее 2%, менее 1%, менее 0,5%, менее 0,3% или менее 0,1% РНК в составе неиммуногенной РНК представляет собой дцРНК. В некоторых воплощениях неиммуногенная РНК не содержит или по существу не содержит дцРНК. В некоторых воплощениях композиция неиммуногенной РНК содержит очищенный препарат одноцепочечной нуклеозид-модифицированной РНК. Например, в некоторых воплощениях очищенный препарат одноцепочечной нуклеозид-модифицированной РНК практически не содержит двухцепочечной РНК (дцРНК). В некоторых воплощениях очищенный препарат составляет по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99%, по меньшей мере 99,5 % или по меньшей мере 99,9 % одноцепочечной нуклеозид-модифицированной РНК относительно всех других молекул нуклеиновых кислот (ДНК, дцРНК и т.д.).
В некоторых воплощениях неиммуногенная РНК транслируется в клетке более эффективно, чем стандартная РНК с той же последовательностью. В некоторых воплощениях трансляция усиливается в 2 раза по сравнению с ее немодифицированным аналогом. В некоторых воплощениях трансляция усиливается в 3 раза. В некоторых воплощениях трансляция усиливается в 4 раза. В некоторых воплощениях трансляция усиливается в 5 раз. В некоторых воплощениях трансляция усиливается в 6 раз. В некоторых воплощениях трансляция усиливается в 7 раз. В некоторых воплощениях трансляция усиливается в 8 раз. В некоторых воплощениях трансляция усиливается в 9 раз. В некоторых воплощениях трансляция усиливается в 10 раз. В некоторых воплощениях трансляция усиливается в 15 раз. В некоторых воплощениях трансляция усиливается в 20 раз. В некоторых воплощениях трансляция усиливается в 50 раз. В некоторых воплощениях трансляция усиливается в 100 раз. В некоторых воплощениях трансляция усиливается в 200 раз. В некоторых воплощениях трансляция усиливается в 500 раз. В некоторых воплощениях трансляция усиливается в 1000 раз. В некоторых воплощениях трансляция усиливается в 2000 раз. В некоторых воплощениях коэффициент составляет 10-1000 раз. В некоторых воплощениях коэффициент составляет 10-100 раз. В некоторых воплощениях коэффициент составляет 10-200 раз. В некоторых воплощениях коэффициент составляет 10-300 раз. В некоторых воплощениях коэффициент составляет 10-500 раз. В некоторых воплощениях коэффициент составляет 20-1000 раз. В некоторых воплощениях коэффициент составляет 30-1000 раз. В некоторых воплощениях коэффициент составляет 50-1000 раз. В некоторых воплощениях коэффициент составляет 100-1000 раз. В некоторых воплощениях коэффициент составляет 200-1000 раз. В некоторых воплощениях перевод усиливается любым другим значительным количеством или диапазоном количеств.
В некоторых воплощениях неиммуногенная РНК проявляет значительно меньшую врожденную иммуногенность, чем стандартная РНК с такой же последовательностью. В некоторых воплощениях неиммуногенная РНК стимулирует врожденный иммунный ответ, который в 2 раза слабее, чем наблюдается у ее немодифицированного аналога. В некоторых воплощениях врожденная иммуногенность снижается в 3 раза. В некоторых воплощениях врожденная иммуногенность снижается в 4 раза. В некоторых воплощениях врожденная иммуногенность снижается в 5 раз. В некоторых воплощениях врожденная иммуногенность снижается в 6 раз. В некоторых воплощениях врожденная иммуногенность снижается в 7 раз. В некоторых воплощениях врожденная иммуногенность снижается в 8 раз. В некоторых воплощениях врожденная иммуногенность снижается в 9 раз. В некоторых воплощениях врожденная иммуногенность снижается в 10 раз. В некоторых воплощениях врожденная иммуногенность снижается в 15 раз. В некоторых воплощениях врожденная иммуногенность снижается в 20 раз. В некоторых воплощениях врожденная иммуногенность снижается в 50 раз. В некоторых воплощениях врожденная иммуногенность снижается в 100 раз. В некоторых воплощениях врожденная иммуногенность снижается в 200 раз. В некоторых воплощениях врожденная иммуногенность снижается в 500 раз. В некоторых воплощениях врожденная иммуногенность снижается в 1000 раз. В некоторых воплощениях врожденная иммуногенность снижается в 2000 раз.
Термин «проявляет значительно меньшую врожденную иммуногенность» относится к выявляемому снижению врожденной иммуногенности. В некоторых воплощениях термин относится к уменьшению, при котором эффективное количество неиммуногенной РНК может быть введено без запуска обнаруживаемого врожденного иммунного ответа. В некоторых воплощениях этот термин относится к снижению, при котором неиммуногенную РНК можно вводить повторно, не вызывая врожденного иммунного ответа, достаточного для заметного снижения продукции белка, кодируемого неиммуногенной РНК. В некоторых воплощениях снижение таково, что неиммуногенную РНК можно вводить повторно, не вызывая врожденного иммунного ответа, достаточного для устранения детектируемого продуцирования белка, кодируемого неиммуногенной РНК.
«Иммуногенность» - это способность чужеродного вещества, такого как РНК, вызывать иммунный ответ в организме человека или другого животного. Врожденная иммунная система является компонентом иммунной системы, который является относительно неспецифическим и оперативным. Это один из двух основных компонентов иммунной системы позвоночных, наряду с адаптивной иммунной системой.
Используемый в данном документе термин «эндогенный» относится к любому материалу из или продуцируемому внутри организма, клетки, ткани или системы.
Используемый в данном документе термин «экзогенный» относится к любому материалу, введенному из или продуцируемому вне организма, клетки, ткани или системы.
Термин «экспрессия», используемый в данном документе, определяется как транскрипция и/или трансляция конкретной нуклеотидной последовательности.
Используемые в данном документе термины «связанный», «гибридный» или «слияние» используются взаимозаменяемо. Эти термины относятся к объединению двух или более элементов, компонентов или доменов.
Оптимизация кодонов
В некоторых воплощениях полезная нагрузка (например, полипептид), описанная в настоящей заявке, кодируется кодирующей последовательностью, которая является кодон-оптимизированной и/или содержание G/C в которой повышено по сравнению с кодирующей последовательностью дикого типа. В некоторых воплощениях один или несколько участков последовательности кодирующей последовательности оптимизированы по кодонам и/или содержат увеличенное содержание G/C по сравнению с соответствующими участками последовательности кодирующей последовательности дикого типа. В некоторых воплощениях оптимизация кодонов и/или увеличение содержания G/C не изменяет последовательность кодируемой аминокислотной последовательности.
Термин «кодон-оптимизированный» понимается специалистами в данной области как относящийся к изменению кодонов в кодирующей области молекулы нуклеиновой кислоты, чтобы отразить типичное использование кодонов организмом-хозяином без предпочтительного изменения аминокислотной последовательности, кодируемой молекулой нуклеиновой кислотой. В контексте настоящего изобретения кодонные области предпочтительно оптимизированы по кодонам для оптимальной экспрессии у субъекта, подлежащего лечению, с использованием полинуклеотида РНК, описанного в настоящей заявке. Оптимизация кодонов основана на обнаружении того факта, что эффективность трансляции также определяется разной частотой встречаемости тРНК в клетках. Таким образом, последовательность РНК может быть модифицирована таким образом, что кодоны, для которых доступны часто встречающиеся тРНК, вставляются вместо «редких кодонов».
В некоторых воплощениях содержание гуанозина/цитидина (G/C) в кодирующей области (например, последовательности полезной нагрузки) РНК повышено по сравнению с содержанием G/C соответствующей кодирующей последовательности РНК дикого типа, кодирующей полезную нагрузку, при этом аминокислотная последовательность, кодируемая РНК, предпочтительно не модифицирована по сравнению с аминокислотной последовательностью, кодируемой РНК дикого типа. Эта модификация последовательности РНК основана на том факте, что последовательность любой транслируемой области РНК важна для эффективной трансляции этой мРНК. Последовательности с повышенным содержанием G (гуанозина)/C (цитидина) более стабильны, чем последовательности с повышенным содержанием A (аденозина)/U (уридина). В связи с тем, что несколько кодонов кодируют одну и ту же аминокислоту (так называемая вырожденность генетического кода), можно определить наиболее благоприятные для стабильности кодоны (так называемое альтернативное использование кодонов). В зависимости от аминокислоты, которая должна кодироваться РНК, существуют различные возможности модификации последовательности РНК по сравнению с ее последовательностью дикого типа. В частности, кодоны, которые содержат нуклеозиды А и/или U, могут быть модифицированы путем замены этих кодонов другими кодонами, которые кодируют те же аминокислоты, но не содержат А и/или U или содержат меньше нуклеозидов А и/или U.
В некоторых воплощениях содержание G/C в кодирующей области РНК, описанной в настоящей заявке, увеличено по меньшей мере на 10%, по меньшей мере на 20%, по меньшей мере на 30%, по меньшей мере на 40%, по меньшей мере на 50%, по меньшей мере на 55%, или даже больше по сравнению с содержанием G/C кодирующей области РНК дикого типа.
5’ кэп
Кэпирование РНК хорошо изучено и описано, например, в Decroly E et al. (2012) Nature Reviews 10: 51-65; and in Ramanathan A. et al., (2016) Nucleic Acids Res; 44(16): 7511-7526, полное содержание каждого из которых настоящим включено ссылкой. 5’-кэпы включают Cap-0 (также именуемый в настоящей заявке «Cap0»), Cap-1 (также именуемый в настоящей заявке «Cap1») или Cap-2 (также именуемый в настоящей заявке «Cap2»). См., например, фигуру 1 из Ramanathan A et al. и фигуру 1 из Decroly E et al.
Термин «5'-кэп», используемый в данном документе, относится к структуре, обнаруженной на 5'-конце РНК, например, мРНК, и обычно включает гуанозиновый нуклеотид, соединенный с РНК, например, мРНК, через 5'- 5'-трифосфатную связь (также называемой Gppp или G(5')ppp(5')). В некоторых воплощениях нуклеозид гуанозина, включенный в 5'-кэп, может быть модифицирован, например, путем метилирования в одном или нескольких положениях (например, в положении 7) основания (гуанина) и/или путем метилирования в одном или более положений рибозы. В некоторых воплощениях нуклеозид гуанозина, включенный в 5’-кэп, содержит 3’O-метилирование рибозы (3’OMeG). В некоторых воплощениях нуклеозид гуанозина, включенный в 5’-кэп, включает метилирование в положении 7 гуанина (m7G). В некоторых воплощениях гуанозиновый нуклеозид, включенный в 5'-кэп, включает метилирование в положении 7 гуанина и 3'-0-метилирование рибозы (m7(3'OMeG)).
В некоторых воплощениях получение РНК с 5'-кэпом, описанным в настоящей заявке, или аналогом 5'-кэпа может быть достигнуто с помощью транскрипции in vitro, при которой 5'-кэп котранскрипционно экспрессируется в цепь РНК, или может быть присоединяются к РНК посттранскрипционно с помощью кэпирующих ферментов. В некоторых воплощениях ко-транскрипционное кэпирование с помощью раскрытого в настоящей заявке кэпа, например, с помощью cap1 или аналога cap1, повышает эффективность кэпирования РНК по сравнению с ко-транскрипционным кэпированием с помощью соответствующего референсного компаратора. В некоторых воплощениях повышение эффективности кэпирования может повышать эффективность трансляции и/или скорость трансляции РНК и/или повышать экспрессию кодируемого полипептида.
В некоторых воплощениях РНК, описанная в настоящей заявке, содержит 5’-кэп или аналог 5’-кэпа, например, Cap0, Cap1 или Cap2. В некоторых воплощениях предоставленная РНК не имеет незакрытых 5'-трифосфатов. В некоторых воплощениях РНК может быть кэпирована аналогом 5'-кэпа. В некоторых воплощениях РНК, описанная в настоящей заявке, содержит Cap0. В некоторых воплощениях РНК, описанная в настоящей заявке, содержит Cap1, например, как описано в настоящей заявке. В некоторых воплощениях РНК, описанная в настоящей заявке, содержит Cap2.
В некоторых воплощениях структура Cap0 содержит нуклеозид гуанозина, метилированный в положении 7 гуанина (m7G). В некоторых воплощениях структура Cap0 соединена с РНК через 5'-5'-трифосфатную связь и также упоминается в настоящем описании как m7Gppp или m7G(5')ppp(5').
В некоторых воплощениях структура Cap1 содержит нуклеозид гуанозина, метилированный в положении 7 гуанина (m7G), и первый нуклеотид, метилированный в положении 2’O в РНК (2'OMeN1). В некоторых воплощениях структура Cap1 соединена с РНК через 5'-5'-трифосфатную связь и также упоминается в настоящей заявке как m7Gppp(2'OMeN1) или m7G(5')ppp(5')(2'OMeN1). В некоторых воплощениях N1 выбран из A, C, G или U. В некоторых воплощениях N1 представляет собой A. В некоторых воплощениях N1 представляет собой C. В некоторых воплощениях N1 представляет собой G. В некоторых воплощениях N1 представляет собой U.
В некоторых воплощениях структура m7G(5')ppp(5')(2'OMeN1) Cap1 содержит второй нуклеотид, N2, который представляет собой кэп-проксимальный нуклеотид в положении 2 и выбран из A, G, C или U (m7G(5')ppp(5')(2'OMeN1)N2). В некоторых воплощениях N2 представляет собой A. В некоторых воплощениях N2 представляет собой C. В некоторых воплощениях N2 представляет собой G. В некоторых воплощениях N2 представляет собой U.
В некоторых воплощениях структура cap1 представляет собой или содержит m7G(5')ppp(5')(2'OMeA1)pG2, где А представляет собой проксимальный к кэпу нуклеотид в положении +1, а G представляет собой проксимальный к кэпу нуклеотид в положении +2, и имеет следующую структуру:
В некоторых воплощениях структура cap1 представляет собой или содержит m7G(5')ppp(5')(2'OMeN1)N2, где A представляет собой проксимальный к кэпу нуклеотид в положении 1, а U представляет собой проксимальный к кэпу нуклеотид в положении 2, и имеет следующую структуру:
В некоторых воплощениях структура cap1 представляет собой или содержит m7G(5')ppp(5')(2'OMeG1)pG2, где G представляет собой проксимальный к кэпу нуклеотид в положении 1, а G представляет собой проксимальный к кэпу нуклеотид в положении 2, и имеет следующую структуру:
В некоторых воплощениях структура Cap1 содержит нуклеозид гуанозина, метилированный в положении 7 гуанина (m7G), и одну или несколько дополнительных модификаций, например, метилирование рибозы и 2'O-метилированный первый нуклеотид в РНК. В некоторых воплощениях структура Cap1 включает нуклеозид гуанозина, метилированный в положении 7 гуанина и 3’O-метилирование рибозы (m7(3’OMeG)); и 2'O-метилированный первый нуклеотид в РНК (2'OMeN1). В некоторых воплощениях структура Cap1 соединена с РНК через 5'-5'-трифосфатную связь и также упоминается в настоящем описании как m7(3'OMeG)ppp(2'OMeN1) или m7(3'OMeG)(5')ppp(5')(2'OMeN1). В некоторых воплощениях N1 выбран из A, C, G или U. В некоторых воплощениях N1 представляет собой A. В некоторых воплощениях N1 представляет собой C. В некоторых воплощениях N1 представляет собой G. В некоторых воплощениях N1 представляет собой U.
В некоторых воплощениях структура m7(3'oMeG)(5')ppp(5')(2'OMeN1) Cap1 содержит второй нуклеотид, N2, который представляет собой проксимальный к кэпу нуклеотид в положении 2 и выбран из A, G, C или U (m7(3'OMeG)(5')ppp(5')(2'OMeN1)N2). В некоторых воплощениях N2 представляет собой A. В некоторых воплощениях N2 представляет собой C. В некоторых воплощениях N2 представляет собой G. В некоторых воплощениях N2 представляет собой U.
В некоторых воплощениях структура cap1 представляет собой или содержит m7(3'OMeG)(5')ppp(5')(2'OMeA1)pG2, где A представляет собой проксимальный к кэпу нуклеотид в положении 1, а G представляет собой проксимальный к кэпу нуклеотид в положении 2, и имеет следующую структуру:
В некоторых воплощениях структура cap1 представляет собой или содержит m7(3'OMeG)(5')ppp(5')(2'OMeG1)pG2, где G представляет собой проксимальный к кэпу нуклеотид в положении 1, а G представляет собой проксимальный к кэпу нуклеотид в положении 2, и имеет следующую структуру:
В некоторых воплощениях второй нуклеотид в структуре Cap1 может содержать одну или несколько модификаций, например, метилирование. В некоторых воплощениях структура Cap1, содержащая второй нуклеотид, содержащий 2’O-метилирование, представляет собой структуру Cap2.
В некоторых воплощениях полинуклеотид РНК, содержащий структуру Cap1, имеет повышенную эффективность трансляции, повышенную скорость трансляции и/или повышенную экспрессию кодируемой полезной нагрузки по сравнению с соответствующим референсным компаратором. В некоторых воплощениях полинуклеотид РНК, содержащий структуру cap1, имеющую m7(3'OMeG)(5')ppp(5')(2'OMeA1)pG2, где A представляет собой проксимальный к кэпу нуклеотид в положении 1, а G представляет собой проксимальный к кэпу нуклеотид в положении 2, имеет повышенную эффективность трансляции по сравнению с полинуклеотидом РНК, содержащим структуру cap1, имеющую m7(3'OMeG)(5')ppp(5')(2'OMeG1)pG2, где G1 представляет собой проксимальный к кэпу нуклеотид в положении 1 и G2 представляет собой проксимальный к кэпу нуклеотид в положении 2. В некоторых воплощениях повышенную эффективность трансляции оценивается при введении полинуклеотида РНК в клетку или организм.
В некоторых воплощениях кэп-аналог, используемый в полинуклеотиде РНК, представляет собой m27,3’-OGppp(m12’-O)ApG (также иногда называемый m27,3`OG(5’)ppp(5’)m2’-OApG или m7(3'OMeG)(5')ppp(5')(2'OMeA)pG), который имеет следующую структуру:
.
Ниже приведена примерная Cap1 РНК, которая включает РНК и m27,3`OG(5’)ppp(5’)m2’-OApG:
.
Ниже приведен еще один пример Cap1 РНК:
.
В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, содержит кэп, показанный на любой из фигур 3A-3I. В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, содержит кэп, показанный на фигуре 3А. В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, содержит кэп, показанный на фигуре 3B. В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, содержит кэп, показанный на фигуре 3C. В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, содержит кэп, показанный на фигуре 3D. В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, содержит кэп, показанный на фигуре 3Е. В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, содержит кэп, показанный на фигуре 3F. В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, содержит кэп, показанный на фигуре 3G. В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, содержит кэп, показанный на фигуре 3H. В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, содержит кэп, показанный на фигуре 3I.
5’ UTR и проксимальные к кэпу последовательности
В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит 5'-UTR. Термин «нетранслируемая область» или «UTR» относится к области в молекуле ДНК, которая транскрибируется, но не транслируется в аминокислотную последовательность, или к соответствующей области в полинуклеотиде РНК, такой как молекула мРНК. Нетранслируемая область (UTR) может присутствовать в 5' (выше по последовательности) открытой рамки считывания (5'-UTR) и/или 3' (ниже по последовательности) открытой рамки считывания (3'-UTR). 5'-UTR, если присутствует, расположена на 5'-конце выше стартового кодона области, кодирующей белок. 5'-UTR находится после 5'-кэпа (если присутствует), например, непосредственно примыкает к 5'-кэпу.
В некоторых воплощениях 5’-UTR, раскрытая в настоящей заявке, содержит проксимальную к кэпу последовательность, например, как раскрыто в настоящей заявке. В некоторых воплощениях проксимальная к кэпу последовательность содержит последовательность, примыкающую к 5’-кэпу. В некоторых воплощениях проксимальная к кэпу последовательность содержит нуклеотиды в положениях +1, +2, +3, +4 и/или +5 полинуклеотида РНК.
В некоторых воплощениях структура кэпа содержит один или несколько полинуклеотидов проксимальной к кэпу последовательности. В некоторых воплощениях структура кэпа содержит кэп m7 гуанозин и нуклеотид +1 (N1) полинуклеотида РНК. В некоторых воплощениях структура кэпа содержит кэп m7 гуанозин и нуклеотид +2 (N2) полинуклеотида РНК. В некоторых воплощениях структура кэпа содержит кэп m7 гуанозин и нуклеотиды +1 и +2 (N1 и N2) полинуклеотида РНК.
Специалисты в данной области, прочитав настоящее раскрытие, поймут, что в некоторых воплощениях один или несколько остатков проксимальной к кэпу последовательности (например, один или несколько остатков +1, +2, +3, +4 и/ или +5) могут быть включены в РНК благодаря включению в кэп-объект (например, структуру Cap1 и т.д.); альтернативно, в некоторых воплощениях по меньшей мере некоторые из остатков в проксимальной к кэпу последовательности могут быть добавлены ферментативно (например, с помощью полимеразы, такой как полимераза Т7). Например, в некоторых приведенных в качестве примера воплощениях, где используется кэп m27,3’-OGppp(m12’-O)ApG, +1 и +2 представляют собой остатки (m12'-O)A и G кэпа, а +3, +4 и +5 добавляются полимеразой (например, полимеразой Т7).
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа, где N1 и N2 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A. В некоторых воплощениях N1 представляет собой C, В некоторых воплощениях N1 представляет собой G. В некоторых воплощениях N1 представляет собой U. В некоторых воплощениях N2 представляет собой A. В некоторых воплощениях N2 представляет собой C. В некоторых воплощениях N2 представляет собой G. В некоторых воплощениях N2 представляет собой U.
В некоторых воплощениях N1 представляет собой A, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой U.
В некоторых воплощениях N1 представляет собой C, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой C, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой C, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой C, а N2 представляет собой U.
В некоторых воплощениях N1 представляет собой G, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой G, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой G, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой G, а N2 представляет собой U.
В некоторых воплощениях N1 представляет собой U, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой U, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой U, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой U, а N2 представляет собой U.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и N3, N4 и N5, где N1-N5 соответствуют положениям +1, +2, +3, +4 и/или +5 РНК полинуклеотида.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой A. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой C. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой G. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой A.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой G.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой C.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой A. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой C. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой G. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях N1, N2, N3, N4 или N5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N3 представляет собой U. В некоторых воплощениях N4 представляет собой U. В некоторых воплощениях N5 представляет собой U.
В некоторых воплощениях 5’-UTR, раскрытая в настоящей заявке, содержит проксимальную к кэпу последовательность, например, как раскрыто в настоящей заявке. В некоторых воплощениях проксимальная к кэпу последовательность содержит последовательность, примыкающую к 5’-кэпу. В некоторых воплощениях проксимальная к кэпу последовательность содержит нуклеотиды в положениях +1, +2, +3, +4 и/или +5 полинуклеотида РНК.
В некоторых воплощениях структура кэпа содержит один или несколько полинуклеотидов проксимальной к кэпу последовательности. В некоторых воплощениях структура кэпа содержит кэп m7 гуанозин и нуклеотид +1 (N1) полинуклеотида РНК. В некоторых воплощениях структура кэпа содержит кэп m7 гуанозин и нуклеотид +2 (N2) полинуклеотида РНК. В некоторых воплощениях структура кэпа содержит кэп m7 гуанозин и нуклеотиды +1 и +2 (N1 и N2) полинуклеотида РНК.
В некоторых воплощениях каждый из N1 и N2 независимо выбран из: A, C, G или U. В некоторых воплощениях N1 представляет собой A. В некоторых воплощениях N1 представляет собой C. В некоторых воплощениях N1 представляет собой G. В некоторых воплощениях N1 представляет собой U. В некоторых воплощениях N2 представляет собой A. В некоторых воплощениях N2 представляет собой C. В некоторых воплощениях N2 представляет собой G. В некоторых воплощениях N2 представляет собой U.
В некоторых воплощениях каждый из N1 и N2 независимо выбран из: A, C, G или U. В некоторых воплощениях N1 представляет собой A. В некоторых воплощениях N1 представляет собой C. В некоторых воплощениях N1 представляет собой G. В некоторых воплощениях N1 представляет собой U. В некоторых воплощениях N2 представляет собой A. В некоторых воплощениях N2 представляет собой C. В некоторых воплощениях N2 представляет собой G. В некоторых воплощениях N2 представляет собой U.
В некоторых воплощениях N1 представляет собой A, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой U.
В некоторых воплощениях N1 представляет собой C, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой C, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой C, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой C, а N2 представляет собой U.
В некоторых воплощениях N1 представляет собой G, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой G, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой G, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой G, а N2 представляет собой U.
В некоторых воплощениях N1 представляет собой U, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой U, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой U, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой U, а N2 представляет собой U.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и последовательность, включающую: A3A4X5 (SEQ ID NO: 1). В некоторых воплощениях каждый из N1 и N2 независимо выбран из: A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях X5 выбирают из A, C, G или U. В некоторых воплощениях X5 представляет собой A. В некоторых воплощениях X5 представляет собой C. В некоторых воплощениях X5 представляет собой G. В некоторых воплощениях X5 представляет собой U.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и последовательность, включающую: C3A4X5 (SEQ ID NO: 2). В некоторых воплощениях каждый из N1 и N2 независимо выбран из: A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях X5 выбирают из A, C, G или U. В некоторых воплощениях X5 представляет собой A. В некоторых воплощениях X5 представляет собой C. В некоторых воплощениях X5 представляет собой G. В некоторых воплощениях X5 представляет собой U.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и последовательность, содержащую X3Y4X5 (SEQ ID NO: 7). В некоторых воплощениях каждый из N1 и N2 независимо выбран из: A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях каждый из X3 и X5 независимо выбирают из A, C, G или U. В некоторых воплощениях X3 и/или X5 представляет собой A. В некоторых воплощениях X3 и/или X5 представляет собой C. В некоторых воплощениях X3 и/или X5 представляет собой G. В некоторых воплощениях X3 и/или X5 представляет собой U. В некоторых воплощениях Y4 не представляет собой C. В некоторых воплощениях Y4 представляет собой A. В некоторых воплощениях Y4 представляет собой G. В некоторых воплощениях Y4 представляет собой U.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и последовательность, содержащую X3Y4X5 (SEQ ID NO: 7). В некоторых воплощениях каждый из N1 и N2 независимо выбран из: A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях каждый из X3 и X5 независимо выбирают из A, C, G или U. В некоторых воплощениях X3 и/или X5 представляет собой A. В некоторых воплощениях X3 и/или X5 представляет собой C. В некоторых воплощениях X3 и/или X5 представляет собой G. В некоторых воплощениях X3 и/или X5 представляет собой U. В некоторых воплощениях Y4 не представляет собой G. В некоторых воплощениях Y4 представляет собой A. В некоторых воплощениях Y4 представляет собой C. В некоторых воплощениях Y4 представляет собой U.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и последовательность, содержащую A3C4A5 (SEQ ID NO: 3). В некоторых воплощениях каждый из N1 и N2 независимо выбран из: A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G.
В некоторых воплощениях проксимальная к кэпу последовательность кэпа содержит N1 и N2 структуры кэпа и последовательность, содержащую A3U4G5 (SEQ ID NO: 4). В некоторых воплощениях каждый из N1 и N2 независимо выбран из: A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G.
В некоторых воплощениях структура кэпа содержит один или несколько полинуклеотидов проксимальной к кэпу последовательности. В некоторых воплощениях структура кэпа содержит кэп m7 гуанозин и нуклеотид +1 (N1) полинуклеотида РНК. В некоторых воплощениях структура кэпа содержит кэп m7 гуанозин и нуклеотид +2 (N2) полинуклеотида РНК. В некоторых воплощениях структура кэпа содержит кэп m7 гуанозин и нуклеотиды +1 и +2 (N1 и N2) полинуклеотида РНК.
В некоторых воплощениях N1 и N2 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A. В некоторых воплощениях N1 представляет собой C. В некоторых воплощениях N1 представляет собой G. В некоторых воплощениях N1 представляет собой U. В некоторых воплощениях N2 представляет собой A. В некоторых воплощениях N2 представляет собой C. В некоторых воплощениях N2 представляет собой G. В некоторых воплощениях N2 представляет собой U.
В некоторых воплощениях N1 и N2 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A. В некоторых воплощениях N1 представляет собой C. В некоторых воплощениях N1 представляет собой G. В некоторых воплощениях N1 представляет собой U. В некоторых воплощениях N2 представляет собой A. В некоторых воплощениях N2 представляет собой C. В некоторых воплощениях N2 представляет собой G. В некоторых воплощениях N2 представляет собой U.
В некоторых воплощениях N1 представляет собой A, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой U.
В некоторых воплощениях N1 представляет собой C, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой C, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой C, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой C, а N2 представляет собой U.
В некоторых воплощениях N1 представляет собой G, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой G, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой G, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой G, а N2 представляет собой U.
В некоторых воплощениях N1 представляет собой U, а N2 представляет собой A. В некоторых воплощениях N1 представляет собой U, а N2 представляет собой C. В некоторых воплощениях N1 представляет собой U, а N2 представляет собой G. В некоторых воплощениях N1 представляет собой U, а N2 представляет собой U.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и последовательность, включающую: A3A4X5 (SEQ ID NO: 1). В некоторых воплощениях N1 и N2 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях X5 выбран из A, C, G или U. В некоторых воплощениях X5 представляет собой A. В некоторых воплощениях X5 представляет собой C. В некоторых воплощениях X5 представляет собой G. В некоторых воплощениях X5 представляет собой U.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и последовательность, включающую: C3A4X5 (SEQ ID NO: 2). В некоторых воплощениях N1 и N2 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях X5 представляет собой любой нуклеотид, например, A, C, G. или U. В некоторых воплощениях X5 представляет собой A. В некоторых воплощениях X5 представляет собой C. В некоторых воплощениях X5 представляет собой G. В некоторых воплощениях X5 представляет собой U.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и последовательность, содержащую X3Y4X5 (SEQ ID NO: 7). В некоторых воплощениях N1 и N2 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях X3 и X5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях X3 и/или X5 представляет собой A. В некоторых воплощениях X3 и/или X5 представляет собой C. В некоторых воплощениях X3 и/или X5 представляет собой G. В некоторых воплощениях X3 и/или X5 представляет собой U. В некоторых воплощениях Y4 не представляет собой C. В некоторых воплощениях Y4 представляет собой A. В некоторых воплощениях Y4 представляет собой G. В некоторых воплощениях Y4 представляет собой U.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и последовательность, содержащую X3Y4X5 (SEQ ID NO: 7). В некоторых воплощениях N1 и N2 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G. В некоторых воплощениях X3 и X5 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях X3 и/или X5 представляет собой A. В некоторых воплощениях X3 и/или X5 представляет собой C. В некоторых воплощениях X3 и/или X5 представляет собой G. В некоторых воплощениях X3 и/или X5 представляет собой U. В некоторых воплощениях Y4 не представляет собой G. В некоторых воплощениях Y4 представляет собой A. В некоторых воплощениях Y4 представляет собой C. В некоторых воплощениях Y4 представляет собой U.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и последовательность, содержащую A3C4A5 (SEQ ID NO: 3). В некоторых воплощениях N1 и N2 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G.
В некоторых воплощениях проксимальная к кэпу последовательность содержит N1 и N2 структуры кэпа и последовательность, содержащую A3U4G5 (SEQ ID NO: 4). В некоторых воплощениях N1 и N2 представляют собой любой нуклеотид, например, A, C, G или U. В некоторых воплощениях N1 представляет собой A, а N2 представляет собой G.
Примеры 5'-UTR включают 5'-UTR альфа-глобина человека (hAg) или его фрагмент, 5'-UTR TEV или его фрагмент, 5'-UTR HSP70 или его фрагмент, или 5'-UTR c-Jun, или его фрагмент.
В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит 5’-UTR hAg или ее фрагмент. В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит hAg 5’ UTR, обладающую 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с 5'-UTR альфа-глобина человека, представленной в SEQ ID NO: 11. В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит 5’-UTR hAg, представленную в SEQ ID NO: 11. В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит hAg 5’ UTR, обладающую 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с 5'-UTR альфа-глобина человека, представленной в SEQ ID NO: 12. В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит 5’-UTR hAg, представленную в SEQ ID NO: 12.
3’ UTR
В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит 3'-UTR. 3'-UTR, если он присутствует, расположен на 3'-конце, ниже терминирующего кодона области, кодирующей белок, но термин «3'-UTR» предпочтительно не включает поли(А)-последовательность. Таким образом, 3'-UTR находится выше последовательности поли(A) (если присутствует), например, непосредственно примыкает к последовательности поли(A).
В некоторых воплощениях РНК, описанная в настоящей заявке, содержит 3’-UTR, содержащую элемент F и/или элемент I. В некоторых воплощениях 3’-UTR или проксимальная к ней последовательность содержит сайт рестрикции. В некоторых воплощениях сайт рестрикции представляет собой сайт BamHI. В некоторых воплощениях сайт рестрикции представляет собой сайт XhoI.
В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит 3'-UTR, имеющую 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с 3'-UTR, представленной в SEQ ID NO: 13. В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит 3’-UTR, представленную в SEQ ID NO: 13.
ПолиА
В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит последовательность полиаденилата (ПолиА), например, как описано в настоящей заявке. В некоторых воплощениях последовательность ПолиА расположена ниже 3'-UTR, например, рядом с 3'-UTR.
Используемый в данном документе термин «поли(А)-последовательность» или «поли-А-хвост» относится к непрерывной или прерывистой последовательности аденилатных остатков, которая обычно располагается на 3'-конце полинуклеотида РНК. Последовательности поли(А) известны специалистам в данной области и могут следовать за 3'-UTR в описанных в данном документе РНК. Непрерывная поли(А) последовательность характеризуется последовательными аденилатными остатками. В природе типична непрерывная поли(А) последовательность. РНК, описанные в настоящей заявке, могут иметь последовательность поли(А), присоединенную к свободному 3'-концу РНК независимой от матрицы РНК-полимеразой после транскрипции, или последовательность поли(А), кодируемую ДНК и транскрибируемую зависимой от матрицы РНК-полимеразой.
Было продемонстрировано, что последовательность поли(А) из примерно 120 нуклеотидов А оказывает благотворное влияние на уровни РНК в трансфицированных эукариотических клетках, а также на уровни белка, который транслируется из открытой рамки считывания, расположенной выше по последовательности относительно (5') последовательности поли(А) (Holtkamp et al., 2006, Blood, vol. 108, pp. 4009-4017).
Поли(А)-последовательность может иметь любую длину. В некоторых воплощениях последовательность поли(А) содержит, по существу состоит из или состоит из по меньшей мере 20, по меньшей мере 30, по меньшей мере 40, по меньшей мере 80 или по меньшей мере 100 и до 500, до 400, до 300, до 200 или до 150 нуклеотидов А и, в частности, около 120 нуклеотидов А. В этом контексте «по существу состоит из» означает, что большинство нуклеотидов в последовательности поли(А), как правило, не менее 75%, не менее 80%, не менее 85%, не менее 90%, не менее 95%, не менее 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% по количеству нуклеотидов в поли(А)-последовательности представляют собой нуклеотиды А, но допускает, что оставшиеся нуклеотиды представляют собой нуклеотиды, отличные от нуклеотидов А, такие как нуклеотиды U (уридилат), нуклеотиды G (гуанилат) или нуклеотиды C (цитидилат). В этом контексте «состоит из» означает, что все нуклеотиды в последовательности поли(А), т.е. 100% по количеству нуклеотидов в последовательности поли(А), являются нуклеотидами А. Термин «нуклеотид А» или «А» относится к аденилату.
В некоторых воплощениях поли-A-последовательность присоединяется во время транскрипции РНК, например, во время получения РНК, транскрибированной in vitro, на основе матрицы ДНК, содержащей повторяющиеся нуклеотиды dT (дезокситимидилат) в цепи, комплементарной кодирующей цепи. Последовательность ДНК, кодирующая поли(А)-последовательность (кодирующую цепь), называется поли(А)-кассетой.
В некоторых воплощениях поли(A)-кассета, присутствующая в кодирующей цепи ДНК, по существу состоит из нуклеотидов dA, но прерывается случайной последовательностью из четырех нуклеотидов (dA, dC, dG и dT). Такая случайная последовательность может иметь длину от 5 до 50, от 10 до 30 или от 10 до 20 нуклеотидов. Такая кассета раскрыта в WO 2016/005324 A1, включенном в данный документ ссылкой. В настоящем изобретении можно использовать любую кассету поли (A), описанную в WO 2016/005324 A1. Поли (А)-кассета, которая по существу состоит из нуклеотидов dA, но прерывается случайной последовательностью, имеющей равное распределение четырех нуклеотидов (dA, dC, dG, dT) и имеющую длину, например, от 5 до 50 нуклеотидов, показывает, на уровне ДНК, постоянное размножение плазмидной ДНК в E. coli, а также связана, на уровне РНК, с полезными свойствами в отношении поддержания стабильности РНК и эффективности трансляции. В некоторых воплощениях последовательность поли(А), содержащаяся в описанном в данном документе полинуклеотиде РНК, по существу состоит из нуклеотидов А, но прерывается случайной последовательностью четырех нуклеотидов (А, С, G, U). Такая случайная последовательность может иметь длину от 5 до 50, от 10 до 30 или от 10 до 20 нуклеотидов.
В некоторых воплощениях никакие другие нуклеотиды, кроме нуклеотидов А, не фланкируют последовательность поли(А) на ее 3'-конце, т.е. последовательность поли(А) не маскируется и не сопровождается на ее 3'-конце нуклеотидом, отличным от А.
В некоторых воплощениях последовательность поли(А) может содержать по меньшей мере 20, по меньшей мере 30, по меньшей мере 40, по меньшей мере 80 или по меньшей мере 100 и до 500, до 400, до 300, до 200 или до 150 нуклеотидов. В некоторых воплощениях последовательность поли(А) может по существу состоять из по меньшей мере 20, по меньшей мере 30, по меньшей мере 40, по меньшей мере 80 или по меньшей мере 100 и до 500, до 400, до 300, до 200 или до 150 нуклеотидов. В некоторых воплощениях последовательность поли(А) может состоять из по меньшей мере 20, по меньшей мере 30, по меньшей мере 40, по меньшей мере 80 или по меньшей мере 100 и до 500, до 400, до 300, до 200, или до 150 нуклеотидов. В некоторых воплощениях последовательность поли(А) содержит по меньшей мере 100 нуклеотидов. В некоторых воплощениях последовательность поли(А) содержит около 150 нуклеотидов. В некоторых воплощениях последовательность поли(А) содержит около 120 нуклеотидов.
В некоторых воплощениях РНК, описанная в настоящей заявке, содержит поли(А)-последовательность, содержащую нуклеотидную последовательность SEQ ID NO: 14, или нуклеотидную последовательность, имеющую по меньшей мере 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности нуклеотидной последовательности SEQ ID NO: 14.
В некоторых воплощениях РНК, раскрытая в настоящей заявке, содержит поли(А)-последовательность SEQ ID NO: 14.
Полезная нагрузка
В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, содержит последовательность, кодирующую полезную нагрузку, например, как описано в настоящей заявке. В некоторых воплощениях последовательность, кодирующая полезную нагрузку, содержит промоторную последовательность. В некоторых воплощениях последовательность, кодирующая полезную нагрузку, содержит последовательность, кодирующую секреторный сигнальный пептид.
В некоторых воплощениях полезная нагрузка выбрана из: полипептида заместительного белка; антительного агента; цитокина; антигенного полипептида; компонента редактирования генов; компонента регенеративной медицины или их комбинации.
В некоторых воплощениях полезная нагрузка представляет собой полипептид заместительного белка или содержит полипептид заместительного белка. В некоторых воплощениях полипептид заместительного белка содержит полипептид с аберрантной экспрессией при заболевании или расстройстве. В некоторых воплощениях полипептид заместительного белка содержит внутриклеточный белок, внеклеточный белок или трансмембранный белок. В некоторых воплощениях полипептид заместительного белка содержит фермент.
В некоторых воплощениях заболевание или расстройство с аберрантной экспрессией полипептида включает, без ограничения указанным: редкое заболевание, нарушение обмена веществ, мышечную дистрофию, сердечно-сосудистое заболевание или моногенное заболевание.
В некоторых воплощениях полезная нагрузка представляет собой антительный агент или содержит его. В некоторых воплощениях антитело связывается с полипептидом, экспрессируемым на клетке. В некоторых воплощениях антитело представляет собой антитело к CD3, антитело к клаудину 6 или их комбинацию.
В некоторых воплощениях полезная нагрузка представляет собой или содержит цитокин, его фрагмент или вариант. В некоторых воплощениях цитокин включает: IL-12, или его фрагмент, или вариант, или его гибрид, IL-15, или его фрагмент, или вариант, или гибрид, GMCSF, или его фрагмент, или вариант; или IFN-альфа, или его фрагмент, или вариант.
В некоторых воплощениях полезная нагрузка представляет собой или содержит антигенный полипептид, или его иммуногенный вариант, или его иммуногенный фрагмент. В некоторых воплощениях антигенный полипептид содержит один эпитоп антигена. В некоторых воплощениях антигенный полипептид содержит множество различных эпитопов антигена. В некоторых воплощениях антигенный полипептид, содержащий множество различных эпитопов антигена, является полиэпитопным.
В некоторых воплощениях антигенный полипептид включает: антигенный полипептид из аллергена, вирусный антигенный полипептид, бактериальный антигенный полипептид, грибной антигенный полипептид, паразитарный антигенный полипептид, антигенный полипептид из инфекционного агента, антигенный полипептид из патогена, опухолевой антигенный полипептид или аутоантигенный полипептид.
В некоторых воплощениях вирусный антигенный полипептид содержит антигенный полипептид ВИЧ, антигенный полипептид гриппа, антигенный полипептид коронавируса, антигенный полипептид бешенства или антигенный полипептид вируса Зика.
В некоторых воплощениях вирусный антигенный полипептид представляет собой антигенный полипептид коронавируса или содержит его. В некоторых воплощениях антиген коронавируса представляет собой белок SARS-CoV-2 или содержит его. В некоторых воплощениях белок SARS-CoV-2 содержит спайк (S) белок SARS-CoV-2, или его иммуногенный вариант, или его иммуногенный фрагмент. В некоторых воплощениях белок SARS-CoV-2 или его иммуногенный вариант или иммуногенный фрагмент содержит остатки пролина в положениях 986 и 987.
В некоторых воплощениях S-полипептид SARS-CoV-2 имеет по меньшей мере 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности S-полипептиду SARS-CoV-2, раскрытому в данном документе. В некоторых воплощениях S-полипептид SARS-CoV-2 имеет по меньшей мере 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с SEQ ID NO: 9.
В некоторых воплощениях S-полипептид SARS-CoV-2 кодируется РНК, имеющий по меньшей мере 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с SARS-CoV-2, раскрытым в настоящей заявке. В некоторых воплощениях S-полипептид SARS-CoV-2 кодируется РНК, имеющей по меньшей мере 99%, 98%, 97%, 96%, 95%, 90%, 85 % или 80 % идентичности с SEQ ID NO: 10.
В некоторых воплощениях полезная нагрузка представляет собой или содержит опухолевый антигенный полипептид, или его иммуногенный вариант, или его иммуногенный фрагмент. В некоторых воплощениях полипептид опухолевого антигена содержит опухолеспецифический антиген, ассоциированный с опухолью антиген, опухолевый неоантиген или их комбинацию. В некоторых воплощениях опухолевый антигенный полипептид содержит p53, ART-4, BAGE, ss-катенин/m, Bcr-abL CAMEL, CAP-1, CASP-8, CDC27/m, CDK4/m, CEA, CLAUDIN-12, c-MYC, CT, Cyp-B, DAM, ELF2M, ETV6-AML1, G250, GAGE, GnT-V, Gap100, HAGE, HER-2/neu, HPV-E7, HPV-E6, HAST-2, hTERT (или hTRT), LAGE, LDLR/FUT, MAGE-A, предпочтительно MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A5, MAGE-A6, MAGE-A7, MAGE-A8, MAGE-A9, MAGE-A10, MAGE-A11 или MAGE-A12, MAGE-B, MAGE-C, MART-1/Melan-A, MC1R, Миозин/m, MUC1, MUM-1, -2, -3, NA88- A, NF1, NY-ESO-1, NY-BR-1, минорный p190 BCR-abL, Plac-1, Pm1/RARa, PRAME, протеиназу 3, PSA, PSM, RAGE, RU1 или RU2, SAGE, SART-1 или SART-3, SCGB3A2, SCP1, SCP2, SCP3, SSX, SURVIVIN, TEL/AML1, TPI/m, TRP-1, TRP-2, TRP-2/INT2, TPTE, WT, WT-1 или их комбинацию.
В некоторых воплощениях полипептид опухолевого антигена содержит опухолевый антиген из карциномы, саркомы, меланомы, лимфомы, лейкоза или их комбинации.
В некоторых воплощениях полипептид опухолевого антигена содержит опухолевый антиген меланомы.
В некоторых воплощениях полипептид опухолевого антигена содержит антиген рака предстательной железы.
В некоторых воплощениях опухолевый антигенный полипептид содержит антиген рака головы и шеи, положительного по HPV16.
В некоторых воплощениях полипептид опухолевого антигена содержит антиген рака молочной железы.
В некоторых воплощениях полипептид опухолевого антигена содержит антиген рака яичников.
В некоторых воплощениях полипептид опухолевого антигена содержит антиген рака легкого.
В некоторых воплощениях полипептид опухолевого антигена содержит антиген НМРЛ.
В некоторых воплощениях полезная нагрузка представляет собой или содержит собственный антигенный полипептид, или его иммуногенный вариант, или его иммуногенный фрагмент. В некоторых воплощениях аутоантигенный полипептид содержит антиген, который обычно экспрессируется на клетках и распознается иммунной системой как аутоантиген. В некоторых воплощениях аутоантигенный полипептид содержит: антигенный полипептид рассеянного склероза, антигенный полипептид ревматоидного артрита, антигенный полипептид волчанки, антигенный полипептид глютеновой болезни, антигенный полипептид синдрома Шегрена или антигенный полипептид анкилозирующего спондилита, или их комбинацию.
Примеры полинуклеотидов
В некоторых воплощениях полинуклеотид РНК, описанный в настоящей заявке, или композиция или медицинский препарат, содержащий его, содержит последовательность нуклеотидов, раскрытую в настоящей заявке. В некоторых воплощениях полинуклеотид РНК содержит последовательность, по меньшей мере на 80% идентичную нуклеотидной последовательности, раскрытой в настоящей заявке. В некоторых воплощениях полинуклеотид РНК содержит последовательность, кодирующую полипептид, по меньшей мере на 80% идентичный последовательности полипептида, описанной в настоящей заявке. Примеры нуклеотидных и полипептидных последовательностей представлены, например, в Таблице 1 или в этом разделе под названием «Примеры полинуклеотидов» или в Примере 2.
В некоторых воплощениях полинуклеотид РНК, описанный в настоящей заявке, или композиция или медицинский препарат, содержащие его, транскрибируются матрицей ДНК. В некоторых воплощениях матрица ДНК, используемая для транскрипции полинуклеотида РНК, описанного в настоящей заявке, содержит последовательность, комплементарную полинуклеотиду РНК.
В некоторых воплощениях полезная нагрузка, описанная в настоящей заявке, кодируется полинуклеотидом РНК, описанным в настоящей заявке, содержащим нуклеотидную последовательность, раскрытую в настоящей заявке, например, в таблице 1 или в этом разделе, озаглавленном «Примеры полинуклеотидов», или в примере 2. В некоторых воплощениях полинуклеотид РНК кодирует полезную нагрузку полипептида, имеющего по меньшей мере 80% идентичности с последовательностью полипептида полезной нагрузки, раскрытой в настоящей заявке. В некоторых воплощениях полезная нагрузка, описанная в настоящей заявке, кодируется полинуклеотидом РНК, транскрибируемым с матрицы ДНК, содержащей последовательность, комплементарную полинуклеотиду РНК.
Таблица 1: Примеры последовательностей описанных в данном документе конструкций РНК
RBL063.1 (SEQ ID NO: 28 нуклеотидная; SEQ ID NO: 9 аминокислотная)
Структура бета-S-ARCA(D1)-hAg-Козак-S1S2-PP-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S1S2) из SARS-CoV-2 (Полноразмерный белок S1S2, вариант последовательности)
RBL063.2 (SEQ ID NO: 29 нуклеотидная; SEQ ID NO: 9 аминокислотная)
Структура бета-S-ARCA(D1)-hAg-Козак-S1S2-PP-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S1S2) из SARS-CoV-2 (Полноразмерный белок S1S2, вариант последовательности)
BNT162a1; RBL063.3 (SEQ ID NO: 30 нуклеотидная; SEQ ID NO: 21 аминокислотная)
Структура бета-S-ARCA(D1)-hAg-Козак-RBD-GS-Фибритин-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S) из SARS-CoV-2 (частичная последовательность, рецепторсвязывающий домен (РСД) из белка S1S2)
BNT162b2; RBP020.1 (SEQ ID NO: 31 нуклеотидная; SEQ ID NO: 9 аминокислотная)
Структура m27,3’-OGppp(m12’-O)ApG)-hAg-Козак-S1S2-PP-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S1S2) из SARS-CoV-2 (Полноразмерный белок S1S2, вариант последовательности)
RBP020.2 (SEQ ID NO: 10 нуклеотидная; SEQ ID NO: 9 аминокислотная) (see Table 1)
Структура m27,3’-OGppp(m12’-O)ApG)-hAg-Козак-S1S2-PP-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S1S2) из SARS-CoV-2 (Полноразмерный белок S1S2, вариант последовательности)
BNT162b1; RBP020.3 (SEQ ID NO: 32; SEQ ID NO: 21 аминокислотная)
Структура m27,3’-OGppp(m12’-O)ApG)-hAg-Козак-RBD-GS-Фибритин-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S1S2) из SARS-CoV-2 (частичная последовательность, рецепторсвязывающий домен (РСД) из белка S1S2 объединенный с фибритином)
RBS004.1 (SEQ ID NO: 33; SEQ ID NO: 9 аминокислотная)
Структура бета-S-ARCA(D1)-репликаза-S1S2-PP-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S) из SARS-CoV-2 (Полноразмерный белок S1S2, вариант последовательности)
RBS004.2 (SEQ ID NO: 34; SEQ ID NO: 9 аминокислотная)
Структура бета-S-ARCA(D1)-репликаза-S1S2-PP-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S) из SARS-CoV-2 (Полноразмерный белок S1S2, вариант последовательности)
BNT162c1; RBS004.3 (SEQ ID NO: 35; SEQ ID NO: 21 аминокислотная)
Структура бета-S-ARCA(D1)-репликаза-RBD-GS-Фибритин-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S) из SARS-CoV-2 (частичная последовательность, рецепторсвязывающий домен (РСД) из белка S1S2)
RBS004.4 (SEQ ID NO: 36; SEQ ID NO: 37)
Структура бета-S-ARCA(D1)-репликаза-RBD-GS-Фибритин-TM-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S) из SARS-CoV-2 (частичная последовательность, рецепторсвязывающий домен (РСД) из белка S1S2)
BNT162b3c (SEQ ID NO: 38; SEQ ID NO: 39)
Структура m27,3’-OGppp(m12’-O)ApG-hAg-Козак-RBD-GS-Фибритин-GS-TM-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S1S2) из SARS-CoV-2 (частичная последовательность, рецепторсвязывающий домен (РСД) из белка S1S2 объединенный с фибритином, объединенный с трансмембранным доменом (TM) из белка S1S2); внутренний секреторный сигнальный пептид белка S1S2 (ак 1-19) на N-конце антигенной последовательности
SEQ ID NO: 38
BNT162b3d (SEQ ID NO: 40; SEQ ID NO: 41)
Структура m27,3’-OGppp(m12’-O)ApG-hAg-Козак-RBD-GS-Фибритин-GS-TM-FI-A30L70
Кодируемый антиген Вирусный спайк белок (белок S1S2) из SARS-CoV-2 (частичная последовательность, рецепторсвязывающий домен (РСД) из белка S1S2 объединенный с фибритином объединенный с трансмембранным доменом (TM) из белка S1S2); иммуноглобулиновый секреторный сигнальный пептид (ак 1-22) на N-конце антигенной последовательности
SEQ ID NO: 40
Частицы, содержащие нуклеиновые кислоты
Описанные в данном документе нуклеиновые кислоты, такие как РНК, кодирующая полезную нагрузку, можно вводить в виде частиц.
В контексте настоящего раскрытия термин «частица» относится к структурированному объекту, образованному молекулами или комплексами молекул. В некоторых воплощениях термин «частица» относится к микро- или наноразмерной структуре, такой как микро- или наноразмерная компактная структура, диспергированная в среде. В некоторых воплощениях частица представляет собой частицу, содержащую нуклеиновую кислоту, такую как частица, содержащая ДНК, РНК или их смесь.
Электростатические взаимодействия между положительно заряженными молекулами, такими как полимеры и липиды, и отрицательно заряженными нуклеиновыми кислотами участвуют в формировании частиц. Это приводит к комплексообразованию и самопроизвольному образованию частиц нуклеиновых кислот. В некоторых воплощениях частица нуклеиновой кислоты представляет собой наночастицу.
Используемый в настоящем описании термин «наночастица» относится к частице со средним диаметром, подходящим для парентерального введения.
«Частица нуклеиновой кислоты» может быть использована для доставки нуклеиновой кислоты в интересующий участок-мишень (например, клетку, ткань, орган и т.п.). Частица нуклеиновой кислоты может быть образована по меньшей мере из одного катионного или катионно-ионизируемого липида или липидоподобного материала, по меньшей мере из одного катионного полимера, такого как протамин, или их смеси и нуклеиновой кислоты. Частицы нуклеиновой кислоты включают составы на основе липидных наночастиц (ЛНЧ) и липоплексов (ЛП).
Не желая быть связанными какой-либо теорией, полагаем, что катионный или катионно-ионизируемый липид или липидоподобный материал и/или катионный полимер объединяются вместе с нуклеиновой кислотой с образованием агрегатов, и эта агрегация приводит к коллоидно-стабильным частицам.
В некоторых воплощениях частицы, описанные в настоящей заявке, дополнительно содержат по меньшей мере один липид или липидоподобный материал, отличный от катионного или катионно-ионизируемого липида или липидоподобного материала, по меньшей мере один полимер, отличный от катионного полимера, или их смесь.
В некоторых воплощениях частицы нуклеиновой кислоты содержат более одного типа молекул нуклеиновой кислоты, где молекулярные параметры молекул нуклеиновой кислоты могут быть похожими или отличаться друг от друга, например, в отношении молекулярной массы или основных структурных элементов, таких как молекулярная архитектура, ограничение, области кодирования или другие функции. Частицы нуклеиновой кислоты, описанные в настоящей заявке, могут иметь средний диаметр, который в некоторых воплощениях находится в диапазоне от около 30 нм до около 1000 нм, от около 50 нм до около 800 нм, от около 70 нм до около 600 нм, от около 90 нм до около 400 нм. или от около 100 нм до около 300 нм.
Частицы нуклеиновой кислоты, описанные в настоящей заявке, могут иметь индекс полидисперсности менее чем около 0,5, менее чем около 0,4, менее чем около 0,3 или около 0,2 или менее. Например, частицы нуклеиновой кислоты могут иметь индекс полидисперсности в диапазоне от около 0,1 до около 0,3 или от около 0,2 до около 0,3.
Что касается липидных частиц РНК, отношение N/P дает отношение групп азота в липиде к количеству фосфатных групп в РНК. Это коррелирует с соотношением зарядов, поскольку атомы азота (в зависимости от pH) обычно заряжены положительно, а фосфатные группы заряжены отрицательно. Отношение N/P, при котором существует равновесие заряда, зависит от pH. Липидные составы часто образуются при соотношении N/P от четырех до двенадцати, поскольку считается, что положительно заряженные наночастицы благоприятны для трансфекции. В этом случае считается, что РНК полностью связана с наночастицами.
Частицы нуклеиновой кислоты, описанные в настоящей заявке, могут быть получены с использованием широкого ряда способов, которые могут включать получение коллоида по меньшей мере из одного катионного или катионно-ионизируемого липида или липидоподобного материала и/или по меньшей мере одного катионного полимера и смешивание коллоида с нуклеиновой кислотой для получения частиц нуклеиновой кислоты.
Используемый в данном документе термин «коллоид» относится к типу гомогенной смеси, в которой не оседают диспергированные частицы. Нерастворимые частицы в смеси микроскопические, с размерами от 1 до 1000 нанометров. Смесь можно назвать коллоидом или коллоидной суспензией. Иногда термин «коллоид» относится только к частицам в смеси, а не ко всей суспензии.
Для приготовления коллоидов, содержащих по меньшей мере один катионный или катионно-ионизируемый липид или липидоподобный материал и/или по меньшей мере один катионный полимер, в настоящей заявке применимы способы, которые обычно используются для получения липосомальных везикул, и соответствующим образом адаптированы. Наиболее часто используемые способы приготовления липосомальных везикул разделяют следующие основные стадии: (i) растворение липидов в органических растворителях, (ii) сушка полученного раствора и (iii) гидратация высушенного липида (с использованием различных водных сред).
В способе пленочной гидратации липиды сначала растворяют в подходящем органическом растворителе и сушат до получения тонкой пленки на дне флакона. Полученную липидную пленку гидратируют с использованием подходящей водной среды для получения липосомальной дисперсии. Кроме того, может быть включена дополнительная стадия уменьшения размеров.
Выпаривание с обратной фазой является альтернативным способу гидратации пленки для приготовления липосомальных везикул, который включает образование эмульсии вода-в-масле между водной фазой и органической фазой, содержащей липиды. Для гомогенизации системы требуется кратковременная обработка этой смеси ультразвуком. Удаление органической фазы при пониженном давлении дает мутный гель, который впоследствии превращается в липосомальную суспензию.
Термин «метод инъекции этанола» относится к процессу, в котором раствор этанола, содержащий липиды, быстро вводится в водный раствор через иглу. Это действие диспергирует липиды по всему раствору и способствует образованию липидной структуры, например образованию липидных пузырьков, таких как образование липосом. Обычно липоплексные частицы РНК, описанные в данном документе, могут быть получены путем добавления РНК к дисперсии коллоидных липосом. Используя метод инъекции этанола, такую коллоидную дисперсию липосом в некоторых воплощениях формируют следующим образом: раствор этанола, содержащий липиды, такие как катионные липиды и дополнительные липиды, вводят в водный раствор при перемешивании. В некоторых воплощениях описанные в данном документе частицы РНК-липоплекса можно получить без стадии экструзии.
Термин «выполнять экструзию» или «экструзия» относится к созданию частиц, имеющих фиксированный профиль поперечного сечения. В частности, это относится к уменьшению размера частицы, когда частица проталкивается через фильтры с определенными порами.
Другие способы, имеющие характеристики отсутствия органических растворителей, также могут быть использованы в соответствии с настоящим изобретением для получения коллоида.
ЛНЧ обычно включают четыре компонента: ионизируемые катионные липиды, нейтральные липиды, такие как фосфолипиды, стероид, такой как холестерин, и липид, связанный с полимером, такой как липиды полиэтиленгликоля (ПЭГ). Каждый компонент отвечает за защиту полезной нагрузки и обеспечивает эффективную внутриклеточную доставку. ЛНЧ могут быть получены путем быстрого смешивания липидов, растворенных в этаноле, с нуклеиновой кислотой в водном буфере.
Термин «средний диаметр» относится к среднему гидродинамическому диаметру частиц, измеренному методом динамического рассеяния лазерного света (ДРС) с анализом данных с использованием так называемого кумулянтного алгоритма, который дает в результате так называемое Z-среднее с размерностью длины, и индекс полидисперсности (ИП), который является безразмерным (Koppel, D., J. Chem. Phys. 57, 1972, pp 4814-4820, ISO 13321). В данной заявке «средний диаметр», «диаметр» или «размер» для частиц используются как синонимы этого значения Z-среднего.
«Индекс полидисперсности» предпочтительно рассчитывается на основе измерений динамического светорассеяния с помощью так называемого кумулятивного анализа, как указано в определении «среднего диаметра». При определенных условиях его можно принять за меру распределения ансамбля наночастиц по размерам.
Ранее были описаны различные типы частиц, содержащих нуклеиновую кислоту, которые подходят для доставки нуклеиновой кислоты в форме частиц (например, Kaczmarek, J.C. et al., 2017, Genome Medicine 9, 60). Для невирусных носителей доставки нуклеиновой кислоты инкапсуляция нуклеиновой кислоты в наночастицы физически защищает нуклеиновую кислоту от деградации и, в зависимости от конкретного химического состава, может способствовать клеточному поглощению и эндосомальному выходу.
Настоящее раскрытие описывает частицы, содержащие нуклеиновую кислоту, по меньшей мере один катионный или катионно-ионизируемый липид или липидоподобный материал и/или по меньшей мере один катионный полимер, который связывается с нуклеиновой кислотой с образованием частиц нуклеиновой кислоты и композиций, содержащих такие частицы. Частицы нуклеиновой кислоты могут содержать нуклеиновую кислоту, которая образует комплексы в различных формах за счет нековалентных взаимодействий с частицей. Описанные в данном документе частицы не являются вирусными частицами, в частности, инфекционными вирусными частицами, т.е. они не способны вирусно заражать клетки.
Подходящими катионными или катионно-ионизируемыми липидами или липидоподобными материалами и катионными полимерами являются те, которые образуют частицы нуклеиновой кислоты, и включаются термином «частицеобразующие компоненты» или «частицеобразующие агенты». Термин «частицеобразующие компоненты» или «частицеобразующие агенты» относится к любым компонентам, которые связываются с нуклеиновой кислотой с образованием частиц нуклеиновой кислоты. Такие компоненты включают любой компонент, который может быть частью частиц нуклеиновой кислоты.
Некоторые воплощения, описанные в настоящей заявке, относятся к композициям, способам и применениям, включающим более одного, например, 2, 3, 4, 5, 6 или даже более видов нуклеиновых кислот, таких как виды РНК, например, а) нуклеиновая кислота, содержащая первую нуклеотидную последовательность кодирующая аминокислотную последовательность, содержащую по меньшей мере фрагмент родительского вирусного белка, при этом аминокислотные положения по меньшей мере в фрагменте родительского вирусного белка модифицированы для включения аминокислот, обнаруженных в соответствующих аминокислотных положениях одного или нескольких вариантов вирусных белков; и b) нуклеиновую кислоту, содержащую вторую нуклеотидную последовательность, кодирующую аминокислотную последовательность, содержащую по меньшей мере фрагмент родительского вирусного белка, где положения аминокислот в по меньшей мере одном фрагменте исходного вирусного белка модифицированы для включения аминокислот, обнаруженных в соответствующих аминокислотных положениях одного или нескольких вариантов вирусного белка.
В составе из частиц возможно, что каждый вид нуклеиновой кислоты включается в состав отдельно в виде индивидуального состава из частиц. В этом случае каждый отдельный состав в виде частиц будет содержать один вид нуклеиновой кислоты. Индивидуальные составы из частиц могут присутствовать в виде отдельных объектов, например в отдельных контейнерах. Такие составы можно получить, предоставляя каждый вид нуклеиновой кислоты отдельно (обычно каждый в форме раствора, содержащего нуклеиновую кислоту) вместе с частицеобразующим агентом, тем самым обеспечивая образование частиц. Соответствующие частицы будут содержать исключительно специфические виды нуклеиновых кислот, которые предоставляются при формировании частиц (составы из отдельных частиц).
В некоторых воплощениях композиция, такая как фармацевтическая композиция, содержит более одного состава отдельных частиц. Соответствующие фармацевтические композиции называются составами в виде смешанных частиц. Смешанные составы в виде частиц в соответствии с изобретением могут быть получены путем формирования, раздельно, составов в виде отдельных частиц, как описано выше, с последующей стадией смешивания составов в виде отдельных частиц. На стадии смешивания можно получить состав, содержащий смешанную популяцию частиц, содержащих нуклеиновую кислоту. Совокупности отдельных частиц могут находиться вместе в одном контейнере, включающем смешанную совокупность составов отдельных частиц.
В качестве альтернативы возможно, что разные виды нуклеиновых кислот входят в состав вместе как комбинированный состав из частиц. Такие составы можно получить путем предоставления комбинированного состава (обычно комбинированного раствора) различных видов РНК вместе с частицеобразующим агентом, тем самым обеспечивая образование частиц. В отличие от смешанной композиции из частиц, комбинированная композиция из частиц обычно будет содержать частицы, которые содержат более одного вида РНК. В комбинированной композиции из частиц различные виды РНК обычно присутствуют вместе в одной частице.
Катионные полимерные материалы (например, полимеры)
Учитывая их высокую степень химической гибкости, полимерные материалы обычно используются для доставки на основе наночастиц. Обычно катионные материалы используются для электростатической конденсации отрицательно заряженной нуклеиновой кислоты в наночастицы. Эти положительно заряженные группы часто состоят из аминов, которые изменяют свое состояние протонирования в диапазоне pH от 5,5 до 7,5, что, как считается, приводит к ионному дисбалансу, который приводит к разрыву эндосомы. Полимеры, такие как поли-L-лизин, полиамидоамин, протамин и полиэтиленимин, а также встречающиеся в природе полимеры, такие как хитозан, применялись для доставки нуклеиновых кислот и подходят в качестве катионных материалов, используемых в некоторых воплощениях настоящего изобретения. Кроме того, некоторые исследователи синтезировали полимерные материалы специально для доставки нуклеиновых кислот. Поли(β-аминоэфиры), в частности, получили широкое применение для доставки нуклеиновых кислот благодаря простоте их синтеза и биоразлагаемости. В некоторых воплощениях такие синтетические материалы могут подходить для использования в данном документе в качестве катионных материалов.
Используемый в данном документе термин «полимерный материал» имеет свое обычное значение, то есть молекулярную структуру, включающую одно или несколько повторяющихся звеньев (мономеров), соединенных ковалентными связями. В некоторых воплощениях все такие повторяющиеся единицы могут быть идентичными; альтернативно, в некоторых случаях в полимерном материале может присутствовать более одного типа повторяющихся единиц. В некоторых случаях полимерный материал получают биологическим путем, например биополимер, такой как белок. В некоторых случаях в полимерном материале также могут присутствовать дополнительные фрагменты, например фрагменты направленного действия, такие как описанные в данном документе.
Специалистам в данной области техники известно, что когда в полимере (или полимерной части) присутствует более одного типа повторяющихся единиц, тогда говорят, что полимер (или полимерная часть) является «сополимером». В некоторых воплощениях полимер (или полимерная часть), используемый в соответствии с настоящим изобретением, может представлять собой сополимер. Повторяющиеся звенья, образующие сополимер, могут быть расположены любым образом. Например, в некоторых воплощениях повторяющиеся единицы могут располагаться в случайном порядке; альтернативно или дополнительно, в некоторых воплощениях повторяющиеся единицы могут быть расположены в чередующемся порядке или в виде «блочного» сополимера, т.е. содержащего одну или несколько областей, каждая из которых содержит первое повторяющуюся единицу (например, первый блок) и один или больше областей, каждая из которых содержит вторую повторяющуюся единицу (например, второй блок) и т.д. Блок-сополимеры могут иметь два (диблок-сополимер), три (триблок-сополимер) или большее количество отдельных блоков.
В некоторых воплощениях полимерный материал для использования в соответствии с настоящим изобретением является биосовместимым. Биосовместимые материалы - это материалы, которые обычно не приводят к значительной гибели клеток при умеренных концентрациях. В некоторых воплощениях биосовместимый материал является биоразлагаемым, то есть способен разлагаться химически и/или биологически в физиологической среде, например в организме.
В некоторых воплощениях полимерный материал может представлять собой или содержать протамин или полиалкиленимин, в частности протамин.
Как известно специалистам в данной области техники, термин «протамин» часто используется для обозначения любого из различных сильноосновных белков с относительно низкой молекулярной массой, которые богаты аргинином и которые обнаруживаются связанными главным образом с ДНК вместо соматических гистонов в клетках спермы различных животных (например, рыб). В частности, термин «протамин» часто используется для обозначения белков, содержащихся в сперме рыб, которые являются сильно щелочными, растворимы в воде, не коагулируются при нагревании и при гидролизе дают главным образом аргинин. В очищенном виде они используются в составе инсулина длительного действия и для нейтрализации антикоагулянтного действия гепарина.
В некоторых воплощениях термин «протамин», используемый в настоящей заявке, относится к аминокислотной последовательности протамина, полученной или извлеченной из природных или биологических источников, включая ее фрагменты и/или мультимерные формы указанной аминокислотной последовательности или ее фрагмента, а также (синтезированные) полипептиды, которые являются искусственными и специально разработаны для конкретных целей и не могут быть выделены из природных или биологических источников.
В некоторых воплощениях полиалкиленимин включает полиэтиленимин и/или полипропиленимин, предпочтительно полиэтиленимин. В некоторых воплощениях предпочтительным полиалкиленимином является полиэтиленимин (ПЭИ). В некоторых воплощениях средняя молекулярная масса ПЭИ предпочтительно составляет от 0,75∙102 до 107 Да, предпочтительно от 1000 до 105 Да, более предпочтительно от 10000 до 40000 Да, более предпочтительно от 15000 до 30000 Да, еще более предпочтительно от 20000 до 25000 Да.
Предпочтительным в соответствии с некоторыми воплощениями изобретения является линейный полиалкиленимин, такой как линейный полиэтиленимин (ПЭИ).
Катионные материалы (например, полимерные материалы, включая поликатионные полимеры), рассматриваемые для использования в настоящей заявке, включают те, которые способны электростатически связывать нуклеиновую кислоту. В некоторых воплощениях катионные полимерные материалы, предполагаемые для применения в настоящей заявке, включают любые катионные полимерные материалы, с которыми может быть связана нуклеиновая кислота, например путем образования комплексов с нуклеиновой кислотой или образования везикул, в которые заключена или инкапсулирована нуклеиновая кислота.
В некоторых воплощениях частицы, описанные в настоящей заявке, могут содержать полимеры, отличные от катионных полимеров, например, некатионные полимерные материалы и/или анионные полимерные материалы. В совокупности анионные и нейтральные полимерные материалы называются в данном документе некатионными полимерными материалами.
Липид и липидоподобный материал
Термины «липид» и «липидоподобный материал» используются в данном документе для обозначения молекул, которые содержат одну или несколько гидрофобных частей или групп и необязательно также одну или несколько гидрофильных частей или групп. Молекулы, содержащие гидрофобные фрагменты и гидрофильные фрагменты, также часто обозначают как амфифилы. Липиды обычно плохо растворимы в воде. В водной среде амфифильная природа позволяет молекулам самостоятельно собираться в организованные структуры и различные фазы. Одна из этих фаз состоит из липидных бислоев, поскольку они присутствуют в везикулах, многослойных/однослойных липосомах или мембранах в водной среде. Гидрофильность может придаваться путем включения неполярных групп, которые включают в частности длинноцепочечные насыщенные и ненасыщенные алифатические углеводные группы и такие группы, замещенные одной или несколькими ароматическими, циклоалифатическими или гетероциклическими группами. В некоторых воплощениях гидрофильные группы могут содержать полярные и/или заряженные группы и включать углеводы, фосфаты, карбоксильные, сульфатные, амино-, сульфгидрильные, нитро-, гидроксильные и другие подобные группы.
Используемый в данном документе термин «амфифильный» относится к молекуле, имеющей как полярную часть, так и неполярную часть. Часто амфифильное соединение имеет полярную головку, прикрепленную к длинному гидрофобному хвосту. В некоторых воплощениях полярная часть растворима в воде, тогда как неполярная часть нерастворима в воде. Кроме того, полярная часть может иметь как формальный положительный заряд, так и формальный отрицательный заряд. Альтернативно, полярная часть может иметь как формальный положительный, так и отрицательный заряд и быть цвиттерионом или внутренней солью. Для целей настоящего изобретения амфифильное соединение может представлять собой, помимо прочего, один или несколько природных или неприродных липидов и липидоподобных соединений.
Термин «липидоподобный материал», «липидоподобное соединение» или «липидоподобная молекула» относится к веществам, которые структурно и/или функционально относятся к липидам, но не могут рассматриваться как липиды в строгом смысле. Например, этот термин включает соединения, которые способны образовывать амфифильные слои, поскольку они присутствуют в везикулах, мультиламеллярных/одноламеллярных липосомах или мембранах в водной среде, и включает поверхностно-активные вещества или синтезированные соединения как с гидрофильными, так и с гидрофобными фрагментами. Вообще говоря, этот термин относится к молекулам, которые содержат гидрофильные и гидрофобные фрагменты с различной структурной организацией, которая может быть или не быть похожей на структуру липидов. Используемый в данном документе термин «липид» следует толковать как охватывающий как липиды, так и липидоподобные материалы, если иное не указано в данном документе или явно не противоречит контексту.
Конкретные примеры амфифильных соединений, которые могут быть включены в амфифильный слой, включают, без ограничения указанным, фосфолипиды, аминолипиды и сфинголипиды.
В некоторых воплощениях амфифильное соединение представляет собой липид. Термин «липид» относится к группе органических соединений, которые характеризуются нерастворимостью в воде, но растворимостью во многих органических растворителях. Как правило, липиды можно разделить на восемь категорий: жирные кислоты, глицеролипиды, глицерофосфолипиды, сфинголипиды, сахаролипиды, поликетиды (полученные в результате конденсации кетоацильных субъединиц), стероловые липиды и преноловые липиды (полученные в результате конденсации изопреновых субъединиц). Хотя термин «липид» иногда используется как синоним жиров, жиры представляют собой подгруппу липидов, называемых триглицеридами. Липиды также включают такие молекулы, как жирные кислоты и их производные (включая три-, ди-, моноглицериды и фосфолипиды), а также стеролсодержащие метаболиты, такие как холестерин.
Жирные кислоты или остатки жирных кислот представляют собой разнообразную группу молекул, состоящую из углеводородной цепи, которая заканчивается группой карбоновой кислоты; такое расположение придает молекуле полярный гидрофильный конец и неполярный гидрофобный конец, нерастворимый в воде. Углеродная цепь, обычно длиной от четырех до 24 атомов углерода, может быть насыщенной или ненасыщенной и может быть присоединена к функциональным группам, содержащим кислород, галогены, азот и серу. Если жирная кислота содержит двойную связь, существует возможность цис- или трансгеометрической изомерии, что существенно влияет на конфигурацию молекулы. Цис-двойные связи вызывают изгиб цепи жирной кислоты, эффект, который усугубляется большим количеством двойных связей в цепи. Другими основными классами липидов в категории жирных кислот являются сложные эфиры жирных кислот и амиды жирных кислот.
Глицеролипиды состоят из моно-, ди- и тризамещенных глицеринов, наиболее известными из которых являются триэфиры жирных кислот глицерина, называемые триглицеридами. Слово «триацилглицерин» иногда используется как синоним «триглицерид». В этих соединениях каждая из трех гидроксильных групп глицерина этерифицирована, как правило, разными жирными кислотами. Дополнительные подклассы глицеролипидов представлены гликозилглицеринами, которые характеризуются наличием одного или нескольких остатков сахара, присоединенных к глицерину посредством гликозидной связи.
Глицерофосфолипиды представляют собой амфипатические молекулы (содержащие как гидрофобные, так и гидрофильные области), которые содержат глицериновое ядро, связанное с двумя «хвостами» жирных кислот сложноэфирными связями, и с одной «головной» группой связью сложноэфирной фосфорной кислоты. Примерами глицерофосфолипидов, обычно называемых фосфолипидами (хотя сфингомиелины также классифицируются как фосфолипиды), являются фосфатидилхолин (также известный как PC, GPCho или лецитин), фосфатидилэтаноламин (PE или GPEtn) и фосфатидилсерин (PS или GPSer).
Сфинголипиды представляют собой сложное семейство соединений, которые имеют общий структурный признак - каркас сфингоидного основания. Основное сфингоидное основание у млекопитающих обычно называют сфингозином. Церамиды (N-ацил-сфингоидные основания) представляют собой основной подкласс производных сфингоидных оснований с жирной кислотой, связанной амидной связью. Жирные кислоты обычно являются насыщенными или мононенасыщенными с длиной цепи от 16 до 26 атомов углерода. Основными фосфосфинголипидами млекопитающих являются сфингомиелины (церамидные фосфохолины), в то время как насекомые содержат в основном церамидные фосфоэтаноламины, а грибы имеют фитоцерамидные фосфоинозиты и головные группы, содержащие маннозу. Гликосфинголипиды представляют собой разнообразное семейство молекул, состоящих из одного или нескольких остатков сахара, связанных гликозидной связью со сфингоидным основанием. Их примерами являются простые и сложные гликосфинголипиды, такие как цереброзиды и ганглиозиды.
Стериновые липиды, такие как холестерин и его производные или токоферол и его производные, являются важным компонентом мембранных липидов, наряду с глицерофосфолипидами и сфингомиелинами.
Сахаролипиды представляют собой соединения, в которых жирные кислоты связаны непосредственно с сахарным остовом, образуя структуры, совместимые с бислоями мембран. В сахаролипидах моносахарид заменяет глицериновую основу, присутствующую в глицеролипидов и глицерофосфолипидов. Наиболее известными сахаролипидами являются предшественники ацилированного глюкозамина липида А, компонента липополисахаридов грамотрицательных бактерий. Типичные молекулы липида А представляют собой дисахариды глюкозамина, которые являются производными с семью жирноацильными цепями. Минимальным липополисахаридом, необходимым для роста E. coli, является Kdo2-липид A, гексаацилированный дисахарид глюкозамина, гликозилированный двумя остатками 3-дезокси-D-маннооктулозоновой кислоты (Kdo).
Поликетиды синтезируются путем полимеризации ацетильных и пропионильных субъединиц классическими ферментами, а также итеративными и многомодульными ферментами, которые имеют общие механистические черты с синтазами жирных кислот. Они включают большое количество вторичных метаболитов и натуральных продуктов животного, растительного, бактериального, грибного и морского происхождения и имеют большое структурное разнообразие. Многие поликетиды представляют собой циклические молекулы, остовы которых часто дополнительно модифицируются в результате гликозилирования, метилирования, гидроксилирования, окисления или других процессов.
Согласно раскрытию, липиды и липидоподобные материалы могут быть катионными, анионными или нейтральными. Нейтральные липиды или липидоподобные материалы существуют в незаряженной или нейтральной цвиттерионной форме при выбранном рН.
Катионные или катионно-ионизируемые липиды или липидоподобные материалы
В некоторых воплощениях частицы нуклеиновой кислоты, описанные и/или используемые в соответствии с настоящим изобретением, могут содержать по меньшей мере один катионный или катионно-ионизируемый липид или липидоподобный материал в качестве частицеобразующего агента. Катионные или катионно-ионизируемые липиды или липидоподобные материалы, рассматриваемые для применения в настоящей заявке, включают любые катионоактивные или катионно-ионизируемые липиды или липидоподобные материалы, которые способны электростатически связывать нуклеиновую кислоту. В некоторых воплощениях катионные или катионно-ионизируемые липиды или липидоподобные материалы, рассматриваемые для применения в настоящей заявке, могут быть связаны с нуклеиновой кислотой, например путем образования комплексов с нуклеиновой кислотой или образования везикул, в которые заключена или инкапсулирована нуклеиновая кислота.
Используемый в данном документе термин «катионный липид» или «катионный липидоподобный материал» относится к липиду или липидоподобному материалу, имеющему суммарный положительный заряд. Катионные липиды или липидоподобные материалы связывают отрицательно заряженные нуклеиновые кислоты посредством электростатического взаимодействия. Как правило, катионные липиды обладают липофильным фрагментом, таким как стерол, ацильная цепь, диацильная или несколько ацильных цепей, и головная группа липида обычно несет положительный заряд.
В некоторых воплощениях катионный липид или липидоподобный материал имеет суммарный положительный заряд только при определенном рН, в частности, при кислом рН, в то время как такой липид предпочтительно не имеет суммарного положительного заряда, предпочтительно не имеет заряда, т.е. является нейтральным, при другом, предпочтительно более высоком рН, таком как физиологический рН. Считается, что это ионизируемое поведение повышает эффективность, помогая ускользнуть из эндосомы и снижая токсичность по сравнению с частицами, которые остаются катионными при физиологическом pH.
Для целей настоящего изобретения такие «катионно-ионизируемые» липиды или липидоподобные материалы охватываются термином «катионоактивный липид или липидоподобный материал», если это не противоречит обстоятельствам.
В некоторых воплощениях катионный или катионно-ионизируемый липид или липидоподобный материал содержит головную группу, которая включает по меньшей мере один атом азота (N), который имеет положительный заряд или способен к протонированию.
Примеры катионных липидов включают, без ограничения указанным: ((4-гидроксибутил)азандиил)бис(гексан-6,1-диил)бис(2-гексилдеканоат); 1,2-диолеоил-3-триметиламмонийпропан (DOTAP); N,N-диметил-2,3-диолеилоксипропиламин (DODMA), 1,2-ди-O-октадеценил-3-триметиламмонийпропан (DOTMA), 3-(N-(N',N'-диметиламиноэтан)-карбамоил) холестерин (DC-Chol), диметилдиоктадециламмоний (DDAB); 1,2-диолеоил-3-диметиламмонийпропан (DODAP); 1,2-диацилокси-3-диметиламмонийпропаны; 1,2-диалкилокси-3-диметиламмонийпропаны; хлорид диоктадецилдиметиламмония (DODAC), 1,2-дистеарилокси-N,N-диметил-3-аминопропан (DSDMA), 2,3-ди(тетрадекокси)пропил-(2-гидроксиэтил)диметилазаний (DMRIE), 1,2 -димиристоил-sn-глицеро-3-этилфосфохолин (DMEPC), 1,2-димиристоил-3-триметиламмонийпропан (DMTAP), бромид 1,2-диолеилоксипропил-3-диметилгидроксиэтиламмония (DORIE) и 2,3- диолеоилокси-N-[2(сперминкарбоксамид)этил]-N,N-диметил-1-пропанамия трифторацетат (DOSPA), 1,2-дилинолеилокси-N,N-диметиламинопропан (DLinDMA), 1,2-дилиноленилокси-N, N-диметиламинопропан (DLenDMA), диоктадециламидоглицилспермин (DOGS), 3-диметиламино-2-(холест-5-ен-3-бета-оксибутан-4-окси)-1-(цис,цис-9,12-ок- тадекадиенокси)пропан (CLinDMA), 2-[5'-(холест-5-ен-3-бета-окси)-3'-оксапентокси)-3-диметил-1-(цис,цис-9',12'- октадекадиенокси)пропан (CpLinDMA), N,N-диметил-3,4-диолеилоксибензиламин (DMOBA), 1,2-N,N'-диолеилкарбамил-3-диметиламинопропан (DOcarbDAP), 2,3-дилинолеоилокси-N,N- диметилпропиламин (DLinDAP), 1,2-N,N'-ди линолеилкарбамил-3-диметиламинопропан (DLincarbDAP), 1,2-дилинолеилкарбамил-3-диметиламинопропан (DLinCDAP), 2,2-дилинолеил-4-диметиламинометил-[1,3]-диоксолан (DLin-K-DMA), 2,2 -дилинолеил-4-диметиламиноэтил-[1,3]-диоксолан (DLin-K-XTC2-DMA), 2,2-дилинолеил-4-(2-диметиламиноэтил)-[1,3]-диоксолан (DLin-KC2- DMA), гептатриаконта-6,9,28,31-тетраен-19-ил-4-(диметиламино)бутаноат (DLin-MC3-DMA), N-(2-гидроксиэтил)-N,N-диметил-2,3 -бис(тетрадецилокси)-1-пропанаминия бромид (DMRIE), (±)-N-(3-аминопропил)-N,N-диметил-2,3-бис(цис-9-тетрадеценилокси)-1-пропанаминия бромид (GAP-DMORIE), (±)-N-(3-аминопропил)-N,N-диметил-2,3-бис(додецилокси)-1-пропанаминия бромид (GAP-DDRIE), (±)-N-(3 -аминопропил)-N,N-диметил-2,3-бис(тетрадецилокси)-1-пропанаминия бромид (GAP-DMRIE), N-(2-аминоэтил)-N,N-диметил-2,3-бис(тетрадецилокси) )-1-пропанаминия бромид (βAE-DMRIE), N-(4-карбоксибензил)-N,N-диметил-2,3-бис(олеоилокси)пропан-1-аминий (DOBAQ), 2-({8-[(3β)-холест-5-ен-3-илокси]октил}окси)-N,N-диметил-3-[(9Z,12Z)-октадека-9,12-диен-1-илокси]пропан-1-амин (октил-CLinDMA), 1,2-димиристоил-3-диметиламмоний-пропан (DMDAP), 1 ,2-дипальмитоил-3-диметиламмоний-пропан (DPDAP), N1-[2-((1S)-1-[(3-аминопропил)амино]-4-[ди(3-аминопропил)амино]бутилкарбоксамидо) этил]-3,4-ди[олеилокси]бензамид (MVL5), 1,2-диолеоил-sn-глицеро-3-этилфосфохолин (DOEPC), 2,3-бис(додецилокси)-N-(2-гидроксиэтил) -N,N-диметилпропан-1-аммония бромид (DLRIE), N-(2-аминоэтил)-N,N-диметил-2,3-бис(тетрадецилокси)пропан-1-аминия бромид (DMORIE), ди((Z)-нон-2-ен-1-ил) 8,8'-((((2(диметиламино)этил)тио)карбонил)азандиил)диоктаноат (АТХ), N,N-диметил-2,3-бис (додецилокси)пропан-1-амин (DLDMA), N,N-диметил-2,3-бис(тетрадецилокси)пропан-1-амин (DMDMA), ди((Z)-нон-2-ен-1-ил )-9-((4-(диметиламинобутаноил)окси)гептадекандиоат (L319), N-додецил-3-((2-додецилкарбамоил-этил)-{2-[(2-додецилкарбамоил-этил)-2-{(2 -додецилкарбамоил-этил)-[2-(2-додецилкарбамоил-этиламино)-этил]-амино}-этиламино)пропионамид (липидоид 98N12-5), 1-[2-[бис(2-гидроксидодецил)амино]этил-[2-[4-[2-[бис(2-гидроксидодецил)амино]этил]пиперазин-1-ил]этил] амино]додекан-2-ол (липидоид C12-200); или гептадекан-9-ил 8-((2-гидроксиэтил)(6-оксо-6-(ундецилокси)гексил)амино)октаноат (SM-102).
В некоторых воплощениях катионный липид представляет собой или включает гептадекан-9-ил 8-((2-гидроксиэтил)(6-оксо-6-(ундецилокси)гексил)амино)октаноат (SM-102). В некоторых воплощениях катионный липид представляет собой или содержит катионный липид, показанный в приведенной ниже структуре.
В некоторых воплощениях катионный липид представляет собой или содержит ((4-гидроксибутил)азандиил)бис(гексан-6,1-диил)бис(2-гексилдеканоат), который также упоминается в данном документе как ALC-0315.
В некоторых воплощениях катионный липид может составлять от около 10 мольных % до около 100 мольных %, от около 20 мольных % до около 100 мольных %, от около 30 мольных % до около 100 мольных %, от около 40 мольных % до около 100 мольных %, или от около 50 мольных % до около 100 мольных % от общего количества липидов, присутствующих в частице.
В некоторых конкретных воплощениях частица для применения в соответствии с настоящим изобретением включает ALC-0315, например, в массовых процентах в диапазоне около 40-55 мольных процентов от общего количества липидов.
Дополнительные липиды или липидоподобные материалы
В некоторых воплощениях частицы, описанные в настоящей заявке, содержат (например, в дополнение к катионному липиду, такому как ALC315), один или несколько липидов или липидоподобных материалов, отличных от катионоактивных или катионно-ионизируемых липидов, или липидоподобных материалов, например, некатионоактивных липидов или липидоподобных материалов (включая некатионно ионизируемые липиды или липидоподобные материалы). В совокупности анионные и нейтральные липиды или липидоподобные материалы называются в данном документе некатионными липидами или липидоподобными материалами. Оптимизация состава частиц нуклеиновой кислоты путем добавления других гидрофобных компонентов, таких как холестерин и липиды, в дополнение к ионизируемому/катионному липиду или липидоподобному материалу может повысить стабильность частиц и эффективность доставки нуклеиновой кислоты.
Может быть включен дополнительный липид или липидоподобный материал, который может влиять или не влиять на общий заряд частиц нуклеиновой кислоты. В некоторых воплощениях дополнительный липид или липидоподобный материал представляет собой некатионный липид или липидоподобный материал. Некатионный липид может включать, например, один или несколько анионных липидов и/или нейтральных липидов. Используемый в данном документе термин «анионный липид» относится к любому липиду, который имеет отрицательный заряд при выбранном рН. Используемый в данном документе термин «нейтральный липид» относится к любому из ряда видов липидов, которые существуют либо в незаряженной, либо в нейтральной цвиттер-ионной форме при выбранном рН. В предпочтительных воплощениях дополнительный липид включает один из следующих нейтральных липидных компонентов: (1) фосфолипид, (2) холестерин или его производное; или (3) смесь фосфолипида и холестерина или их производных. Примеры производных холестерина включают, без ограничения указанным, холестанол, холестанон, холестенон, копростанол, холестерил-2'-гидроксиэтиловый эфир, холестерил-4'-гидроксибутиловый эфир, токоферол и их производные, а также их смеси.
Конкретные фосфолипиды, которые можно использовать, включают, без ограничения указанным, фосфатидилхолины, фосфатидилэтаноламины, фосфатидилглицерины, фосфатидные кислоты, фосфатидилсерины или сфингомиелин. Такие фосфолипиды включают, в частности, диацилфосфатидилхолины, такие как дистеароилфосфатидилхолин (DSPC), диолеоилфосфатидилхолин (DOPC), димиристоилфосфатидилхолин (DMPC), дипентадеканоилфосфатидилхолин, дилауроилфосфатидилхолин, дипальмитоилфосфатидилхолин (DPPC), диарахидоилфосфатидилхолин (DAPC), дибегеноилфосфатидилхолин (DBPC), дитрикозаноилфосфатидилхолин (DTPC), дилигноцероилфатидилхолин (DLPC), пальмитоилолеоилфосфатидилхолин (POPC), 1,2-ди-O-октадеценил-sn-глицеро-3-фосфохолин (18:0 диэфир PC), 1-олеоил -2-холестерилгемисукциноил-sn-глицеро-3-фосфохолин (OChemsPC), 1-гексадецил-sn-глицеро-3-фосфохолин (C16 Лизо PC) и фосфатидилэтаноламины, в частности диацилфосфатидилэтаноламины, такие как диолеоилфосфатидилэтаноламин (DOPE), дистеароилфосфатидилэтаноламин (DSPE), дипальмитоилфосфатидилэтаноламин (DPPE), димиристоилфосфатидилэтаноламин (DMPE), дилауроилфосфатидилэтаноламин (DLPE), дифитаноилфосфатидилэтаноламин (DPyPE) и другие липиды фосфатидилэтаноламина с различными гидрофобными цепями.
В некоторых предпочтительных воплощениях дополнительным липидом является DSPC или DSPC и холестерин.
В некоторых воплощениях частицы нуклеиновой кислоты включают как катионный липид, так и дополнительный липид.
В некоторых воплощениях частицы, описанные в настоящей заявке, включают конъюгированный с полимером липид, такой как ПЭГ-илированный липид. Термин «ПЭГ-илированный липид» относится к молекуле, включающей как липидную часть, так и полиэтиленгликолевую часть. Пегилированные липиды известны в данной области. В некоторых воплощениях ПЭГ-илированный липид представляет собой ALC-0159, также упоминаемый в настоящем описании как (2-[(полиэтиленгликоль)-2000]-N,N-дитетрадецилацетамид).
Не желая быть связанными какой-либо теорией, полагаем, что количество по меньшей мере одного катионного липида по сравнению с количеством по меньшей мере одного дополнительного липида может влиять на важные характеристики частиц нуклеиновых кислот, такие как заряд, размер частиц, стабильность, тканевая селективность и биоактивность нуклеиновой кислоты. Соответственно, в некоторых воплощениях молярное отношение по меньшей мере одного катионного липида по меньшей мере к одному дополнительному липиду составляет от около 10: 0 до около 1: 9, от около 4: 1 до около 1: 2 или от около 3: 1 до около 1: 1.
В некоторых воплощениях некатионный липид, в частности нейтральный липид (например, один или несколько фосфолипидов и/или холестерина), может составлять от около 0 мольных % до около 90 мольных %, от около 0 мольных % до около 80 мольных %, от около 0 мольных % до около 70 мольных %, от около 0 мольных % до около 60 мольных % или от около 0 мольных % до около 50 мольных % от общего количества липидов, присутствующих в частице.
В некоторых воплощениях частицы для применения в соответствии с настоящим изобретением могут включать, например, ALC-0315, DSPC, CHOL и ALC-0159, где, например, ALC-0315 составляет от около 40 до 55 мольных процентов; DSPC составляет примерно от 5 до 15 мольных процентов; CHOL составляет от около 30 до 50 мольных процентов; и ALC-0159 составляет от около 1 до 10 мольных процентов.
Частицы липоплекса
В некоторых воплощениях настоящего изобретения РНК может присутствовать в частицах РНК-липоплекса.
В контексте настоящего описания термин «частица липоплекс РНК» относится к частице, которая содержит липид, в частности катионный липид, и РНК. Электростатические взаимодействия между положительно заряженными липосомами и отрицательно заряженной РНК приводят к комплексообразованию и спонтанному образованию частиц РНК-липоплекса. Положительно заряженные липосомы обычно можно синтезировать с использованием катионного липида, такого как DOTMA, и дополнительных липидов, таких как DOPE. В некоторых воплощениях частица РНК-липоплекса представляет собой наночастицу.
В некоторых воплощениях частицы РНК-липоплекса включают как катионный липид, так и дополнительный липид. В иллюстративном воплощении катионный липид представляет собой DOTMA, а дополнительный липид представляет собой DOPE.
В некоторых воплощениях молярное отношение по меньшей мере одного катионного липида к по меньшей мере одному дополнительному липиду составляет от около 10: 0 до около 1: 9, от около 4: 1 до около 1: 2 или от около 3: 1 до около 1: 1. В конкретных воплощениях молярное соотношение может составлять около 3: 1, около 2,75: 1, около 2,5: 1, около 2,25: 1, около 2: 1, около 1,75: 1, около 1,5: 1, около 1,25: 1 или около 1: 1. В примерном воплощении молярное отношение по меньшей мере одного катионного липида по меньшей мере к одному дополнительному липиду составляет около 2:1.
Частицы РНК-липоплекса, описанные в настоящей заявке, имеют средний диаметр, который в некоторых воплощениях находится в диапазоне от около 200 нм до около 1000 нм, от около 200 нм до около 800 нм, от около 250 до около 700 нм, от около 400 до около 600 нм, от около от 300 нм до около 500 нм или от около 350 нм до около 400 нм. В конкретных воплощениях частицы РНК-липоплекса имеют средний диаметр около 200 нм, около 225 нм, около 250 нм, около 275 нм, около 300 нм, около 325 нм, около 350 нм, около 375 нм, около 400 нм, около 425 нм, около 450 нм, около 475 нм, около 500 нм, около 525 нм, около 550 нм, около 575 нм, около 600 нм, около 625 нм, около 650 нм, около 700 нм, около 725 нм, около 750 нм, около 775 нм, около 800 нм, около 825 нм, около 850 нм, около 875 нм, около 900 нм, около 925 нм, около 950 нм, около 975 нм или около 1000 нм. В одном воплощении частицы РНК-липоплекса имеют средний диаметр в диапазоне от около 250 нм до около 700 нм. В другом воплощении частицы РНК-липоплекса имеют средний диаметр в диапазоне от около 300 нм до около 500 нм. В примерном воплощении частицы РНК-липоплекса имеют средний диаметр около 400 нм.
В некоторых воплощениях частицы РНК-липоплекса и/или композиции, содержащие частицы РНК-липоплекса, описанные в настоящей заявке, применимы для доставки РНК в ткань-мишень после парентерального введения, в частности после внутривенного введения. В некоторых воплощениях частицы РНК-липоплекса могут быть получены с использованием липосом, которые могут быть получены инъекцией раствора липидов в этаноле в воду или подходящую водную фазу. В некоторых воплощениях водная фаза имеет кислый рН. В некоторых воплощениях водная фаза содержит уксусную кислоту, например, в количестве около 5 мМ. Липосомы можно использовать для приготовления частиц РНК-липоплекса путем смешивания липосом с РНК. В некоторых воплощениях липосомы и частицы РНК-липоплекса содержат по меньшей мере один катионный липид и по меньшей мере один дополнительный липид. В некоторых воплощениях по меньшей мере один катионный липид включает 1,2-ди-О-октадеценил-3-триметиламмонийпропан (DOTMA) и/или 1,2-диолеоил-3-триметиламмонийпропан (DOTAP). В некоторых воплощениях по меньшей мере один дополнительный липид включает 1,2-ди-(9Z-октадеценоил)-sn-глицеро-3-фосфоэтаноламин (DOPE), холестерин (Chol) и/или 1,2-диолеоил-sn-глицеро-3-фосфохолин (DOPC). В некоторых воплощениях по меньшей мере один катионный липид включает 1,2-ди-О-октадеценил-3-триметиламмонийпропан (DOTMA), а по меньшей мере один дополнительный липид включает 1,2-ди-(9Z-октадеценил)-sn- глицеро-3-фосфоэтаноламин (DOPE). В некоторых воплощениях липосомы и частицы РНК-липоплекса содержат 1,2-ди-O-октадеценил-3-триметиламмонийпропан (DOTMA) и 1,2-ди-(9Z-октадеценил)-sn-глицеро-3-фосфоэтаноламин (DOPE).
Липоплексные частицы РНК, нацеленной на селезенку, описаны в WO 2013/143683, включенном в данный документ ссылкой. Было обнаружено, что частицы РНК-липоплекса, имеющие суммарный отрицательный заряд, могут быть использованы для предпочтительного нацеливания на ткань селезенки или клетки селезенки, такие как антигенпрезентирующие клетки, в частности дендритные клетки. Соответственно, после введения частиц РНК-липоплекса происходит накопление РНК и/или экспрессия РНК в селезенке. Таким образом, частицы РНК-липоплекса по настоящему описанию можно использовать для экспрессии РНК в селезенке. В одном воплощении после введения частиц РНК-липоплекса не происходит или практически не происходит накопления РНК и/или экспрессии РНК в легких и/или печени. В некоторых воплощениях после введения частиц РНК-липоплекса происходит накопление РНК и/или экспрессия РНК в антигенпрезентирующих клетках, таких как профессиональные антигенпрезентирующие клетки в селезенке. Таким образом, липоплексные частицы РНК по настоящему описанию можно использовать для экспрессии РНК в таких антигенпрезентирующих клетках. В некоторых воплощениях антигенпрезентирующие клетки представляют собой дендритные клетки и/или макрофаги.
Липидные наночастицы (ЛНЧ)
В некоторых воплощениях нуклеиновую кислоту, такую как РНК, описанную в настоящей заявке, вводят в форме липидных наночастиц (ЛНЧ). ЛНЧ может содержать любой липид, способный образовывать частицу, к которой присоединены одна или несколько молекул нуклеиновой кислоты или в которую инкапсулированы одна или несколько молекул нуклеиновой кислоты.
В некоторых воплощениях ЛНЧ содержит один или несколько катионных липидов и один или несколько стабилизирующих липидов. Стабилизирующие липиды включают нейтральные липиды и ПЭГ-илированные липиды.
В некоторых воплощениях ЛНЧ включает катионный липид, нейтральный липид, стероид, конъюгированный с полимером липид; и РНК, инкапсулированная внутри липидной наночастицы или связанная с ней.
В некоторых воплощениях ЛНЧ включает от 40 до 55 мольных процентов, от 40 до 50 мольных процентов, от 41 до 49 мольных процентов, от 41 до 48 мольных процентов, от 42 до 48 мольных процентов, от 43 до 48 мольных процентов, от 44 до 48 мольных процентов, от 45 до 48 мольных процентов, от 46 до 48 мольных процентов, от 47 до 48 мольных процентов или от 47,2 до 47,8 мольных процентов катионного липида. В некоторых воплощениях ЛНЧ содержит около 47,0, 47,1, 47,2, 47,3, 47,4, 47,5, 47,6, 47,7, 47,8, 47,9 или 48,0 мольных процентов катионного липида.
В некоторых воплощениях нейтральный липид присутствует в концентрации от 5 до 15 мольных процентов, от 7 до 13 мольных процентов или от 9 до 11 мольных процентов. В некоторых воплощениях нейтральный липид присутствует в концентрации около 9,5, 10 или 10,5 мольных процентов.
В некоторых воплощениях стероид присутствует в концентрации от 30 до 50 мольных процентов, от 35 до 45 мольных процентов или от 38 до 43 мольных процентов. В некоторых воплощениях стероид присутствует в концентрации около 40, 41, 42, 43, 44, 45 или 46 мольных процентов.
В некоторых воплощениях ЛНЧ включает от 1 до 10 мольных процентов, от 1 до 5 мольных процентов или от 1 до 2,5 мольных процентов липида, конъюгированного с полимером.
В некоторых воплощениях ЛНЧ содержит от 40 до 50 мольных процентов катионного липида; от 5 до 15 мольных процентов нейтрального липида; от 35 до 45 мольных процентов стероида; от 1 до 10 мольных процентов полимерконъюгированного липида; и РНК, инкапсулированной внутри липидной наночастицы или связанной с ней.
В некоторых воплощениях молярный процент определяют на основе общего молярного содержания липида, присутствующего в липидной наночастице.
В некоторых воплощениях нейтральный липид выбран из группы, состоящей из DSPC, DPPC, DMPC, DOPC, POPC, DOPE, DOPG, DPPG, POPE, DPPE, DMPE, DSPE и SM. В некоторых воплощениях нейтральный липид выбран из группы, состоящей из DSPC, DPPC, DMPC, DOPC, POPC, DOPE и SM. В некоторых воплощениях нейтральный липид представляет собой DSPC.
В некоторых воплощениях стероид представляет собой холестерин.
В некоторых воплощениях липид, конъюгированный с полимером, представляет собой ПЭГ-илированный липид. В некоторых воплощениях ПЭГ-илированный липид имеет следующую структуру:
или его фармацевтически приемлемая соль, таутомер или стереоизомер, где:
каждый из R12 и R13 независимо представляет собой прямую или разветвленную, насыщенную или ненасыщенную алкильную цепь, содержащую от 10 до 30 атомов углерода, где алкильная цепь необязательно прерывается одной или несколькими сложноэфирными связями; и w имеет среднее значение в диапазоне от 30 до 60. В некоторых воплощениях каждый из R12 и R13 независимо представляет собой прямые насыщенные алкильные цепи, содержащие от 12 до 16 атомов углерода. В некоторых воплощениях w имеет среднее значение в диапазоне от 40 до 55. В некоторых воплощениях среднее значение w составляет около 45. В некоторых воплощениях каждый из R12 и R13 независимо представляет собой прямую насыщенную алкильную цепь, содержащую около 14 атомов углерода, и w имеет среднее значение около 45.
В некоторых воплощениях ПЭГ-илированный липид представляет собой DMG-PEG 2000, например, имеющий следующую структуру:
В некоторых воплощениях катионный липидный компонент ЛНЧ имеет структуру Формулы (III):
или его фармацевтически приемлемая соль, таутомер, пролекарство или стереоизомер, где:
один из L1 или L2 представляет собой -O(C=O)-, -(C=O)O-, -C(=O)-, -O-, -S(O)x-, -S-S-, C(=O)S-, SC(=O)-, -NRaC(=O)-, -C(=O)NRa-, NRaC(=O)NRa, -OC(=O)NRa- или -NRaC(= O)O-, а другой из L1 или L2 представляет собой -O(C=O)-, -(C=O)O-, -C(=O)-, -O-, -S(O)x-, -SS-, -C(=O)S-, SC(=O)-, -NRaC(=O)-, -C(=O)NRa-, NRaC(=O)NRa, -OC(=O )NRa- или -NRaC(=O)O- или прямую связь;
каждый из G1 и G2 независимо представляет собой незамещенный C1-C12 алкилен или C1-C12 алкенилен;
G3 представляет собой C1-C24-алкилен, C1-C24-алкенилен, C3-C8-циклоалкилен, C3-C8-циклоалкенилен;
Ra представляет собой H или C1-C12 алкил;
каждый из R1 и R2 независимо представляют собой C6-C24 алкил или C6-C24 алкенил;
R3 представляет собой H, OR5, CN, C(=O)OR4, OC(=O)R4 или -NR5C(=O)R4;
R4 представляет собой C1-C12 алкил;
R5 представляет собой H или C1-C6 алкил; и
х равно 0, 1 или 2.
В некоторых из приведенных выше воплощений Формулы (III) липид имеет одну из следующих структур (IIIA) или (IIIB):
где:
А представляет собой 3-8-членное циклоалкильное или циклоалкиленовое кольцо;
R6 в каждом случае независимо представляет собой H, OH или C1-C24 алкил;
n представляет собой целое число в диапазоне от 1 до 15.
В некоторых из приведенных выше воплощений формулы (III) липид имеет структуру (IIIA), а в других воплощениях липид имеет структуру (IIIB).
В других воплощениях формулы (III) липид имеет одну из следующих структур (IIIC) или (IIID):
где y и z, каждый независимо, представляют собой целые числа в диапазоне от 1 до 12.
В любом из приведенных выше воплощений формулы (III) один из L1 или L2 представляет собой O(C=O). Например, в некоторых воплощениях каждый из L1 и L2 представляет собой O(C=O). В некоторых различных воплощениях любого из вышеперечисленных L1 и L2, каждый независимо, представляют собой (C=O)O или O(C=O)-. Например, в некоторых воплощениях каждый из L1 и L2 представляет собой (C=O)O.
В некоторых различных воплощениях формулы (III) липид имеет одну из следующих структур (IIIE) или (IIIF):
В некоторых из приведенных выше воплощений формулы (III) липид имеет одну из следующих структур (IIIG), (IIIH), (IIII) или (IIIJ):
В некоторых из приведенных выше воплощений Формулы (III) n представляет собой целое число в диапазоне от 2 до 12, например, от 2 до 8 или от 2 до 4. Например, в некоторых воплощениях n равно 3, 4, 5 или 6. В некоторых воплощениях n равно 3. В некоторых воплощениях n равно 4. В некоторых воплощениях n равно 5. В некоторых воплощениях n равно 6.
В некоторых других из приведенных выше воплощений Формулы (III) каждый из y и z независимо представляет собой целое число в диапазоне от 2 до 10. Например, в некоторых воплощениях каждый из y и z независимо представляет собой целое число в диапазоне от 4 до 9 или от 4 до 6.
В некоторых из предыдущих воплощений формулы (III) R6 представляет собой H. В других из предыдущих воплощений R6 представляет собой C1-C24-алкил. В других воплощениях R6 представляет собой ОН.
В некоторых воплощениях Формулы (III) G3 является незамещенным. В других воплощениях замещен G3. В различных воплощениях G3 представляет собой линейный C1-C24 алкилен или линейный C1-C24 алкенилен.
В некоторых других предшествующих воплощениях формулы (III) R1 или R2, или оба, представляют собой C6-C24 алкенил. Например, в некоторых воплощениях каждый из R1 и R2 независимо имеет следующую структуру:
,
где:
R7a и R7b в каждом случае независимо представляют собой H или C1-C12 алкил; и
а представляет собой целое число от 2 до 12,
где каждый из R7a, R7b и а выбран так, что каждый из R1 и R2 независимо содержит от 6 до 20 атомов углерода. Например, в некоторых воплощениях а представляет собой целое число в диапазоне от 5 до 9 или от 8 до 12.
В некоторых из приведенных выше воплощений формулы (III) по меньшей мере в одном случае R7a представляет собой H. Например, в некоторых воплощениях R7a в каждом случае представляет собой H. В других различных воплощениях вышеизложенного по меньшей мере в одном случае R7b представляет собой C1-C8 алкил. Например, в некоторых воплощениях C1-C8 алкил представляет собой метил, этил, н-пропил, изопропил, н-бутил, изобутил, трет-бутил, н-гексил или н-октил.
В различных воплощениях Формулы (III) R1 или R2 или оба имеют одну из следующих структур:
;
;
;
;
;
;
;
;
;
.
В некоторых из приведенных выше воплощений формулы (III) R3 представляет собой OH, CN, C(=O)OR4, OC(=O)R4 или -NHC(=O)R4. В некоторых воплощениях R4 представляет собой метил или этил.
В различных воплощениях катионный липид формулы (III) имеет одну из структур, представленных в таблице ниже.
Репрезентативные соединения формулы (III).
В некоторых воплощениях ЛНЧ содержит липид формулы (III), РНК, нейтральный липид, стероид и ПЭГ-илированный липид. В некоторых воплощениях липид формулы (III) представляет собой соединение III-3. В некоторых воплощениях нейтральный липид представляет собой DSPC. В некоторых воплощениях стероид представляет собой холестерин. В некоторых воплощениях ПЭГ-илированный липид представляет собой ALC-0159.
В некоторых воплощениях катионный липид присутствует в ЛНЧ в количестве от около 40 до около 50 мольных процентов. В некоторых воплощениях нейтральный липид присутствует в ЛНЧ в количестве от около 5 до около 15 мольных процентов. В некоторых воплощениях стероид присутствует в ЛНЧ в количестве от около 35 до около 45 мольных процентов. В некоторых воплощениях ПЭГ-илированный липид присутствует в ЛНЧ в количестве от около 1 до около 10 мольных процентов.
В некоторых воплощениях ЛНЧ содержит соединение III-3 в количестве от около 40 до около 50 мольных процентов, DSPC в количестве от около 5 до около 15 мольных процентов, холестерин в количестве от около 35 до около 45 мольных процентов и ALC-0159 в количестве от около 1 до около 10 мольных процентов.
В некоторых воплощениях ЛНЧ содержит соединение III-3 в количестве около 47,5 мольных процентов, DSPC в количестве около 10 мольных процентов, холестерин в количестве около 40,7 мольных процентов и ALC-0159 в количестве около 1,8 мольного процента.
В различных воплощениях катионный липид имеет одну из структур, представленных в таблице ниже.
В некоторых воплощениях ЛНЧ содержит катионный липид, показанный в приведенной выше таблице, например, катионный липид формулы (B) или формулы (D), в частности, катионный липид формулы (D), РНК, нейтральный липид, стероид и ПЭГ-илированный липид. В некоторых воплощениях нейтральный липид представляет собой DSPC. В некоторых воплощениях стероид представляет собой холестерин. В некоторых воплощениях ПЭГ-илированный липид представляет собой DMG-PEG 2000.
В некоторых воплощениях ЛНЧ содержит катионный липид, который представляет собой ионизируемый липидоподобный материал (липидоид). В некоторых воплощениях катионный липид имеет следующую структуру:
Значение N/P предпочтительно составляет по меньшей мере около 4. В некоторых воплощениях значение N/P находится в диапазоне от 4 до 20, от 4 до 12, от 4 до 10, от 4 до 8 или от 5 до 7. В некоторых воплощениях значение N/P составляет около 6.
ЛНЧ, описанные в настоящей заявке, могут иметь средний диаметр, который в некоторых воплощениях находится в диапазоне от около 30 нм до около 200 нм или от около 60 нм до около 120 нм.
Фармацевтические композиции
В некоторых воплощениях фармацевтическая композиция содержит полинуклеотид РНК, раскрытый в настоящей заявке, в виде частицы. В некоторых воплощениях частица представляет собой или содержит липидную наночастицу (ЛНЧ) или липоплексную частицу (ЛП).
В некоторых воплощениях описанный в данном документе полинуклеотид РНК можно вводить в составе фармацевтической композиции или лекарственного средства и можно вводить в форме любой подходящей фармацевтической композиции.
В некоторых воплощениях фармацевтическая композиция, описанная в настоящей заявке, представляет собой иммуногенную композицию для индукции иммунного ответа. Например, в некоторых воплощениях иммуногенная композиция представляет собой вакцину.
В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, можно вводить в составе фармацевтической композиции, которая может содержать фармацевтически приемлемый носитель и необязательно может содержать один или несколько адъювантов, стабилизаторов и т.д. В некоторых воплощениях фармацевтическая композиция предназначена для терапевтического или профилактического лечения.
Термин «адъювант» относится к соединению, которое продлевает, усиливает или ускоряет иммунный ответ. Адъюванты включают гетерогенную группу соединений, таких как масляные эмульсии (например, адъюванты Фрейнда), минеральные соединения (такие как квасцы), бактериальные продукты (такие как токсин Bordetella pertussis) или иммуностимулирующие комплексы. Примеры адъювантов включают, без ограничения, LPS, GP96, олигодезоксинуклеотиды CpG, факторы роста и цитокины, такие как монокины, лимфокины, интерлейкины, хемокины. Цитокины могут представлять собой IL1, IL2, IL3, IL4, IL5, IL6, IL7, IL8, IL9, IL10, IL12, IFNα, IFNγ, GM-CSF, LT-α. Другими известными адъювантами являются гидроксид алюминия, адъювант Фрейнда или масло, такое как Montanide® ISA51. Другие подходящие адъюванты для применения в настоящем раскрытии включают липопептиды, такие как Pam3Cys.
Фармацевтические композиции согласно настоящему раскрытию обычно применяют в «фармацевтически эффективном количестве» и в «фармацевтически приемлемом составе».
Термин «фармацевтически приемлемый» относится к нетоксичности материала, который не взаимодействует с действием активного компонента фармацевтической композиции.
Термин «фармацевтически эффективное количество» или «терапевтически эффективное количество» относится к количеству, которое обеспечивает искомую реакцию или искомый эффект отдельно или вместе с дополнительными дозами. В случае лечения конкретного заболевания искомая реакция предпочтительно связана с ингибированием течения заболевания. Это включает замедление прогресса заболевания и, в частности, прекращение или реверсию прогресса заболевания. Искомой реакцией при лечении заболевания также может быть отсрочка начала или предотвращение наступления указанного заболевания или указанного состояния. Эффективное количество описанных в данном документе композиций будет зависеть от состояния, подлежащего лечению, тяжести заболевания, индивидуальных параметров пациента, включая возраст, физиологическое состояние, размер и массу, продолжительность лечения, тип сопутствующей терапии (при наличии), конкретный способ введения и аналогичные факторы. Соответственно, вводимые дозы композиций, описанных в данном документе, могут зависеть от множества таких параметров. В случае когда реакция пациента недостаточна при исходной дозе, могут использоваться более высокие дозы (или эффективно более высокие дозы, достигнутые с помощью другого более точно локализованного пути введения).
В некоторых воплощениях фармацевтическая композиция, раскрытая в настоящей заявке, может содержать соли, буферы, консерванты и, необязательно, другие терапевтические агенты. В некоторых воплощениях фармацевтическая композиция, раскрытая в настоящей заявке, содержит один или несколько фармацевтически приемлемых носителей, разбавителей и/или эксцепиентов.
Подходящие консерванты для применения в фармацевтических композициях по настоящему изобретению включают, без ограничения указанным, хлорид бензалкония, хлорбутанол, парабен и тимеросал.
Используемый в данном документе термин «эксцепиент» относится к веществу, которое может присутствовать в фармацевтической композиции по настоящему изобретению, но не является активным ингредиентом. Примеры эксципиентов включают, без ограничения указанным, носители, связующие, разбавители, смазывающие вещества, загустители, поверхностно-активные агенты, консерванты, стабилизаторы, эмульгаторы, буферы, ароматизаторы или красители.
Термин «разбавитель» относится к разбавляющему и/или разжижающему агенту. Более того, термин «разбавитель» включает любую одну или несколько из жидкости, жидкой или твердой суспензии и/или смешивающей среды. Примеры подходящих разбавителей включают этанол, глицерин и воду.
Термин «носитель» относится к компоненту, который может быть натуральным, синтетическим, органическим, неорганическим, в котором активный компонент объединен для облегчения, усиления или обеспечения возможности введения фармацевтической композиции. Используемый в данном документе носитель может быть одним или несколькими совместимыми твердыми или жидкими наполнителями, разбавителями или инкапсулирующими веществами, которые подходят для введения субъекту. Подходящий носитель включает, без ограничения указанным, стерильную воду, раствор Рингера, лактат Рингера, стерильный раствор хлорида натрия, изотонический солевой раствор, полиалкиленгликоли, гидрогенизированные нафталины и, в частности, биосовместимые полимеры лактида, сополимеры лактида/гликолида или сополимеры полиоксиэтилена/полиоксипропилена. В некоторых воплощениях фармацевтическая композиция по настоящему изобретению включает изотонический солевой раствор.
Фармацевтически приемлемые носители, эксципиенты или разбавители для терапевтического применения хорошо известны в фармацевтике и описаны, например, в Remington's Pharmaceutical Sciences, Mack Publishing Co. (А. R Gennaro edit. 1985).
Фармацевтические носители, эксципиенты или разбавители могут быть выбраны с учетом предполагаемого пути введения и стандартной фармацевтической практики.
В некоторых воплощениях описанную в данном документе фармацевтическую композицию можно вводить внутривенно, внутриартериально, подкожно, внутрикожно или внутримышечно. В некоторых воплощениях фармацевтическая композиция составлена для местного или системного введения. Системное введение может включать энтеральное введение, которое включает абсорбцию через желудочно-кишечный тракт, или парентеральное введение. Используемый в данном документе термин «парентеральное введение» относится к введению любым способом, отличным от желудочно-кишечного тракта, например, путем внутривенной инъекции. В предпочтительном воплощении фармацевтическая композиция составлена для внутримышечного введения. В другом воплощении фармацевтическая композиция составлена для системного введения, например, для внутривенного введения.
Характеризация
В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, характеризуется тем, что при оценке в организме, которому вводят композицию или медицинский препарат, содержащий полинуклеотид РНК, наблюдается повышенная экспрессия полезной нагрузки по сравнению с соответствующим референсным компаратором.
В некоторых воплощениях РНК-полинуклеотид, раскрытый в настоящей заявке, характеризуется тем, что при оценке в организме, которому вводят композицию или медицинский препарат, содержащий РНК-полинуклеотид, наблюдается увеличенная продолжительность экспрессии (например, пролонгированная экспрессия) полезной нагрузки по сравнению с соответствующим референсным компаратором.
В некоторых воплощениях РНК-полинуклеотид, раскрытый в настоящей заявке, характеризуется тем, что при оценке в организме, которому вводили композицию или медицинский препарат, содержащий РНК-полинуклеотид, наблюдается сниженное взаимодействие с IFIT1 РНК-полинуклеотида по сравнению с соответствующим референсным компаратором.
В некоторых воплощениях РНК-полинуклеотид, раскрытый в настоящей заявке, характеризуется тем, что при оценке в организме, которому вводили композицию или медицинский препарат, содержащий РНК-полинуклеотид, наблюдается повышенная трансляция РНК-полинуклеотида по сравнению с соответствующим референсным компаратором.
В некоторых воплощениях референсный препарат сравнения включает организм, которому вводили во всем остальном сходный полинуклеотид РНК без кэпа m7(3'OMeG)(5')ppp(5')(2'OMeA1)pG2. В некоторых воплощениях референсный компаратор включает организм, которому вводили во всем остальном сходный полинуклеотид РНК без проксимальной к кэпу последовательности, описанной в настоящей заявке. В некоторых воплощениях референсный препарат сравнения включает организм, которому вводили во всем остальном сходный полинуклеотид РНК с самогибридизирующейся последовательностью.
В некоторых воплощениях полинуклеотид РНК, раскрытый в настоящей заявке, характеризуется тем, что при оценке в организме, которому вводят композицию или медицинский препарат, содержащий полинуклеотид РНК, наблюдается повышенная экспрессия и увеличенная продолжительность экспрессии (например, пролонгированная экспрессия) полезной нагрузки по сравнению с соответствующий референсным компаратором.
В некоторых воплощениях повышенная экспрессия определяется по меньшей мере через 24 часа, по меньшей мере через 48 часов, по меньшей мере через 72 часа, по меньшей мере через 96 часов или по меньшей мере через 120 часов после введения композиции или медицинского препарата, содержащего полинуклеотид РНК. В некоторых воплощениях повышенная экспрессия определяется по меньшей мере через 24 часа после введения композиции или медицинского препарата, содержащего полинуклеотид РНК. В некоторых воплощениях повышенная экспрессия определяется по меньшей мере через 48 часов после введения композиции или медицинского препарата, содержащего полинуклеотид РНК. В некоторых воплощениях повышенная экспрессия определяется по меньшей мере через 72 часа после введения композиции или медицинского препарата, содержащего полинуклеотид РНК. В некоторых воплощениях повышенная экспрессия определяется по меньшей мере через 96 часов после введения композиции или медицинского препарата, содержащего полинуклеотид РНК. В некоторых воплощениях повышенная экспрессия определяется по меньшей мере через 120 часов после введения композиции или медицинского препарата, содержащего полинуклеотид РНК.
В некоторых воплощениях повышенная экспрессия определяется примерно через 24-120 часов после введения композиции или медицинского препарата, содержащего полинуклеотид РНК. В некоторых воплощениях повышенная экспрессия определяется примерно через около 24-110 часов, около 24-100 часов, около 24-90 часов, около 24-80 часов, около 24-70 часов, около 24-60 часов, около 24-50 часов, около 24-40 часов, около 24-30 часов, около 30-120 часов, около 40-120 часов, около 50-120 часов, около 60-120 часов, около 70-120 часов, около 80-120 часов, около 90-120 часов, около 100-120 часов или около 110-120 часов после введения композиции или медицинского препарата, содержащего полинуклеотид РНК.
В некоторых воплощениях повышенная экспрессия полезной нагрузки составляет по меньшей мере от 2 до по меньшей мере 10 раз. В некоторых воплощениях повышенная экспрессия полезной нагрузки по меньшей мере в 2 раза. В некоторых воплощениях повышенная экспрессия полезной нагрузки по меньшей мере в 3 раза. В некоторых воплощениях повышенная экспрессия полезной нагрузки по меньшей мере в 4 раза. В некоторых воплощениях экспрессия полезной нагрузки повышена по меньшей мере в 6 раз. В некоторых воплощениях экспрессия полезной нагрузки повышена по меньшей мере в 8 раз. В некоторых воплощениях экспрессия полезной нагрузки повышена по меньшей мере в 10 раз.
В некоторых воплощениях повышенная экспрессия полезной нагрузки составляет от около 2 до около 50 раз. В некоторых воплощениях повышенная экспрессия полезной нагрузки составляет от около 2-кратной до около 45-кратной, от около 2-кратной до около 40-кратной, от около 2-кратной до около 30-кратной, от около 2-кратной до около 25-кратной, от около 2-кратной до около 20-кратной, от около 2-кратной до около 15-кратной, от около 2-кратной до около 10-кратной, от около 2-кратной до около 8-кратной, от около 2-кратной до около 5-кратной, от около 5-кратной до около 50-кратной, от около 10-кратной до около 50-кратной, от около 15-кратной до около 50-кратной, от около 20-кратной до около 50-кратной, от около 25-кратной до около 50-кратной, от около 30-кратной до около 50-кратной, от около 40-кратной до около 50-кратной или от около 45-кратной до около 50-кратной.
В некоторых воплощениях повышенная экспрессия (например, увеличенная продолжительность экспрессии) полезной нагрузки сохраняется в течение по меньшей мере 24 часов, по меньшей мере 48 часов, по меньшей мере 72 часов, по меньшей мере 96 часов или по меньшей мере 120 часов после введения композиции или медицинского препарата, содержащего полинуклеотид РНК. В некоторых воплощениях повышенная экспрессия полезной нагрузки сохраняется по меньшей мере в течение 24 часов после введения. В некоторых воплощениях повышенная экспрессия полезной нагрузки сохраняется по меньшей мере в течение 48 часов после введения. В некоторых воплощениях повышенная экспрессия полезной нагрузки сохраняется по меньшей мере в течение 72 часов после введения. В некоторых воплощениях повышенная экспрессия полезной нагрузки сохраняется по меньшей мере в течение 96 часов после введения. В некоторых воплощениях повышенная экспрессия полезной нагрузки сохраняется в течение по меньшей мере 120 часов после введения композиции или медицинского препарата, содержащего полинуклеотид РНК.
В некоторых воплощениях повышенная экспрессия полезной нагрузки сохраняется примерно в течение 24-120 часов после введения композиции или медицинского препарата, содержащего полинуклеотид РНК. В некоторых воплощениях повышенная экспрессия сохраняется в течение около 24-110 часов, около 24-100 часов, около 24-90 часов, около 24-80 часов, около 24-70 часов, около 24-60 часов, около 24-50 часов, около 24-40 часов, около 24-30 часов, около 30-120 часов, около 40-120 часов, около 50-120 часов, около 60-120 часов, около 70-120 часов, около 80-120 часов, около 90 -120 часов, около 100-120 часов или около 110-120 часов после введения композиции или медицинского препарата, содержащего полинуклеотид РНК.
Применения
Среди прочего, в настоящей заявке раскрыты способы получения и способы применения полинуклеотида РНК, содержащего 5'-кэп; 5'-UTR, содержащий проксимальную к кэпу структуру; и последовательность, кодирующая полезную нагрузку.
В некоторых воплощениях в настоящей заявке раскрыта реакция транскрипции in vitro, включающая: (i) ДНК-матрицу, содержащую полинуклеотидную последовательность, комплементарную описанной в настоящей заявке полинуклеотидной последовательности РНК; (ii) полимеразу; и (iii) полинуклеотид РНК. В некоторых воплощениях полимераза представляет собой полимеразу Т7 или включает полимеразу Т7. В некоторых воплощениях реакция дополнительно включает 5’-кэп или аналог 5’-кэпа. В некоторых воплощениях аналог 5’-кэпа представляет собой структуру Cap1 или содержит структуру Cap1. В некоторых воплощениях полинуклеотид РНК содержит кэп, содержащий структуру Cap1; и проксимальную к кэпу последовательность, содержащую положения +1, +2, +3, +4 и +5 полинуклеотида РНК; и последовательность, кодирующая полезную нагрузку. В некоторых воплощениях структура Cap1 содержит m7G(5')ppp(5')(2'OMeN1)pN2, где N1 представляет собой положение +1 полинуклеотида РНК, а N2 представляет собой положение +2 полинуклеотида РНК, и где N1 и N2, каждый независимо выбран из: A, C, G или U.
В некоторых воплощениях в настоящей заявке также раскрыт способ получения кэпированной РНК, включающий транскрипцию матрицы нуклеиновой кислоты в присутствии кэп-структуры, где кэп-структура содержит G*ppp(m12'-O)N1pN2,
где N1 комплементарен положению +1 матрицы нуклеиновой кислоты, а N2 комплементарен положению +2 матрицы нуклеиновой кислоты, и N1 и N2 независимо выбраны из A, C, G или U,
при этом РНК содержит: N3, который комплементарен положению +3 матрицы нуклеиновой кислоты и представляет собой любой нуклеотид, предпочтительно А или С; N4, который комплементарен положению +4 матрицы нуклеиновой кислоты и представляет собой нуклеотид, выбранный из группы, состоящей из A, G и U, предпочтительно T; и N5, который комплементарен положению +5 матрицы нуклеиновой кислоты и представляет собой любой нуклеотид,
где G* имеет следующую структуру:
где представляет собой связь, посредством которой G* связан с первым атомом фосфора группы ppp, R1 представляет собой CH3, R2 представляет собой OH или O-CH3, а R3 представляет собой O-CH3.
В некоторых воплощениях в настоящей заявке раскрыт способ получения полипептида, включающий стадию: предоставления полинуклеотида РНК, который содержит 5'-кэп, проксимальную кэпу последовательность, которая содержит положения +1, +2, +3, +4 и + 5 полинуклеотида РНК и последовательности, кодирующей полезную нагрузку; при этом полинуклеотид РНК характеризуется тем, что при оценке в организме, которому вводят полинуклеотид РНК или композицию, содержащую его, наблюдается повышенная экспрессия и/или повышенная продолжительность экспрессии полезной нагрузки по сравнению с соответствующим референсным компаратором.
В некоторых воплощениях в настоящей заявке раскрыт способ, включающий: введение субъекту фармацевтической композиции, содержащей полинуклеотид РНК, составленный в виде липидной наночастицы (ЛНЧ) или частицы липоплекса (ЛП), описанной в настоящей заявке.
В некоторых воплощениях в настоящей заявке раскрыт способ индукции иммунного ответа у субъекта, включающий введение субъекту фармацевтической композиции, содержащей полинуклеотид РНК, приготовленный в липидной наночастице (ЛНЧ) или частице липоплекса (ЛП), описанной в настоящей заявке.
В некоторых воплощениях в настоящей заявке раскрыт способ вакцинации субъекта, включающий введение субъекту фармацевтической композиции, содержащей полинуклеотид РНК, составленный в виде липидной наночастицы (ЛНЧ) или частицы липоплекса (ЛП), раскрытой в настоящей заявке.
В некоторых воплощениях в настоящей заявке предложен способ уменьшения взаимодействия с IFIT1 полинуклеотида РНК, который содержит 5'-кэп и проксимальную к кэпу последовательность, включающую положения +1, +2, +3, +4 и +5 полинуклеотида РНК, при этом способ включает стадию:
предоставления варианта полинуклеотида РНК, который отличается от исходного полинуклеотида РНК заменой одного или нескольких остатков в проксимальной к кэпу последовательности, и
определения того, что взаимодействие варианта с IFIT1 снижено по сравнению с исходным полинуклеотидом РНК. В некоторых воплощениях определение включает введение полинуклеотида РНК или содержащей его композиции в клетку или организм.
В некоторых воплощениях в настоящей заявке раскрыт способ повышения трансляционной способности полинуклеотида РНК, который содержит 5'-кэп, проксимальную к кэпу последовательность, которая содержит положения +1, +2, +3, +4 и +5 полинуклеотида РНК, и последовательность, кодирующую полезную нагрузку, причем способ включает стадию: получения варианта полинуклеотида РНК, который отличается от исходного полинуклеотида РНК заменой одного или нескольких остатков в проксимальной к кэпу последовательности; и определения того, что экспрессия варианта повышена по сравнению с исходным полинуклеотидом РНК. В некоторых воплощениях определение включает введение полинуклеотида РНК или содержащей его композиции в клетку или организм. В некоторых воплощениях повышенную транслируемость оценивают по повышенной экспрессии и/или постоянству экспрессии полезной нагрузки. В некоторых воплощениях повышенная экспрессия определяется по меньшей мере через 6 часов, по меньшей мере через 24 часа, по меньшей мере через 48 часов, по меньшей мере через 72 часа, по меньшей мере через 96 часов или по меньшей мере через 120 часов после введения. В некоторых воплощениях увеличение экспрессии составляет по меньшей мере от 2 до 10 раз. В некоторых воплощениях увеличение экспрессии составляет примерно от 2 до 50 раз. В некоторых воплощениях повышенная экспрессия сохраняется в течение по меньшей мере 24 часов, по меньшей мере 48 часов, по меньшей мере 72 часов, по меньшей мере 96 часов или по меньшей мере 120 часов после введения.
В некоторых воплощениях в настоящей заявке предлагается терапевтическая РНК, содержащая 5'-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, улучшение, которое включает: включение одного или нескольких из следующих остатков в проксимальную к кэпу последовательность: X в положении +1 полинуклеотида РНК, X в положении +2 полинуклеотида РНК, A в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида РНК и X в положении +5 полинуклеотида РНК, продемонстрировало увеличение экспрессии РНК при введении субъекту в составе ЛНЧ. В некоторых воплощениях X выбран из A, C, G или U.
В некоторых воплощениях в настоящей заявке предлагается терапевтическая РНК, содержащая 5'-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, улучшение, которое включает: включение одного или нескольких из следующих остатков в проксимальную к кэпу последовательность: A в положении +1 полинуклеотида РНК, G в положении +2 полинуклеотида РНК, A в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида РНК и U в положении +5 полинуклеотида РНК, продемонстрировало увеличение экспрессии РНК при введении субъекту в составе ЛНЧ.
В некоторых воплощениях в настоящей заявке предлагается терапевтическая РНК, содержащая 5'-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, улучшение, которое включает: включение одного или нескольких из следующих остатков в проксимальную к кэпу последовательность: X в положении +1 полинуклеотида РНК, X в положении +2 полинуклеотида РНК, C в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида РНК и X в положении +5 полинуклеотида РНК, продемонстрировало увеличение экспрессии РНК при введении субъекту в составе ЛНЧ. В некоторых воплощениях X выбран из A, C, G или U.
В некоторых воплощениях в настоящей заявке предложен способ увеличения трансляции полинуклеотида РНК, содержащего 5'-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, улучшение, которое включает: включение одного или нескольких из следующих остатков в проксимальной к кэпу последовательности: X в положении +1 полинуклеотида РНК, X в положении +2 полинуклеотида РНК, A в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида РНК и X в положении положение +5 полинуклеотида РНК. В некоторых воплощениях X выбран из A, C, G или U.
В некоторых воплощениях в настоящей заявке предложен способ увеличения трансляции полинуклеотида РНК, содержащего 5'-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, улучшение, которое включает: включение одного или нескольких из следующих остатков в проксимальной к кэпу последовательности: A в положении +1 полинуклеотида РНК, G в положении +2 полинуклеотида РНК, A в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида РНК и U в положении положение +5 полинуклеотида РНК.
В некоторых воплощениях в настоящей заявке предложен способ увеличения трансляции полинуклеотида РНК, содержащего 5'-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, улучшение, которое включает: включение одного или нескольких из следующих остатков в проксимальной к кэпу последовательности: X в положении +1 полинуклеотида РНК, X в положении +2 полинуклеотида РНК, C в положении +3 полинуклеотида РНК, A в положении +4 полинуклеотида РНК и X в положении положение +5 полинуклеотида РНК. В некоторых воплощениях X выбран из A, C, G или U.
В некоторых воплощениях любого из раскрытых в данном документе способов у субъекта индуцируется иммунный ответ. В некоторых воплощениях любого из раскрытых в данном документе способов иммунный ответ представляет собой профилактический иммунный ответ или терапевтический иммунный ответ.
В некоторых воплощениях любого из раскрытых в данном документе способов субъектом является млекопитающее.
В некоторых воплощениях любого из раскрытых в данном документе способов субъектом является человек.
В некоторых воплощениях любого из способов, раскрытых в настоящей заявке, у субъекта имеется заболевание или расстройство, раскрытое в настоящей заявке.
В некоторых воплощениях любого из описанных в данном документе способов вакцинация вызывает иммунный ответ на агент. В некоторых воплощениях иммунный ответ представляет собой профилактический иммунный ответ.
В некоторых воплощениях любого из способов, раскрытых в настоящей заявке, у субъекта имеется заболевание или расстройство, раскрытое в настоящей заявке.
В некоторых воплощениях любого из раскрытых в данном документе способов вводят одну дозу фармацевтической композиции.
В некоторых воплощениях любого из описанных в данном документе способов вводят множество доз фармацевтической композиции.
В некоторых воплощениях любого из способов, раскрытых в настоящей заявке, способ дополнительно включает введение одного или нескольких терапевтических средств. В некоторых воплощениях одно или несколько терапевтических средств вводят до, после или одновременно с введением фармацевтической композиции, содержащей полинуклеотид РНК.
В некоторых воплощениях в настоящей заявке также предложен способ получения каркаса для полинуклеотида РНК, который содержит 5’-кэп, проксимальную к кэпу последовательность и последовательность полезной нагрузки, причем способ включает стадию:
оценки по меньшей мере двух вариантов полинуклеотида РНК, где:
каждый вариант включает одинаковый 5’-кэп и последовательность полезной нагрузки; и
варианты отличаются друг от друга одним или несколькими специфическими остатками проксимальной к кэпу последовательности;
при этом оценка включает определение уровней экспрессии и/или продолжительности экспрессии полезной нагрузки; и
выбор по меньшей мере одной комбинации 5’-кэпа и проксимальной к кэпу последовательности, которая демонстрирует повышенную экспрессию по сравнению по меньшей мере с одной другой комбинацией.
В некоторых воплощениях оценка включает введение конструкции РНК или содержащей ее композиции в клетку или организм:
В некоторых воплощениях повышенная экспрессия полезной нагрузки обнаруживается в момент времени по меньшей мере через 6 часов, по меньшей мере через 24 часа, по меньшей мере через 48 часов, по меньшей мере через 72 часа, по меньшей мере через 96 часов или по меньшей мере через 120 часов после введения. В некоторых воплощениях повышенная экспрессия составляет по меньшей мере от 2 до 10 раз. В некоторых воплощениях повышенная экспрессия составляет от около 2 до около 50 раз.
В некоторых воплощениях повышенная экспрессия полезной нагрузки сохраняется в течение по меньшей мере 24 часов, по меньшей мере 48 часов, по меньшей мере 72 часов, по меньшей мере 96 часов или по меньшей мере 120 часов после введения.
В некоторых воплощениях любого из способов, раскрытых в настоящей заявке, полинуклеотид РНК содержит один или несколько признаков полинуклеотида РНК, представленного в настоящей заявке.
В некоторых воплощениях любого из способов, раскрытых в настоящей заявке, композиция, содержащая полинуклеотид РНК, представляет собой фармацевтическую композицию, представленную в настоящей заявке.
ПЕРЕЧИСЛЕННЫЕ ВОПЛОЩЕНИЯ
1. Композиция или медицинский препарат, включающие полинуклеотид РНК, содержащий:
5’-кэп, содержащий структуру Cap1; проксимальную к кэпу последовательность, включающую положения +1, +2, +3, +4 и +5 полинуклеотида РНК; и последовательность, кодирующую полезную нагрузку, где:
(i) структура Cap1 содержит m7G(5')ppp(5')(2'OMeN1)pN2, где N1 представляет собой положение +1 полинуклеотида РНК, а N2 представляет собой положение +2 полинуклеотида РНК, и где N1 и N2 каждый независимо выбран из: A, C, G или U; и
(ii) проксимальная к кэпу последовательность содержит N1 и N2 структуры Cap1, и:
(а) последовательность, выбранную из группы, состоящей из: A3A4X5 (SEQ ID NO: 1); C3A4X5 (SEQ ID NO: 2); A3C4A5 (SEQ ID NO: 3) и A3U4G5 (SEQ ID NO: 4); или
(b) последовательность, включающую: X3Y4X5 (SEQ ID NO: 7);
где каждый из X3 (нуклеотид X в положении +3 в SEQ ID NO: 7) или X5 (нуклеотид X в положении +5 в SEQ ID NO: 1 или SEQ ID NO: 2) независимо выбраны из A, G, C или U; и
где Y4 (нуклеотид Y в положении +4 в SEQ ID NO: 7) не является C.
2. Композиция или медицинский препарат по воплощению 1, отличающиеся тем, что:
(i) положение N1 представляет собой A, а положение N2 представляет собой G, и структура Cap1 включает m7G(5')ppp(5')(2'OMeA1)pG2;
(ii) положение N1 представляет собой A, а положение N2 представляет собой U, и структура Cap1 включает m7G(5')ppp(5')(2'OMeN1)N2; или
(iii) положение N1 представляет собой G, а положение N2 представляет собой G, и структура Cap1 включает m7G(5')ppp(5')(2'OMeG1)pG2.
3. Композиция или медицинский препарат по воплощению 1 или 2, отличающиеся тем, что метилированный гуанозин (m7G) в структуре Cap1 дополнительно содержит одну или несколько модификаций, например, при этом m7G в структуре Cap1 содержит метилированную рибозу.
4. Композиция или медицинский препарат по воплощению 3, отличающиеся тем, что m7G в Cap1 содержит 3’O-метилирование (m7(3’OMeG)).
5. Композиция или медицинский препарат, содержащие полинуклеотид РНК, содержащий: 5’-кэп; проксимальную к кэпу последовательность, содержащую положения +1, +2, +3, +4 и +5 полинуклеотида РНК; и последовательность, кодирующую полезную нагрузку, где:
(i) 5’-кэп включает структуру Cap1, содержащую G*ppp(m12'-O)N1pN2, где:
N1 представляет собой положение +1 полинуклеотида РНК, а N2 представляет собой положение +2 полинуклеотида РНК, и где каждый из N1 и N2 независимо выбран из: A, C, G или U; и
G* включает следующую структуру:
где представляет собой связь, посредством которой G* связан с первым атомом фосфора группы ррр, R1 представляет собой СН3, R2 представляет собой ОН или O-CH3, а R3 представляет собой O-CH3; и
(ii) проксимальная к кэпу последовательность содержит N1 и N2 структуры Cap1, и:
(а) последовательность, выбранную из группы, состоящей из: A3A4X5 (SEQ ID NO: 1); C3A4X5 (SEQ ID NO: 2); A3C4A5 (SEQ ID NO: 3) или A3U4G5 (SEQ ID NO: 4); или
(b) последовательность, включающую X3Y4X5 (SEQ ID NO: 7);
где каждый из X3 (нуклеотид X в положении +3 в SEQ ID NO: 7) или X5 (нуклеотид X в положении +5 в SEQ ID NO: 1 или SEQ ID NO: 2) независимо выбраны из A, G, C или U; и
где Y4 (нуклеотид Y в положении +4 в SEQ ID NO: 7) не является C.
6. Композиция или медицинский препарат по воплощению 5, отличающиеся тем, что:
(i) положение N1 представляет собой A, а положение N2 представляет собой G, и структура Cap1 включает m7G(5')ppp(5')(2'OMeA1)pG2;
(ii) положение N1 представляет собой A, а положение N2 представляет собой U, и структура Cap1 включает m7G(5')ppp(5')(2'OMeN1)N2; или
(iii) положение N1 представляет собой G, а положение N2 представляет собой G, и структура Cap1 включает m7G(5')ppp(5')(2'OMeG1)pG2.
7. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что проксимальная к кэпу последовательность содержит N1 и N2 структуры Cap1, и последовательность, включающую: A3A4X5 (SEQ ID NO: 1), необязательно где X5 представляет собой любой нуклеотид, например, A, C, G или U, предпочтительно U.
8. Композиция или медицинский препарат в соответствии с любым из воплощений 1-6, отличающиеся тем, что проксимальная к кэпу последовательность содержит N1 и N2 структуры Cap1, и последовательность, содержащую C3A4X5 (SEQ ID NO: 2), необязательно где X5 представляет собой любой нуклеотид, например, A, C, G или U.
9. Композиция или медицинский препарат в соответствии с любым из воплощений 1-6, отличающиеся тем, что проксимальная к кэпу последовательность содержит N1 и N2 структуры Cap1, и последовательность, включающую ); X3Y4X5 (SEQ ID NO: 7), где X3 или X5 представляют собой любой нуклеотид, например, A, G, C или U, а Y4 не является C.
10. Композиция или медицинский препарат в соответствии с любым из воплощений 1-6, отличающиеся тем, что проксимальная к кэпу последовательность содержит N1 и N2 структуры Cap1 и последовательность, содержащую A3C4A5 (SEQ ID NO: 3).
11. Композиция или медицинский препарат в соответствии с любым из воплощений 1-6, отличающиеся тем, что проксимальная к кэпу последовательность содержит N1 и N2 структуры Cap1, и последовательность, содержащую A3U4G5 (SEQ ID NO: 4).
12. Композиция или медицинский препарат, включающие полинуклеотид РНК, содержащий:
5’-кэп, содержащий структуру Cap1; проксимальную к кэпу последовательность, включающую положения +1, +2, +3, +4 и +5 полинуклеотида РНК; и последовательность, кодирующую полезную нагрузку, где:
(i) структура Cap1 содержит m7(3'OMeG)(5')ppp(5')(2'OMeA1)pG2, где A1 представляет собой положение +1 полинуклеотида РНК, а G2 представляет собой положение +2 полинуклеотида РНК; и
(ii) проксимальная к кэпу последовательность содержит A1 и G2 структуры Cap1 и последовательность, включающую: A3A4U5 в положениях +3, +4 и +5 соответственно полинуклеотида РНК.
13. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что полинуклеотид РНК содержит 5'-UTR, а проксимальная к кэпу последовательность расположена в 5'-UTR.
14. Композиция или медицинский препарат, содержащие кэпированный полинуклеотид РНК, кодирующий генный продукт, где полинуклеотид РНК имеет формулу:
где R1 представляет собой CH3, R2 представляет собой OH или O-CH3, и R3 представляет собой O-CH3,
где B1 представляет собой любое азотистое основание, предпочтительно А; B2 представляет собой любое азотистое основание, предпочтительно G; B3 представляет собой любое азотистое основание, предпочтительно A или C; B4 представляет собой любое азотистое основание; и B5 представляет собой любое азотистое основание, и
где, когда полинуклеотид РНК вводят субъекту, уровни экспрессии кодируемого генного продукта примерно через 6 часов после введения и примерно через 48 часов после введения не различаются более чем в 5 раз.
15. Композиция или медицинский препарат по воплощению 14, отличающиеся тем, что при введении полинуклеотида РНК субъекту экспрессия генного продукта обнаруживается по меньшей мере через 72 часа после введения.
16. Композиция или медицинский препарат по воплощению 14 или 15, отличающийся тем, что:
полинуклеотид РНК содержит 5'-UTR; и/или
полинуклеотид РНК дополнительно содержит последовательность 3'UTR; и/или последовательность поли-А.
17. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что полинуклеотид РНК не содержит самогибридизирующейся последовательности, при этом самогибридизирующаяся последовательность необязательно представляет собой последовательность, которая может гибридизоваться с последовательностью в 5' UTR или в 3'-конце UTR полинуклеотида РНК, например, где самогибридизирующаяся последовательность представляет собой или содержит SEQ ID NO: 8.
18. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что 5'-UTR содержит 5'-UTR альфа-глобина (hAg) человека или его фрагмент, 5'-UTR TEV или его фрагмент, 5'-UTR HSP70 или его фрагмент, или 5' UTR c-Jun, или его фрагмент.
19. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что 5'-UTR содержит 5'-UTR альфа-глобина человека, представленную в SEQ ID NO: 11, или последовательность, имеющую по меньшей мере 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с ней.
20. Композиция или медицинский препарат в соответствии с любым из воплощений 1-18, отличающиеся тем, что 5'-UTR содержит 5'-UTR альфа-глобина человека, представленную в SEQ ID NO: 12, или последовательность, имеющую по меньшей мере 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с ней.
21. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что 5’-UTR дополнительно содержит последовательность промотора РНК-полимеразы T7.
22. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что 5’-кэп-структура добавлена котранскрипционно или не добавлена ферментативно.
23. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что полинуклеотид РНК содержит 3'-UTR или ее фрагмент, при этом необязательно последовательность 3'-UTR содержит SEQ ID NO: 13 или последовательность, имеющую по меньшей мере 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с ней.
24. Композиция или медицинский препарат в соответствии с любым из воплощений 16-23, отличающиеся тем, что 3’-UTR или ближайшая к ней последовательность содержит сайт рестрикции, необязательно где сайт рестрикции представляет собой сайт BamHI или сайт XhoI.
25. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что последовательность поли-А содержит по меньшей мере 100 нуклеотидов, необязательно при этом:
(i) последовательность поли-А представляет собой прерывистую последовательность адениновых нуклеотидов; и/или
(ii) последовательность поли-А содержит 30 адениновых нуклеотидов, за которыми следуют 70 адениновых нуклеотидов, где 30 адениновых нуклеотидов и 70 адениновых нуклеотидов разделены линкерной последовательностью.
26. Композиция или медицинский препарат по воплощению 25, отличающиеся тем, что последовательность поли-А содержит последовательность SEQ ID NO: 14.
27. Композиция или медицинский препарат в соответствии с любым из воплощений 16-26, отличающиеся тем, что 5'-кэп, 5' UTR, последовательность, кодирующая полезную нагрузку, 3' UTR и полиА-последовательность расположены в ориентации от 5' к 3'.
28. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что полинуклеотид РНК содержит последовательность Козак, расположенную выше последовательности, кодирующей полезную нагрузку.
29. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что последовательность, кодирующая полезную нагрузку, содержит промоторную последовательность, и/или при этом последовательность, кодирующая полезную нагрузку, содержит последовательность, кодирующую секреторный сигнальный пептид.
30. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что полинуклеотид РНК содержит последовательность, кодирующую полезную нагрузку, выбранную из: полипептида заместительного белка; антительного агента; цитокина; антигенного полипептида; компонента редактирования генов; компонента регенеративной медицины или их комбинаций.
31. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, характеризуется тем, что при оценке в организме, которому вводят композицию или медицинский препарат, содержащий полинуклеотид РНК, наблюдается повышенная экспрессия и/или повышенная продолжительность экспрессии полезной нагрузки по сравнению с соответствующим референсным компаратором.
32. Композиция или медицинский препарат по воплощению 30, отличающиеся тем, что полезная нагрузка представляет собой или содержит полипептид заместительного белка, необязательно при этом:
полипептид заместительного белка включает полипептид с аберрантной экспрессией при заболевании или нарушении;
полипептид заместительного белка включает внутриклеточный белок, внеклеточный белок или трансмембранный белок; и/или
полипептид заместительного белка содержит фермент.
33. Композиция или медицинский препарат по воплощению 32, отличающиеся тем, что заболевание или нарушение с аберрантной экспрессией полипептида включает, без ограничения указанным: редкое заболевание, нарушение обмена веществ, мышечную дистрофию, сердечно-сосудистое заболевание или моногенное заболевание.
34. Композиция или медицинский препарат по воплощению 30, отличающиеся тем, что полезная нагрузка представляет собой или содержит агент антитело, необязательно при этом антительный агент связывается с полипептидом, экспрессируемым на клетке.
35. Композиция или медицинский препарат по воплощению 34, отличающиеся тем, что антительный агент содержит антитело к CD3, антитело к клаудину 6 или их комбинацию.
36. Композиция или медицинский препарат по воплощению 30, отличающиеся тем, что полезная нагрузка представляет собой или содержит цитокин, или его фрагмент, или вариант, при этом цитокин, необязательно, содержит: IL-12 или его фрагмент или вариант или гибрид, IL-15 или его фрагмент или вариант или гибрид, GMCSF или его фрагмент или вариант; или IFN-альфа или его фрагмент или вариант.
37. Композиция или медицинский препарат по воплощению 30, отличающиеся тем, что полезная нагрузка представляет собой или содержит антигенный полипептид, или его иммуногенный вариант или иммуногенный фрагмент, при этом антигенный полипептид необязательно содержит один эпитоп из антигена или множество различных эпитопов из антигена.
38. Композиция или медицинский препарат по воплощению 37, отличающиеся тем, что антигенный полипептид, содержащий множество различных эпитопов антигена, является полиэпитопным.
39. Композиция или медицинский препарат по воплощению 37 или 38, отличающиеся тем, что антигенный полипептид содержит: антигенный полипептид из аллергена, вирусный антигенный полипептид, бактериальный антигенный полипептид, грибной антигенный полипептид, паразитарный антигенный полипептид, антигенный полипептид из инфекционного агента, антигенный полипептид патогена, опухолевый антигенный полипептид или аутоантигенный полипептид.
40. Композиция или медицинский препарат по воплощению 39, отличающиеся тем, что вирусный антигенный полипептид содержит антигенный полипептид ВИЧ, антигенный полипептид гриппа, антигенный полипептид коронавируса, антигенный полипептид бешенства или антигенный полипептид вируса Зика, необязательно где вирусный антигенный полипептид представляет собой или содержит антигенный полипептид коронавируса.
41. Композиция или медицинский препарат по воплощению 40, отличающиеся тем, что антиген коронавируса представляет собой или содержит белок SARS-CoV-2, необязательно при этом белок SARS-CoV-2 содержит спайк (S) белок SARS-CoV-2 или его иммуногенный вариант или иммуногенный фрагмент.
42. Композиция или медицинский препарат по воплощению 41, отличающиеся тем, что белок SARS-CoV-2, или его иммуногенный вариант или иммуногенный фрагмент содержит остатки пролина в положениях 986 и 987.
43. Композиция или медицинский препарат по воплощению 41 или 42, отличающиеся тем, что S-полипептид SARS-CoV-2:
(i) имеет по меньшей мере 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с SEQ ID NO: 9; или
(ii) кодируется РНК, имеющей по меньшей мере 99%, 98%, 97%, 96%, 95%, 90%, 85% или 80% идентичности с SEQ ID NO: 10.
44. Композиция или медицинский препарат по воплощению 30, отличающиеся тем, что полезная нагрузка представляет собой или содержит полипептид опухолевого антигена, или его иммуногенный вариант, или его иммуногенный фрагмент, необязательно при этом полипептид опухолевого антигена содержит опухолеспецифический антиген, опухолеассоциированный антиген, опухолевый неоантиген, или их комбинацию.
45. Композиция или медицинский препарат по воплощению 43 или 44, отличающиеся тем, что опухолевый антигенный полипептид содержит p53, ART-4, BAGE, ss-катенин/m, Bcr-abL CAMEL, CAP-1, CASP-8, CDC27/m, CDK4/ m, CEA, CLAUDIN-12, c-MYC, CT, Cyp-B, DAM, ELF2M, ETV6-AML1, G250, GAGE, GnT-V, Gap100, HAGE, HER-2/neu, HPV-E7, HPV- E6, HAST-2, hTERT (или hTRT), LAGE, LDLR/FUT, MAGE-A, предпочтительно MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A5, MAGE-A6, MAGE-A7, MAGE-A8, MAGE-A9, MAGE-A10, MAGE-A11 или MAGE-A12, MAGE-B, MAGE-C, MART-1/Melan-A, MC1R, Миозин/m, MUC1, MUM-1, -2, -3, NA88-A, NF1, NY-ESO-1, NY-BR-1, минорный p190 BCR-abL, Plac-1, Pm1/RARa, PRAME, протеиназу 3, ПСА, PSM, RAGE, RU1 или RU2, SAGE, SART-1 или SART-3, SCGB3A2, SCP1, SCP2, SCP3, SSX, SURVIVIN, TEL/AML1, TPI/m, TRP-1, TRP-2, TRP-2/INT2, TPTE, WT, WT-1 или их комбинацию.
46. Композиция или медицинский препарат по любому из воплощений 44-45, отличающиеся тем, что полипептид опухолевого антигена содержит опухолевый антиген из карциномы, саркомы, меланомы, лимфомы, лейкоза или их комбинации.
47. Композиция или медицинский препарат по воплощению 46, отличающиеся тем, что полипептид опухолевого антигена содержит: опухолевый антиген меланомы; антиген рака предстательной железы; антиген рака головы и шеи, положительного по HPV16; антиген рака молочной железы; антиген рака яичников; антиген рака легкого, например, антиген НМРЛ.
48. Композиция или медицинский препарат по воплощению 39, отличающиеся тем, что полезная нагрузка представляет собой или содержит аутоантигенный полипептид, или его иммуногенный вариант, или его иммуногенный фрагмент, при этом необязательно, при этом аутоантигенный полипептид содержит антиген, который обычно экспрессируется на клетках и распознается как аутоантиген иммунной системой.
49. Композиция или медицинский препарат по воплощению 48, отличающиеся тем, что аутоантигенный полипептид содержит: антигенный полипептид рассеянного склероза, антигенный полипептид ревматоидного артрита, антигенный полипептид волчанки, антигенный полипептид глютеновой болезни, антигенный полипептид синдрома Шегрена или антигенный полипептид анкилозирующего спондилита или их комбинацию.
50. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что полинуклеотид РНК содержит модифицированный нуклеозид вместо уридина, причем модифицированный нуклеозид необязательно выбран из псевдоуридина (Ψ), N1-метил-псевдоуридина (m1Ψ) и 5 -метил-уридина (m5U).
51. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, отличающиеся тем, что полинуклеотид РНК дополнительно содержит одну или несколько дополнительных последовательностей, например, одну или несколько дополнительных полезных нагрузок, и/или один или несколько регуляторных элементов.
52. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, характеризуется тем, что полинуклеотид РНК отличается тем, что при введении в организм он повышает эффективность трансляции полезной нагрузки по сравнению с введением во всем остальном сходного полинуклеотида РНК без кэпа m7(3'OMeG)(5')ppp(5')(2'OMeA1)pG2.
53. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, характеризуется тем, что полинуклеотид РНК характеризуется тем, что при введении в организм он увеличивает уровень экспрессии и/или продолжительность экспрессии кодируемой полезной нагрузки по сравнению с введением во всем остальном сходного полинуклеотида РНК без кэпа m7(3'OMeG)(5')ppp(5')(2'OMeA1)pG2, без проксимальной к кэпу последовательности, описанной в настоящей заявке, и/или с самогибридизирующейся последовательностью, необязательно где:
(i) повышенная экспрессия определяется по меньшей мере через 6 часов, по меньшей мере через 24 часа, по меньшей мере через 48 часов, по меньшей мере через 72 часа, по меньшей мере через 96 часов или по меньшей мере через 120 часов после введения, необязательно при этом повышение экспрессии является по меньшей мере 2-10-кратным; или
(ii) повышенная экспрессия сохраняется в течение по меньшей мере 24 часов, по меньшей мере 48 часов, по меньшей мере 72 часов, по меньшей мере 96 часов или по меньшей мере 120 часов.
54. Композиция или медицинский препарат в соответствии с любым из предыдущих воплощений, где РНК составлена или должна быть составлена в виде жидкости, твердого вещества или их комбинации; где РНК составлена или должна быть составлена для инъекции; или где РНК составлена или должна быть составлена для внутримышечного введения.
55. Фармацевтическая композиция, содержащая полинуклеотид РНК по любому из предыдущих воплощений, составленная в виде частицы, необязательно где частица представляет собой или содержит липидную наночастицу (ЛНЧ) или липоплексную (ЛП) частицу.
56. Фармацевтическая композиция по воплощению 55, отличающаяся тем, что липидная наночастица содержит каждое из следующего: катионный липид; стерол; нейтральный липид; и липидный конъюгат.
57. Фармацевтическая композиция по воплощению 56, отличающаяся тем, что катионный липид представляет собой или содержит ((4-гидроксибутил)азандиил)бис(гексан-6,1-диил)бис(2-гексилдеканоат), стерол представляет собой холестерин, нейтральный липид представляет собой или содержит фосфолипид, а липидный конъюгат представляет собой или содержит полиэтиленгликоль (ПЭГ)-липид.
58. Фармацевтическая композиция по воплощению 57, отличающаяся тем, что фосфолипид представляет собой или содержит дистеароилфосфатидилхолин (DSPC).
59. Фармацевтическая композиция по воплощению 57, отличающаяся тем, что (ПЭГ)-липид представляет собой или содержит 2-[(полиэтиленгликоль)-2000]-N,N-дитетрадецилацетамид.
60. Фармацевтическая композиция по любому из воплощений 56-58, отличающаяся тем, что липидная наночастица содержит каждый из: a. ((4-гидроксибутил)азандиил)бис(гексан-6,1-диил)бис(2-гексилдеканоат); b. холестерин; c. дистеароилфосфатидилхолин (DSPC); и d. 2-[(полиэтиленгликоль)-2000]-N,N-дитетрадецилацетамид.
61. Фармацевтическая композиция по любому из воплощений 56-60, отличающаяся тем, что:
нейтральный липид присутствует в концентрации от 5 до 15 мольных процентов от общего количества липидов;
катионно-ионизируемый липид присутствует в концентрации от 40 до 55 мольных процентов от общего количества липидов;
стероид присутствует в концентрации от 30 до 50 мольных процентов от общего количества липидов; и/или
ПЭГ-илированный липид присутствует в концентрации от 1 до 10 мольных процентов от общего количества липидов.
62. Фармацевтическая композиция по любому из воплощений 56-61, отличающаяся тем, что липидная наночастица содержит от 40 до 55 мольных процентов катионно-ионизируемого липида; от 5 до 15 мольных процентов нейтрального липида; от 30 до 50 мольных процентов стероида; и от 1 до 10 мольных процентов ПЭГилированного липида.
62. Фармацевтическая композиция по воплощению 55, отличающаяся тем, что частицу РНК-липоплекса можно получить путем смешивания полинуклеотида РНК с липосомами.
63. Композиция или медицинский препарат по любому из воплощений 1-54 или фармацевтическая композиция по любому из воплощений 55-62, отличающиеся тем, что РНК представляет собой мРНК или маРНК.
64. Фармацевтическая композиция по любому из воплощений 55-63, отличающаяся тем, что фармацевтическая композиция дополнительно содержит один или несколько фармацевтически приемлемых носителей, разбавителей и/или эксцепиентов.
65. Фармацевтическая композиция по любому из воплощений 55-64, которая упакована в виде набора, при этом набор дополнительно содержит инструкции по применению указанной фармацевтической композиции для индукции иммунного ответа у субъекта.
66. Способ производства фармацевтической композиции по любому из воплощений 55-64 путем объединения полинуклеотида РНК с липидами с образованием липидных наночастиц, которые инкапсулируют указанную РНК.
67. Матричная нуклеиновая кислота, подходящая для получения РНК, кэпированной cap1, в которой первые пять нуклеотидов, транскрибированные с матричной цепи матричной нуклеиновой кислоты, содержат последовательность N1pN2pN3pN4pN5, где N1 представляет собой любой нуклеотид, предпочтительно Т; N2 представляет собой любой нуклеотид, предпочтительно С; N3 представляет собой любой нуклеотид, предпочтительно T или G; N4 представляет собой любой нуклеотид; и N5 представляет собой любой нуклеотид.
68. Матричная нуклеиновая кислота по воплощению 67, отличающаяся тем, что матрица ДНК содержит: 5’ UTR, последовательность, кодирующую полезную нагрузку, 3’ UTR и последовательность поли-А.
69. Реакция транскрипции in vitro, включающая:
(i) ДНК-матрицу, содержащую полинуклеотидную последовательность, комплементарную полинуклеотидной последовательности РНК, представленной в любом из воплощений 1-54;
(ii) полимеразу (например, полимеразу Т7); и
(iii) полинуклеотид РНК.
70. Реакция транскрипции in vitro по воплощению 69, дополнительно включающая 5’-кэп или аналог 5’-кэпа, необязательно где 5’-кэп или аналог 5’-кэпа представляет собой или содержит структуру Cap1.
71. Реакция транскрипции in vitro по воплощению 69, отличающаяся тем, что полинуклеотид РНК содержит кэп, содержащий структуру Cap1; и проксимальную к кэпу последовательность, содержащую положения +1, +2, +3, +4 и +5 полинуклеотида РНК; и последовательность, кодирующую полезную нагрузку, при этом структура Cap1 необязательно содержит m7G(5')ppp(5')(2'OMeN1)pN2, где N1 представляет собой положение +1 полинуклеотида РНК, а N2 представляет собой положение +2 полинуклеотида РНК, и где каждый из N1 и N2 независимо выбран из: A, C, G или U.
72. Полинуклеотид РНК, выделенный в результате реакции транскрипции in vitro, представленный в любом из воплощений 69-71.
73. Способ получения кэпированной РНК, включающий транскрипцию матричной нуклеиновой кислоты в присутствии кэп-структуры, где кэп-структура содержит G*ppp(m12'-O)N1pN2,
где N1 комплементарен положению +1 матричной нуклеиновой кислоты, а N2 комплементарен положению +2 матричной нуклеиновой кислоты, и N1 и N2 независимо выбраны из A, C, G или U,
где положение +3 матричной нуклеиновой кислоты представляет собой любой нуклеотид, предпочтительно T или G; положение +4 матричной нуклеиновой кислоты представляет собой любой нуклеотид; и положение +5 матричной нуклеиновой кислоты представляет собой любой нуклеотид,
где G* имеет следующую структуру:
где представляет собой связь, посредством которой G* связан с первым атомом фосфора группы ppp, R1 представляет собой CH3, R2 представляет собой OH или O-CH3, а R3 представляет собой O-CH3.
74. Композиция, содержащая полинуклеотид ДНК, содержащий последовательность, комплементарную последовательности полинуклеотида РНК, представленную в любом из воплощений 1-54.
75. Композиция ДНК-полинуклеотида по воплощению 74, которую можно использовать для транскрипции полинуклеотида РНК и/или которая расположена в векторе.
76. Способ, включающий:
введение субъекту фармацевтической композиции, содержащей полинуклеотид РНК, составленной в виде липидной наночастицы (ЛНЧ) или частицы липоплекса (ЛП) по любому из воплощений 55-64.
77. Способ индукции иммунного ответа у субъекта, включающий введение субъекту фармацевтической композиции, содержащей полинуклеотид РНК, составленный в виде липидной наночастицы (ЛНЧ) или частицы липоплекса (ЛП) по любому из воплощений 55-64.
78. Способ по воплощению 77, отличающийся тем, что у субъекта индуцируют иммунный ответ, необязательно при этом иммунный ответ представляет собой профилактический иммунный ответ или терапевтический иммунный ответ.
79. Способ вакцинации субъекта путем введения фармацевтической композиции, содержащей полинуклеотид РНК, входящий в состав липидной наночастицы (ЛНЧ) или частицы липоплекса (ЛП) по любому из воплощений 55-64.
80. Способ по воплощению 79, вакцинация вызывает иммунный ответ, при этом иммунный ответ необязательно представляет собой профилактический иммунный ответ.
81. Способ уменьшения взаимодействия с IFIT1 полинуклеотида РНК, который содержит 5'-кэп и проксимальную к кэпу последовательность, включающую положения +1, +2, +3, +4 и +5 полинуклеотида РНК, причем способ включает стадию:
предоставление варианта полинуклеотида РНК, который отличается от исходного полинуклеотида РНК заменой одного или нескольких остатков в проксимальной к кэпу последовательности, и
определение того, что взаимодействие варианта с IFIT1 снижено по сравнению с исходным полинуклеотидом РНК, при этом определение необязательно включает введение полинуклеотида РНК или композиции, содержащей его, в клетку или организм.
82. Способ получения полипептида, включающий стадию:
предоставление полинуклеотида РНК, который содержит 5'-кэп, проксимальную к кэпу последовательность, которая содержит положения +1, +2, +3, +4 и +5 полинуклеотида РНК, и последовательность, кодирующую полезную нагрузку;
при этом полинуклеотид РНК характеризуется тем, что при оценке в организме, которому вводят полинуклеотид РНК или композицию, содержащую его, наблюдается повышенная экспрессия и/или повышенная продолжительность экспрессии полезной нагрузки по сравнению с соответствующим референсным компаратором.
83. Способ повышения трансляционности полинуклеотида РНК, который содержит 5'-кэп, проксимальную к кэпу последовательность, которая содержит положения +1, +2, +3, +4 и +5 полинуклеотида РНК, и последовательность, кодирующую полезную нагрузку, который включает стадию:
предоставления варианта полинуклеотида РНК, который отличается от исходного полинуклеотида РНК заменой одного или нескольких остатков в проксимальной к кэпу последовательности; и
определения того, что экспрессия варианта повышена по сравнению с исходным полинуклеотидом РНК, при этом определение необязательно включает введение полинуклеотида РНК или композиции, содержащей его, в клетку или организм.
84. Способ по воплощению 83, отличающийся тем, что повышенную транслируемость оценивают по повышенной экспрессии и/или постоянству экспрессии полезной нагрузки.
85. Способ по воплощению 84, отличающийся тем, что:
(i) повышенная экспрессия определяется по меньшей мере через 6 часов, по меньшей мере через 24 часа, по меньшей мере через 48 часов, по меньшей мере через 72 часа, по меньшей мере через 96 часов или по меньшей мере через 120 часов после введения, необязательно при этом повышение экспрессии является по меньшей мере 2-10-кратным; или
(ii) повышенная экспрессия сохраняется в течение по меньшей мере 24 часов, по меньшей мере 48 часов, по меньшей мере 72 часов, по меньшей мере 96 часов или по меньшей мере 120 часов.
86. В терапевтической РНК, содержащей 5’-кэп, который включает структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, где улучшение включает:
один или несколько из следующих остатков в проксимальной к кэпу последовательности: А в положении +1 полинуклеотида РНК, G в положении +2 полинуклеотида РНК, А в положении +3 полинуклеотида РНК, А в положении +4 полинуклеотида РНК и U в положении +5 полинуклеотида РНК,
продемонстрировано увеличение экспрессии РНК при введении субъекту в составе ЛНЧ.
87. Способ увеличения трансляции полинуклеотида РНК, содержащего 5'-кэп, включающий структуру Cap1, проксимальную к кэпу последовательность и последовательность, кодирующую полезную нагрузку, где улучшение включает:
один или несколько из следующих остатков в проксимальной к кэпу последовательности: А в положении +1 полинуклеотида РНК, G в положении +2 полинуклеотида РНК, А в положении +3 полинуклеотида РНК, А в положении +4 полинуклеотида полинуклеотид РНК и U в положении +5 полинуклеотида РНК.
88. Способ по любому из воплощений 76-87, отличающийся тем, что вводят одну дозу или множество доз фармацевтической композиции.
89. Способ по любому из воплощений 76-88, отличающийся тем, что способ дополнительно включает введение одного или нескольких терапевтических средств.
90. Способ по воплощению 89, отличающийся тем, что одно или несколько терапевтических средств вводят до, после или одновременно с введением фармацевтической композиции, содержащей полинуклеотид РНК.
91. Способ по любому из воплощений 76-90, отличающийся тем, что субъект или организм представляет собой млекопитающее.
92. Способ по воплощению 91, отличающийся тем, что субъект или организм представляет собой человека.
93. Способ по любому из воплощений 76-93, отличающийся тем, что субъект страдает заболеванием или нарушением, описанным в настоящей заявке.
94. Способ получения каркаса для полинуклеотида РНК, который содержит 5'-кэп, проксимальную к кэпу последовательность и последовательность полезной нагрузки, причем способ включает стадию:
оценки по меньшей мере двух вариантов полинуклеотида РНК, где:
каждый вариант включает одинаковый 5’-кэп и последовательность полезной нагрузки; и
варианты отличаются друг от друга одним или несколькими специфическими остатками проксимальной к кэпу последовательности;
при этом оценка включает определение уровней экспрессии и/или продолжительности экспрессии последовательности полезной нагрузки; и
выбор по меньшей мере одной комбинации 5’-кэпа и проксимальной к кэпу последовательности кэпа, которая демонстрирует повышенную экспрессию по сравнению по меньшей мере с одной другой комбинацией.
95. Способ по воплощению 94, отличающийся тем, что оценка включает введение конструкции РНК или содержащей ее композиции в клетку или организм:
96. Способ по воплощению 94 или 95, отличающийся тем, что:
повышенная экспрессия обнаруживается в момент времени не менее чем через 6 часов, не менее чем через 24 часа, не менее чем через 48 часов, не менее чем через 72 часа, не менее чем через 96 часов или не менее чем через 120 часов после введения, необязательно, при этом повышенная экспрессия является по меньшей мере 2-10-кратной; и/или
повышенная экспрессия сохраняется не менее 24 часов, не менее 48 часов, не менее 72 часов, не менее 96 часов или не менее 120 часов.
97. Способ по любому из воплощений 76-96, отличающийся тем, что полинуклеотид РНК содержит один или несколько признаков полинуклеотида РНК, представленного в любом из воплощений 1-54.
98. Способ по любому из воплощений 76-97, отличающийся тем, что композиция содержит фармацевтическую композицию по любому из воплощений 55-64.
ПРИМЕР
Пример 1. Создание кассеты РНК, которая обеспечивает улучшенную и устойчивую экспрессию кодируемого белка.
В настоящем примере описано получение кассет РНК с улучшенным уровнем экспрессии кодируемой полезной нагрузки и/или увеличенной продолжительностью экспрессии кодированной полезной нагрузки in vivo. Способы, использованные в этом примере, описаны ниже.
Способы:
Получение мРНК
В качестве матриц использовали очищенные плазмиды, кодирующие кодон-оптимизированный мышиный эритропоэтин (mEPO). Плазмиды, соответствующие последовательностям 5'-нетранслируемой области 5'-лидерной РНК (TEV) вируса гравировки табака или мРНК α-глобина человека (hAg), линеаризовали с помощью BspQI (New England Biolabs, Кат. № R0712L) для создания матриц. Набор РНК-полимеразы MEGAscript T7 (Thermo Fisher Scientific, Кат. № AMB1334-5) использовали для транскрипции, а UTP заменили на N1-метилпсевдоуридин (m1Ψ) 5’-трифосфат (TriLink, Кат. № N-1081). Кэпирование мРНК выполняли котранскрипционно с использованием антиреверсивного аналога Cap1 CleanCap413 (TriLink, Кат. № N-7413) в конечной концентрации 3 мМ. Для получения желаемых транскриптов, созданными с аналогами кэпа, начальную концентрацию GTP в реакции транскрипции снижали с 7,5 мМ до 1,5 мМ и инкубировали при 37°C в течение 30 мин в камере для гибридизации. Начальная концентрация дополнительных нуклеотидов, включая ATP, CTP и m1ΨTP, соответствовала конечной концентрации 7,5 мМ. Добавление дополнительных 1,5 мМ GTP к смеси требовалось через 30, 60, 90 и 120 минут инкубации и далее инкубировали при 37°С в течение 30 минут. мРНК были транскрибированы так, чтобы они содержали 3’-поли(А)-хвост длиной 100 нуклеотидов. Для удаления матрицы к реакционной смеси добавляли 1/10 объема ДНКазы DNA Turbo DNase (Thermo Fisher Scientific, Кат. № AM1907) и инкубировали смесь при 37°С в течение 15 минут. Синтезированную мРНК выделяли из реакционной смеси путем осаждения половиной реакционного объема 8 М раствора LiCl (Sigma-Aldrich, кат. № L7026). После охлаждения при -20°C в течение по меньшей мере 1 часа осадок РНК собирали центрифугированием при 17000×g при 4°C в течение 5 минут. После промывания осадка РНК дважды по меньшей мере 200 мкл ледяного 75% раствора этанола осадок растворяли в воде, не содержащей нуклеаз. Концентрацию и качество транскрибируемой in vitro мРНК измеряли на спектрофотометре NanoDrop2000C (Thermo Fisher Scientific, Кат. № ND-2000c). Аликвоты денатурированных IVT мРНК анализировали электрофорезом в агарозных гелях, содержащих 0,005% (об./об.) красителя геля нуклеиновой кислоты GelRed™ (Masek T et al., (2005) Anal Biochem 336: 46-50). Небольшие аликвоты образцов мРНК хранили в силиконизированных пробирках при -20°С. Все мРНК очищали с помощью целлюлозы, как описано (Baiersdorfer M. et al. (2019) Mol Ther Nucleic Acids 15(15):26-35).
Мышиный EPO-специфический иммуноферментный анализ (ELISA)
Для количественного определения уровней EPO мыши образцы плазмы собирали у мышей, которым вводили IVT мРНК, кодирующую мышиный эритропоэтин в комплексе с TransIT мРНК (Mirusbio, кат. № MIR2255), в указанные моменты времени и анализировали с помощью набора Erythropoietin DuoSet ELISA для мышей (R&D Systems, кат. #DY959). Плоскодонные 96-луночные планшеты предварительно покрывали 2 мкг/мл крысиного антитела против мышиного ЕРО (100 мкл/лунку) и инкубировали при комнатной температуре (КТ) в течение ночи. Планшеты трижды промывали PBS, содержащим 0,05% Tween-20, и инкубировали с 1% раствором BSA (бычий сывороточный альбумин) (Sigma-Aldrich, кат. № 2153) при комнатной температуре в течение 2 часов для предотвращения неспецифического связывания антитела и снова промывали. Применяли семиточечную стандартную кривую с использованием 2-кратных серийных разведений и высокого стандарта 4000 пг/мл. В конечный объем 50 мкл образцы плазмы и стандарт, разведенные в 1% растворе БСА, добавляли в соответствующие лунки и инкубировали при комнатной температуре в течение 2 часов. После промывания планшетов в каждую лунку распределяли 100 мкл 1 мкг/мл крысиного биотинилированного антитела для обнаружения мышиного EPO в 1% растворе BSA и инкубировали при комнатной температуре в течение 2 часов. Планшеты промывали и затем инкубировали со 100 мкл стрептавидина, конъюгированного с пероксидазой хрена, разведенного (1:200) в 1% растворе БСА, при комнатной температуре в течение 20 мин. После промывки в каждую лунку добавляли раствор субстрата TMB 2-Component Microwell Peroxidase (Medac Gmbh, кат. № 50-76-11) (100 мкл/лунка). Образцы инкубировали при комнатной температуре в течение 5 минут и добавляли 2 М серную кислоту (R&D Systems, кат. № DY994) (50 мкл/лунку) для остановки реакции, и измеряли оптическую плотность при 450 нм и 570 нм с использованием планшетного ридера Infinite 200 Pro (Tecan).
Протокол эксперимента на животных
Все эксперименты проводились в соответствии с федеральной политикой исследований на животных с использованием самок мышей BALB/c из Charles River Laboratories (Сандхофер, Германия) в возрасте 6-12 недель. Для определения трансляции мРНК in vivo мышам (3 мыши/группу) внутривенно вводили 1-3 мкг каркас- и нуклеозид-модифицированной cap1-TEV-mEPO мРНК или cap1-hAg-mEPO мРНК, кодирующей мышиный эритропоэтин в комплексе с TransIT. Кровь собирали через 6, 24, 48 и 72 часа после инъекции мРНК, как описано (Kariko K et al., (2012) Mol. Ther. 20:948-953; Mahin AJ et al., (2016) Methods Mol Biol 1428:297-306), чтобы избежать влияния отбора проб на гематологические параметры животных. Вкратце, кровь (18 мкл) собирали путем пункции хвостовой вены, смешивали с 2 мкл 0,2 М EDTA и центрифугировали в 20 мкл стеклянных микрокапиллярных пробирках Drummond microcaps (Sigma-Aldrich). После защелкивания микрокапиллярных пробирок плазму извлекали для измерения уровней mEPO в плазме с использованием набора mEPO DuoSet ELISA Development kit (R&D Systems, Миннеаполис, Миннесота, США) и планшетного ридера Infinite 200 Pro (Tecan, Маннедорф, Швейцария). Подробности см. в описании EPO-ELISA.
Результаты
В этом примере оценивается влияние элементов последовательности в РНК на уровень экспрессии и/или продолжительность экспрессии полезной нагрузки, кодируемой РНК. Первая оценка была сосредоточена на определении влияния последовательностей самогибридизации в последовательности 3’UTR полинуклеотида РНК. Конструкции РНК с последовательностью самогибридизации или без нее, называемые «Lig3», были созданы и введены внутривенно мышам. Через 6, 24, 48 и 72 ч после инъекции мРНК у животных собирали кровь и оценивали экспрессию EPO - полипептида, кодируемого конструкциями РНК.
Как показано на фиг. 1, экспрессия EPO из конструкций, не содержащих последовательности Lig3, была более устойчивой. Уровень экспрессии EPO у этих животных был выше, чем в контроле (РНК с Lig3) через 24 часа и 48 часов после введения, и продолжительность экспрессии EPO также была больше, при этом значительное количество EPO обнаруживалось до 72 часов после введения. Эти данные демонстрируют, что отсутствие самогибридизирующейся последовательности в 3'-UTR, которая может гибридизоваться с другими элементами РНК, например, 5'-UTR или самой 3'-UTR, как показано на фиг. 2, полезны для улучшения экспрессии полезной нагрузки, кодируемой РНК.
Затем были оценены дополнительные элементы последовательности, которые могли повлиять на экспрессию полезной нагрузки, кодируемой РНК. Одним из структурных элементов РНК, необходимых для трансляции и/или стабильности, является 5’-кэп. Различные структуры 5'-кэпа, которые можно использовать с РНК, показаны на фиг. 3А-3Н. Ранее было показано, что белок IFIT1 (интерферониндуцированный тетратрикопептид1) может связываться с 5'-концом мРНК с очень высокой аффинностью, когда мРНК имеет структуру cap0 (PLoS pathogens (2013) 9, e1003663). Аффинность взаимодействия IFIT1 с мРНК снижается, когда она имеет структуру cap1, и это делает возможным предпочтительное связывание с факторами трансляции, такими как фактор элонгации eIF4E. Впоследствии также сообщалось, что первые 4 транскрибируемых нуклеотида на 5'-конце мРНК расположены в полости IFIT1 (PNAS (2017) 114(11): E2106-E2115). Основываясь на этих наблюдениях, была выдвинута гипотеза, что присутствие структуры Cap1 на РНК и идентичность последовательности РНК, проксимальной к 5'-кэпу (также называемой в данном документе «проксимальной к кэпу последовательностью»), могут влиять на экспрессию полезной нагрузки, кодируемой РНК.
Для проверки этой гипотезы были созданы и протестированы РНК, имеющие разные остатки в положениях +3, +4 и +5 последовательности РНК. Положения +1 и +2 протестированных последовательностей РНК были A и G, соответственно. Животным внутривенно вводили различные конструкции РНК, показанные на фиг. 4. Через 6, 24, 48 и 72 ч после инъекции у животных собирали кровь и оценивали экспрессию EPO - полипептида, кодируемого конструкциями РНК.
Уровень экспрессии EPO через 6 и 24 часа после введения РНК был сопоставим у всех животных, которым вводили различные конструкции. Через 48 часов после введения некоторые конструкции приводили к лучшей экспрессии EPO in vivo по сравнению с другими (сравните AGAAU с AGACA через 48 часов). Через 72 часа разница в экспрессии EPO in vivo между животными, которым вводили разные конструкции, была еще более значительной, когда конструкция AGACA демонстрировала более чем 10-кратное снижение экспрессии EPO по сравнению с несколькими конструкциями, включая конструкции AGAAU, AGAAC, AGCAA, AGCAC.
Эти данные демонстрируют, что идентичность последовательностей РНК, проксимальных к 5'-кэпу, оказывает значительное влияние на уровень экспрессии in vivo и/или продолжительность экспрессии полезной нагрузки, кодируемой РНК. В некоторых воплощениях эти данные свидетельствуют о том, что РНК-конструкция, имеющая проксимальную последовательность РНК с оптимизированным кэпом с повышенной экспрессией полезной нагрузки и/или продолжительностью экспрессии in vivo, позволяет вводить в организм более низкую дозу указанной РНК или композиции, содержащей ее, по сравнению с компаратором, например, последовательностью РНК без оптимизированной проксимальной к кэпу последовательности.
Пример 2: Примерные конструкции коронавирусной вакцины
В настоящем примере описаны некоторые вакцинные РНК против коронавируса. Примеры конструкций включают последовательности, кодирующие по меньшей мере один эпитоп спайк белка коронавируса, а также различные другие структурные элементы и/или признаки. Среди прочего, документы, иллюстрируют РНК, включающие, например, структуру cap1 и проксимальные к кэпу последовательности, описанные в настоящей заявке, которые хорошо экспрессируются и проявляют сильную иммуногенность.
Первичные фармакодинамические исследования проводились на мышах BALB/c для проверки иммуногенности вакцин-кандидатов, показанных в таблице ниже.
В ходе исследования четыре группы по восемь самок мышей BALB/c однократно иммунизировали материалом для испытаний на животных в трех различных дозах или буфером (контрольная группа; см. Таблицу 4). В то время как материал для клинических испытаний будет разбавлен физиологическим раствором, материал для испытаний на животных разбавляли PBS, включающем 300 мМ сахарозы. Поскольку это буфер для хранения самого материала, образцы для испытаний являются репрезентативными для вакцины, которая будет использоваться в запланированных клинических испытаниях. Иммунизацию проводили внутримышечно с использованием объема дозы 20 мкл.
сбора крови
Кровь иммунизированных животных собирали на 7, 14, 21 и 28 дни и анализировали на иммунный ответ антител с помощью ELISA и анализа нейтрализации на основе псевдовируса (pVNT).
Специфические ответы антител против SARS-CoV-2-S, направленные против рекомбинантной субъединицы S1 или RBD, были обнаружены с помощью ELISA. Вкратце, 96-луночные планшеты с высоким связыванием белка (планшеты MaxiSorp ELISA, VWR International GmbH, Кат. № 7341284) покрывали 100 нг рекомбинантной субъединицы S1 (Sino Biological Inc., Кат. № 40591-V08H) или RBD (Sino Biological Inc., Кат. № 40592-V02H) на лунку в 100 мкл буфера для покрытия (50 мМ карбонатно-бикарбонатного буфера натрия, pH 9,6) в течение ночи при 4°C. Планшеты трижды промывали 300 мкл/лунка 1x фосфатно-солевым буфером (PBS, VWR International GmbH, Кат. № 0780-10L) с добавлением 0,01% Tween 20 (Carl Roth GmbH & Co. KG, кат. № 9127.1) и блокировали с помощью 250 мкл/лунку 1x казеинового блокирующего буфера (Sigma-Aldrich GmbH, Кат. № B6429-500 мл) в течение 1 часа при 37°C на шейкере для микропланшетов. Планшеты снова трижды промывали 300 мкл/лунку 1x PBS с добавлением 0,01% Tween 20 и инкубировали с образцами сыворотки мыши, разведенными в 1x казеиновом блокирующем буфере, в течение 1 часа при 37°C на шейкере для микропланшетов. Планшеты трижды промывали 300 мкл/лунку 1x PBS с добавлением 0,01% Tween 20, а затем инкубировали с пероксидазно-конъюгированным козьим вторичным антителом против мышиных антител (Jackson ImmunoResearch Ltd., Кат. № 115-036-071; разведенным 1:7500 в 1x казеиновом блокирующем буфере) в течение 45 минут при 37°C в шейкере для микропланшетов. Планшеты трижды промывали 300 мкл/лунку 1x PBS с добавлением 0,01% Tween 20 и 100 мкл/лунку субстрата TMB (Biotrend Chemiekalien GmbH, кат. № 4380А). Планшеты инкубировали в течение 8 минут при комнатной температуре и реакцию останавливали добавлением 100 мкл 25% серной кислоты (VWR International GmbH, кат. № 1007161000). Планшеты считывали на устройстве для считывания микропланшетов, и зарегистрированное поглощение при 450 нм корректировали путем вычитания референсного поглощения при 620 нМ.
Функциональные гуморальные ответы на вакцины-кандидаты выявляли с помощью pVNT. В pVNT используется вирус везикулярного стоматита с дефицитом репликации (VSV), в котором отсутствует генетическая информация для гликопротеина G оболочки VSV, но содержится открытая рамка считывания (ORF) для зеленого флуоресцентного белка (GFP). Псевдовирус VSV/SARS-CoV-2 был создан в соответствии с опубликованным протоколом (Hoffmann et al., Cell, 2020; PMID 32142651). Псевдотипированный вирус несет S-белок из SARS-CoV-2, который опосредует проникновение в клетку. Следовательно, псевдовирус можно инактивировать нейтрализующими антителами, которые связывают S из SARS-CoV-2. Эту инактивацию можно проанализировать с помощью методов in vitro.
Вкратце, 4×104 клеток Vero 76 (ATCC® CRL-1587™) на лунку высевали в 96-луночный планшет (Greiner Bio-One GmbH, кат. № 655160) в 150 мкл/лунку DMEM (Thermo Fisher Scientific, кат. № 61965059) с добавлением 10% эмбриональной бычьей сыворотки (FBS, Sigma-Aldrich GmbH, Кат. No. F7524). Клетки инкубировали от 4 до 6 часов при 37°С и 7,5% СО2. При этом образцы сыворотки мышей разбавляли от 1:6 до 1:768 в среде DMEM/10% FBS с двукратным разведением. Разбавленные образцы сыворотки объединяли с равным объемом оттитрованной и предварительно разбавленной надосадочной жидкости псевдовируса VSV/SARS CoV-2, что привело к разведению сыворотки в диапазоне от 1:12 до 1:1536. Смесь разведений псевдовируса и сыворотки инкубировали в течение 5 минут при комнатной температуре на шейкере для микропланшетов при 750 об/мин с дополнительной инкубацией в течение 5 минут при комнатной температуре без перемешивания. К засеянным клеткам Vero-76 добавляли 50 мкл/лунку смеси разведений псевдовируса/сыворотки с нанесенным объемом псевдовируса на лунку, соответствующим 200 инфекционным единицам (МЕ). Каждое разведение образцов сыворотки тестировали в двух лунках. Клетки инкубировали от 16 до 24 часов при 37°С и 7,5% СО2. Клетки Vero 76, инкубированные с псевдовирусом в отсутствие мышиной сыворотки, использовали в качестве положительных контролей. Клетки Vero 76, инкубированные без псевдовируса, использовали в качестве отрицательного контроля. После инкубации планшеты с клеточными культурами извлекали из инкубатора, помещали в систему анализа живых клеток IncuCyte (Essen Bioscience) и инкубировали в течение 30 мин перед анализом. Сканирование всей лунки на светлое поле и флуоресценцию GFP выполняли с использованием 4-кратного объектива. Для расчета нейтрализующего титра количество инфицированных GFP-положительных клеток на лунку сравнивали с положительным контролем псевдовируса. Средние значения положительного контроля псевдовируса, умноженные на 0,5, представляют нейтрализацию псевдовируса 50% (pVN50). Образцы сыворотки со средними значениями ниже этого порогового значения проявляют активность нейтрализации вируса >50%, соответственно.
Исследование иммуногенности BNT162a1 (RBL063.3)
Чтобы проанализировать эффективность мРНК-вакцины, содержащей ЛНЧ, кодирующей BNT162a1, мышей BALB/c однократно иммунизировали внутримышечно, как указано в таблице 3. Иммуногенность РНК-вакцины будет исследована путем изучения антительного иммунного ответа.
Данные ELISA 7, 14, 21 и 28 дней после первой иммунизации показывают раннюю дозозависимую иммунную активацию против протеина S1 и рецептор-связывающего домена (фигура 5).
Исследование иммуногенности BNT162b1 (RBP020.3)
Чтобы проанализировать активность модифицированной ЛНЧ-вакцины, кодирующей BNT162b1, мышей BALB/c однократно иммунизировали в/м, как указано в таблице 3. Иммуногенность РНК-вакцины будет исследована путем изучения антительного иммунного ответа.
Данные ELISA 7, 14, 21 и 28 дней после первой иммунизации показывают раннюю дозозависимую иммунную активацию против протеина S1 и рецептор-связывающего домена (фигура 6). Сыворотки, полученные через 14, 21 и 28 дней после иммунизации, демонстрируют высокую степень нейтрализации псевдовируса SARS-CoV-2, особенно сыворотки мышей, иммунизированных 1 или 5 мкг BNT162b1, что коррелирует с сильным увеличением титров антител IgG (фигура 7).
Исследование иммуногенности BNT162c1 (RBS004.3)
Чтобы проанализировать эффективность вакцины маРНК в составе ЛНЧ, кодирующей BNT162c1, мышей BALB/c однократно иммунизировали внутримышечно, как указано в таблице 3. Иммуногенность РНК-вакцины будет исследована путем изучения антительного иммунного ответа.
Данные ELISA через 7, 14 и 21 дней после первой иммунизации показывают раннюю дозозависимую иммунную активацию против протеина S1 и рецептор-связывающего домена (фигура 8). Сыворотки, полученные через 14 и 21 день после иммунизации, демонстрируют дозозависимую активность нейтрализации псевдовируса SARS-CoV-2 (фигура 9).
Исследование иммуногенности мРНК в составе ЛНЧ, кодирующей вирусный белок S-V8 (SEQ ID NO: 7, 8) (RBL063.1)
Чтобы проанализировать активность мРНК-вакцины в составе ЛНЧ, кодирующей вирусный белок S-V8 (RBL063.1), мышей BALB/c однократно иммунизировали внутримышечно, как указано в Таблице 3. Иммуногенность РНК-вакцины будет исследована путем изучения антительного иммунного ответа.
Доступны данные ELISA 7, 14, 21 и 28 d после первой иммунизации, которые показывают раннюю дозозависимую иммунную активацию против протеина S1 и рецептор-связывающего домена (фигура 10). Сыворотки, полученные через 14, 21 и 28 дней после иммунизации, демонстрируют дозозависимую активность нейтрализации псевдовируса SARS-CoV-2 (фигура 11).
Исследование иммуногенности BNT162b2 (RBP020.1)
Чтобы проанализировать активность вакцины BNT162b2 (RBP020.1), исследовали иммуногенность конструкции. С этой целью было начато исследование титрования дозы на мышах BALB/c, в ходе которого будет проанализирован иммунный ответ с упором на иммунный ответ антител.
Доступны данные ELISA через 7, 14 и 21 дней после первой иммунизации, которые показывают раннюю дозозависимую иммунную активацию против протеина S1 и рецептор-связывающего домена (фигура 12). Сыворотки, полученные через 14 и 21 день после иммунизации, демонстрируют дозозависимую активность нейтрализации псевдовируса SARS-CoV-2 (фигура 13).
Исследование иммуногенности маРНК в составе ЛНЧ, кодирующей вирусный белок S-V9 (SEQ ID NO: 7, 9) (RBS004.2)
Чтобы проанализировать эффективность вакцины маРНК в составе ЛНЧ, кодирующей V9, мышей BALB/c однократно иммунизировали внутримышечно, как указано в таблице 3. Иммуногенность РНК-вакцины будет исследована путем изучения антительного иммунного ответа.
Доступны данные ELISA через 7, 14 и 21 дней после первой иммунизации, которые показывают раннюю дозозависимую иммунную активацию против протеина S1 и рецептор-связывающего домена (фигура 14). Сыворотки, полученные через 14 и 21 день после иммунизации, демонстрируют дозозависимую активность нейтрализации псевдовируса SARS-CoV-2 (фигура 15).
Приведенные выше данные демонстрируют иммунный ответ как для RBD с доменом тримеризации («V5»), так и для мутированного полноразмерного белка S («V8»/«V9») in vivo на всех протестированных платформах (включая вакцины BNT162a1, BNT162b1, BNT162b2 и BNT162c1). Антительный иммунный ответ с помощью ELISA наблюдался в очень ранние моменты времени (т.е. через 7 дней после иммунизации). Важно отметить, что индуцированные антитела были способны эффективно нейтрализовать псевдовирусную инфекцию SARS-COV-2 in vitro. Кроме того, индукция ответа антител с использованием очень низкой дозы иммунизации 0,2 мкг/мышь при использовании платформы модРНК (BNT162b1, BNT162b2), а также платформы маРНК (BNT162c1) указывает на высокую эффективность вакцин-кандидатов.
У мышей BNT162b2 индуцировала более высокий антигенспецифический титр по сравнению с BNT162b1, кодируемой идентичной РНК-платформой. Как и ожидалось, иммуногенность у мышей против антигенов различается между платформами РНК. У мышей наиболее иммуногенной платформой, основанной на индукции антиген-специфических антител, является модРНК, за которой следует маРНК. Платформа uРНК индуцирует самый низкий титр антиген-специфических антител.
Пример 3: Состав ЛНЧ
Примерная система доставки ЛНЧ была разработана для эффективной и безопасной доставки терапевтических нуклеиновых кислот в цитозоль различных типов клеток после местного введения in vivo. Работа над ранними составами была выполнена с несколькими многообещающими составами ЛНЧ и суррогатной РНК, кодирующей люциферазу. Цель экспериментов заключалась в сопоставлении влияния различных ионизируемых катионных липидов на эффективность доставки РНК ЛНЧ in vivo. Составы сравнивали с точки зрения эффективности инкапсуляции РНК, кажущегося pKa, размера ЛНЧ и полидисперсности.
Среди проверенных катионных липидов ALC-0315 продемонстрировал подходящие физические характеристики в отношении размера частиц, гомогенности и эффективности инкапсуляции РНК.
На основании этого прототип ALC-0315/DSPC/CHOL/ALC-0159 был представлен для скрининга in vivo. Результаты, представленные на фигуре 16, обобщают испытания in vivo двух независимых экспериментальных партий с использованием люциферазы (Luc) РНК. Результаты демонстрируют улучшенную эффективность прототипа ALC-0315 по сравнению с внутренним стандартом (ALC-0218). На основании этих исследований ALC-0315 был идентифицирован как сильнодействующий катионный липид и предложен для дальнейших исследований по разработке продукта.
Процедура скрининга состава, описанная выше, включает внутривенное введение, приводящее к доставке в первую очередь в печень. Механизм захвата ЛНЧ гепатоцитами обусловлен связыванием эндогенных аполипопротеинов с ЛНЧ с последующим рецептор-опосредованным эндоцитозом, т.е. через рецепторы липопротеинов низкой плотности. Чтобы исследовать, задействован ли тот же механизм при внутримышечном введении, РНК Luc, содержащие ЛНЧ, содержащие ALC-0315, вводили внутривенно (0,3 мг/кг) и внутримышечно (0,2 мг/кг) мышам с нокаутом ApoE в присутствии или в отсутствие рекомбинантный человеческий ApoE3. В качестве контроля мышей C57Bl/6 дикого типа также лечили различными путями введения. РНК-ЛНЧ предварительно инкубировали с рекомбинантным ApoE3 человека (1 мг инкапсулированной мРНК с 1 мг ApoE3) в течение 1 часа при комнатной температуре (КТ) перед введением. Экспрессию Luc отслеживали через 4, 24, 72 и 96 часов после введения (фигура 17).
При внутривенном введении мышам, экспрессию Luc детектировали у мышей C57Bl/6 дикого типа. У мышей с нокаутом ApoE экспрессия Luc была значительно снижена, однако при предварительной инкубации с экзогенным ApoE экспрессия Luc восстанавливалась до уровня, сходного с уровнем экспрессии у мышей дикого типа (фигура 18).
Эксперименты по экспрессии Luc in vivo на мышиных моделях показали, что в захвате РНК-ЛНЧ при внутримышечном введении задействованы те же механизмы, что и при внутривенном введении, и это справедливо не только для гепатоцитов, но и для клеток, локализованных в месте введения.
Эксперименты in vivo после внутримышечного введения конечного препарата ALC-0315/DSPC/CHOL/ALC-0159 подтвердили минимальный дренаж в отношении биораспределения, иммуногенности (активности вакцины) и переносимости.
Эквиваленты
Специалисту в данной области понятно или специалист способен выявить с использованием не более чем обычного эксперимента много эквивалентов конкретных воплощений изобретения, описанного в настоящей заявке. Следует понимать, что изобретение охватывает все варианты, комбинации и перестановки, в которых одно или несколько ограничений, элементов, пунктов, описательных терминов и т.д. из одного или нескольких перечисленных пунктов формулы изобретения вводятся в другой пункт, зависящий от того же основного пункта (или, в зависимости от обстоятельств, от другого пункта), если не указано иное или если специалисту в данной области техники не будет очевидно, что возникнет противоречие или несоответствие. Кроме того, следует также понимать, что любое воплощение или аспект изобретения может быть явно исключен из формулы изобретения, независимо от того, указано ли конкретное исключение в описании. Объем настоящего изобретения не предназначен для ограничения вышеприведенным описанием, а скорее изложен в следующей формуле изобретения.
--->
Перечень последовательностей
<110> BioNTech RNA Pharmaceuticals GmbH
<120> RNA Constructs and Uses Thereof
<130> 674-409 PCT
<140> PCT/EP2021/060508
<141> 2021-04-22
<150> PCT/EP2020/061239
<151> 2020-04-22
<150> PCT/EP2020/066968
<151> 2020-06-18
<150> PCT/EP2020/068174
<151> 2020-06-26
<150> PCT/EP2020/069805
<151> 2020-07-13
<150> PCT/EP2020/071733
<151> 2020-07-31
<150> PCT/EP2020/071839
<151> 2020-08-03
<150> PCT/EP2020/073668
<151> 2020-08-24
<150> PCT/EP2020/081544
<151> 2020-11-09
<150> PCT/EP2020/081981
<151> 2020-11-12
<150> PCT/EP2020/082601
<151> 2020-11-18
<150> PCT/EP2020/082989
<151> 2020-11-20
<150> PCT/EP2020/083435
<151> 2020-11-25
<150> PCT/EP2020/084342
<151> 2020-12-02
<150> PCT/EP2020/085145
<151> 2020-12-08
<150> PCT/EP2020/085653
<151> 2020-12-10
<150> PCT/EP2020/087844
<151> 2020-12-23
<150> PCT/EP2021/050027
<151> 2021-01-04
<150> PCT/EP2021/050875
<151> 2021-01-15
<150> PCT/EP2021/050874
<151> 2021-01-15
<150> PCT/EP2021/051772
<151> 2021-01-26
<150> PCT/EP2021/052572
<151> 2021-02-03
<150> PCT/EP2021/052716
<151> 2021-02-04
<150> PCT/EP2021/054622
<151> 2021-02-24
<150> PCT/EP2021/059947
<151> 2021-04-16
<160> 41
<170> PatentIn version 3.5
<210> 1
<211> 3
<212> RNA
<213> Artificial Sequence
<220>
<223> nucleotides +3 to +5 of a 5' UTR
<220>
<221> misc_feature
<222> (3)..(3)
<223> n is a, c, g, or u
<400> 1
aan 3
<210> 2
<211> 3
<212> RNA
<213> Artificial Sequence
<220>
<223> nucleotides +3 to +5 of a 5' UTR
<220>
<221> misc_feature
<222> (3)..(3)
<223> n is a, c, g, or u
<400> 2
can 3
<210> 3
<211> 3
<212> RNA
<213> Artificial Sequence
<220>
<223> nucleotides +3 to +5 of a 5' UTR
<400> 3
aca 3
<210> 4
<211> 3
<212> RNA
<213> Artificial Sequence
<220>
<223> nucleotides +3 to +5 of a 5' UTR
<400> 4
aug 3
<210> 5
<211> 3
<212> RNA
<213> Artificial Sequence
<220>
<223> nucleotides +3 to +5 of a 5' UTR
<400> 5
aau 3
<210> 6
<211> 3
<212> RNA
<213> Artificial Sequence
<220>
<223> nucleotides +3 to +5 of a 5' UTR
<400> 6
cac 3
<210> 7
<211> 3
<212> RNA
<213> Artificial Sequence
<220>
<223> nucleotides +3 to +5 of a 5' UTR
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (3)..(3)
<223> n is a, c, g, or u
<400> 7
ndn 3
<210> 8
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> ligation 3 sequence
<400> 8
gagucgcuag ccgcgucgcu 20
<210> 9
<211> 1273
<212> PRT
<213> Artificial Sequence
<220>
<223> S protein PP
<400> 9
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 10
<211> 4283
<212> RNA
<213> Artificial Sequence
<220>
<223> RBP020.2
<400> 10
agaauaaacu aguauucuuc ugguccccac agacucagag agaacccgcc accauguucg 60
uguuccuggu gcugcugccu cuggugucca gccagugugu gaaccugacc accagaacac 120
agcugccucc agccuacacc aacagcuuua ccagaggcgu guacuacccc gacaaggugu 180
ucagauccag cgugcugcac ucuacccagg accuguuccu gccuuucuuc agcaacguga 240
ccugguucca cgccauccac guguccggca ccaauggcac caagagauuc gacaaccccg 300
ugcugcccuu caacgacggg guguacuuug ccagcaccga gaaguccaac aucaucagag 360
gcuggaucuu cggcaccaca cuggacagca agacccagag ccugcugauc gugaacaacg 420
ccaccaacgu ggucaucaaa gugugcgagu uccaguucug caacgacccc uuccugggcg 480
ucuacuacca caagaacaac aagagcugga uggaaagcga guuccgggug uacagcagcg 540
ccaacaacug caccuucgag uacguguccc agccuuuccu gauggaccug gaaggcaagc 600
agggcaacuu caagaaccug cgcgaguucg uguuuaagaa caucgacggc uacuucaaga 660
ucuacagcaa gcacaccccu aucaaccucg ugcgggaucu gccucagggc uucucugcuc 720
uggaaccccu gguggaucug cccaucggca ucaacaucac ccgguuucag acacugcugg 780
cccugcacag aagcuaccug acaccuggcg auagcagcag cggauggaca gcuggugccg 840
ccgcuuacua ugugggcuac cugcagccua gaaccuuccu gcugaaguac aacgagaacg 900
gcaccaucac cgacgccgug gauugugcuc uggauccucu gagcgagaca aagugcaccc 960
ugaaguccuu caccguggaa aagggcaucu accagaccag caacuuccgg gugcagccca 1020
ccgaauccau cgugcgguuc cccaauauca ccaaucugug ccccuucggc gagguguuca 1080
augccaccag auucgccucu guguacgccu ggaaccggaa gcggaucagc aauugcgugg 1140
ccgacuacuc cgugcuguac aacuccgcca gcuucagcac cuucaagugc uacggcgugu 1200
ccccuaccaa gcugaacgac cugugcuuca caaacgugua cgccgacagc uucgugaucc 1260
ggggagauga agugcggcag auugccccug gacagacagg caagaucgcc gacuacaacu 1320
acaagcugcc cgacgacuuc accggcugug ugauugccug gaacagcaac aaccuggacu 1380
ccaaagucgg cggcaacuac aauuaccugu accggcuguu ccggaagucc aaucugaagc 1440
ccuucgagcg ggacaucucc accgagaucu aucaggccgg cagcaccccu uguaacggcg 1500
uggaaggcuu caacugcuac uucccacugc aguccuacgg cuuucagccc acaaauggcg 1560
ugggcuauca gcccuacaga gugguggugc ugagcuucga acugcugcau gccccugcca 1620
cagugugcgg cccuaagaaa agcaccaauc ucgugaagaa caaaugcgug aacuucaacu 1680
ucaacggccu gaccggcacc ggcgugcuga cagagagcaa caagaaguuc cugccauucc 1740
agcaguuugg ccgggauauc gccgauacca cagacgccgu uagagauccc cagacacugg 1800
aaauccugga caucaccccu ugcagcuucg gcggaguguc ugugaucacc ccuggcacca 1860
acaccagcaa ucagguggca gugcuguacc aggacgugaa cuguaccgaa gugcccgugg 1920
ccauucacgc cgaucagcug acaccuacau ggcgggugua cuccaccggc agcaaugugu 1980
uucagaccag agccggcugu cugaucggag ccgagcacgu gaacaauagc uacgagugcg 2040
acauccccau cggcgcugga aucugcgcca gcuaccagac acagacaaac agcccucgga 2100
gagccagaag cguggccagc cagagcauca uugccuacac aaugucucug ggcgccgaga 2160
acagcguggc cuacuccaac aacucuaucg cuauccccac caacuucacc aucagcguga 2220
ccacagagau ccugccugug uccaugacca agaccagcgu ggacugcacc auguacaucu 2280
gcggcgauuc caccgagugc uccaaccugc ugcugcagua cggcagcuuc ugcacccagc 2340
ugaauagagc ccugacaggg aucgccgugg aacaggacaa gaacacccaa gagguguucg 2400
cccaagugaa gcagaucuac aagaccccuc cuaucaagga cuucggcggc uucaauuuca 2460
gccagauucu gcccgauccu agcaagccca gcaagcggag cuucaucgag gaccugcugu 2520
ucaacaaagu gacacuggcc gacgccggcu ucaucaagca guauggcgau ugucugggcg 2580
acauugccgc cagggaucug auuugcgccc agaaguuuaa cggacugaca gugcugccuc 2640
cucugcugac cgaugagaug aucgcccagu acacaucugc ccugcuggcc ggcacaauca 2700
caagcggcug gacauuugga gcaggcgccg cucugcagau ccccuuugcu augcagaugg 2760
ccuaccgguu caacggcauc ggagugaccc agaaugugcu guacgagaac cagaagcuga 2820
ucgccaacca guucaacagc gccaucggca agauccagga cagccugagc agcacagcaa 2880
gcgcccuggg aaagcugcag gacgugguca accagaaugc ccaggcacug aacacccugg 2940
ucaagcagcu guccuccaac uucggcgcca ucagcucugu gcugaacgau auccugagca 3000
gacuggaccc uccugaggcc gaggugcaga ucgacagacu gaucacaggc agacugcaga 3060
gccuccagac auacgugacc cagcagcuga ucagagccgc cgagauuaga gccucugcca 3120
aucuggccgc caccaagaug ucugagugug ugcugggcca gagcaagaga guggacuuuu 3180
gcggcaaggg cuaccaccug augagcuucc cucagucugc cccucacggc gugguguuuc 3240
ugcacgugac auaugugccc gcucaagaga agaauuucac caccgcucca gccaucugcc 3300
acgacggcaa agcccacuuu ccuagagaag gcguguucgu guccaacggc acccauuggu 3360
ucgugacaca gcggaacuuc uacgagcccc agaucaucac caccgacaac accuucgugu 3420
cuggcaacug cgacgucgug aucggcauug ugaacaauac cguguacgac ccucugcagc 3480
ccgagcugga cagcuucaaa gaggaacugg acaaguacuu uaagaaccac acaagccccg 3540
acguggaccu gggcgauauc agcggaauca augccagcgu cgugaacauc cagaaagaga 3600
ucgaccggcu gaacgaggug gccaagaauc ugaacgagag ccugaucgac cugcaagaac 3660
uggggaagua cgagcaguac aucaaguggc ccugguacau cuggcugggc uuuaucgccg 3720
gacugauugc caucgugaug gucacaauca ugcuguguug caugaccagc ugcuguagcu 3780
gccugaaggg cuguuguagc uguggcagcu gcugcaaguu cgacgaggac gauucugagc 3840
ccgugcugaa gggcgugaaa cugcacuaca caugaugacu cgagcuggua cugcaugcac 3900
gcaaugcuag cugccccuuu cccguccugg guaccccgag ucucccccga ccucgggucc 3960
cagguaugcu cccaccucca ccugccccac ucaccaccuc ugcuaguucc agacaccucc 4020
caagcacgca gcaaugcagc ucaaaacgcu uagccuagcc acacccccac gggaaacagc 4080
agugauuaac cuuuagcaau aaacgaaagu uuaacuaagc uauacuaacc ccaggguugg 4140
ucaauuucgu gccagccaca cccuggagcu agcaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200
aaagcauaug acuaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4260
aaaaaaaaaa aaaaaaaaaa aaa 4283
<210> 11
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> human alpha globin 5' UTR with AGAAU
<400> 11
agaauaaacu aguauucuuc ugguccccac agacucagag agaaccc 47
<210> 12
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> human alpha globin 5' UTR
<400> 12
aaacuaguau ucuucugguc cccacagacu cagagagaac cc 42
<210> 13
<211> 278
<212> RNA
<213> Artificial Sequence
<220>
<223> 3' UTR
<400> 13
cugguacugc augcacgcaa ugcuagcugc cccuuucccg uccuggguac cccgagucuc 60
ccccgaccuc gggucccagg uaugcuccca ccuccaccug ccccacucac caccucugcu 120
aguuccagac accucccaag cacgcagcaa ugcagcucaa aacgcuuagc cuagccacac 180
ccccacggga aacagcagug auuaaccuuu agcaauaaac gaaaguuuaa cuaagcuaua 240
cuaaccccag gguuggucaa uuucgugcca gccacacc 278
<210> 14
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> A30L70 PolyA
<400> 14
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gcauaugacu aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 110
<210> 15
<211> 458
<212> RNA
<213> Artificial Sequence
<220>
<223> exemplary RNA polynucleotide without payload
<400> 15
agaauaaacu aguauucuuc ugguccccac agacucagag agaacccgcc acccucgagc 60
ugguacugca ugcacgcaau gcuagcugcc ccuuucccgu ccuggguacc ccgagucucc 120
cccgaccucg ggucccaggu augcucccac cuccaccugc cccacucacc accucugcua 180
guuccagaca ccucccaagc acgcagcaau gcagcucaaa acgcuuagcc uagccacacc 240
cccacgggaa acagcaguga uuaaccuuua gcaauaaacg aaaguuuaac uaagcuauac 300
uaaccccagg guuggucaau uucgugccag ccacacccug gagcuagcaa aaaaaaaaaa 360
aaaaaaaaaa aaaaaaaagc auaugacuaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 420
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 458
<210> 16
<211> 4283
<212> RNA
<213> Artificial Sequence
<220>
<223> exemplary RNA polynucleotide with payload BNT162b2
<400> 16
agaauaaacu aguauucuuc ugguccccac agacucagag agaacccgcc accauguucg 60
uguuccuggu gcugcugccu cuggugucca gccagugugu gaaccugacc accagaacac 120
agcugccucc agccuacacc aacagcuuua ccagaggcgu guacuacccc gacaaggugu 180
ucagauccag cgugcugcac ucuacccagg accuguuccu gccuuucuuc agcaacguga 240
ccugguucca cgccauccac guguccggca ccaauggcac caagagauuc gacaaccccg 300
ugcugcccuu caacgacggg guguacuuug ccagcaccga gaaguccaac aucaucagag 360
gcuggaucuu cggcaccaca cuggacagca agacccagag ccugcugauc gugaacaacg 420
ccaccaacgu ggucaucaaa gugugcgagu uccaguucug caacgacccc uuccugggcg 480
ucuacuacca caagaacaac aagagcugga uggaaagcga guuccgggug uacagcagcg 540
ccaacaacug caccuucgag uacguguccc agccuuuccu gauggaccug gaaggcaagc 600
agggcaacuu caagaaccug cgcgaguucg uguuuaagaa caucgacggc uacuucaaga 660
ucuacagcaa gcacaccccu aucaaccucg ugcgggaucu gccucagggc uucucugcuc 720
uggaaccccu gguggaucug cccaucggca ucaacaucac ccgguuucag acacugcugg 780
cccugcacag aagcuaccug acaccuggcg auagcagcag cggauggaca gcuggugccg 840
ccgcuuacua ugugggcuac cugcagccua gaaccuuccu gcugaaguac aacgagaacg 900
gcaccaucac cgacgccgug gauugugcuc uggauccucu gagcgagaca aagugcaccc 960
ugaaguccuu caccguggaa aagggcaucu accagaccag caacuuccgg gugcagccca 1020
ccgaauccau cgugcgguuc cccaauauca ccaaucugug ccccuucggc gagguguuca 1080
augccaccag auucgccucu guguacgccu ggaaccggaa gcggaucagc aauugcgugg 1140
ccgacuacuc cgugcuguac aacuccgcca gcuucagcac cuucaagugc uacggcgugu 1200
ccccuaccaa gcugaacgac cugugcuuca caaacgugua cgccgacagc uucgugaucc 1260
ggggagauga agugcggcag auugccccug gacagacagg caagaucgcc gacuacaacu 1320
acaagcugcc cgacgacuuc accggcugug ugauugccug gaacagcaac aaccuggacu 1380
ccaaagucgg cggcaacuac aauuaccugu accggcuguu ccggaagucc aaucugaagc 1440
ccuucgagcg ggacaucucc accgagaucu aucaggccgg cagcaccccu uguaacggcg 1500
uggaaggcuu caacugcuac uucccacugc aguccuacgg cuuucagccc acaaauggcg 1560
ugggcuauca gcccuacaga gugguggugc ugagcuucga acugcugcau gccccugcca 1620
cagugugcgg cccuaagaaa agcaccaauc ucgugaagaa caaaugcgug aacuucaacu 1680
ucaacggccu gaccggcacc ggcgugcuga cagagagcaa caagaaguuc cugccauucc 1740
agcaguuugg ccgggauauc gccgauacca cagacgccgu uagagauccc cagacacugg 1800
aaauccugga caucaccccu ugcagcuucg gcggaguguc ugugaucacc ccuggcacca 1860
acaccagcaa ucagguggca gugcuguacc aggacgugaa cuguaccgaa gugcccgugg 1920
ccauucacgc cgaucagcug acaccuacau ggcgggugua cuccaccggc agcaaugugu 1980
uucagaccag agccggcugu cugaucggag ccgagcacgu gaacaauagc uacgagugcg 2040
acauccccau cggcgcugga aucugcgcca gcuaccagac acagacaaac agcccucgga 2100
gagccagaag cguggccagc cagagcauca uugccuacac aaugucucug ggcgccgaga 2160
acagcguggc cuacuccaac aacucuaucg cuauccccac caacuucacc aucagcguga 2220
ccacagagau ccugccugug uccaugacca agaccagcgu ggacugcacc auguacaucu 2280
gcggcgauuc caccgagugc uccaaccugc ugcugcagua cggcagcuuc ugcacccagc 2340
ugaauagagc ccugacaggg aucgccgugg aacaggacaa gaacacccaa gagguguucg 2400
cccaagugaa gcagaucuac aagaccccuc cuaucaagga cuucggcggc uucaauuuca 2460
gccagauucu gcccgauccu agcaagccca gcaagcggag cuucaucgag gaccugcugu 2520
ucaacaaagu gacacuggcc gacgccggcu ucaucaagca guauggcgau ugucugggcg 2580
acauugccgc cagggaucug auuugcgccc agaaguuuaa cggacugaca gugcugccuc 2640
cucugcugac cgaugagaug aucgcccagu acacaucugc ccugcuggcc ggcacaauca 2700
caagcggcug gacauuugga gcaggcgccg cucugcagau ccccuuugcu augcagaugg 2760
ccuaccgguu caacggcauc ggagugaccc agaaugugcu guacgagaac cagaagcuga 2820
ucgccaacca guucaacagc gccaucggca agauccagga cagccugagc agcacagcaa 2880
gcgcccuggg aaagcugcag gacgugguca accagaaugc ccaggcacug aacacccugg 2940
ucaagcagcu guccuccaac uucggcgcca ucagcucugu gcugaacgau auccugagca 3000
gacuggaccc uccugaggcc gaggugcaga ucgacagacu gaucacaggc agacugcaga 3060
gccuccagac auacgugacc cagcagcuga ucagagccgc cgagauuaga gccucugcca 3120
aucuggccgc caccaagaug ucugagugug ugcugggcca gagcaagaga guggacuuuu 3180
gcggcaaggg cuaccaccug augagcuucc cucagucugc cccucacggc gugguguuuc 3240
ugcacgugac auaugugccc gcucaagaga agaauuucac caccgcucca gccaucugcc 3300
acgacggcaa agcccacuuu ccuagagaag gcguguucgu guccaacggc acccauuggu 3360
ucgugacaca gcggaacuuc uacgagcccc agaucaucac caccgacaac accuucgugu 3420
cuggcaacug cgacgucgug aucggcauug ugaacaauac cguguacgac ccucugcagc 3480
ccgagcugga cagcuucaaa gaggaacugg acaaguacuu uaagaaccac acaagccccg 3540
acguggaccu gggcgauauc agcggaauca augccagcgu cgugaacauc cagaaagaga 3600
ucgaccggcu gaacgaggug gccaagaauc ugaacgagag ccugaucgac cugcaagaac 3660
uggggaagua cgagcaguac aucaaguggc ccugguacau cuggcugggc uuuaucgccg 3720
gacugauugc caucgugaug gucacaauca ugcuguguug caugaccagc ugcuguagcu 3780
gccugaaggg cuguuguagc uguggcagcu gcugcaaguu cgacgaggac gauucugagc 3840
ccgugcugaa gggcgugaaa cugcacuaca caugaugacu cgagcuggua cugcaugcac 3900
gcaaugcuag cugccccuuu cccguccugg guaccccgag ucucccccga ccucgggucc 3960
cagguaugcu cccaccucca ccugccccac ucaccaccuc ugcuaguucc agacaccucc 4020
caagcacgca gcaaugcagc ucaaaacgcu uagccuagcc acacccccac gggaaacagc 4080
agugauuaac cuuuagcaau aaacgaaagu uuaacuaagc uauacuaacc ccaggguugg 4140
ucaauuucgu gccagccaca cccuggagcu agcaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200
aaagcauaug acuaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4260
aaaaaaaaaa aaaaaaaaaa aaa 4283
<210> 17
<211> 1273
<212> PRT
<213> Artificial Sequence
<220>
<223> S protein
<400> 17
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 18
<211> 3819
<212> RNA
<213> Artificial Sequence
<220>
<223> S protein CDS
<400> 18
auguuugugu uucuugugcu gcugccucuu gugucuucuc agugugugaa uuugacaaca 60
agaacacagc ugccaccagc uuauacaaau ucuuuuacca gaggagugua uuauccugau 120
aaaguguuua gaucuucugu gcugcacagc acacaggacc uguuucugcc auuuuuuagc 180
aaugugacau gguuucaugc aauucaugug ucuggaacaa auggaacaaa aagauuugau 240
aauccugugc ugccuuuuaa ugauggagug uauuuugcuu caacagaaaa gucaaauauu 300
auuagaggau ggauuuuugg aacaacacug gauucuaaaa cacagucucu gcugauugug 360
aauaaugcaa caaauguggu gauuaaagug ugugaauuuc aguuuuguaa ugauccuuuu 420
cugggagugu auuaucacaa aaauaauaaa ucuuggaugg aaucugaauu uagaguguau 480
uccucugcaa auaauuguac auuugaauau gugucucagc cuuuucugau ggaucuggaa 540
ggaaaacagg gcaauuuuaa aaaucugaga gaauuugugu uuaaaaauau ugauggauau 600
uuuaaaauuu auucuaaaca cacaccaauu aauuuaguga gagaucugcc ucagggauuu 660
ucugcucugg aaccucuggu ggaucugcca auuggcauua auauuacaag auuucagaca 720
cugcuggcuc ugcacagauc uuaucugaca ccuggagauu cuucuucugg auggacagcc 780
ggagcugcag cuuauuaugu gggcuaucug cagccaagaa cauuucugcu gaaauauaau 840
gaaaauggaa caauuacaga ugcuguggau ugugcucugg auccucuguc ugaaacaaaa 900
uguacauuaa aaucuuuuac aguggaaaaa ggcauuuauc agacaucuaa uuuuagagug 960
cagccaacag aaucuauugu gagauuucca aauauuacaa aucugugucc auuuggagaa 1020
guguuuaaug caacaagauu ugcaucugug uaugcaugga auagaaaaag aauuucuaau 1080
uguguggcug auuauucugu gcuguauaau agugcuucuu uuuccacauu uaaauguuau 1140
ggagugucuc caacaaaauu aaaugauuua uguuuuacaa auguguaugc ugauucuuuu 1200
gugaucagag gugaugaagu gagacagauu gcccccggac agacaggaaa aauugcugau 1260
uacaauuaca aacugccuga ugauuuuaca ggauguguga uugcuuggaa uucuaauaau 1320
uuagauucua aagugggagg aaauuacaau uaucuguaca gacuguuuag aaaaucaaau 1380
cugaaaccuu uugaaagaga uauuucaaca gaaauuuauc aggcuggauc aacaccuugu 1440
aauggagugg aaggauuuaa uuguuauuuu ccauuacaga gcuauggauu ucagccaacc 1500
aauggugugg gauaucagcc auauagagug guggugcugu cuuuugaacu gcugcaugca 1560
ccugcaacag uguguggacc uaaaaaaucu acaaauuuag ugaaaaauaa augugugaau 1620
uuuaauuuua auggauuaac aggaacagga gugcugacag aaucuaauaa aaaauuucug 1680
ccuuuucagc aguuuggcag agauauugca gauaccacag augcagugag agauccucag 1740
acauuagaaa uucuggauau uacaccuugu ucuuuugggg gugugucugu gauuacaccu 1800
ggaacaaaua caucuaauca gguggcugug cuguaucagg augugaauug uacagaagug 1860
ccaguggcaa uucaugcaga ucagcugaca ccaacaugga gaguguauuc uacaggaucu 1920
aauguguuuc agacaagagc aggaugucug auuggagcag aacaugugaa uaauucuuau 1980
gaaugugaua uuccaauugg agcaggcauu ugugcaucuu aucagacaca gacaaauucc 2040
ccaaggagag caagaucugu ggcaucucag ucuauuauug cauacaccau gucucuggga 2100
gcagaaaauu cuguggcaua uucuaauaau ucuauugcua uuccaacaaa uuuuaccauu 2160
ucugugacaa cagaaauuuu accugugucu augacaaaaa caucugugga uuguaccaug 2220
uacauuugug gagauucuac agaauguucu aaucugcugc ugcaguaugg aucuuuuugu 2280
acacagcuga auagagcuuu aacaggaauu gcuguggaac aggauaaaaa uacacaggaa 2340
guguuugcuc aggugaaaca gauuuacaaa acaccaccaa uuaaagauuu uggaggauuu 2400
aauuuuagcc agauucugcc ugauccuucu aaaccuucua aaagaucuuu uauugaagau 2460
cugcuguuua auaaagugac acuggcagau gcaggauuua uuaaacagua uggagauugc 2520
cugggugaua uugcugcaag agaucugauu ugugcucaga aauuuaaugg acugacagug 2580
cugccuccuc ugcugacaga ugaaaugauu gcucaguaca caucugcuuu acuggcugga 2640
acaauuacaa gcggauggac auuuggagcu ggagcugcuc ugcagauucc uuuugcaaug 2700
cagauggcuu acagauuuaa uggaauugga gugacacaga auguguuaua ugaaaaucag 2760
aaacugauug caaaucaguu uaauucugca auuggcaaaa uucaggauuc ucugucuucu 2820
acagcuucug cucugggaaa acugcaggau guggugaauc agaaugcaca ggcacugaau 2880
acucugguga aacagcuguc uagcaauuuu ggggcaauuu cuucugugcu gaaugauauu 2940
cugucuagac uggauaaagu ggaagcugaa gugcagauug auagacugau cacaggaaga 3000
cugcagucuc ugcagacuua ugugacacag cagcugauua gagcugcuga aauuagagcu 3060
ucugcuaauc uggcugcuac aaaaaugucu gaaugugugc ugggacaguc aaaaagagug 3120
gauuuuugug gaaaaggaua ucaucugaug ucuuuuccac agucugcucc acauggagug 3180
guguuuuuac augugacaua ugugccagca caggaaaaga auuuuaccac agcaccagca 3240
auuugucaug auggaaaagc acauuuucca agagaaggag uguuuguguc uaauggaaca 3300
cauugguuug ugacacagag aaauuuuuau gaaccucaga uuauuacaac agauaauaca 3360
uuugugucag gaaauuguga uguggugauu ggaauuguga auaauacagu guaugaucca 3420
cugcagccag aacuggauuc uuuuaaagaa gaacuggaua aauauuuuaa aaaucacaca 3480
ucuccugaug uggauuuagg agauauuucu ggaaucaaug caucuguggu gaauauucag 3540
aaagaaauug auagacugaa ugaaguggcc aaaaaucuga augaaucucu gauugaucug 3600
caggaacuug gaaaauauga acaguacauu aaauggccuu gguacauuug gcuuggauuu 3660
auugcaggau uaauugcaau ugugauggug acaauuaugu uauguuguau gacaucaugu 3720
uguucuuguu uaaaaggaug uuguucuugu ggaagcuguu guaaauuuga ugaagaugau 3780
ucugaaccug uguuaaaagg agugaaauug cauuacaca 3819
<210> 19
<211> 218
<212> PRT
<213> Artificial Sequence
<220>
<223> S protein RBD
<400> 19
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe
20 25 30
Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile
35 40 45
Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe
50 55 60
Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu
65 70 75 80
Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu
85 90 95
Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn
100 105 110
Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser
115 120 125
Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg
130 135 140
Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr
145 150 155 160
Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe
165 170 175
Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly
180 185 190
Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu
195 200 205
His Ala Pro Ala Thr Val Cys Gly Pro Lys
210 215
<210> 20
<211> 654
<212> RNA
<213> Artificial Sequence
<220>
<223> S protein RBD CDS
<400> 20
auguuugugu uucuugugcu gcugccucuu gugucuucuc aguguguggu gagauuucca 60
aauauuacaa aucugugucc auuuggagaa guguuuaaug caacaagauu ugcaucugug 120
uaugcaugga auagaaaaag aauuucuaau uguguggcug auuauucugu gcuguauaau 180
agugcuucuu uuuccacauu uaaauguuau ggagugucuc caacaaaauu aaaugauuua 240
uguuuuacaa auguguaugc ugauucuuuu gugaucagag gugaugaagu gagacagauu 300
gcccccggac agacaggaaa aauugcugau uacaauuaca aacugccuga ugauuuuaca 360
ggauguguga uugcuuggaa uucuaauaau uuagauucua aagugggagg aaauuacaau 420
uaucuguaca gacuguuuag aaaaucaaau cugaaaccuu uugaaagaga uauuucaaca 480
gaaauuuauc aggcuggauc aacaccuugu aauggagugg aaggauuuaa uuguuauuuu 540
ccauuacaga gcuauggauu ucagccaacc aauggugugg gauaucagcc auauagagug 600
guggugcugu cuuuugaacu gcugcaugca ccugcaacag uguguggacc uaaa 654
<210> 21
<211> 266
<212> PRT
<213> Artificial Sequence
<220>
<223> S protein RBD / Fibritin
<400> 21
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe
20 25 30
Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile
35 40 45
Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe
50 55 60
Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu
65 70 75 80
Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu
85 90 95
Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn
100 105 110
Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser
115 120 125
Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg
130 135 140
Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr
145 150 155 160
Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe
165 170 175
Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly
180 185 190
Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu
195 200 205
His Ala Pro Ala Thr Val Cys Gly Pro Lys Gly Ser Pro Gly Ser Gly
210 215 220
Ser Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
225 230 235 240
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Arg
245 250 255
Ser Leu Glu Val Leu Phe Gln Gly Pro Gly
260 265
<210> 22
<211> 798
<212> RNA
<213> Artificial Sequence
<220>
<223> S protein RBD / Fibritin CDS
<400> 22
auguuugugu uucuugugcu gcugccucuu gugucuucuc aguguguggu gagauuucca 60
aauauuacaa aucugugucc auuuggagaa guguuuaaug caacaagauu ugcaucugug 120
uaugcaugga auagaaaaag aauuucuaau uguguggcug auuauucugu gcuguauaau 180
agugcuucuu uuuccacauu uaaauguuau ggagugucuc caacaaaauu aaaugauuua 240
uguuuuacaa auguguaugc ugauucuuuu gugaucagag gugaugaagu gagacagauu 300
gcccccggac agacaggaaa aauugcugau uacaauuaca aacugccuga ugauuuuaca 360
ggauguguga uugcuuggaa uucuaauaau uuagauucua aagugggagg aaauuacaau 420
uaucuguaca gacuguuuag aaaaucaaau cugaaaccuu uugaaagaga uauuucaaca 480
gaaauuuauc aggcuggauc aacaccuugu aauggagugg aaggauuuaa uuguuauuuu 540
ccauuacaga gcuauggauu ucagccaacc aauggugugg gauaucagcc auauagagug 600
guggugcugu cuuuugaacu gcugcaugca ccugcaacag uguguggacc uaaaggcucc 660
cccggcuccg gcuccggauc ugguuauauu ccugaagcuc caagagaugg gcaagcuuac 720
guucguaaag auggcgaaug gguauuacuu ucuaccuuuu uaggccgguc ccuggaggug 780
cuguuccagg gccccggc 798
<210> 23
<211> 3819
<212> RNA
<213> Artificial Sequence
<220>
<223> S protein PP CDS V08
<400> 23
auguuugugu uucuugugcu gcugccucuu gugucuucuc agugugugaa uuugacaaca 60
agaacacagc ugccaccagc uuauacaaau ucuuuuacca gaggagugua uuauccugau 120
aaaguguuua gaucuucugu gcugcacagc acacaggacc uguuucugcc auuuuuuagc 180
aaugugacau gguuucaugc aauucaugug ucuggaacaa auggaacaaa aagauuugau 240
aauccugugc ugccuuuuaa ugauggagug uauuuugcuu caacagaaaa gucaaauauu 300
auuagaggau ggauuuuugg aacaacacug gauucuaaaa cacagucucu gcugauugug 360
aauaaugcaa caaauguggu gauuaaagug ugugaauuuc aguuuuguaa ugauccuuuu 420
cugggagugu auuaucacaa aaauaauaaa ucuuggaugg aaucugaauu uagaguguau 480
uccucugcaa auaauuguac auuugaauau gugucucagc cuuuucugau ggaucuggaa 540
ggaaaacagg gcaauuuuaa aaaucugaga gaauuugugu uuaaaaauau ugauggauau 600
uuuaaaauuu auucuaaaca cacaccaauu aauuuaguga gagaucugcc ucagggauuu 660
ucugcucugg aaccucuggu ggaucugcca auuggcauua auauuacaag auuucagaca 720
cugcuggcuc ugcacagauc uuaucugaca ccuggagauu cuucuucugg auggacagcc 780
ggagcugcag cuuauuaugu gggcuaucug cagccaagaa cauuucugcu gaaauauaau 840
gaaaauggaa caauuacaga ugcuguggau ugugcucugg auccucuguc ugaaacaaaa 900
uguacauuaa aaucuuuuac aguggaaaaa ggcauuuauc agacaucuaa uuuuagagug 960
cagccaacag aaucuauugu gagauuucca aauauuacaa aucugugucc auuuggagaa 1020
guguuuaaug caacaagauu ugcaucugug uaugcaugga auagaaaaag aauuucuaau 1080
uguguggcug auuauucugu gcuguauaau agugcuucuu uuuccacauu uaaauguuau 1140
ggagugucuc caacaaaauu aaaugauuua uguuuuacaa auguguaugc ugauucuuuu 1200
gugaucagag gugaugaagu gagacagauu gcccccggac agacaggaaa aauugcugau 1260
uacaauuaca aacugccuga ugauuuuaca ggauguguga uugcuuggaa uucuaauaau 1320
uuagauucua aagugggagg aaauuacaau uaucuguaca gacuguuuag aaaaucaaau 1380
cugaaaccuu uugaaagaga uauuucaaca gaaauuuauc aggcuggauc aacaccuugu 1440
aauggagugg aaggauuuaa uuguuauuuu ccauuacaga gcuauggauu ucagccaacc 1500
aauggugugg gauaucagcc auauagagug guggugcugu cuuuugaacu gcugcaugca 1560
ccugcaacag uguguggacc uaaaaaaucu acaaauuuag ugaaaaauaa augugugaau 1620
uuuaauuuua auggauuaac aggaacagga gugcugacag aaucuaauaa aaaauuucug 1680
ccuuuucagc aguuuggcag agauauugca gauaccacag augcagugag agauccucag 1740
acauuagaaa uucuggauau uacaccuugu ucuuuugggg gugugucugu gauuacaccu 1800
ggaacaaaua caucuaauca gguggcugug cuguaucagg augugaauug uacagaagug 1860
ccaguggcaa uucaugcaga ucagcugaca ccaacaugga gaguguauuc uacaggaucu 1920
aauguguuuc agacaagagc aggaugucug auuggagcag aacaugugaa uaauucuuau 1980
gaaugugaua uuccaauugg agcaggcauu ugugcaucuu aucagacaca gacaaauucc 2040
ccaaggagag caagaucugu ggcaucucag ucuauuauug cauacaccau gucucuggga 2100
gcagaaaauu cuguggcaua uucuaauaau ucuauugcua uuccaacaaa uuuuaccauu 2160
ucugugacaa cagaaauuuu accugugucu augacaaaaa caucugugga uuguaccaug 2220
uacauuugug gagauucuac agaauguucu aaucugcugc ugcaguaugg aucuuuuugu 2280
acacagcuga auagagcuuu aacaggaauu gcuguggaac aggauaaaaa uacacaggaa 2340
guguuugcuc aggugaaaca gauuuacaaa acaccaccaa uuaaagauuu uggaggauuu 2400
aauuuuagcc agauucugcc ugauccuucu aaaccuucua aaagaucuuu uauugaagau 2460
cugcuguuua auaaagugac acuggcagau gcaggauuua uuaaacagua uggagauugc 2520
cugggugaua uugcugcaag agaucugauu ugugcucaga aauuuaaugg acugacagug 2580
cugccuccuc ugcugacaga ugaaaugauu gcucaguaca caucugcuuu acuggcugga 2640
acaauuacaa gcggauggac auuuggagcu ggagcugcuc ugcagauucc uuuugcaaug 2700
cagauggcuu acagauuuaa uggaauugga gugacacaga auguguuaua ugaaaaucag 2760
aaacugauug caaaucaguu uaauucugca auuggcaaaa uucaggauuc ucugucuucu 2820
acagcuucug cucugggaaa acugcaggau guggugaauc agaaugcaca ggcacugaau 2880
acucugguga aacagcuguc uagcaauuuu ggggcaauuu cuucugugcu gaaugauauu 2940
cugucuagac uggauccucc ugaagcugaa gugcagauug auagacugau cacaggaaga 3000
cugcagucuc ugcagacuua ugugacacag cagcugauua gagcugcuga aauuagagcu 3060
ucugcuaauc uggcugcuac aaaaaugucu gaaugugugc ugggacaguc aaaaagagug 3120
gauuuuugug gaaaaggaua ucaucugaug ucuuuuccac agucugcucc acauggagug 3180
guguuuuuac augugacaua ugugccagca caggaaaaga auuuuaccac agcaccagca 3240
auuugucaug auggaaaagc acauuuucca agagaaggag uguuuguguc uaauggaaca 3300
cauugguuug ugacacagag aaauuuuuau gaaccucaga uuauuacaac agauaauaca 3360
uuugugucag gaaauuguga uguggugauu ggaauuguga auaauacagu guaugaucca 3420
cugcagccag aacuggauuc uuuuaaagaa gaacuggaua aauauuuuaa aaaucacaca 3480
ucuccugaug uggauuuagg agauauuucu ggaaucaaug caucuguggu gaauauucag 3540
aaagaaauug auagacugaa ugaaguggcc aaaaaucuga augaaucucu gauugaucug 3600
caggaacuug gaaaauauga acaguacauu aaauggccuu gguacauuug gcuuggauuu 3660
auugcaggau uaauugcaau ugugauggug acaauuaugu uauguuguau gacaucaugu 3720
uguucuuguu uaaaaggaug uuguucuugu ggaagcuguu guaaauuuga ugaagaugau 3780
ucugaaccug uguuaaaagg agugaaauug cauuacaca 3819
<210> 24
<211> 3819
<212> RNA
<213> Artificial Sequence
<220>
<223> S protein PP CDS V09
<400> 24
auguucgugu uccuggugcu gcugccucug guguccagcc agugugugaa ccugaccacc 60
agaacacagc ugccuccagc cuacaccaac agcuuuacca gaggcgugua cuaccccgac 120
aagguguuca gauccagcgu gcugcacucu acccaggacc uguuccugcc uuucuucagc 180
aacgugaccu gguuccacgc cauccacgug uccggcacca auggcaccaa gagauucgac 240
aaccccgugc ugcccuucaa cgacggggug uacuuugcca gcaccgagaa guccaacauc 300
aucagaggcu ggaucuucgg caccacacug gacagcaaga cccagagccu gcugaucgug 360
aacaacgcca ccaacguggu caucaaagug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgucu acuaccacaa gaacaacaag agcuggaugg aaagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugucccagc cuuuccugau ggaccuggaa 540
ggcaagcagg gcaacuucaa gaaccugcgc gaguucgugu uuaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccuauc aaccucgugc gggaucugcc ucagggcuuc 660
ucugcucugg aaccccuggu ggaucugccc aucggcauca acaucacccg guuucagaca 720
cugcuggccc ugcacagaag cuaccugaca ccuggcgaua gcagcagcgg auggacagcu 780
ggugccgccg cuuacuaugu gggcuaccug cagccuagaa ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggau ugugcucugg auccucugag cgagacaaag 900
ugcacccuga aguccuucac cguggaaaag ggcaucuacc agaccagcaa cuuccgggug 960
cagcccaccg aauccaucgu gcgguucccc aauaucacca aucugugccc cuucggcgag 1020
guguucaaug ccaccagauu cgccucugug uacgccugga accggaagcg gaucagcaau 1080
ugcguggccg acuacuccgu gcuguacaac uccgccagcu ucagcaccuu caagugcuac 1140
ggcguguccc cuaccaagcu gaacgaccug ugcuucacaa acguguacgc cgacagcuuc 1200
gugauccggg gagaugaagu gcggcagauu gccccuggac agacaggcaa gaucgccgac 1260
uacaacuaca agcugcccga cgacuucacc ggcuguguga uugccuggaa cagcaacaac 1320
cuggacucca aagucggcgg caacuacaau uaccuguacc ggcuguuccg gaaguccaau 1380
cugaagcccu ucgagcggga caucuccacc gagaucuauc aggccggcag caccccuugu 1440
aacggcgugg aaggcuucaa cugcuacuuc ccacugcagu ccuacggcuu ucagcccaca 1500
aauggcgugg gcuaucagcc cuacagagug guggugcuga gcuucgaacu gcugcaugcc 1560
ccugccacag ugugcggccc uaagaaaagc accaaucucg ugaagaacaa augcgugaac 1620
uucaacuuca acggccugac cggcaccggc gugcugacag agagcaacaa gaaguuccug 1680
ccauuccagc aguuuggccg ggauaucgcc gauaccacag acgccguuag agauccccag 1740
acacuggaaa uccuggacau caccccuugc agcuucggcg gagugucugu gaucaccccu 1800
ggcaccaaca ccagcaauca gguggcagug cuguaccagg acgugaacug uaccgaagug 1860
cccguggcca uucacgccga ucagcugaca ccuacauggc ggguguacuc caccggcagc 1920
aauguguuuc agaccagagc cggcugucug aucggagccg agcacgugaa caauagcuac 1980
gagugcgaca uccccaucgg cgcuggaauc ugcgccagcu accagacaca gacaaacagc 2040
ccucggagag ccagaagcgu ggccagccag agcaucauug ccuacacaau gucucugggc 2100
gccgagaaca gcguggccua cuccaacaac ucuaucgcua uccccaccaa cuucaccauc 2160
agcgugacca cagagauccu gccugugucc augaccaaga ccagcgugga cugcaccaug 2220
uacaucugcg gcgauuccac cgagugcucc aaccugcugc ugcaguacgg cagcuucugc 2280
acccagcuga auagagcccu gacagggauc gccguggaac aggacaagaa cacccaagag 2340
guguucgccc aagugaagca gaucuacaag accccuccua ucaaggacuu cggcggcuuc 2400
aauuucagcc agauucugcc cgauccuagc aagcccagca agcggagcuu caucgaggac 2460
cugcuguuca acaaagugac acuggccgac gccggcuuca ucaagcagua uggcgauugu 2520
cugggcgaca uugccgccag ggaucugauu ugcgcccaga aguuuaacgg acugacagug 2580
cugccuccuc ugcugaccga ugagaugauc gcccaguaca caucugcccu gcuggccggc 2640
acaaucacaa gcggcuggac auuuggagca ggcgccgcuc ugcagauccc cuuugcuaug 2700
cagauggccu accgguucaa cggcaucgga gugacccaga augugcugua cgagaaccag 2760
aagcugaucg ccaaccaguu caacagcgcc aucggcaaga uccaggacag ccugagcagc 2820
acagcaagcg cccugggaaa gcugcaggac guggucaacc agaaugccca ggcacugaac 2880
acccugguca agcagcuguc cuccaacuuc ggcgccauca gcucugugcu gaacgauauc 2940
cugagcagac uggacccucc ugaggccgag gugcagaucg acagacugau cacaggcaga 3000
cugcagagcc uccagacaua cgugacccag cagcugauca gagccgccga gauuagagcc 3060
ucugccaauc uggccgccac caagaugucu gagugugugc ugggccagag caagagagug 3120
gacuuuugcg gcaagggcua ccaccugaug agcuucccuc agucugcccc ucacggcgug 3180
guguuucugc acgugacaua ugugcccgcu caagagaaga auuucaccac cgcuccagcc 3240
aucugccacg acggcaaagc ccacuuuccu agagaaggcg uguucguguc caacggcacc 3300
cauugguucg ugacacagcg gaacuucuac gagccccaga ucaucaccac cgacaacacc 3360
uucgugucug gcaacugcga cgucgugauc ggcauuguga acaauaccgu guacgacccu 3420
cugcagcccg agcuggacag cuucaaagag gaacuggaca aguacuuuaa gaaccacaca 3480
agccccgacg uggaccuggg cgauaucagc ggaaucaaug ccagcgucgu gaacauccag 3540
aaagagaucg accggcugaa cgagguggcc aagaaucuga acgagagccu gaucgaccug 3600
caagaacugg ggaaguacga gcaguacauc aaguggcccu gguacaucug gcugggcuuu 3660
aucgccggac ugauugccau cgugaugguc acaaucaugc uguguugcau gaccagcugc 3720
uguagcugcc ugaagggcug uuguagcugu ggcagcugcu gcaaguucga cgaggacgau 3780
ucugagcccg ugcugaaggg cgugaaacug cacuacaca 3819
<210> 25
<211> 41
<212> PRT
<213> Artificial Sequence
<220>
<223> Foldon
<400> 25
Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val
1 5 10 15
Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Arg Ser
20 25 30
Leu Glu Val Leu Phe Gln Gly Pro Gly
35 40
<210> 26
<211> 123
<212> RNA
<213> Artificial Sequence
<220>
<223> Foldon CDS
<400> 26
ggaucugguu auauuccuga agcuccaaga gaugggcaag cuuacguucg uaaagauggc 60
gaauggguau uacuuucuac cuuuuuaggc cggucccugg aggugcuguu ccagggcccc 120
ggc 123
<210> 27
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> 5' UTR
<400> 27
aacuaguauu cuucuggucc ccacagacuc agagagaacc cgccacc 47
<210> 28
<211> 4282
<212> RNA
<213> Artificial Sequence
<220>
<223> RBL063.1
<400> 28
gggcgaacua guauucuucu gguccccaca gacucagaga gaacccgcca ccauguuugu 60
guuucuugug cugcugccuc uugugucuuc ucagugugug aauuugacaa caagaacaca 120
gcugccacca gcuuauacaa auucuuuuac cagaggagug uauuauccug auaaaguguu 180
uagaucuucu gugcugcaca gcacacagga ccuguuucug ccauuuuuua gcaaugugac 240
augguuucau gcaauucaug ugucuggaac aaauggaaca aaaagauuug auaauccugu 300
gcugccuuuu aaugauggag uguauuuugc uucaacagaa aagucaaaua uuauuagagg 360
auggauuuuu ggaacaacac uggauucuaa aacacagucu cugcugauug ugaauaaugc 420
aacaaaugug gugauuaaag ugugugaauu ucaguuuugu aaugauccuu uucugggagu 480
guauuaucac aaaaauaaua aaucuuggau ggaaucugaa uuuagagugu auuccucugc 540
aaauaauugu acauuugaau augugucuca gccuuuucug auggaucugg aaggaaaaca 600
gggcaauuuu aaaaaucuga gagaauuugu guuuaaaaau auugauggau auuuuaaaau 660
uuauucuaaa cacacaccaa uuaauuuagu gagagaucug ccucagggau uuucugcucu 720
ggaaccucug guggaucugc caauuggcau uaauauuaca agauuucaga cacugcuggc 780
ucugcacaga ucuuaucuga caccuggaga uucuucuucu ggauggacag ccggagcugc 840
agcuuauuau gugggcuauc ugcagccaag aacauuucug cugaaauaua augaaaaugg 900
aacaauuaca gaugcugugg auugugcucu ggauccucug ucugaaacaa aauguacauu 960
aaaaucuuuu acaguggaaa aaggcauuua ucagacaucu aauuuuagag ugcagccaac 1020
agaaucuauu gugagauuuc caaauauuac aaaucugugu ccauuuggag aaguguuuaa 1080
ugcaacaaga uuugcaucug uguaugcaug gaauagaaaa agaauuucua auuguguggc 1140
ugauuauucu gugcuguaua auagugcuuc uuuuuccaca uuuaaauguu auggaguguc 1200
uccaacaaaa uuaaaugauu uauguuuuac aaauguguau gcugauucuu uugugaucag 1260
aggugaugaa gugagacaga uugcccccgg acagacagga aaaauugcug auuacaauua 1320
caaacugccu gaugauuuua caggaugugu gauugcuugg aauucuaaua auuuagauuc 1380
uaaaguggga ggaaauuaca auuaucugua cagacuguuu agaaaaucaa aucugaaacc 1440
uuuugaaaga gauauuucaa cagaaauuua ucaggcugga ucaacaccuu guaauggagu 1500
ggaaggauuu aauuguuauu uuccauuaca gagcuaugga uuucagccaa ccaauggugu 1560
gggauaucag ccauauagag ugguggugcu gucuuuugaa cugcugcaug caccugcaac 1620
agugugugga ccuaaaaaau cuacaaauuu agugaaaaau aaauguguga auuuuaauuu 1680
uaauggauua acaggaacag gagugcugac agaaucuaau aaaaaauuuc ugccuuuuca 1740
gcaguuuggc agagauauug cagauaccac agaugcagug agagauccuc agacauuaga 1800
aauucuggau auuacaccuu guucuuuugg gggugugucu gugauuacac cuggaacaaa 1860
uacaucuaau cagguggcug ugcuguauca ggaugugaau uguacagaag ugccaguggc 1920
aauucaugca gaucagcuga caccaacaug gagaguguau ucuacaggau cuaauguguu 1980
ucagacaaga gcaggauguc ugauuggagc agaacaugug aauaauucuu augaauguga 2040
uauuccaauu ggagcaggca uuugugcauc uuaucagaca cagacaaauu ccccaaggag 2100
agcaagaucu guggcaucuc agucuauuau ugcauacacc augucucugg gagcagaaaa 2160
uucuguggca uauucuaaua auucuauugc uauuccaaca aauuuuacca uuucugugac 2220
aacagaaauu uuaccugugu cuaugacaaa aacaucugug gauuguacca uguacauuug 2280
uggagauucu acagaauguu cuaaucugcu gcugcaguau ggaucuuuuu guacacagcu 2340
gaauagagcu uuaacaggaa uugcugugga acaggauaaa aauacacagg aaguguuugc 2400
ucaggugaaa cagauuuaca aaacaccacc aauuaaagau uuuggaggau uuaauuuuag 2460
ccagauucug ccugauccuu cuaaaccuuc uaaaagaucu uuuauugaag aucugcuguu 2520
uaauaaagug acacuggcag augcaggauu uauuaaacag uauggagauu gccuggguga 2580
uauugcugca agagaucuga uuugugcuca gaaauuuaau ggacugacag ugcugccucc 2640
ucugcugaca gaugaaauga uugcucagua cacaucugcu uuacuggcug gaacaauuac 2700
aagcggaugg acauuuggag cuggagcugc ucugcagauu ccuuuugcaa ugcagauggc 2760
uuacagauuu aauggaauug gagugacaca gaauguguua uaugaaaauc agaaacugau 2820
ugcaaaucag uuuaauucug caauuggcaa aauucaggau ucucugucuu cuacagcuuc 2880
ugcucuggga aaacugcagg auguggugaa ucagaaugca caggcacuga auacucuggu 2940
gaaacagcug ucuagcaauu uuggggcaau uucuucugug cugaaugaua uucugucuag 3000
acuggauccu ccugaagcug aagugcagau ugauagacug aucacaggaa gacugcaguc 3060
ucugcagacu uaugugacac agcagcugau uagagcugcu gaaauuagag cuucugcuaa 3120
ucuggcugcu acaaaaaugu cugaaugugu gcugggacag ucaaaaagag uggauuuuug 3180
uggaaaagga uaucaucuga ugucuuuucc acagucugcu ccacauggag ugguguuuuu 3240
acaugugaca uaugugccag cacaggaaaa gaauuuuacc acagcaccag caauuuguca 3300
ugauggaaaa gcacauuuuc caagagaagg aguguuugug ucuaauggaa cacauugguu 3360
ugugacacag agaaauuuuu augaaccuca gauuauuaca acagauaaua cauuuguguc 3420
aggaaauugu gaugugguga uuggaauugu gaauaauaca guguaugauc cacugcagcc 3480
agaacuggau ucuuuuaaag aagaacugga uaaauauuuu aaaaaucaca caucuccuga 3540
uguggauuua ggagauauuu cuggaaucaa ugcaucugug gugaauauuc agaaagaaau 3600
ugauagacug aaugaagugg ccaaaaaucu gaaugaaucu cugauugauc ugcaggaacu 3660
uggaaaauau gaacaguaca uuaaauggcc uugguacauu uggcuuggau uuauugcagg 3720
auuaauugca auugugaugg ugacaauuau guuauguugu augacaucau guuguucuug 3780
uuuaaaagga uguuguucuu guggaagcug uuguaaauuu gaugaagaug auucugaacc 3840
uguguuaaaa ggagugaaau ugcauuacac augaugacuc gagcugguac ugcaugcacg 3900
caaugcuagc ugccccuuuc ccguccuggg uaccccgagu cucccccgac cucggguccc 3960
agguaugcuc ccaccuccac cugccccacu caccaccucu gcuaguucca gacaccuccc 4020
aagcacgcag caaugcagcu caaaacgcuu agccuagcca cacccccacg ggaaacagca 4080
gugauuaacc uuuagcaaua aacgaaaguu uaacuaagcu auacuaaccc caggguuggu 4140
caauuucgug ccagccacac ccuggagcua gcaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200
aagcauauga cuaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4260
aaaaaaaaaa aaaaaaaaaa aa 4282
<210> 29
<211> 4282
<212> RNA
<213> Artificial Sequence
<220>
<223> RBL063.2
<400> 29
gggcgaacua guauucuucu gguccccaca gacucagaga gaacccgcca ccauguucgu 60
guuccuggug cugcugccuc ugguguccag ccagugugug aaccugacca ccagaacaca 120
gcugccucca gccuacacca acagcuuuac cagaggcgug uacuaccccg acaagguguu 180
cagauccagc gugcugcacu cuacccagga ccuguuccug ccuuucuuca gcaacgugac 240
cugguuccac gccauccacg uguccggcac caauggcacc aagagauucg acaaccccgu 300
gcugcccuuc aacgacgggg uguacuuugc cagcaccgag aaguccaaca ucaucagagg 360
cuggaucuuc ggcaccacac uggacagcaa gacccagagc cugcugaucg ugaacaacgc 420
caccaacgug gucaucaaag ugugcgaguu ccaguucugc aacgaccccu uccugggcgu 480
cuacuaccac aagaacaaca agagcuggau ggaaagcgag uuccgggugu acagcagcgc 540
caacaacugc accuucgagu acguguccca gccuuuccug auggaccugg aaggcaagca 600
gggcaacuuc aagaaccugc gcgaguucgu guuuaagaac aucgacggcu acuucaagau 660
cuacagcaag cacaccccua ucaaccucgu gcgggaucug ccucagggcu ucucugcucu 720
ggaaccccug guggaucugc ccaucggcau caacaucacc cgguuucaga cacugcuggc 780
ccugcacaga agcuaccuga caccuggcga uagcagcagc ggauggacag cuggugccgc 840
cgcuuacuau gugggcuacc ugcagccuag aaccuuccug cugaaguaca acgagaacgg 900
caccaucacc gacgccgugg auugugcucu ggauccucug agcgagacaa agugcacccu 960
gaaguccuuc accguggaaa agggcaucua ccagaccagc aacuuccggg ugcagcccac 1020
cgaauccauc gugcgguucc ccaauaucac caaucugugc cccuucggcg agguguucaa 1080
ugccaccaga uucgccucug uguacgccug gaaccggaag cggaucagca auugcguggc 1140
cgacuacucc gugcuguaca acuccgccag cuucagcacc uucaagugcu acggcguguc 1200
cccuaccaag cugaacgacc ugugcuucac aaacguguac gccgacagcu ucgugauccg 1260
gggagaugaa gugcggcaga uugccccugg acagacaggc aagaucgccg acuacaacua 1320
caagcugccc gacgacuuca ccggcugugu gauugccugg aacagcaaca accuggacuc 1380
caaagucggc ggcaacuaca auuaccugua ccggcuguuc cggaagucca aucugaagcc 1440
cuucgagcgg gacaucucca ccgagaucua ucaggccggc agcaccccuu guaacggcgu 1500
ggaaggcuuc aacugcuacu ucccacugca guccuacggc uuucagccca caaauggcgu 1560
gggcuaucag cccuacagag ugguggugcu gagcuucgaa cugcugcaug ccccugccac 1620
agugugcggc ccuaagaaaa gcaccaaucu cgugaagaac aaaugcguga acuucaacuu 1680
caacggccug accggcaccg gcgugcugac agagagcaac aagaaguucc ugccauucca 1740
gcaguuuggc cgggauaucg ccgauaccac agacgccguu agagaucccc agacacugga 1800
aauccuggac aucaccccuu gcagcuucgg cggagugucu gugaucaccc cuggcaccaa 1860
caccagcaau cagguggcag ugcuguacca ggacgugaac uguaccgaag ugcccguggc 1920
cauucacgcc gaucagcuga caccuacaug gcggguguac uccaccggca gcaauguguu 1980
ucagaccaga gccggcuguc ugaucggagc cgagcacgug aacaauagcu acgagugcga 2040
cauccccauc ggcgcuggaa ucugcgccag cuaccagaca cagacaaaca gcccucggag 2100
agccagaagc guggccagcc agagcaucau ugccuacaca augucucugg gcgccgagaa 2160
cagcguggcc uacuccaaca acucuaucgc uauccccacc aacuucacca ucagcgugac 2220
cacagagauc cugccugugu ccaugaccaa gaccagcgug gacugcacca uguacaucug 2280
cggcgauucc accgagugcu ccaaccugcu gcugcaguac ggcagcuucu gcacccagcu 2340
gaauagagcc cugacaggga ucgccgugga acaggacaag aacacccaag agguguucgc 2400
ccaagugaag cagaucuaca agaccccucc uaucaaggac uucggcggcu ucaauuucag 2460
ccagauucug cccgauccua gcaagcccag caagcggagc uucaucgagg accugcuguu 2520
caacaaagug acacuggccg acgccggcuu caucaagcag uauggcgauu gucugggcga 2580
cauugccgcc agggaucuga uuugcgccca gaaguuuaac ggacugacag ugcugccucc 2640
ucugcugacc gaugagauga ucgcccagua cacaucugcc cugcuggccg gcacaaucac 2700
aagcggcugg acauuuggag caggcgccgc ucugcagauc cccuuugcua ugcagauggc 2760
cuaccgguuc aacggcaucg gagugaccca gaaugugcug uacgagaacc agaagcugau 2820
cgccaaccag uucaacagcg ccaucggcaa gauccaggac agccugagca gcacagcaag 2880
cgcccuggga aagcugcagg acguggucaa ccagaaugcc caggcacuga acacccuggu 2940
caagcagcug uccuccaacu ucggcgccau cagcucugug cugaacgaua uccugagcag 3000
acuggacccu ccugaggccg aggugcagau cgacagacug aucacaggca gacugcagag 3060
ccuccagaca uacgugaccc agcagcugau cagagccgcc gagauuagag ccucugccaa 3120
ucuggccgcc accaagaugu cugagugugu gcugggccag agcaagagag uggacuuuug 3180
cggcaagggc uaccaccuga ugagcuuccc ucagucugcc ccucacggcg ugguguuucu 3240
gcacgugaca uaugugcccg cucaagagaa gaauuucacc accgcuccag ccaucugcca 3300
cgacggcaaa gcccacuuuc cuagagaagg cguguucgug uccaacggca cccauugguu 3360
cgugacacag cggaacuucu acgagcccca gaucaucacc accgacaaca ccuucguguc 3420
uggcaacugc gacgucguga ucggcauugu gaacaauacc guguacgacc cucugcagcc 3480
cgagcuggac agcuucaaag aggaacugga caaguacuuu aagaaccaca caagccccga 3540
cguggaccug ggcgauauca gcggaaucaa ugccagcguc gugaacaucc agaaagagau 3600
cgaccggcug aacgaggugg ccaagaaucu gaacgagagc cugaucgacc ugcaagaacu 3660
ggggaaguac gagcaguaca ucaaguggcc cugguacauc uggcugggcu uuaucgccgg 3720
acugauugcc aucgugaugg ucacaaucau gcuguguugc augaccagcu gcuguagcug 3780
ccugaagggc uguuguagcu guggcagcug cugcaaguuc gacgaggacg auucugagcc 3840
cgugcugaag ggcgugaaac ugcacuacac augaugacuc gagcugguac ugcaugcacg 3900
caaugcuagc ugccccuuuc ccguccuggg uaccccgagu cucccccgac cucggguccc 3960
agguaugcuc ccaccuccac cugccccacu caccaccucu gcuaguucca gacaccuccc 4020
aagcacgcag caaugcagcu caaaacgcuu agccuagcca cacccccacg ggaaacagca 4080
gugauuaacc uuuagcaaua aacgaaaguu uaacuaagcu auacuaaccc caggguuggu 4140
caauuucgug ccagccacac ccuggagcua gcaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200
aagcauauga cuaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4260
aaaaaaaaaa aaaaaaaaaa aa 4282
<210> 30
<211> 1261
<212> RNA
<213> Artificial Sequence
<220>
<223> BNT162a1; RBL063.3
<400> 30
gggcgaacua guauucuucu gguccccaca gacucagaga gaacccgcca ccauguuugu 60
guuucuugug cugcugccuc uugugucuuc ucagugugug gugagauuuc caaauauuac 120
aaaucugugu ccauuuggag aaguguuuaa ugcaacaaga uuugcaucug uguaugcaug 180
gaauagaaaa agaauuucua auuguguggc ugauuauucu gugcuguaua auagugcuuc 240
uuuuuccaca uuuaaauguu auggaguguc uccaacaaaa uuaaaugauu uauguuuuac 300
aaauguguau gcugauucuu uugugaucag aggugaugaa gugagacaga uugcccccgg 360
acagacagga aaaauugcug auuacaauua caaacugccu gaugauuuua caggaugugu 420
gauugcuugg aauucuaaua auuuagauuc uaaaguggga ggaaauuaca auuaucugua 480
cagacuguuu agaaaaucaa aucugaaacc uuuugaaaga gauauuucaa cagaaauuua 540
ucaggcugga ucaacaccuu guaauggagu ggaaggauuu aauuguuauu uuccauuaca 600
gagcuaugga uuucagccaa ccaauggugu gggauaucag ccauauagag ugguggugcu 660
gucuuuugaa cugcugcaug caccugcaac agugugugga ccuaaaggcu cccccggcuc 720
cggcuccgga ucugguuaua uuccugaagc uccaagagau gggcaagcuu acguucguaa 780
agauggcgaa uggguauuac uuucuaccuu uuuaggccgg ucccuggagg ugcuguucca 840
gggccccggc ugaugacucg agcugguacu gcaugcacgc aaugcuagcu gccccuuucc 900
cguccugggu accccgaguc ucccccgacc ucggguccca gguaugcucc caccuccacc 960
ugccccacuc accaccucug cuaguuccag acaccuccca agcacgcagc aaugcagcuc 1020
aaaacgcuua gccuagccac acccccacgg gaaacagcag ugauuaaccu uuagcaauaa 1080
acgaaaguuu aacuaagcua uacuaacccc aggguugguc aauuucgugc cagccacacc 1140
cuggagcuag caaaaaaaaa aaaaaaaaaa aaaaaaaaaa agcauaugac uaaaaaaaaa 1200
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1260
a 1261
<210> 31
<211> 4283
<212> RNA
<213> Artificial Sequence
<220>
<223> BNT162b2; RBP020.1
<400> 31
agaauaaacu aguauucuuc ugguccccac agacucagag agaacccgcc accauguuug 60
uguuucuugu gcugcugccu cuugugucuu cucagugugu gaauuugaca acaagaacac 120
agcugccacc agcuuauaca aauucuuuua ccagaggagu guauuauccu gauaaagugu 180
uuagaucuuc ugugcugcac agcacacagg accuguuucu gccauuuuuu agcaauguga 240
caugguuuca ugcaauucau gugucuggaa caaauggaac aaaaagauuu gauaauccug 300
ugcugccuuu uaaugaugga guguauuuug cuucaacaga aaagucaaau auuauuagag 360
gauggauuuu uggaacaaca cuggauucua aaacacaguc ucugcugauu gugaauaaug 420
caacaaaugu ggugauuaaa gugugugaau uucaguuuug uaaugauccu uuucugggag 480
uguauuauca caaaaauaau aaaucuugga uggaaucuga auuuagagug uauuccucug 540
caaauaauug uacauuugaa uaugugucuc agccuuuucu gauggaucug gaaggaaaac 600
agggcaauuu uaaaaaucug agagaauuug uguuuaaaaa uauugaugga uauuuuaaaa 660
uuuauucuaa acacacacca auuaauuuag ugagagaucu gccucaggga uuuucugcuc 720
uggaaccucu gguggaucug ccaauuggca uuaauauuac aagauuucag acacugcugg 780
cucugcacag aucuuaucug acaccuggag auucuucuuc uggauggaca gccggagcug 840
cagcuuauua ugugggcuau cugcagccaa gaacauuucu gcugaaauau aaugaaaaug 900
gaacaauuac agaugcugug gauugugcuc uggauccucu gucugaaaca aaauguacau 960
uaaaaucuuu uacaguggaa aaaggcauuu aucagacauc uaauuuuaga gugcagccaa 1020
cagaaucuau ugugagauuu ccaaauauua caaaucugug uccauuugga gaaguguuua 1080
augcaacaag auuugcaucu guguaugcau ggaauagaaa aagaauuucu aauugugugg 1140
cugauuauuc ugugcuguau aauagugcuu cuuuuuccac auuuaaaugu uauggagugu 1200
cuccaacaaa auuaaaugau uuauguuuua caaaugugua ugcugauucu uuugugauca 1260
gaggugauga agugagacag auugcccccg gacagacagg aaaaauugcu gauuacaauu 1320
acaaacugcc ugaugauuuu acaggaugug ugauugcuug gaauucuaau aauuuagauu 1380
cuaaaguggg aggaaauuac aauuaucugu acagacuguu uagaaaauca aaucugaaac 1440
cuuuugaaag agauauuuca acagaaauuu aucaggcugg aucaacaccu uguaauggag 1500
uggaaggauu uaauuguuau uuuccauuac agagcuaugg auuucagcca accaauggug 1560
ugggauauca gccauauaga gugguggugc ugucuuuuga acugcugcau gcaccugcaa 1620
cagugugugg accuaaaaaa ucuacaaauu uagugaaaaa uaaaugugug aauuuuaauu 1680
uuaauggauu aacaggaaca ggagugcuga cagaaucuaa uaaaaaauuu cugccuuuuc 1740
agcaguuugg cagagauauu gcagauacca cagaugcagu gagagauccu cagacauuag 1800
aaauucugga uauuacaccu uguucuuuug gggguguguc ugugauuaca ccuggaacaa 1860
auacaucuaa ucagguggcu gugcuguauc aggaugugaa uuguacagaa gugccagugg 1920
caauucaugc agaucagcug acaccaacau ggagagugua uucuacagga ucuaaugugu 1980
uucagacaag agcaggaugu cugauuggag cagaacaugu gaauaauucu uaugaaugug 2040
auauuccaau uggagcaggc auuugugcau cuuaucagac acagacaaau uccccaagga 2100
gagcaagauc uguggcaucu cagucuauua uugcauacac caugucucug ggagcagaaa 2160
auucuguggc auauucuaau aauucuauug cuauuccaac aaauuuuacc auuucuguga 2220
caacagaaau uuuaccugug ucuaugacaa aaacaucugu ggauuguacc auguacauuu 2280
guggagauuc uacagaaugu ucuaaucugc ugcugcagua uggaucuuuu uguacacagc 2340
ugaauagagc uuuaacagga auugcugugg aacaggauaa aaauacacag gaaguguuug 2400
cucaggugaa acagauuuac aaaacaccac caauuaaaga uuuuggagga uuuaauuuua 2460
gccagauucu gccugauccu ucuaaaccuu cuaaaagauc uuuuauugaa gaucugcugu 2520
uuaauaaagu gacacuggca gaugcaggau uuauuaaaca guauggagau ugccugggug 2580
auauugcugc aagagaucug auuugugcuc agaaauuuaa uggacugaca gugcugccuc 2640
cucugcugac agaugaaaug auugcucagu acacaucugc uuuacuggcu ggaacaauua 2700
caagcggaug gacauuugga gcuggagcug cucugcagau uccuuuugca augcagaugg 2760
cuuacagauu uaauggaauu ggagugacac agaauguguu auaugaaaau cagaaacuga 2820
uugcaaauca guuuaauucu gcaauuggca aaauucagga uucucugucu ucuacagcuu 2880
cugcucuggg aaaacugcag gaugugguga aucagaaugc acaggcacug aauacucugg 2940
ugaaacagcu gucuagcaau uuuggggcaa uuucuucugu gcugaaugau auucugucua 3000
gacuggaucc uccugaagcu gaagugcaga uugauagacu gaucacagga agacugcagu 3060
cucugcagac uuaugugaca cagcagcuga uuagagcugc ugaaauuaga gcuucugcua 3120
aucuggcugc uacaaaaaug ucugaaugug ugcugggaca gucaaaaaga guggauuuuu 3180
guggaaaagg auaucaucug augucuuuuc cacagucugc uccacaugga gugguguuuu 3240
uacaugugac auaugugcca gcacaggaaa agaauuuuac cacagcacca gcaauuuguc 3300
augauggaaa agcacauuuu ccaagagaag gaguguuugu gucuaaugga acacauuggu 3360
uugugacaca gagaaauuuu uaugaaccuc agauuauuac aacagauaau acauuugugu 3420
caggaaauug ugauguggug auuggaauug ugaauaauac aguguaugau ccacugcagc 3480
cagaacugga uucuuuuaaa gaagaacugg auaaauauuu uaaaaaucac acaucuccug 3540
auguggauuu aggagauauu ucuggaauca augcaucugu ggugaauauu cagaaagaaa 3600
uugauagacu gaaugaagug gccaaaaauc ugaaugaauc ucugauugau cugcaggaac 3660
uuggaaaaua ugaacaguac auuaaauggc cuugguacau uuggcuugga uuuauugcag 3720
gauuaauugc aauugugaug gugacaauua uguuauguug uaugacauca uguuguucuu 3780
guuuaaaagg auguuguucu uguggaagcu guuguaaauu ugaugaagau gauucugaac 3840
cuguguuaaa aggagugaaa uugcauuaca caugaugacu cgagcuggua cugcaugcac 3900
gcaaugcuag cugccccuuu cccguccugg guaccccgag ucucccccga ccucgggucc 3960
cagguaugcu cccaccucca ccugccccac ucaccaccuc ugcuaguucc agacaccucc 4020
caagcacgca gcaaugcagc ucaaaacgcu uagccuagcc acacccccac gggaaacagc 4080
agugauuaac cuuuagcaau aaacgaaagu uuaacuaagc uauacuaacc ccaggguugg 4140
ucaauuucgu gccagccaca cccuggagcu agcaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200
aaagcauaug acuaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4260
aaaaaaaaaa aaaaaaaaaa aaa 4283
<210> 32
<211> 1262
<212> RNA
<213> Artificial Sequence
<220>
<223> BNT162b1; RBP020.3
<400> 32
agaauaaacu aguauucuuc ugguccccac agacucagag agaacccgcc accauguuug 60
uguuucuugu gcugcugccu cuugugucuu cucagugugu ggugagauuu ccaaauauua 120
caaaucugug uccauuugga gaaguguuua augcaacaag auuugcaucu guguaugcau 180
ggaauagaaa aagaauuucu aauugugugg cugauuauuc ugugcuguau aauagugcuu 240
cuuuuuccac auuuaaaugu uauggagugu cuccaacaaa auuaaaugau uuauguuuua 300
caaaugugua ugcugauucu uuugugauca gaggugauga agugagacag auugcccccg 360
gacagacagg aaaaauugcu gauuacaauu acaaacugcc ugaugauuuu acaggaugug 420
ugauugcuug gaauucuaau aauuuagauu cuaaaguggg aggaaauuac aauuaucugu 480
acagacuguu uagaaaauca aaucugaaac cuuuugaaag agauauuuca acagaaauuu 540
aucaggcugg aucaacaccu uguaauggag uggaaggauu uaauuguuau uuuccauuac 600
agagcuaugg auuucagcca accaauggug ugggauauca gccauauaga gugguggugc 660
ugucuuuuga acugcugcau gcaccugcaa cagugugugg accuaaaggc ucccccggcu 720
ccggcuccgg aucugguuau auuccugaag cuccaagaga ugggcaagcu uacguucgua 780
aagauggcga auggguauua cuuucuaccu uuuuaggccg gucccuggag gugcuguucc 840
agggccccgg cugaugacuc gagcugguac ugcaugcacg caaugcuagc ugccccuuuc 900
ccguccuggg uaccccgagu cucccccgac cucggguccc agguaugcuc ccaccuccac 960
cugccccacu caccaccucu gcuaguucca gacaccuccc aagcacgcag caaugcagcu 1020
caaaacgcuu agccuagcca cacccccacg ggaaacagca gugauuaacc uuuagcaaua 1080
aacgaaaguu uaacuaagcu auacuaaccc caggguuggu caauuucgug ccagccacac 1140
ccuggagcua gcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aagcauauga cuaaaaaaaa 1200
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1260
aa 1262
<210> 33
<211> 11917
<212> RNA
<213> Artificial Sequence
<220>
<223> RBS004.1
<400> 33
gaugggcggc gcaugagaga agcccagacc aauuaccuac ccaaaaugga gaaaguucac 60
guugacaucg aggaagacag cccauuccuc agagcuuugc agcggagcuu cccgcaguuu 120
gagguagaag ccaagcaggu cacugauaau gaccaugcua augccagagc guuuucgcau 180
cuggcuucaa aacugaucga aacggaggug gacccauccg acacgauccu ugacauugga 240
agugcgcccg cccgcagaau guauucuaag cacaaguauc auuguaucug uccgaugaga 300
ugugcggaag auccggacag auuguauaag uaugcaacua agcugaagaa aaacuguaag 360
gaaauaacug auaaggaauu ggacaagaaa augaaggagc ucgccgccgu caugagcgac 420
ccugaccugg aaacugagac uaugugccuc cacgacgacg agucgugucg cuacgaaggg 480
caagucgcug uuuaccagga uguauacgcg guugacggac cgacaagucu cuaucaccaa 540
gccaauaagg gaguuagagu cgccuacugg auaggcuuug acaccacccc uuuuauguuu 600
aagaacuugg cuggagcaua uccaucauac ucuaccaacu gggccgacga aaccguguua 660
acggcucgua acauaggccu augcagcucu gacguuaugg agcggucacg uagagggaug 720
uccauucuua gaaagaagua uuugaaacca uccaacaaug uucuauucuc uguuggcucg 780
accaucuacc acgaaaagag ggacuuacug aggagcuggc accugccguc uguauuucac 840
uuacguggca agcaaaauua cacaugucgg ugugagacua uaguuaguug cgacggguac 900
gucguuaaaa gaauagcuau caguccaggc cuguauggga agccuucagg cuaugcugcu 960
acgaugcacc gcgagggauu cuugugcugc aaagugacag acacauugaa cggggagagg 1020
gucucuuuuc ccgugugcac guaugugcca gcuacauugu gugaccaaau gacuggcaua 1080
cuggcaacag augucagugc ggacgacgcg caaaaacugc ugguugggcu caaccagcgu 1140
auagucguca acggucgcac ccagagaaac accaauacca ugaaaaauua ccuuuugccc 1200
guaguggccc aggcauuugc uaggugggca aaggaauaua aggaagauca agaagaugaa 1260
aggccacuag gacuacgaga uagacaguua gucauggggu guuguugggc uuuuagaagg 1320
cacaagauaa caucuauuua uaagcgcccg gauacccaaa ccaucaucaa agugaacagc 1380
gauuuccacu cauucgugcu gcccaggaua ggcaguaaca cauuggagau cgggcugaga 1440
acaagaauca ggaaaauguu agaggagcac aaggagccgu caccucucau uaccgccgag 1500
gacguacaag aagcuaagug cgcagccgau gaggcuaagg aggugcguga agccgaggag 1560
uugcgcgcag cucuaccacc uuuggcagcu gauguugagg agcccacucu ggaagccgau 1620
gucgacuuga uguuacaaga ggcuggggcc ggcucagugg agacaccucg uggcuugaua 1680
aagguuacca gcuacgcugg cgaggacaag aucggcucuu acgcugugcu uucuccgcag 1740
gcuguacuca agagugaaaa auuaucuugc auccacccuc ucgcugaaca agucauagug 1800
auaacacacu cuggccgaaa agggcguuau gccguggaac cauaccaugg uaaaguagug 1860
gugccagagg gacaugcaau acccguccag gacuuucaag cucugaguga aagugccacc 1920
auuguguaca acgaacguga guucguaaac agguaccugc accauauugc cacacaugga 1980
ggagcgcuga acacugauga agaauauuac aaaacuguca agcccagcga gcacgacggc 2040
gaauaccugu acgacaucga caggaaacag ugcgucaaga aagagcuagu cacugggcua 2100
gggcucacag gcgagcuggu cgauccuccc uuccaugaau ucgccuacga gagucugaga 2160
acacgaccag ccgcuccuua ccaaguacca accauagggg uguauggcgu gccaggauca 2220
ggcaagucug gcaucauuaa aagcgcaguc accaaaaaag aucuaguggu gagcgccaag 2280
aaagaaaacu gugcagaaau uauaagggac gucaagaaaa ugaaagggcu ggacgucaau 2340
gccagaacug uggacucagu gcucuugaau ggaugcaaac accccguaga gacccuguau 2400
auugacgagg cuuuugcuug ucaugcaggu acucucagag cgcucauagc cauuauaaga 2460
ccuaaaaagg cagugcucug cggagauccc aaacagugcg guuuuuuuaa caugaugugc 2520
cugaaagugc auuuuaacca cgagauuugc acacaagucu uccacaaaag caucucucgc 2580
cguugcacua aaucugugac uucggucguc ucaaccuugu uuuacgacaa aaaaaugaga 2640
acgacgaauc cgaaagagac uaagauugug auugacacua ccggcaguac caaaccuaag 2700
caggacgauc ucauucucac uuguuucaga ggguggguga agcaguugca aauagauuac 2760
aaaggcaacg aaauaaugac ggcagcugcc ucucaagggc ugacccguaa agguguguau 2820
gccguucggu acaaggugaa ugaaaauccu cuguacgcac ccaccucaga acaugugaac 2880
guccuacuga cccgcacgga ggaccgcauc guguggaaaa cacuagccgg cgacccaugg 2940
auaaaaacac ugacugccaa guacccuggg aauuucacug ccacgauaga ggaguggcaa 3000
gcagagcaug augccaucau gaggcacauc uuggagagac cggacccuac cgacgucuuc 3060
cagaauaagg caaacgugug uugggccaag gcuuuagugc cggugcugaa gaccgcuggc 3120
auagacauga ccacugaaca auggaacacu guggauuauu uugaaacgga caaagcucac 3180
ucagcagaga uaguauugaa ccaacuaugc gugagguucu uuggacucga ucuggacucc 3240
ggucuauuuu cugcacccac uguuccguua uccauuagga auaaucacug ggauaacucc 3300
ccgucgccua acauguacgg gcugaauaaa gaaguggucc gucagcucuc ucgcagguac 3360
ccacaacugc cucgggcagu ugccacuggu agagucuaug acaugaacac ugguacacug 3420
cgcaauuaug auccgcgcau aaaccuagua ccuguaaaca gaagacugcc ucaugcuuua 3480
guccuccacc auaaugaaca cccacagagu gacuuuucuu cauucgucag caaauugaag 3540
ggcagaacug uccugguggu cggggaaaag uuguccgucc caggcaaaau gguugacugg 3600
uugucagacc ggccugaggc uaccuucaga gcucggcugg auuuaggcau cccaggugau 3660
gugcccaaau augacauaau auuuguuaau gugaggaccc cauauaaaua ccaucacuau 3720
cagcagugug aagaccaugc cauuaagcua agcauguuga ccaagaaagc augucugcau 3780
cugaaucccg gcggaaccug ugucagcaua gguuaugguu acgcugacag ggccagcgaa 3840
agcaucauug gugcuauagc gcggcaguuc aaguuuuccc gaguaugcaa accgaaaucc 3900
ucacuugagg agacggaagu ucuguuugua uucauugggu acgaucgcaa ggcccguacg 3960
cacaauccuu acaagcuauc aucaaccuug accaacauuu auacagguuc cagacuccac 4020
gaagccggau gugcacccuc auaucaugug gugcgagggg auauugccac ggccaccgaa 4080
ggagugauua uaaaugcugc uaacagcaaa ggacaaccug gcggaggggu gugcggagcg 4140
cuguauaaga aauucccgga aaguuucgau uuacagccga ucgaaguagg aaaagcgcga 4200
cuggucaaag gugcagcuaa acauaucauu caugccguag gaccaaacuu caacaaaguu 4260
ucggagguug aaggugacaa acaguuggca gaggcuuaug aguccaucgc uaagauuguc 4320
aacgauaaca auuacaaguc aguagcgauu ccacuguugu ccaccggcau cuuuuccggg 4380
aacaaagauc gacuaaccca aucauugaac cauuugcuga cagcuuuaga caccacugau 4440
gcagauguag ccauauacug cagggacaag aaaugggaaa ugacucucaa ggaagcagug 4500
gcuaggagag aagcagugga ggagauaugc auauccgacg auucuucagu gacagaaccu 4560
gaugcagagc uggugagggu gcaucccaag aguucuuugg cuggaaggaa gggcuacagc 4620
acaagcgaug gcaaaacuuu cucauauuug gaagggacca aguuucacca ggcggccaag 4680
gauauagcag aaauuaaugc cauguggccc guugcaacgg aggccaauga gcagguaugc 4740
auguauaucc ucggagaaag caugagcagu auuaggucga aaugccccgu cgaggagucg 4800
gaagccucca caccaccuag cacgcugccu ugcuugugca uccaugccau gacuccagaa 4860
agaguacagc gccuaaaagc cucacgucca gaacaaauua cugugugcuc auccuuucca 4920
uugccgaagu auagaaucac uggugugcag aagauccaau gcucccagcc uauauuguuc 4980
ucaccgaaag ugccugcgua uauucaucca aggaaguauc ucguggaaac accaccggua 5040
gacgagacuc cggagccauc ggcagagaac caauccacag aggggacacc ugaacaacca 5100
ccacuuauaa ccgaggauga gaccaggacu agaacgccug agccgaucau caucgaagaa 5160
gaagaagaag auagcauaag uuugcuguca gauggcccga cccaccaggu gcugcaaguc 5220
gaggcagaca uucacgggcc gcccucugua ucuagcucau ccugguccau uccucaugca 5280
uccgacuuug auguggacag uuuauccaua cuugacaccc uggagggagc uagcgugacc 5340
agcggggcaa cgucagccga gacuaacucu uacuucgcaa agaguaugga guuucuggcg 5400
cgaccggugc cugcgccucg aacaguauuc aggaacccuc cacaucccgc uccgcgcaca 5460
agaacaccgu cacuugcacc cagcagggcc ugcuccagaa ccagccuagu uuccaccccg 5520
ccaggcguga auagggugau cacuagagag gagcucgaag cgcuuacccc gucacgcacu 5580
ccuagcaggu cggucuccag aaccagccug gucuccaacc cgccaggcgu aaauagggug 5640
auuacaagag aggaguuuga ggcguucgua gcacaacaac aaugacgguu ugaugcgggu 5700
gcauacaucu uuuccuccga caccggucaa gggcauuuac aacaaaaauc aguaaggcaa 5760
acggugcuau ccgaaguggu guuggagagg accgaauugg agauuucgua ugccccgcgc 5820
cucgaccaag aaaaagaaga auuacuacgc aagaaauuac aguuaaaucc cacaccugcu 5880
aacagaagca gauaccaguc caggaaggug gagaacauga aagccauaac agcuagacgu 5940
auucugcaag gccuagggca uuauuugaag gcagaaggaa aaguggagug cuaccgaacc 6000
cugcauccug uuccuuugua uucaucuagu gugaaccgug ccuuuucaag ccccaagguc 6060
gcaguggaag ccuguaacgc cauguugaaa gagaacuuuc cgacuguggc uucuuacugu 6120
auuauuccag aguacgaugc cuauuuggac augguugacg gagcuucaug cugcuuagac 6180
acugccaguu uuugcccugc aaagcugcgc agcuuuccaa agaaacacuc cuauuuggaa 6240
cccacaauac gaucggcagu gccuucagcg auccagaaca cgcuccagaa cguccuggca 6300
gcugccacaa aaagaaauug caaugucacg caaaugagag aauugcccgu auuggauucg 6360
gcggccuuua auguggaaug cuucaagaaa uaugcgugua auaaugaaua uugggaaacg 6420
uuuaaagaaa accccaucag gcuuacugaa gaaaacgugg uaaauuacau uaccaaauua 6480
aaaggaccaa aagcugcugc ucuuuuugcg aagacacaua auuugaauau guugcaggac 6540
auaccaaugg acagguuugu aauggacuua aagagagacg ugaaagugac uccaggaaca 6600
aaacauacug aagaacggcc caagguacag gugauccagg cugccgaucc gcuagcaaca 6660
gcguaucugu gcggaaucca ccgagagcug guuaggagau uaaaugcggu ccugcuuccg 6720
aacauucaua cacuguuuga uaugucggcu gaagacuuug acgcuauuau agccgagcac 6780
uuccagccug gggauugugu ucuggaaacu gacaucgcgu cguuugauaa aagugaggac 6840
gacgccaugg cucugaccgc guuaaugauu cuggaagacu uaggugugga cgcagagcug 6900
uugacgcuga uugaggcggc uuucggcgaa auuucaucaa uacauuugcc cacuaaaacu 6960
aaauuuaaau ucggagccau gaugaaaucu ggaauguucc ucacacuguu ugugaacaca 7020
gucauuaaca uuguaaucgc aagcagagug uugagagaac ggcuaaccgg aucaccaugu 7080
gcagcauuca uuggagauga caauaucgug aaaggaguca aaucggacaa auuaauggca 7140
gacaggugcg ccaccugguu gaauauggaa gucaagauua uagaugcugu ggugggcgag 7200
aaagcgccuu auuucugugg aggguuuauu uugugugacu ccgugaccgg cacagcgugc 7260
cguguggcag acccccuaaa aaggcuguuu aagcuaggca aaccucuggc agcagacgau 7320
gaacaugaug augacaggag aagggcauug caugaggagu caacacgcug gaaccgagug 7380
gguauucuuu cagagcugug caaggcagua gaaucaaggu augaaaccgu aggaacuucc 7440
aucauaguua uggccaugac uacucuagcu agcaguguua aaucauucag cuaccugaga 7500
ggggccccua uaacucucua cggcuaaccu gaauggacua cgacauaguc uaguccgcca 7560
agacuaguau guuuguguuu cuugugcugc ugccucuugu gucuucucag ugugugaauu 7620
ugacaacaag aacacagcug ccaccagcuu auacaaauuc uuuuaccaga ggaguguauu 7680
auccugauaa aguguuuaga ucuucugugc ugcacagcac acaggaccug uuucugccau 7740
uuuuuagcaa ugugacaugg uuucaugcaa uucauguguc uggaacaaau ggaacaaaaa 7800
gauuugauaa uccugugcug ccuuuuaaug auggagugua uuuugcuuca acagaaaagu 7860
caaauauuau uagaggaugg auuuuuggaa caacacugga uucuaaaaca cagucucugc 7920
ugauugugaa uaaugcaaca aaugugguga uuaaagugug ugaauuucag uuuuguaaug 7980
auccuuuucu gggaguguau uaucacaaaa auaauaaauc uuggauggaa ucugaauuua 8040
gaguguauuc cucugcaaau aauuguacau uugaauaugu gucucagccu uuucugaugg 8100
aucuggaagg aaaacagggc aauuuuaaaa aucugagaga auuuguguuu aaaaauauug 8160
auggauauuu uaaaauuuau ucuaaacaca caccaauuaa uuuagugaga gaucugccuc 8220
agggauuuuc ugcucuggaa ccucuggugg aucugccaau uggcauuaau auuacaagau 8280
uucagacacu gcuggcucug cacagaucuu aucugacacc uggagauucu ucuucuggau 8340
ggacagccgg agcugcagcu uauuaugugg gcuaucugca gccaagaaca uuucugcuga 8400
aauauaauga aaauggaaca auuacagaug cuguggauug ugcucuggau ccucugucug 8460
aaacaaaaug uacauuaaaa ucuuuuacag uggaaaaagg cauuuaucag acaucuaauu 8520
uuagagugca gccaacagaa ucuauuguga gauuuccaaa uauuacaaau cuguguccau 8580
uuggagaagu guuuaaugca acaagauuug caucugugua ugcauggaau agaaaaagaa 8640
uuucuaauug uguggcugau uauucugugc uguauaauag ugcuucuuuu uccacauuua 8700
aauguuaugg agugucucca acaaaauuaa augauuuaug uuuuacaaau guguaugcug 8760
auucuuuugu gaucagaggu gaugaaguga gacagauugc ccccggacag acaggaaaaa 8820
uugcugauua caauuacaaa cugccugaug auuuuacagg augugugauu gcuuggaauu 8880
cuaauaauuu agauucuaaa gugggaggaa auuacaauua ucuguacaga cuguuuagaa 8940
aaucaaaucu gaaaccuuuu gaaagagaua uuucaacaga aauuuaucag gcuggaucaa 9000
caccuuguaa uggaguggaa ggauuuaauu guuauuuucc auuacagagc uauggauuuc 9060
agccaaccaa ugguguggga uaucagccau auagaguggu ggugcugucu uuugaacugc 9120
ugcaugcacc ugcaacagug uguggaccua aaaaaucuac aaauuuagug aaaaauaaau 9180
gugugaauuu uaauuuuaau ggauuaacag gaacaggagu gcugacagaa ucuaauaaaa 9240
aauuucugcc uuuucagcag uuuggcagag auauugcaga uaccacagau gcagugagag 9300
auccucagac auuagaaauu cuggauauua caccuuguuc uuuugggggu gugucuguga 9360
uuacaccugg aacaaauaca ucuaaucagg uggcugugcu guaucaggau gugaauugua 9420
cagaagugcc aguggcaauu caugcagauc agcugacacc aacauggaga guguauucua 9480
caggaucuaa uguguuucag acaagagcag gaugucugau uggagcagaa caugugaaua 9540
auucuuauga augugauauu ccaauuggag caggcauuug ugcaucuuau cagacacaga 9600
caaauucccc aaggagagca agaucugugg caucucaguc uauuauugca uacaccaugu 9660
cucugggagc agaaaauucu guggcauauu cuaauaauuc uauugcuauu ccaacaaauu 9720
uuaccauuuc ugugacaaca gaaauuuuac cugugucuau gacaaaaaca ucuguggauu 9780
guaccaugua cauuugugga gauucuacag aauguucuaa ucugcugcug caguauggau 9840
cuuuuuguac acagcugaau agagcuuuaa caggaauugc uguggaacag gauaaaaaua 9900
cacaggaagu guuugcucag gugaaacaga uuuacaaaac accaccaauu aaagauuuug 9960
gaggauuuaa uuuuagccag auucugccug auccuucuaa accuucuaaa agaucuuuua 10020
uugaagaucu gcuguuuaau aaagugacac uggcagaugc aggauuuauu aaacaguaug 10080
gagauugccu gggugauauu gcugcaagag aucugauuug ugcucagaaa uuuaauggac 10140
ugacagugcu gccuccucug cugacagaug aaaugauugc ucaguacaca ucugcuuuac 10200
uggcuggaac aauuacaagc ggauggacau uuggagcugg agcugcucug cagauuccuu 10260
uugcaaugca gauggcuuac agauuuaaug gaauuggagu gacacagaau guguuauaug 10320
aaaaucagaa acugauugca aaucaguuua auucugcaau uggcaaaauu caggauucuc 10380
ugucuucuac agcuucugcu cugggaaaac ugcaggaugu ggugaaucag aaugcacagg 10440
cacugaauac ucuggugaaa cagcugucua gcaauuuugg ggcaauuucu ucugugcuga 10500
augauauucu gucuagacug gauccuccug aagcugaagu gcagauugau agacugauca 10560
caggaagacu gcagucucug cagacuuaug ugacacagca gcugauuaga gcugcugaaa 10620
uuagagcuuc ugcuaaucug gcugcuacaa aaaugucuga augugugcug ggacagucaa 10680
aaagagugga uuuuugugga aaaggauauc aucugauguc uuuuccacag ucugcuccac 10740
auggaguggu guuuuuacau gugacauaug ugccagcaca ggaaaagaau uuuaccacag 10800
caccagcaau uugucaugau ggaaaagcac auuuuccaag agaaggagug uuugugucua 10860
auggaacaca uugguuugug acacagagaa auuuuuauga accucagauu auuacaacag 10920
auaauacauu ugugucagga aauugugaug uggugauugg aauugugaau aauacagugu 10980
augauccacu gcagccagaa cuggauucuu uuaaagaaga acuggauaaa uauuuuaaaa 11040
aucacacauc uccugaugug gauuuaggag auauuucugg aaucaaugca ucugugguga 11100
auauucagaa agaaauugau agacugaaug aaguggccaa aaaucugaau gaaucucuga 11160
uugaucugca ggaacuugga aaauaugaac aguacauuaa auggccuugg uacauuuggc 11220
uuggauuuau ugcaggauua auugcaauug ugauggugac aauuauguua uguuguauga 11280
caucauguug uucuuguuua aaaggauguu guucuugugg aagcuguugu aaauuugaug 11340
aagaugauuc ugaaccugug uuaaaaggag ugaaauugca uuacacauga ugacucgagc 11400
ugguacugca ugcacgcaau gcuagcugcc ccuuucccgu ccuggguacc ccgagucucc 11460
cccgaccucg ggucccaggu augcucccac cuccaccugc cccacucacc accucugcua 11520
guuccagaca ccucccaagc acgcagcaau gcagcucaaa acgcuuagcc uagccacacc 11580
cccacgggaa acagcaguga uuaaccuuua gcaauaaacg aaaguuuaac uaagcuauac 11640
uaaccccagg guuggucaau uucgugccag ccacaccgcg gccgcaugaa uacagcagca 11700
auuggcaagc ugcuuacaua gaacucgcgg cgauuggcau gccgccuuaa aauuuuuauu 11760
uuauuuuuuc uuuucuuuuc cgaaucggau uuuguuuuua auauuucaaa aaaaaaaaaa 11820
aaaaaaaaaa aaaaaaagca uaugacuaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 11880
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 11917
<210> 34
<211> 11917
<212> RNA
<213> Artificial Sequence
<220>
<223> RBS004.2
<400> 34
gaugggcggc gcaugagaga agcccagacc aauuaccuac ccaaaaugga gaaaguucac 60
guugacaucg aggaagacag cccauuccuc agagcuuugc agcggagcuu cccgcaguuu 120
gagguagaag ccaagcaggu cacugauaau gaccaugcua augccagagc guuuucgcau 180
cuggcuucaa aacugaucga aacggaggug gacccauccg acacgauccu ugacauugga 240
agugcgcccg cccgcagaau guauucuaag cacaaguauc auuguaucug uccgaugaga 300
ugugcggaag auccggacag auuguauaag uaugcaacua agcugaagaa aaacuguaag 360
gaaauaacug auaaggaauu ggacaagaaa augaaggagc ucgccgccgu caugagcgac 420
ccugaccugg aaacugagac uaugugccuc cacgacgacg agucgugucg cuacgaaggg 480
caagucgcug uuuaccagga uguauacgcg guugacggac cgacaagucu cuaucaccaa 540
gccaauaagg gaguuagagu cgccuacugg auaggcuuug acaccacccc uuuuauguuu 600
aagaacuugg cuggagcaua uccaucauac ucuaccaacu gggccgacga aaccguguua 660
acggcucgua acauaggccu augcagcucu gacguuaugg agcggucacg uagagggaug 720
uccauucuua gaaagaagua uuugaaacca uccaacaaug uucuauucuc uguuggcucg 780
accaucuacc acgaaaagag ggacuuacug aggagcuggc accugccguc uguauuucac 840
uuacguggca agcaaaauua cacaugucgg ugugagacua uaguuaguug cgacggguac 900
gucguuaaaa gaauagcuau caguccaggc cuguauggga agccuucagg cuaugcugcu 960
acgaugcacc gcgagggauu cuugugcugc aaagugacag acacauugaa cggggagagg 1020
gucucuuuuc ccgugugcac guaugugcca gcuacauugu gugaccaaau gacuggcaua 1080
cuggcaacag augucagugc ggacgacgcg caaaaacugc ugguugggcu caaccagcgu 1140
auagucguca acggucgcac ccagagaaac accaauacca ugaaaaauua ccuuuugccc 1200
guaguggccc aggcauuugc uaggugggca aaggaauaua aggaagauca agaagaugaa 1260
aggccacuag gacuacgaga uagacaguua gucauggggu guuguugggc uuuuagaagg 1320
cacaagauaa caucuauuua uaagcgcccg gauacccaaa ccaucaucaa agugaacagc 1380
gauuuccacu cauucgugcu gcccaggaua ggcaguaaca cauuggagau cgggcugaga 1440
acaagaauca ggaaaauguu agaggagcac aaggagccgu caccucucau uaccgccgag 1500
gacguacaag aagcuaagug cgcagccgau gaggcuaagg aggugcguga agccgaggag 1560
uugcgcgcag cucuaccacc uuuggcagcu gauguugagg agcccacucu ggaagccgau 1620
gucgacuuga uguuacaaga ggcuggggcc ggcucagugg agacaccucg uggcuugaua 1680
aagguuacca gcuacgcugg cgaggacaag aucggcucuu acgcugugcu uucuccgcag 1740
gcuguacuca agagugaaaa auuaucuugc auccacccuc ucgcugaaca agucauagug 1800
auaacacacu cuggccgaaa agggcguuau gccguggaac cauaccaugg uaaaguagug 1860
gugccagagg gacaugcaau acccguccag gacuuucaag cucugaguga aagugccacc 1920
auuguguaca acgaacguga guucguaaac agguaccugc accauauugc cacacaugga 1980
ggagcgcuga acacugauga agaauauuac aaaacuguca agcccagcga gcacgacggc 2040
gaauaccugu acgacaucga caggaaacag ugcgucaaga aagagcuagu cacugggcua 2100
gggcucacag gcgagcuggu cgauccuccc uuccaugaau ucgccuacga gagucugaga 2160
acacgaccag ccgcuccuua ccaaguacca accauagggg uguauggcgu gccaggauca 2220
ggcaagucug gcaucauuaa aagcgcaguc accaaaaaag aucuaguggu gagcgccaag 2280
aaagaaaacu gugcagaaau uauaagggac gucaagaaaa ugaaagggcu ggacgucaau 2340
gccagaacug uggacucagu gcucuugaau ggaugcaaac accccguaga gacccuguau 2400
auugacgagg cuuuugcuug ucaugcaggu acucucagag cgcucauagc cauuauaaga 2460
ccuaaaaagg cagugcucug cggagauccc aaacagugcg guuuuuuuaa caugaugugc 2520
cugaaagugc auuuuaacca cgagauuugc acacaagucu uccacaaaag caucucucgc 2580
cguugcacua aaucugugac uucggucguc ucaaccuugu uuuacgacaa aaaaaugaga 2640
acgacgaauc cgaaagagac uaagauugug auugacacua ccggcaguac caaaccuaag 2700
caggacgauc ucauucucac uuguuucaga ggguggguga agcaguugca aauagauuac 2760
aaaggcaacg aaauaaugac ggcagcugcc ucucaagggc ugacccguaa agguguguau 2820
gccguucggu acaaggugaa ugaaaauccu cuguacgcac ccaccucaga acaugugaac 2880
guccuacuga cccgcacgga ggaccgcauc guguggaaaa cacuagccgg cgacccaugg 2940
auaaaaacac ugacugccaa guacccuggg aauuucacug ccacgauaga ggaguggcaa 3000
gcagagcaug augccaucau gaggcacauc uuggagagac cggacccuac cgacgucuuc 3060
cagaauaagg caaacgugug uugggccaag gcuuuagugc cggugcugaa gaccgcuggc 3120
auagacauga ccacugaaca auggaacacu guggauuauu uugaaacgga caaagcucac 3180
ucagcagaga uaguauugaa ccaacuaugc gugagguucu uuggacucga ucuggacucc 3240
ggucuauuuu cugcacccac uguuccguua uccauuagga auaaucacug ggauaacucc 3300
ccgucgccua acauguacgg gcugaauaaa gaaguggucc gucagcucuc ucgcagguac 3360
ccacaacugc cucgggcagu ugccacuggu agagucuaug acaugaacac ugguacacug 3420
cgcaauuaug auccgcgcau aaaccuagua ccuguaaaca gaagacugcc ucaugcuuua 3480
guccuccacc auaaugaaca cccacagagu gacuuuucuu cauucgucag caaauugaag 3540
ggcagaacug uccugguggu cggggaaaag uuguccgucc caggcaaaau gguugacugg 3600
uugucagacc ggccugaggc uaccuucaga gcucggcugg auuuaggcau cccaggugau 3660
gugcccaaau augacauaau auuuguuaau gugaggaccc cauauaaaua ccaucacuau 3720
cagcagugug aagaccaugc cauuaagcua agcauguuga ccaagaaagc augucugcau 3780
cugaaucccg gcggaaccug ugucagcaua gguuaugguu acgcugacag ggccagcgaa 3840
agcaucauug gugcuauagc gcggcaguuc aaguuuuccc gaguaugcaa accgaaaucc 3900
ucacuugagg agacggaagu ucuguuugua uucauugggu acgaucgcaa ggcccguacg 3960
cacaauccuu acaagcuauc aucaaccuug accaacauuu auacagguuc cagacuccac 4020
gaagccggau gugcacccuc auaucaugug gugcgagggg auauugccac ggccaccgaa 4080
ggagugauua uaaaugcugc uaacagcaaa ggacaaccug gcggaggggu gugcggagcg 4140
cuguauaaga aauucccgga aaguuucgau uuacagccga ucgaaguagg aaaagcgcga 4200
cuggucaaag gugcagcuaa acauaucauu caugccguag gaccaaacuu caacaaaguu 4260
ucggagguug aaggugacaa acaguuggca gaggcuuaug aguccaucgc uaagauuguc 4320
aacgauaaca auuacaaguc aguagcgauu ccacuguugu ccaccggcau cuuuuccggg 4380
aacaaagauc gacuaaccca aucauugaac cauuugcuga cagcuuuaga caccacugau 4440
gcagauguag ccauauacug cagggacaag aaaugggaaa ugacucucaa ggaagcagug 4500
gcuaggagag aagcagugga ggagauaugc auauccgacg auucuucagu gacagaaccu 4560
gaugcagagc uggugagggu gcaucccaag aguucuuugg cuggaaggaa gggcuacagc 4620
acaagcgaug gcaaaacuuu cucauauuug gaagggacca aguuucacca ggcggccaag 4680
gauauagcag aaauuaaugc cauguggccc guugcaacgg aggccaauga gcagguaugc 4740
auguauaucc ucggagaaag caugagcagu auuaggucga aaugccccgu cgaggagucg 4800
gaagccucca caccaccuag cacgcugccu ugcuugugca uccaugccau gacuccagaa 4860
agaguacagc gccuaaaagc cucacgucca gaacaaauua cugugugcuc auccuuucca 4920
uugccgaagu auagaaucac uggugugcag aagauccaau gcucccagcc uauauuguuc 4980
ucaccgaaag ugccugcgua uauucaucca aggaaguauc ucguggaaac accaccggua 5040
gacgagacuc cggagccauc ggcagagaac caauccacag aggggacacc ugaacaacca 5100
ccacuuauaa ccgaggauga gaccaggacu agaacgccug agccgaucau caucgaagaa 5160
gaagaagaag auagcauaag uuugcuguca gauggcccga cccaccaggu gcugcaaguc 5220
gaggcagaca uucacgggcc gcccucugua ucuagcucau ccugguccau uccucaugca 5280
uccgacuuug auguggacag uuuauccaua cuugacaccc uggagggagc uagcgugacc 5340
agcggggcaa cgucagccga gacuaacucu uacuucgcaa agaguaugga guuucuggcg 5400
cgaccggugc cugcgccucg aacaguauuc aggaacccuc cacaucccgc uccgcgcaca 5460
agaacaccgu cacuugcacc cagcagggcc ugcuccagaa ccagccuagu uuccaccccg 5520
ccaggcguga auagggugau cacuagagag gagcucgaag cgcuuacccc gucacgcacu 5580
ccuagcaggu cggucuccag aaccagccug gucuccaacc cgccaggcgu aaauagggug 5640
auuacaagag aggaguuuga ggcguucgua gcacaacaac aaugacgguu ugaugcgggu 5700
gcauacaucu uuuccuccga caccggucaa gggcauuuac aacaaaaauc aguaaggcaa 5760
acggugcuau ccgaaguggu guuggagagg accgaauugg agauuucgua ugccccgcgc 5820
cucgaccaag aaaaagaaga auuacuacgc aagaaauuac aguuaaaucc cacaccugcu 5880
aacagaagca gauaccaguc caggaaggug gagaacauga aagccauaac agcuagacgu 5940
auucugcaag gccuagggca uuauuugaag gcagaaggaa aaguggagug cuaccgaacc 6000
cugcauccug uuccuuugua uucaucuagu gugaaccgug ccuuuucaag ccccaagguc 6060
gcaguggaag ccuguaacgc cauguugaaa gagaacuuuc cgacuguggc uucuuacugu 6120
auuauuccag aguacgaugc cuauuuggac augguugacg gagcuucaug cugcuuagac 6180
acugccaguu uuugcccugc aaagcugcgc agcuuuccaa agaaacacuc cuauuuggaa 6240
cccacaauac gaucggcagu gccuucagcg auccagaaca cgcuccagaa cguccuggca 6300
gcugccacaa aaagaaauug caaugucacg caaaugagag aauugcccgu auuggauucg 6360
gcggccuuua auguggaaug cuucaagaaa uaugcgugua auaaugaaua uugggaaacg 6420
uuuaaagaaa accccaucag gcuuacugaa gaaaacgugg uaaauuacau uaccaaauua 6480
aaaggaccaa aagcugcugc ucuuuuugcg aagacacaua auuugaauau guugcaggac 6540
auaccaaugg acagguuugu aauggacuua aagagagacg ugaaagugac uccaggaaca 6600
aaacauacug aagaacggcc caagguacag gugauccagg cugccgaucc gcuagcaaca 6660
gcguaucugu gcggaaucca ccgagagcug guuaggagau uaaaugcggu ccugcuuccg 6720
aacauucaua cacuguuuga uaugucggcu gaagacuuug acgcuauuau agccgagcac 6780
uuccagccug gggauugugu ucuggaaacu gacaucgcgu cguuugauaa aagugaggac 6840
gacgccaugg cucugaccgc guuaaugauu cuggaagacu uaggugugga cgcagagcug 6900
uugacgcuga uugaggcggc uuucggcgaa auuucaucaa uacauuugcc cacuaaaacu 6960
aaauuuaaau ucggagccau gaugaaaucu ggaauguucc ucacacuguu ugugaacaca 7020
gucauuaaca uuguaaucgc aagcagagug uugagagaac ggcuaaccgg aucaccaugu 7080
gcagcauuca uuggagauga caauaucgug aaaggaguca aaucggacaa auuaauggca 7140
gacaggugcg ccaccugguu gaauauggaa gucaagauua uagaugcugu ggugggcgag 7200
aaagcgccuu auuucugugg aggguuuauu uugugugacu ccgugaccgg cacagcgugc 7260
cguguggcag acccccuaaa aaggcuguuu aagcuaggca aaccucuggc agcagacgau 7320
gaacaugaug augacaggag aagggcauug caugaggagu caacacgcug gaaccgagug 7380
gguauucuuu cagagcugug caaggcagua gaaucaaggu augaaaccgu aggaacuucc 7440
aucauaguua uggccaugac uacucuagcu agcaguguua aaucauucag cuaccugaga 7500
ggggccccua uaacucucua cggcuaaccu gaauggacua cgacauaguc uaguccgcca 7560
agacuaguau guucguguuc cuggugcugc ugccucuggu guccagccag ugugugaacc 7620
ugaccaccag aacacagcug ccuccagccu acaccaacag cuuuaccaga ggcguguacu 7680
accccgacaa gguguucaga uccagcgugc ugcacucuac ccaggaccug uuccugccuu 7740
ucuucagcaa cgugaccugg uuccacgcca uccacguguc cggcaccaau ggcaccaaga 7800
gauucgacaa ccccgugcug cccuucaacg acggggugua cuuugccagc accgagaagu 7860
ccaacaucau cagaggcugg aucuucggca ccacacugga cagcaagacc cagagccugc 7920
ugaucgugaa caacgccacc aacgugguca ucaaagugug cgaguuccag uucugcaacg 7980
accccuuccu gggcgucuac uaccacaaga acaacaagag cuggauggaa agcgaguucc 8040
ggguguacag cagcgccaac aacugcaccu ucgaguacgu gucccagccu uuccugaugg 8100
accuggaagg caagcagggc aacuucaaga accugcgcga guucguguuu aagaacaucg 8160
acggcuacuu caagaucuac agcaagcaca ccccuaucaa ccucgugcgg gaucugccuc 8220
agggcuucuc ugcucuggaa ccccuggugg aucugcccau cggcaucaac aucacccggu 8280
uucagacacu gcuggcccug cacagaagcu accugacacc uggcgauagc agcagcggau 8340
ggacagcugg ugccgccgcu uacuaugugg gcuaccugca gccuagaacc uuccugcuga 8400
aguacaacga gaacggcacc aucaccgacg ccguggauug ugcucuggau ccucugagcg 8460
agacaaagug cacccugaag uccuucaccg uggaaaaggg caucuaccag accagcaacu 8520
uccgggugca gcccaccgaa uccaucgugc gguuccccaa uaucaccaau cugugccccu 8580
ucggcgaggu guucaaugcc accagauucg ccucugugua cgccuggaac cggaagcgga 8640
ucagcaauug cguggccgac uacuccgugc uguacaacuc cgccagcuuc agcaccuuca 8700
agugcuacgg cguguccccu accaagcuga acgaccugug cuucacaaac guguacgccg 8760
acagcuucgu gauccgggga gaugaagugc ggcagauugc cccuggacag acaggcaaga 8820
ucgccgacua caacuacaag cugcccgacg acuucaccgg cugugugauu gccuggaaca 8880
gcaacaaccu ggacuccaaa gucggcggca acuacaauua ccuguaccgg cuguuccgga 8940
aguccaaucu gaagcccuuc gagcgggaca ucuccaccga gaucuaucag gccggcagca 9000
ccccuuguaa cggcguggaa ggcuucaacu gcuacuuccc acugcagucc uacggcuuuc 9060
agcccacaaa uggcgugggc uaucagcccu acagaguggu ggugcugagc uucgaacugc 9120
ugcaugcccc ugccacagug ugcggcccua agaaaagcac caaucucgug aagaacaaau 9180
gcgugaacuu caacuucaac ggccugaccg gcaccggcgu gcugacagag agcaacaaga 9240
aguuccugcc auuccagcag uuuggccggg auaucgccga uaccacagac gccguuagag 9300
auccccagac acuggaaauc cuggacauca ccccuugcag cuucggcgga gugucuguga 9360
ucaccccugg caccaacacc agcaaucagg uggcagugcu guaccaggac gugaacugua 9420
ccgaagugcc cguggccauu cacgccgauc agcugacacc uacauggcgg guguacucca 9480
ccggcagcaa uguguuucag accagagccg gcugucugau cggagccgag cacgugaaca 9540
auagcuacga gugcgacauc cccaucggcg cuggaaucug cgccagcuac cagacacaga 9600
caaacagccc ucggagagcc agaagcgugg ccagccagag caucauugcc uacacaaugu 9660
cucugggcgc cgagaacagc guggccuacu ccaacaacuc uaucgcuauc cccaccaacu 9720
ucaccaucag cgugaccaca gagauccugc cuguguccau gaccaagacc agcguggacu 9780
gcaccaugua caucugcggc gauuccaccg agugcuccaa ccugcugcug caguacggca 9840
gcuucugcac ccagcugaau agagcccuga cagggaucgc cguggaacag gacaagaaca 9900
cccaagaggu guucgcccaa gugaagcaga ucuacaagac cccuccuauc aaggacuucg 9960
gcggcuucaa uuucagccag auucugcccg auccuagcaa gcccagcaag cggagcuuca 10020
ucgaggaccu gcuguucaac aaagugacac uggccgacgc cggcuucauc aagcaguaug 10080
gcgauugucu gggcgacauu gccgccaggg aucugauuug cgcccagaag uuuaacggac 10140
ugacagugcu gccuccucug cugaccgaug agaugaucgc ccaguacaca ucugcccugc 10200
uggccggcac aaucacaagc ggcuggacau uuggagcagg cgccgcucug cagauccccu 10260
uugcuaugca gauggccuac cgguucaacg gcaucggagu gacccagaau gugcuguacg 10320
agaaccagaa gcugaucgcc aaccaguuca acagcgccau cggcaagauc caggacagcc 10380
ugagcagcac agcaagcgcc cugggaaagc ugcaggacgu ggucaaccag aaugcccagg 10440
cacugaacac ccuggucaag cagcuguccu ccaacuucgg cgccaucagc ucugugcuga 10500
acgauauccu gagcagacug gacccuccug aggccgaggu gcagaucgac agacugauca 10560
caggcagacu gcagagccuc cagacauacg ugacccagca gcugaucaga gccgccgaga 10620
uuagagccuc ugccaaucug gccgccacca agaugucuga gugugugcug ggccagagca 10680
agagagugga cuuuugcggc aagggcuacc accugaugag cuucccucag ucugccccuc 10740
acggcguggu guuucugcac gugacauaug ugcccgcuca agagaagaau uucaccaccg 10800
cuccagccau cugccacgac ggcaaagccc acuuuccuag agaaggcgug uucgugucca 10860
acggcaccca uugguucgug acacagcgga acuucuacga gccccagauc aucaccaccg 10920
acaacaccuu cgugucuggc aacugcgacg ucgugaucgg cauugugaac aauaccgugu 10980
acgacccucu gcagcccgag cuggacagcu ucaaagagga acuggacaag uacuuuaaga 11040
accacacaag ccccgacgug gaccugggcg auaucagcgg aaucaaugcc agcgucguga 11100
acauccagaa agagaucgac cggcugaacg agguggccaa gaaucugaac gagagccuga 11160
ucgaccugca agaacugggg aaguacgagc aguacaucaa guggcccugg uacaucuggc 11220
ugggcuuuau cgccggacug auugccaucg ugauggucac aaucaugcug uguugcauga 11280
ccagcugcug uagcugccug aagggcuguu guagcugugg cagcugcugc aaguucgacg 11340
aggacgauuc ugagcccgug cugaagggcg ugaaacugca cuacacauga ugacucgagc 11400
ugguacugca ugcacgcaau gcuagcugcc ccuuucccgu ccuggguacc ccgagucucc 11460
cccgaccucg ggucccaggu augcucccac cuccaccugc cccacucacc accucugcua 11520
guuccagaca ccucccaagc acgcagcaau gcagcucaaa acgcuuagcc uagccacacc 11580
cccacgggaa acagcaguga uuaaccuuua gcaauaaacg aaaguuuaac uaagcuauac 11640
uaaccccagg guuggucaau uucgugccag ccacaccgcg gccgcaugaa uacagcagca 11700
auuggcaagc ugcuuacaua gaacucgcgg cgauuggcau gccgccuuaa aauuuuuauu 11760
uuauuuuuuc uuuucuuuuc cgaaucggau uuuguuuuua auauuucaaa aaaaaaaaaa 11820
aaaaaaaaaa aaaaaaagca uaugacuaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 11880
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 11917
<210> 35
<211> 8896
<212> RNA
<213> Artificial Sequence
<220>
<223> BNT162c1; RBS004.3
<400> 35
gaugggcggc gcaugagaga agcccagacc aauuaccuac ccaaaaugga gaaaguucac 60
guugacaucg aggaagacag cccauuccuc agagcuuugc agcggagcuu cccgcaguuu 120
gagguagaag ccaagcaggu cacugauaau gaccaugcua augccagagc guuuucgcau 180
cuggcuucaa aacugaucga aacggaggug gacccauccg acacgauccu ugacauugga 240
agugcgcccg cccgcagaau guauucuaag cacaaguauc auuguaucug uccgaugaga 300
ugugcggaag auccggacag auuguauaag uaugcaacua agcugaagaa aaacuguaag 360
gaaauaacug auaaggaauu ggacaagaaa augaaggagc ucgccgccgu caugagcgac 420
ccugaccugg aaacugagac uaugugccuc cacgacgacg agucgugucg cuacgaaggg 480
caagucgcug uuuaccagga uguauacgcg guugacggac cgacaagucu cuaucaccaa 540
gccaauaagg gaguuagagu cgccuacugg auaggcuuug acaccacccc uuuuauguuu 600
aagaacuugg cuggagcaua uccaucauac ucuaccaacu gggccgacga aaccguguua 660
acggcucgua acauaggccu augcagcucu gacguuaugg agcggucacg uagagggaug 720
uccauucuua gaaagaagua uuugaaacca uccaacaaug uucuauucuc uguuggcucg 780
accaucuacc acgaaaagag ggacuuacug aggagcuggc accugccguc uguauuucac 840
uuacguggca agcaaaauua cacaugucgg ugugagacua uaguuaguug cgacggguac 900
gucguuaaaa gaauagcuau caguccaggc cuguauggga agccuucagg cuaugcugcu 960
acgaugcacc gcgagggauu cuugugcugc aaagugacag acacauugaa cggggagagg 1020
gucucuuuuc ccgugugcac guaugugcca gcuacauugu gugaccaaau gacuggcaua 1080
cuggcaacag augucagugc ggacgacgcg caaaaacugc ugguugggcu caaccagcgu 1140
auagucguca acggucgcac ccagagaaac accaauacca ugaaaaauua ccuuuugccc 1200
guaguggccc aggcauuugc uaggugggca aaggaauaua aggaagauca agaagaugaa 1260
aggccacuag gacuacgaga uagacaguua gucauggggu guuguugggc uuuuagaagg 1320
cacaagauaa caucuauuua uaagcgcccg gauacccaaa ccaucaucaa agugaacagc 1380
gauuuccacu cauucgugcu gcccaggaua ggcaguaaca cauuggagau cgggcugaga 1440
acaagaauca ggaaaauguu agaggagcac aaggagccgu caccucucau uaccgccgag 1500
gacguacaag aagcuaagug cgcagccgau gaggcuaagg aggugcguga agccgaggag 1560
uugcgcgcag cucuaccacc uuuggcagcu gauguugagg agcccacucu ggaagccgau 1620
gucgacuuga uguuacaaga ggcuggggcc ggcucagugg agacaccucg uggcuugaua 1680
aagguuacca gcuacgcugg cgaggacaag aucggcucuu acgcugugcu uucuccgcag 1740
gcuguacuca agagugaaaa auuaucuugc auccacccuc ucgcugaaca agucauagug 1800
auaacacacu cuggccgaaa agggcguuau gccguggaac cauaccaugg uaaaguagug 1860
gugccagagg gacaugcaau acccguccag gacuuucaag cucugaguga aagugccacc 1920
auuguguaca acgaacguga guucguaaac agguaccugc accauauugc cacacaugga 1980
ggagcgcuga acacugauga agaauauuac aaaacuguca agcccagcga gcacgacggc 2040
gaauaccugu acgacaucga caggaaacag ugcgucaaga aagagcuagu cacugggcua 2100
gggcucacag gcgagcuggu cgauccuccc uuccaugaau ucgccuacga gagucugaga 2160
acacgaccag ccgcuccuua ccaaguacca accauagggg uguauggcgu gccaggauca 2220
ggcaagucug gcaucauuaa aagcgcaguc accaaaaaag aucuaguggu gagcgccaag 2280
aaagaaaacu gugcagaaau uauaagggac gucaagaaaa ugaaagggcu ggacgucaau 2340
gccagaacug uggacucagu gcucuugaau ggaugcaaac accccguaga gacccuguau 2400
auugacgagg cuuuugcuug ucaugcaggu acucucagag cgcucauagc cauuauaaga 2460
ccuaaaaagg cagugcucug cggagauccc aaacagugcg guuuuuuuaa caugaugugc 2520
cugaaagugc auuuuaacca cgagauuugc acacaagucu uccacaaaag caucucucgc 2580
cguugcacua aaucugugac uucggucguc ucaaccuugu uuuacgacaa aaaaaugaga 2640
acgacgaauc cgaaagagac uaagauugug auugacacua ccggcaguac caaaccuaag 2700
caggacgauc ucauucucac uuguuucaga ggguggguga agcaguugca aauagauuac 2760
aaaggcaacg aaauaaugac ggcagcugcc ucucaagggc ugacccguaa agguguguau 2820
gccguucggu acaaggugaa ugaaaauccu cuguacgcac ccaccucaga acaugugaac 2880
guccuacuga cccgcacgga ggaccgcauc guguggaaaa cacuagccgg cgacccaugg 2940
auaaaaacac ugacugccaa guacccuggg aauuucacug ccacgauaga ggaguggcaa 3000
gcagagcaug augccaucau gaggcacauc uuggagagac cggacccuac cgacgucuuc 3060
cagaauaagg caaacgugug uugggccaag gcuuuagugc cggugcugaa gaccgcuggc 3120
auagacauga ccacugaaca auggaacacu guggauuauu uugaaacgga caaagcucac 3180
ucagcagaga uaguauugaa ccaacuaugc gugagguucu uuggacucga ucuggacucc 3240
ggucuauuuu cugcacccac uguuccguua uccauuagga auaaucacug ggauaacucc 3300
ccgucgccua acauguacgg gcugaauaaa gaaguggucc gucagcucuc ucgcagguac 3360
ccacaacugc cucgggcagu ugccacuggu agagucuaug acaugaacac ugguacacug 3420
cgcaauuaug auccgcgcau aaaccuagua ccuguaaaca gaagacugcc ucaugcuuua 3480
guccuccacc auaaugaaca cccacagagu gacuuuucuu cauucgucag caaauugaag 3540
ggcagaacug uccugguggu cggggaaaag uuguccgucc caggcaaaau gguugacugg 3600
uugucagacc ggccugaggc uaccuucaga gcucggcugg auuuaggcau cccaggugau 3660
gugcccaaau augacauaau auuuguuaau gugaggaccc cauauaaaua ccaucacuau 3720
cagcagugug aagaccaugc cauuaagcua agcauguuga ccaagaaagc augucugcau 3780
cugaaucccg gcggaaccug ugucagcaua gguuaugguu acgcugacag ggccagcgaa 3840
agcaucauug gugcuauagc gcggcaguuc aaguuuuccc gaguaugcaa accgaaaucc 3900
ucacuugagg agacggaagu ucuguuugua uucauugggu acgaucgcaa ggcccguacg 3960
cacaauccuu acaagcuauc aucaaccuug accaacauuu auacagguuc cagacuccac 4020
gaagccggau gugcacccuc auaucaugug gugcgagggg auauugccac ggccaccgaa 4080
ggagugauua uaaaugcugc uaacagcaaa ggacaaccug gcggaggggu gugcggagcg 4140
cuguauaaga aauucccgga aaguuucgau uuacagccga ucgaaguagg aaaagcgcga 4200
cuggucaaag gugcagcuaa acauaucauu caugccguag gaccaaacuu caacaaaguu 4260
ucggagguug aaggugacaa acaguuggca gaggcuuaug aguccaucgc uaagauuguc 4320
aacgauaaca auuacaaguc aguagcgauu ccacuguugu ccaccggcau cuuuuccggg 4380
aacaaagauc gacuaaccca aucauugaac cauuugcuga cagcuuuaga caccacugau 4440
gcagauguag ccauauacug cagggacaag aaaugggaaa ugacucucaa ggaagcagug 4500
gcuaggagag aagcagugga ggagauaugc auauccgacg auucuucagu gacagaaccu 4560
gaugcagagc uggugagggu gcaucccaag aguucuuugg cuggaaggaa gggcuacagc 4620
acaagcgaug gcaaaacuuu cucauauuug gaagggacca aguuucacca ggcggccaag 4680
gauauagcag aaauuaaugc cauguggccc guugcaacgg aggccaauga gcagguaugc 4740
auguauaucc ucggagaaag caugagcagu auuaggucga aaugccccgu cgaggagucg 4800
gaagccucca caccaccuag cacgcugccu ugcuugugca uccaugccau gacuccagaa 4860
agaguacagc gccuaaaagc cucacgucca gaacaaauua cugugugcuc auccuuucca 4920
uugccgaagu auagaaucac uggugugcag aagauccaau gcucccagcc uauauuguuc 4980
ucaccgaaag ugccugcgua uauucaucca aggaaguauc ucguggaaac accaccggua 5040
gacgagacuc cggagccauc ggcagagaac caauccacag aggggacacc ugaacaacca 5100
ccacuuauaa ccgaggauga gaccaggacu agaacgccug agccgaucau caucgaagaa 5160
gaagaagaag auagcauaag uuugcuguca gauggcccga cccaccaggu gcugcaaguc 5220
gaggcagaca uucacgggcc gcccucugua ucuagcucau ccugguccau uccucaugca 5280
uccgacuuug auguggacag uuuauccaua cuugacaccc uggagggagc uagcgugacc 5340
agcggggcaa cgucagccga gacuaacucu uacuucgcaa agaguaugga guuucuggcg 5400
cgaccggugc cugcgccucg aacaguauuc aggaacccuc cacaucccgc uccgcgcaca 5460
agaacaccgu cacuugcacc cagcagggcc ugcuccagaa ccagccuagu uuccaccccg 5520
ccaggcguga auagggugau cacuagagag gagcucgaag cgcuuacccc gucacgcacu 5580
ccuagcaggu cggucuccag aaccagccug gucuccaacc cgccaggcgu aaauagggug 5640
auuacaagag aggaguuuga ggcguucgua gcacaacaac aaugacgguu ugaugcgggu 5700
gcauacaucu uuuccuccga caccggucaa gggcauuuac aacaaaaauc aguaaggcaa 5760
acggugcuau ccgaaguggu guuggagagg accgaauugg agauuucgua ugccccgcgc 5820
cucgaccaag aaaaagaaga auuacuacgc aagaaauuac aguuaaaucc cacaccugcu 5880
aacagaagca gauaccaguc caggaaggug gagaacauga aagccauaac agcuagacgu 5940
auucugcaag gccuagggca uuauuugaag gcagaaggaa aaguggagug cuaccgaacc 6000
cugcauccug uuccuuugua uucaucuagu gugaaccgug ccuuuucaag ccccaagguc 6060
gcaguggaag ccuguaacgc cauguugaaa gagaacuuuc cgacuguggc uucuuacugu 6120
auuauuccag aguacgaugc cuauuuggac augguugacg gagcuucaug cugcuuagac 6180
acugccaguu uuugcccugc aaagcugcgc agcuuuccaa agaaacacuc cuauuuggaa 6240
cccacaauac gaucggcagu gccuucagcg auccagaaca cgcuccagaa cguccuggca 6300
gcugccacaa aaagaaauug caaugucacg caaaugagag aauugcccgu auuggauucg 6360
gcggccuuua auguggaaug cuucaagaaa uaugcgugua auaaugaaua uugggaaacg 6420
uuuaaagaaa accccaucag gcuuacugaa gaaaacgugg uaaauuacau uaccaaauua 6480
aaaggaccaa aagcugcugc ucuuuuugcg aagacacaua auuugaauau guugcaggac 6540
auaccaaugg acagguuugu aauggacuua aagagagacg ugaaagugac uccaggaaca 6600
aaacauacug aagaacggcc caagguacag gugauccagg cugccgaucc gcuagcaaca 6660
gcguaucugu gcggaaucca ccgagagcug guuaggagau uaaaugcggu ccugcuuccg 6720
aacauucaua cacuguuuga uaugucggcu gaagacuuug acgcuauuau agccgagcac 6780
uuccagccug gggauugugu ucuggaaacu gacaucgcgu cguuugauaa aagugaggac 6840
gacgccaugg cucugaccgc guuaaugauu cuggaagacu uaggugugga cgcagagcug 6900
uugacgcuga uugaggcggc uuucggcgaa auuucaucaa uacauuugcc cacuaaaacu 6960
aaauuuaaau ucggagccau gaugaaaucu ggaauguucc ucacacuguu ugugaacaca 7020
gucauuaaca uuguaaucgc aagcagagug uugagagaac ggcuaaccgg aucaccaugu 7080
gcagcauuca uuggagauga caauaucgug aaaggaguca aaucggacaa auuaauggca 7140
gacaggugcg ccaccugguu gaauauggaa gucaagauua uagaugcugu ggugggcgag 7200
aaagcgccuu auuucugugg aggguuuauu uugugugacu ccgugaccgg cacagcgugc 7260
cguguggcag acccccuaaa aaggcuguuu aagcuaggca aaccucuggc agcagacgau 7320
gaacaugaug augacaggag aagggcauug caugaggagu caacacgcug gaaccgagug 7380
gguauucuuu cagagcugug caaggcagua gaaucaaggu augaaaccgu aggaacuucc 7440
aucauaguua uggccaugac uacucuagcu agcaguguua aaucauucag cuaccugaga 7500
ggggccccua uaacucucua cggcuaaccu gaauggacua cgacauaguc uaguccgcca 7560
agacuaguau guuuguguuu cuugugcugc ugccucuugu gucuucucag ugugugguga 7620
gauuuccaaa uauuacaaau cuguguccau uuggagaagu guuuaaugca acaagauuug 7680
caucugugua ugcauggaau agaaaaagaa uuucuaauug uguggcugau uauucugugc 7740
uguauaauag ugcuucuuuu uccacauuua aauguuaugg agugucucca acaaaauuaa 7800
augauuuaug uuuuacaaau guguaugcug auucuuuugu gaucagaggu gaugaaguga 7860
gacagauugc ccccggacag acaggaaaaa uugcugauua caauuacaaa cugccugaug 7920
auuuuacagg augugugauu gcuuggaauu cuaauaauuu agauucuaaa gugggaggaa 7980
auuacaauua ucuguacaga cuguuuagaa aaucaaaucu gaaaccuuuu gaaagagaua 8040
uuucaacaga aauuuaucag gcuggaucaa caccuuguaa uggaguggaa ggauuuaauu 8100
guuauuuucc auuacagagc uauggauuuc agccaaccaa ugguguggga uaucagccau 8160
auagaguggu ggugcugucu uuugaacugc ugcaugcacc ugcaacagug uguggaccua 8220
aaggcucccc cggcuccggc uccggaucug guuauauucc ugaagcucca agagaugggc 8280
aagcuuacgu ucguaaagau ggcgaauggg uauuacuuuc uaccuuuuua ggccgguccc 8340
uggaggugcu guuccagggc cccggcugau gacucgagcu gguacugcau gcacgcaaug 8400
cuagcugccc cuuucccguc cuggguaccc cgagucuccc ccgaccucgg gucccaggua 8460
ugcucccacc uccaccugcc ccacucacca ccucugcuag uuccagacac cucccaagca 8520
cgcagcaaug cagcucaaaa cgcuuagccu agccacaccc ccacgggaaa cagcagugau 8580
uaaccuuuag caauaaacga aaguuuaacu aagcuauacu aaccccaggg uuggucaauu 8640
ucgugccagc cacaccgcgg ccgcaugaau acagcagcaa uuggcaagcu gcuuacauag 8700
aacucgcggc gauuggcaug ccgccuuaaa auuuuuauuu uauuuuuucu uuucuuuucc 8760
gaaucggauu uuguuuuuaa uauuucaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagcau 8820
augacuaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 8880
aaaaaaaaaa aaaaaa 8896
<210> 36
<211> 9079
<212> RNA
<213> Artificial Sequence
<220>
<223> RBS004.4
<400> 36
gaugggcggc gcaugagaga agcccagacc aauuaccuac ccaaaaugga gaaaguucac 60
guugacaucg aggaagacag cccauuccuc agagcuuugc agcggagcuu cccgcaguuu 120
gagguagaag ccaagcaggu cacugauaau gaccaugcua augccagagc guuuucgcau 180
cuggcuucaa aacugaucga aacggaggug gacccauccg acacgauccu ugacauugga 240
agugcgcccg cccgcagaau guauucuaag cacaaguauc auuguaucug uccgaugaga 300
ugugcggaag auccggacag auuguauaag uaugcaacua agcugaagaa aaacuguaag 360
gaaauaacug auaaggaauu ggacaagaaa augaaggagc ucgccgccgu caugagcgac 420
ccugaccugg aaacugagac uaugugccuc cacgacgacg agucgugucg cuacgaaggg 480
caagucgcug uuuaccagga uguauacgcg guugacggac cgacaagucu cuaucaccaa 540
gccaauaagg gaguuagagu cgccuacugg auaggcuuug acaccacccc uuuuauguuu 600
aagaacuugg cuggagcaua uccaucauac ucuaccaacu gggccgacga aaccguguua 660
acggcucgua acauaggccu augcagcucu gacguuaugg agcggucacg uagagggaug 720
uccauucuua gaaagaagua uuugaaacca uccaacaaug uucuauucuc uguuggcucg 780
accaucuacc acgaaaagag ggacuuacug aggagcuggc accugccguc uguauuucac 840
uuacguggca agcaaaauua cacaugucgg ugugagacua uaguuaguug cgacggguac 900
gucguuaaaa gaauagcuau caguccaggc cuguauggga agccuucagg cuaugcugcu 960
acgaugcacc gcgagggauu cuugugcugc aaagugacag acacauugaa cggggagagg 1020
gucucuuuuc ccgugugcac guaugugcca gcuacauugu gugaccaaau gacuggcaua 1080
cuggcaacag augucagugc ggacgacgcg caaaaacugc ugguugggcu caaccagcgu 1140
auagucguca acggucgcac ccagagaaac accaauacca ugaaaaauua ccuuuugccc 1200
guaguggccc aggcauuugc uaggugggca aaggaauaua aggaagauca agaagaugaa 1260
aggccacuag gacuacgaga uagacaguua gucauggggu guuguugggc uuuuagaagg 1320
cacaagauaa caucuauuua uaagcgcccg gauacccaaa ccaucaucaa agugaacagc 1380
gauuuccacu cauucgugcu gcccaggaua ggcaguaaca cauuggagau cgggcugaga 1440
acaagaauca ggaaaauguu agaggagcac aaggagccgu caccucucau uaccgccgag 1500
gacguacaag aagcuaagug cgcagccgau gaggcuaagg aggugcguga agccgaggag 1560
uugcgcgcag cucuaccacc uuuggcagcu gauguugagg agcccacucu ggaagccgau 1620
gucgacuuga uguuacaaga ggcuggggcc ggcucagugg agacaccucg uggcuugaua 1680
aagguuacca gcuacgcugg cgaggacaag aucggcucuu acgcugugcu uucuccgcag 1740
gcuguacuca agagugaaaa auuaucuugc auccacccuc ucgcugaaca agucauagug 1800
auaacacacu cuggccgaaa agggcguuau gccguggaac cauaccaugg uaaaguagug 1860
gugccagagg gacaugcaau acccguccag gacuuucaag cucugaguga aagugccacc 1920
auuguguaca acgaacguga guucguaaac agguaccugc accauauugc cacacaugga 1980
ggagcgcuga acacugauga agaauauuac aaaacuguca agcccagcga gcacgacggc 2040
gaauaccugu acgacaucga caggaaacag ugcgucaaga aagagcuagu cacugggcua 2100
gggcucacag gcgagcuggu cgauccuccc uuccaugaau ucgccuacga gagucugaga 2160
acacgaccag ccgcuccuua ccaaguacca accauagggg uguauggcgu gccaggauca 2220
ggcaagucug gcaucauuaa aagcgcaguc accaaaaaag aucuaguggu gagcgccaag 2280
aaagaaaacu gugcagaaau uauaagggac gucaagaaaa ugaaagggcu ggacgucaau 2340
gccagaacug uggacucagu gcucuugaau ggaugcaaac accccguaga gacccuguau 2400
auugacgagg cuuuugcuug ucaugcaggu acucucagag cgcucauagc cauuauaaga 2460
ccuaaaaagg cagugcucug cggagauccc aaacagugcg guuuuuuuaa caugaugugc 2520
cugaaagugc auuuuaacca cgagauuugc acacaagucu uccacaaaag caucucucgc 2580
cguugcacua aaucugugac uucggucguc ucaaccuugu uuuacgacaa aaaaaugaga 2640
acgacgaauc cgaaagagac uaagauugug auugacacua ccggcaguac caaaccuaag 2700
caggacgauc ucauucucac uuguuucaga ggguggguga agcaguugca aauagauuac 2760
aaaggcaacg aaauaaugac ggcagcugcc ucucaagggc ugacccguaa agguguguau 2820
gccguucggu acaaggugaa ugaaaauccu cuguacgcac ccaccucaga acaugugaac 2880
guccuacuga cccgcacgga ggaccgcauc guguggaaaa cacuagccgg cgacccaugg 2940
auaaaaacac ugacugccaa guacccuggg aauuucacug ccacgauaga ggaguggcaa 3000
gcagagcaug augccaucau gaggcacauc uuggagagac cggacccuac cgacgucuuc 3060
cagaauaagg caaacgugug uugggccaag gcuuuagugc cggugcugaa gaccgcuggc 3120
auagacauga ccacugaaca auggaacacu guggauuauu uugaaacgga caaagcucac 3180
ucagcagaga uaguauugaa ccaacuaugc gugagguucu uuggacucga ucuggacucc 3240
ggucuauuuu cugcacccac uguuccguua uccauuagga auaaucacug ggauaacucc 3300
ccgucgccua acauguacgg gcugaauaaa gaaguggucc gucagcucuc ucgcagguac 3360
ccacaacugc cucgggcagu ugccacuggu agagucuaug acaugaacac ugguacacug 3420
cgcaauuaug auccgcgcau aaaccuagua ccuguaaaca gaagacugcc ucaugcuuua 3480
guccuccacc auaaugaaca cccacagagu gacuuuucuu cauucgucag caaauugaag 3540
ggcagaacug uccugguggu cggggaaaag uuguccgucc caggcaaaau gguugacugg 3600
uugucagacc ggccugaggc uaccuucaga gcucggcugg auuuaggcau cccaggugau 3660
gugcccaaau augacauaau auuuguuaau gugaggaccc cauauaaaua ccaucacuau 3720
cagcagugug aagaccaugc cauuaagcua agcauguuga ccaagaaagc augucugcau 3780
cugaaucccg gcggaaccug ugucagcaua gguuaugguu acgcugacag ggccagcgaa 3840
agcaucauug gugcuauagc gcggcaguuc aaguuuuccc gaguaugcaa accgaaaucc 3900
ucacuugagg agacggaagu ucuguuugua uucauugggu acgaucgcaa ggcccguacg 3960
cacaauccuu acaagcuauc aucaaccuug accaacauuu auacagguuc cagacuccac 4020
gaagccggau gugcacccuc auaucaugug gugcgagggg auauugccac ggccaccgaa 4080
ggagugauua uaaaugcugc uaacagcaaa ggacaaccug gcggaggggu gugcggagcg 4140
cuguauaaga aauucccgga aaguuucgau uuacagccga ucgaaguagg aaaagcgcga 4200
cuggucaaag gugcagcuaa acauaucauu caugccguag gaccaaacuu caacaaaguu 4260
ucggagguug aaggugacaa acaguuggca gaggcuuaug aguccaucgc uaagauuguc 4320
aacgauaaca auuacaaguc aguagcgauu ccacuguugu ccaccggcau cuuuuccggg 4380
aacaaagauc gacuaaccca aucauugaac cauuugcuga cagcuuuaga caccacugau 4440
gcagauguag ccauauacug cagggacaag aaaugggaaa ugacucucaa ggaagcagug 4500
gcuaggagag aagcagugga ggagauaugc auauccgacg auucuucagu gacagaaccu 4560
gaugcagagc uggugagggu gcaucccaag aguucuuugg cuggaaggaa gggcuacagc 4620
acaagcgaug gcaaaacuuu cucauauuug gaagggacca aguuucacca ggcggccaag 4680
gauauagcag aaauuaaugc cauguggccc guugcaacgg aggccaauga gcagguaugc 4740
auguauaucc ucggagaaag caugagcagu auuaggucga aaugccccgu cgaggagucg 4800
gaagccucca caccaccuag cacgcugccu ugcuugugca uccaugccau gacuccagaa 4860
agaguacagc gccuaaaagc cucacgucca gaacaaauua cugugugcuc auccuuucca 4920
uugccgaagu auagaaucac uggugugcag aagauccaau gcucccagcc uauauuguuc 4980
ucaccgaaag ugccugcgua uauucaucca aggaaguauc ucguggaaac accaccggua 5040
gacgagacuc cggagccauc ggcagagaac caauccacag aggggacacc ugaacaacca 5100
ccacuuauaa ccgaggauga gaccaggacu agaacgccug agccgaucau caucgaagaa 5160
gaagaagaag auagcauaag uuugcuguca gauggcccga cccaccaggu gcugcaaguc 5220
gaggcagaca uucacgggcc gcccucugua ucuagcucau ccugguccau uccucaugca 5280
uccgacuuug auguggacag uuuauccaua cuugacaccc uggagggagc uagcgugacc 5340
agcggggcaa cgucagccga gacuaacucu uacuucgcaa agaguaugga guuucuggcg 5400
cgaccggugc cugcgccucg aacaguauuc aggaacccuc cacaucccgc uccgcgcaca 5460
agaacaccgu cacuugcacc cagcagggcc ugcuccagaa ccagccuagu uuccaccccg 5520
ccaggcguga auagggugau cacuagagag gagcucgaag cgcuuacccc gucacgcacu 5580
ccuagcaggu cggucuccag aaccagccug gucuccaacc cgccaggcgu aaauagggug 5640
auuacaagag aggaguuuga ggcguucgua gcacaacaac aaugacgguu ugaugcgggu 5700
gcauacaucu uuuccuccga caccggucaa gggcauuuac aacaaaaauc aguaaggcaa 5760
acggugcuau ccgaaguggu guuggagagg accgaauugg agauuucgua ugccccgcgc 5820
cucgaccaag aaaaagaaga auuacuacgc aagaaauuac aguuaaaucc cacaccugcu 5880
aacagaagca gauaccaguc caggaaggug gagaacauga aagccauaac agcuagacgu 5940
auucugcaag gccuagggca uuauuugaag gcagaaggaa aaguggagug cuaccgaacc 6000
cugcauccug uuccuuugua uucaucuagu gugaaccgug ccuuuucaag ccccaagguc 6060
gcaguggaag ccuguaacgc cauguugaaa gagaacuuuc cgacuguggc uucuuacugu 6120
auuauuccag aguacgaugc cuauuuggac augguugacg gagcuucaug cugcuuagac 6180
acugccaguu uuugcccugc aaagcugcgc agcuuuccaa agaaacacuc cuauuuggaa 6240
cccacaauac gaucggcagu gccuucagcg auccagaaca cgcuccagaa cguccuggca 6300
gcugccacaa aaagaaauug caaugucacg caaaugagag aauugcccgu auuggauucg 6360
gcggccuuua auguggaaug cuucaagaaa uaugcgugua auaaugaaua uugggaaacg 6420
uuuaaagaaa accccaucag gcuuacugaa gaaaacgugg uaaauuacau uaccaaauua 6480
aaaggaccaa aagcugcugc ucuuuuugcg aagacacaua auuugaauau guugcaggac 6540
auaccaaugg acagguuugu aauggacuua aagagagacg ugaaagugac uccaggaaca 6600
aaacauacug aagaacggcc caagguacag gugauccagg cugccgaucc gcuagcaaca 6660
gcguaucugu gcggaaucca ccgagagcug guuaggagau uaaaugcggu ccugcuuccg 6720
aacauucaua cacuguuuga uaugucggcu gaagacuuug acgcuauuau agccgagcac 6780
uuccagccug gggauugugu ucuggaaacu gacaucgcgu cguuugauaa aagugaggac 6840
gacgccaugg cucugaccgc guuaaugauu cuggaagacu uaggugugga cgcagagcug 6900
uugacgcuga uugaggcggc uuucggcgaa auuucaucaa uacauuugcc cacuaaaacu 6960
aaauuuaaau ucggagccau gaugaaaucu ggaauguucc ucacacuguu ugugaacaca 7020
gucauuaaca uuguaaucgc aagcagagug uugagagaac ggcuaaccgg aucaccaugu 7080
gcagcauuca uuggagauga caauaucgug aaaggaguca aaucggacaa auuaauggca 7140
gacaggugcg ccaccugguu gaauauggaa gucaagauua uagaugcugu ggugggcgag 7200
aaagcgccuu auuucugugg aggguuuauu uugugugacu ccgugaccgg cacagcgugc 7260
cguguggcag acccccuaaa aaggcuguuu aagcuaggca aaccucuggc agcagacgau 7320
gaacaugaug augacaggag aagggcauug caugaggagu caacacgcug gaaccgagug 7380
gguauucuuu cagagcugug caaggcagua gaaucaaggu augaaaccgu aggaacuucc 7440
aucauaguua uggccaugac uacucuagcu agcaguguua aaucauucag cuaccugaga 7500
ggggccccua uaacucucua cggcuaaccu gaauggacua cgacauaguc uaguccgcca 7560
agacuaguau guuuguguuu cuugugcugc ugccucuugu gucuucucag ugugugguga 7620
gauuuccaaa uauuacaaau cuguguccau uuggagaagu guuuaaugca acaagauuug 7680
caucugugua ugcauggaau agaaaaagaa uuucuaauug uguggcugau uauucugugc 7740
uguauaauag ugcuucuuuu uccacauuua aauguuaugg agugucucca acaaaauuaa 7800
augauuuaug uuuuacaaau guguaugcug auucuuuugu gaucagaggu gaugaaguga 7860
gacagauugc ccccggacag acaggaaaaa uugcugauua caauuacaaa cugccugaug 7920
auuuuacagg augugugauu gcuuggaauu cuaauaauuu agauucuaaa gugggaggaa 7980
auuacaauua ucuguacaga cuguuuagaa aaucaaaucu gaaaccuuuu gaaagagaua 8040
uuucaacaga aauuuaucag gcuggaucaa caccuuguaa uggaguggaa ggauuuaauu 8100
guuauuuucc auuacagagc uauggauuuc agccaaccaa ugguguggga uaucagccau 8160
auagaguggu ggugcugucu uuugaacugc ugcaugcacc ugcaacagug uguggaccua 8220
aaggcucccc cggcuccggc uccggaucug guuauauucc ugaagcucca agagaugggc 8280
aagcuuacgu ucguaaagau ggcgaauggg uauuacuuuc uaccuuuuua ggaagcggca 8340
gcggaucuga acaguacauu aaauggccuu gguacauuug gcuuggauuu auugcaggau 8400
uaauugcaau ugugauggug acaauuaugu uauguuguau gacaucaugu uguucuuguu 8460
uaaaaggaug uuguucuugu ggaagcuguu guaaauuuga ugaagaugau ucugaaccug 8520
uguuaaaagg agugaaauug cauuacacau gaugacucga gcugguacug caugcacgca 8580
augcuagcug ccccuuuccc guccugggua ccccgagucu cccccgaccu cgggucccag 8640
guaugcuccc accuccaccu gccccacuca ccaccucugc uaguuccaga caccucccaa 8700
gcacgcagca augcagcuca aaacgcuuag ccuagccaca cccccacggg aaacagcagu 8760
gauuaaccuu uagcaauaaa cgaaaguuua acuaagcuau acuaacccca ggguugguca 8820
auuucgugcc agccacaccg cggccgcaug aauacagcag caauuggcaa gcugcuuaca 8880
uagaacucgc ggcgauuggc augccgccuu aaaauuuuua uuuuauuuuu ucuuuucuuu 8940
uccgaaucgg auuuuguuuu uaauauuuca aaaaaaaaaa aaaaaaaaaa aaaaaaaaag 9000
cauaugacua aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 9060
aaaaaaaaaa aaaaaaaaa 9079
<210> 37
<211> 327
<212> PRT
<213> Artificial Sequence
<220>
<223> RBS004.4
<400> 37
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe
20 25 30
Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile
35 40 45
Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe
50 55 60
Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu
65 70 75 80
Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu
85 90 95
Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn
100 105 110
Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser
115 120 125
Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg
130 135 140
Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr
145 150 155 160
Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe
165 170 175
Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly
180 185 190
Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu
195 200 205
His Ala Pro Ala Thr Val Cys Gly Pro Lys Gly Ser Pro Gly Ser Gly
210 215 220
Ser Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
225 230 235 240
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser
245 250 255
Gly Ser Gly Ser Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
260 265 270
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu
275 280 285
Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys
290 295 300
Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
305 310 315 320
Gly Val Lys Leu His Tyr Thr
325
<210> 38
<211> 311
<212> PRT
<213> Artificial Sequence
<220>
<223> BNT162b3c
<400> 38
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
20 25 30
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
35 40 45
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
50 55 60
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
65 70 75 80
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
85 90 95
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala
100 105 110
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
115 120 125
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
130 135 140
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
145 150 155 160
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
165 170 175
Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
180 185 190
Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
195 200 205
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Gly Ser Pro
210 215 220
Gly Ser Gly Ser Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly
225 230 235 240
Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe
245 250 255
Leu Gly Ser Gly Ser Gly Ser Glu Gln Tyr Ile Lys Trp Pro Trp Tyr
260 265 270
Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr
275 280 285
Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys
290 295 300
Cys Ser Cys Gly Ser Cys Cys
305 310
<210> 39
<211> 1397
<212> RNA
<213> Artificial Sequence
<220>
<223> BNT162b3c
<400> 39
agaauaaacu aguauucuuc ugguccccac agacucagag agaacccgcc accauguuug 60
uguuucuugu gcugcugccu cuugugucuu cucagugugu gaauuugaca gugagauuuc 120
caaauauuac aaaucugugu ccauuuggag aaguguuuaa ugcaacaaga uuugcaucug 180
uguaugcaug gaauagaaaa agaauuucua auuguguggc ugauuauucu gugcuguaua 240
auagugcuuc uuuuuccaca uuuaaauguu auggaguguc uccaacaaaa uuaaaugauu 300
uauguuuuac aaauguguau gcugauucuu uugugaucag aggugaugaa gugagacaga 360
uugcccccgg acagacagga aaaauugcug auuacaauua caaacugccu gaugauuuua 420
caggaugugu gauugcuugg aauucuaaua auuuagauuc uaaaguggga ggaaauuaca 480
auuaucugua cagacuguuu agaaaaucaa aucugaaacc uuuugaaaga gauauuucaa 540
cagaaauuua ucaggcugga ucaacaccuu guaauggagu ggaaggauuu aauuguuauu 600
uuccauuaca gagcuaugga uuucagccaa ccaauggugu gggauaucag ccauauagag 660
ugguggugcu gucuuuugaa cugcugcaug caccugcaac agugugugga ccuaaaggcu 720
cccccggcuc cggcuccgga ucugguuaua uuccugaagc uccaagagau gggcaagcuu 780
acguucguaa agauggcgaa uggguauuac uuucuaccuu uuuaggaagc ggcagcggau 840
cugaacagua cauuaaaugg ccuugguaca uuuggcuugg auuuauugca ggauuaauug 900
caauugugau ggugacaauu auguuauguu guaugacauc auguuguucu uguuuaaaag 960
gauguuguuc uuguggaagc uguuguugau gacucgagcu gguacugcau gcacgcaaug 1020
cuagcugccc cuuucccguc cuggguaccc cgagucuccc ccgaccucgg gucccaggua 1080
ugcucccacc uccaccugcc ccacucacca ccucugcuag uuccagacac cucccaagca 1140
cgcagcaaug cagcucaaaa cgcuuagccu agccacaccc ccacgggaaa cagcagugau 1200
uaaccuuuag caauaaacga aaguuuaacu aagcuauacu aaccccaggg uuggucaauu 1260
ucgugccagc cacacccugg agcuagcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaagca 1320
uaugacuaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1380
aaaaaaaaaa aaaaaaa 1397
<210> 40
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> BNT162b3d
<400> 40
Met Asp Trp Ile Trp Arg Ile Leu Phe Leu Val Gly Ala Ala Thr Gly
1 5 10 15
Ala His Ser Gln Met Gln Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
20 25 30
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
35 40 45
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
50 55 60
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
65 70 75 80
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
85 90 95
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
100 105 110
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
115 120 125
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
130 135 140
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
145 150 155 160
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
165 170 175
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
180 185 190
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
195 200 205
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
210 215 220
Gly Ser Pro Gly Ser Gly Ser Gly Ser Gly Tyr Ile Pro Glu Ala Pro
225 230 235 240
Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu
245 250 255
Ser Thr Phe Leu Gly Ser Gly Ser Gly Ser Glu Gln Tyr Ile Lys Trp
260 265 270
Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val
275 280 285
Met Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu
290 295 300
Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys
305 310
<210> 41
<211> 1406
<212> RNA
<213> Artificial Sequence
<220>
<223> BNT162b3d
<400> 41
agaauaaacu aguauucuuc ugguccccac agacucagag agaacccgcc accauggauu 60
ggauuuggag aauccuguuc cucgugggag ccgcuacagg agcccacucc cagaugcagg 120
ugagauuucc aaauauuaca aaucuguguc cauuuggaga aguguuuaau gcaacaagau 180
uugcaucugu guaugcaugg aauagaaaaa gaauuucuaa uuguguggcu gauuauucug 240
ugcuguauaa uagugcuucu uuuuccacau uuaaauguua uggagugucu ccaacaaaau 300
uaaaugauuu auguuuuaca aauguguaug cugauucuuu ugugaucaga ggugaugaag 360
ugagacagau ugcccccgga cagacaggaa aaauugcuga uuacaauuac aaacugccug 420
augauuuuac aggaugugug auugcuugga auucuaauaa uuuagauucu aaagugggag 480
gaaauuacaa uuaucuguac agacuguuua gaaaaucaaa ucugaaaccu uuugaaagag 540
auauuucaac agaaauuuau caggcuggau caacaccuug uaauggagug gaaggauuua 600
auuguuauuu uccauuacag agcuauggau uucagccaac caauggugug ggauaucagc 660
cauauagagu gguggugcug ucuuuugaac ugcugcaugc accugcaaca guguguggac 720
cuaaaggcuc ccccggcucc ggcuccggau cugguuauau uccugaagcu ccaagagaug 780
ggcaagcuua cguucguaaa gauggcgaau ggguauuacu uucuaccuuu uuaggaagcg 840
gcagcggauc ugaacaguac auuaaauggc cuugguacau uuggcuugga uuuauugcag 900
gauuaauugc aauugugaug gugacaauua uguuauguug uaugacauca uguuguucuu 960
guuuaaaagg auguuguucu uguggaagcu guuguugaug acucgagcug guacugcaug 1020
cacgcaaugc uagcugcccc uuucccgucc uggguacccc gagucucccc cgaccucggg 1080
ucccagguau gcucccaccu ccaccugccc cacucaccac cucugcuagu uccagacacc 1140
ucccaagcac gcagcaaugc agcucaaaac gcuuagccua gccacacccc cacgggaaac 1200
agcagugauu aaccuuuagc aauaaacgaa aguuuaacua agcuauacua accccagggu 1260
uggucaauuu cgugccagcc acacccugga gcuagcaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaagcau augacuaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1380
aaaaaaaaaa aaaaaaaaaa aaaaaa 1406
<---
название | год | авторы | номер документа |
---|---|---|---|
Полинуклеотиды, кодирующие релаксин | 2017 |
|
RU2795683C2 |
ВАРИАНТЫ РНК-ПОЛИМЕРАЗЫ Т7 | 2018 |
|
RU2796061C2 |
СНИЖЕНИЕ ПРЕВРАЩЕНИЯ НИКОТИНА В НОРНИКОТИН В РАСТЕНИЯХ | 2015 |
|
RU2733837C2 |
ВАРИАНТЫ, КОМПОЗИЦИИ И СПОСОБЫ ПРИМЕНЕНИЯ ЭНДОНУКЛЕАЗЫ CBLB | 2018 |
|
RU2779097C2 |
ЧАСТИЦА РЕПЛИКОНА АЛЬФАВИРУСА | 2018 |
|
RU2795596C2 |
ВАКЦИНЫ НА ОСНОВЕ ВИРУСОПОДОБНЫХ ЧАСТИЦ (VLP) СОБАЧЬЕГО ПАРВОВИРУСА (CPV) И ИХ ПРИМЕНЕНИЕ | 2016 |
|
RU2710854C1 |
МОДУЛИРОВАНИЕ СОДЕРЖАНИЯ РЕДУЦИРУЮЩИХ САХАРОВ В РАСТЕНИИ | 2019 |
|
RU2801948C2 |
РЕКОМБИНАНТНЫЕ ВАКЦИНЫ ОТ FMDV И ИХ ПРИМЕНЕНИЕ | 2015 |
|
RU2745373C2 |
НОВЫЙ ПОЛИПЕПТИД И СПОСОБ ПОЛУЧЕНИЯ L-ЛЕЙЦИНА С ЕГО ИСПОЛЬЗОВАНИЕМ | 2021 |
|
RU2811433C1 |
ГЛИКАНЗАВИСИМЫЕ ИММУНОТЕРАПЕВТИЧЕСКИЕ МОЛЕКУЛЫ | 2016 |
|
RU2754661C2 |
Изобретение относится к области биотехнологии, в частности к вариантам композиции для индукции иммунного ответа для терапевтического или профилактического лечения заболевания. Указанная композиция включает эффективное количество полинуклеотида РНК, содержащего последовательность, кодирующую полезную нагрузку, причем 5’-конец полинуклеотида РНК содержит m7(3’OMeG)(5')ppp(5')(2'OMeA1)pG2pA3pA4pN5, где N5 представляет собой уридин, или модифицированный уридин, или m7(3'OMeG)(5')ppp(5')(2'OMeA1)pG2pA3pN4pN5, где каждый из N4 и N5 независимо выбран из A, G, C, U или модифицированного уридина. Кроме того, настоящее изобретение также относится к вариантам фармацевтической композиции, в которой указанный полинуклеотид РНК составлен в виде частицы. Настоящее изобретение обеспечивает кассеты РНК с улучшенным уровнем экспрессии кодируемой полезной нагрузки и/или увеличенной продолжительностью экспрессии кодированной полезной нагрузки in vivo. 4 н. и 48 з.п. ф-лы, 18 ил., 4 табл., 3 пр.
1. Композиция для индукции иммунного ответа для терапевтического или профилактического лечения заболевания, включающая эффективное количество полинуклеотида РНК, содержащего последовательность, кодирующую полезную нагрузку, где:
полинуклеотид РНК необязательно включает модифицированный уридин вместо одного или нескольких уридинов; и
5’-конец полинуклеотида РНК содержит m7(3’OMeG)(5')ppp(5')(2'OMeA1)pG2pA3pA4pN5, где N5 представляет собой уридин или модифицированный уридин.
2. Композиция по п. 1, где композиция представляет собой медицинский препарат.
3. Композиция по п. 1 или 2, где полинуклеотид РНК включает 5'-UTR альфа-глобина (hAg) человека или его фрагмент, и где 5'-UTR hAg или его фрагмент необязательно содержат модифицированный уридин вместо одного или нескольких уридинов.
4. Композиция по п. 3, где полинуклеотид РНК включает последовательность Козак, необязательно содержащую модифицированный уридин вместо одного или нескольких уридинов.
5. Композиция по п. 4, где полинуклеотид РНК содержит нуклеотидную последовательность SEQ ID NO: 27, необязательно содержащую модифицированный уридин вместо одного или нескольких уридинов.
6. Композиция по п. 1, где полинуклеотид РНК включает последовательность 3’ UTR, необязательно содержащую модифицированный уридин вместо одного или нескольких уридинов.
7. Композиция по п. 6, где последовательность 3’ UTR содержит нуклеотидную последовательность SEQ ID NO: 13, необязательно содержащую модифицированный уридин вместо одного или нескольких уридинов.
8. Композиция по п. 1, где полинуклеотид РНК включает последовательность полиА.
9. Композиция по п. 8, где последовательность полиА содержит по меньшей мере 100 нуклеотидов.
10. Композиция по п. 9, где:
(i) последовательность полиА представляет собой прерванную последовательность адениновых нуклеотидов; и/или
(ii) последовательность полиА содержит 30 адениновых нуклеотидов, за которыми следуют 70 адениновых нуклеотидов, где 30 адениновых нуклеотидов и 70 адениновых нуклеотидов разделены линкерной последовательностью.
11. Композиция по п. 10, где последовательность полиА содержит нуклеотидную последовательность SEQ ID NO: 14.
12. Композиция по п. 1, где полинуклеотид РНК, содержит:
(a) 5’-кэп, содержащий структуру Cap1;
(b) проксимальную последовательность кэпа, включающую положения +1, +2, +3, +4 и +5 полинуклеотида РНК;
(c) последовательность 5’-UTR, содержащую нуклеотидную последовательность SEQ ID NO: 27;
(d) последовательность, кодирующую полезную нагрузку;
(e) последовательность 3’-UTR, содержащую нуклеотидную последовательность SEQ ID NO: 13; и
(f) последовательность полиА, содержащую нуклеотидную последовательность SEQ ID NO: 14;
где:
(i) структура Cap1 содержит m7(3’OMeG)(5')ppp(5')(2'OMeA1)pG2, где A1 представляет собой положение +1 полинуклеотида РНК, а G2 представляет собой положение +2 полинуклеотида РНК;
(ii) проксимальная последовательность кэпа содержит A1 и G2 структуры Cap1, и последовательность, содержащую: A3A4U5 (SEQ ID NO: 5) в положениях +3, +4 и +5, соответственно, полинуклеотида РНК; и
(iii) полинуклеотид РНК необязательно содержит модифицированный уридин вместо одного или нескольких уридинов.
13. Композиция по п. 1 или 12, где полинуклеотид РНК включает модифицированный уридин вместо одного или нескольких уридинов.
14. Композиция по п. 13, где полинуклеотид РНК включает модифицированный уридин вместо каждого уридина.
15. Композиция по п. 13 или 14, где модифицированный уридин представляет собой N1-метилпсевдуридин (m1ψ).
16. Композиция по п. 1 или 12, где полинуклеотид РНК включает в ориентации от 5’ к 3’, 5’ кэп и проксимальную последовательность кэпа, содержащие m7(3’OMeG)(5’)ppp(5’)(2’OMeA1)pG2pA3pA4pN5, 5’ UTR, последовательность, кодирующую полезную нагрузку, последовательности 3'-UTR и последовательность полиА.
17. Композиция по п. 1 или 12, где последовательность, кодирующая полезную нагрузку, включает последовательность, кодирующую полипептид заместительного белка; последовательность, кодирующую антительный агент; последовательность, кодирующую цитокин; последовательность, кодирующую антигенный полипептид; последовательность, кодирующую компонент редактирования генов; последовательность, кодирующую компонент регенеративной медицины или их комбинацию.
18. Композиция по п. 17, где последовательность, кодирующая полезную нагрузку, содержит последовательность, кодирующую антигенный полипептид.
19. Композиция по п. 18, где антигенный полипептид содержит эпитоп антигена.
20. Композиция по п. 18 или 19, где антигенный полипептид содержит множество различных эпитопов из одного или нескольких антигенов.
21. Композиция по п. 18, где антигенный полипептид содержит: антигенный полипептид из аллергена, вирусный антигенный полипептид, бактериальный антигенный полипептид, грибной антигенный полипептид, паразитарный антигенный полипептид, антигенный полипептид из инфекционного агента, антигенный полипептид патогена, опухолевый антигенный полипептид или аутоантигенный полипептид.
22. Композиция по п. 1, где полинуклеотид РНК представляет собой мРНК.
23. Фармацевтическая композиция для индукции иммунного ответа для терапевтического или профилактического лечения заболевания, содержащая эффективное количество полинуклеотида РНК, составленного в виде частицы, где полинуклеотид РНК включает последовательность, кодирующую полезную нагрузку, где:
полинуклеотид РНК необязательно включает модифицированный уридин вместо одного или нескольких уридинов; и
5’-конец полинуклеотида РНК содержит m7(3’OMeG)(5’)ppp(5’)(2’OMeA1)pG2pA3pA4pN5, где N5 представляет собой уридин или модифицированный уридин.
24. Фармацевтическая композиция по п. 23, где частица представляет собой липидную наночастицу (ЛНЧ) или липоплексную частицу (ЛП).
25. Фармацевтическая композиция по п. 23 или 24, где липидные наночастицы (ЛНЧ), содержат катионно ионизируемый липид, нейтральный липид, стерол и конъюгированный с полимером липид, причем полинуклеотид РНК содержит:
(a) 5’-кэп, содержащий структуру Cap1;
(b) проксимальную последовательность кэпа, включающую положения +1, +2, +3, +4 и +5 полинуклеотида РНК;
(c) последовательность 5’-UTR, содержащую нуклеотидную последовательность SEQ ID NO: 27;
(d) последовательность, кодирующая полезную нагрузку;
(e) последовательность 3’-UTR, содержащую нуклеотидную последовательность SEQ ID NO: 13; и
(f) последовательность полиА, содержащую нуклеотидную последовательность SEQ ID NO: 14;
где:
(i) структура Cap1 содержит m7(3’OMeG)(5')ppp(5')(2'OMeA1)pG2, где A1 представляет собой положение +1 полинуклеотида РНК, а G2 представляет собой положение +2 полинуклеотида РНК;
(ii) проксимальная последовательность кэпа содержит A1 и G2 структуры Cap1, и последовательность, содержащую: A3A4U5 (SEQ ID NO: 5) в положениях +3, +4 и +5, соответственно, полинуклеотида РНК; и
(iii) полинуклеотид РНК необязательно содержит модифицированный уридин вместо одного или нескольких уридинов.
26. Фармацевтическая композиция по п. 23 или 25, которая составлена в виде жидкости.
27. Фармацевтическая композиция по п. 23 или 25, которая составлена в виде твердой формы.
28. Фармацевтическая композиция по п. 23 или 25, где полинуклеотид РНК включает в ориентации от 5' к 3', 5’ кэп и проксимальную последовательность кэпа, содержащие m7(3’OMeG)(5')ppp(5')(2'OMeA1)pG2pA3pA4pN5, 5'-UTR, последовательность, кодирующую полезную нагрузку, 3'-UTR и последовательность полиА.
29. Фармацевтическая композиция по п. 23 или 25, где полинуклеотид РНК включает модифицированный уридин вместо одного или нескольких уридинов.
30. Фармацевтическая композиция по п. 29, где модифицированный уридин представляет собой N1-метилпсевдуридин (m1ψ).
31. Фармацевтическая композиция по п. 23 или 25, где полинуклеотид РНК включает модифицированный уридин вместо каждого уридина.
32. Фармацевтическая композиция по п. 31, где модифицированный уридин представляет собой N1-метилпсевдуридин (m1ψ).
33. Композиция для индукции иммунного ответа для терапевтического или профилактического лечения заболевания, включающая эффективное количество полинуклеотида РНК, содержащего последовательность, кодирующую полезную нагрузку, где:
полинуклеотид РНК необязательно включает модифицированный уридин вместо одного или нескольких уридинов; и
5'-конец полинуклеотида РНК содержит m7(3'OMeG)(5')ppp(5')(2'OMeA1)pG2pA3pN4pN5, где каждый из N4 и N5 независимо выбран из A, G, C, U или модифицированного уридина.
34. Композиция по п. 33, где композиция представляет собой медицинский препарат.
35. Композиция по п. 33, где полинуклеотид РНК содержит последовательность SEQ ID NO: 27, необязательно содержащую модифицированный уридин вместо одного или нескольких уридинов.
36. Композиция по п. 33, где полинуклеотид РНК содержит последовательность 3’-UTR, причем последовательность 3’-UTR содержит нуклеотидную последовательность SEQ ID NO: 13, необязательно содержащую модифицированный уридин вместо одного или нескольких уридинов.
37. Композиция по п. 33, где полинуклеотид РНК включает последовательность полиА.
38. Композиция по п. 33, где последовательность полиА содержит последовательность SEQ ID NO: 14, необязательно содержащую модифицированный уридин вместо одного или нескольких уридинов.
39. Композиция по п. 33, где полинуклеотид РНК включает в ориентации от 5’ к 3’ m7(3’OMeG)(5')ppp(5')(2'OMeA1)pG2pA3pN4pN5, другие последовательности 5’ UTR, последовательность, кодирующую полезную нагрузку, последовательности 3'-UTR и последовательность полиА.
40. Композиция по п. 33, где полинуклеотид РНК включает модифицированный уридин вместо каждого уридина.
41. Композиция по п. 40, где модифицированный уридин представляет собой N1-метилпсевдуридин (m1ψ).
42. Композиция по п. 33, где последовательность, кодирующая полезную нагрузку, включает последовательность, кодирующую полипептид заместительного белка; последовательность, кодирующую антительный агент; последовательность, кодирующую цитокин; последовательность, кодирующую антигенный полипептид; последовательность, кодирующую компонент редактирования генов; последовательность, кодирующую компонент регенеративной медицины или их комбинацию.
43. Композиция по п. 42, где последовательность, кодирующая полезную нагрузку, содержит последовательность, кодирующую антигенный полипептид.
44. Композиция по п. 43, где антигенный полипептид содержит множество различных эпитопов из одного или нескольких антигенов.
45. Композиция по п. 42, где антигенный полипептид содержит: антигенный полипептид из аллергена, вирусный антигенный полипептид, бактериальный антигенный полипептид, грибной антигенный полипептид, паразитарный антигенный полипептид, антигенный полипептид из инфекционного агента, антигенный полипептид патогена, опухолевый антигенный полипептид или аутоантигенный полипептид.
46. Фармацевтическая композиция для индукции иммунного ответа для терапевтического или профилактического лечения заболевания, содержащая эффективное количество полинуклеотида РНК, составленного в виде частицы, где полинуклеотид РНК включает последовательность, кодирующую полезную нагрузку, где:
полинуклеотид РНК необязательно включает модифицированный уридин вместо одного или нескольких уридинов; и
5'-конец полинуклеотида РНК содержит m7(3'OMeG)(5')ppp(5')(2'OMeA1)pG2pA3pN4pN5, где каждый из N4 и N5 независимо выбран из A, G, C, U или модифицированного уридина.
47. Фармацевтическая композиция по п. 46, где частица представляет собой липидную наночастицу (ЛНЧ), содержащую катионно ионизируемый липид; стерол; фосфолипид; и ПЭГилированный липид.
48. Фармацевтическая композиция по п. 46, где полинуклеотид РНК включает в ориентации от 5' к 3' m7(3’OMeG)(5')ppp(5')(2'OMeA1)pG2pA3pN4pN5, другие последовательности 5'-UTR, последовательность, кодирующая полезную нагрузку, 3'-UTR и последовательность полиА.
49. Фармацевтическая композиция по п. 46, отличающаяся тем, что полинуклеотид РНК включает модифицированный уридин вместо по меньшей мере одного уридина.
50. Фармацевтическая композиция по п. 49, где модифицированный уридин представляет собой N1-метилпсевдуридин (m1ψ).
51. Фармацевтическая композиция по п. 46, где полинуклеотид РНК включает модифицированный уридин вместо каждого уридина.
52. Фармацевтическая композиция по п. 51, где модифицированный уридин представляет собой N1-метилпсевдуридин (m1ψ).
ZENG, CHUNXI et al., Leveraging mRNAs sequences to express SARS-CoV-2 antigens in vivo, bioRxiv: the preprint server for biology, 2020.04.01.019877 | |||
Способ восстановления спиралей из вольфрамовой проволоки для электрических ламп накаливания, наполненных газом | 1924 |
|
SU2020A1 |
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами | 1921 |
|
SU10A1 |
HYDE, JENNIFER L et al., A viral RNA structural element alters host recognition of nonself RNA, Science (New York, N.Y.), 2014, v | |||
Питательное приспособление к трепальной машине для лубовых растений | 1923 |
|
SU343A1 |
Авторы
Даты
2025-04-16—Публикация
2021-04-22—Подача