РОДСТВЕННЫЕ ЗАЯВКИ
[1] Настоящая заявка испрашивает приоритет согласно предварительной заявке на патент США с серийным № 62/716826, поданной 9 августа 2018 г., полное раскрытие которой настоящим включено в данный документ посредством ссылки.
ССЫЛКА НА ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ, ПОДАННЫЙ В ЭЛЕКТРОННОМ ВИДЕ
[2] Содержание перечня последовательностей, предоставленного в электронном виде в виде текстового файла в формате ASCII (название: SA9-465PC_SL_ST25.txt; размер: 460648 байт; и дата создания: 8 августа 2019 г.), включено в данный документ посредством ссылки во всей своей полноте.
ПРЕДПОСЫЛКИ К СОЗДАНИЮ ИЗОБРЕТЕНИЯ
[3] Генная терапия предоставляет возможность получения средств длительного действия для лечения различных заболеваний. В прошлом многие средства лечения для генной терапии, как правило, основывались на применении вирусов. Имеется множество вирусных средств, которые могут быть выбраны для данной цели, каждое из которых характеризуется отличающимися свойствами, которые будут делать их более или менее подходящими для генной терапии. Zhou et al., Adv Drug Deliv Rev. 106(Pt A):3-26, 2016. Однако нежелательные свойства некоторых вирусных векторов, в том числе их иммуногенные профили или их склонность вызывать рак, привели к опасениям в отношении клинической безопасности и до недавнего времени ограничивали их клиническое применение определенными областями применения, например, в вакцинах и онколитических стратегиях. Cotter et al., Front Biosci. 10:1098-105 (2005).
[4] Аденоассоциированный вирус (AAV) является одним из наиболее широко исследуемых геннотерапевтических векторов. AAV представляет собой белковую оболочку, окружающую и защищающую геном на основе небольшой однонитевой ДНК, составляющей примерно 4,8 тысячи нуклеотидов (т. о.). Naso et al., BioDrugs, 31(4): 317-334, 2017. AAV принадлежит к семейству парвовирусов и для осуществления своей репликации полагается на совместную инфекцию другими вирусами, главным образом аденовирусами. Id. Его однонитевой геном содержит три гена: Rep (репликация), Cap (капсид) и aap (сборка). Id. Данные кодирующие последовательности фланкированы инвертированными концевыми повторами (ITR), которые необходимы для репликации и упаковки генома. Id. Оба цис-действующих ITR AAV характеризуются длиной, составляющей примерно 145 нуклеотидов, с наличием прерывающихся палиндромных последовательностей, которые могут сворачиваться в Т-образные шпилечные структуры, которые функционируют в качестве праймеров в ходе инициации репликации ДНК.
[5] Однако применение стандартного AAV в качестве вектора доставки генов имеет определенные недостатки. Один из основных недостатков связан с ограниченной пакующей способностью вируса AAV, составляющей приблизительно 4,5 т. о. гетерологичной ДНК. (Dong et al., Hum Gene Ther. 7(17): 2101-12, 1996). Кроме того, введение векторов на основе AAV может индуцировать иммунный ответ у людей. Хотя было показано, что AAV характеризуется меньшей степенью иммуногенности, чем некоторые другие вирусы (т. е. аденовирус), капсидные белки могут активировать различные компоненты иммунной системы человека. См. Naso et al., 2017. AAV является распространенным вирусом в человеческой популяции, и большинство людей подвергалось воздействию AAV, соответственно у большинства людей уже развился иммунный ответ в отношении конкретных вариантов, воздействию которых они подвергались ранее. Данный предсуществующий адаптивный ответ может включать нейтрализующие антитела (NAb) и T-клетки, которые будут способны снижать клиническую эффективность последующих повторных инфекций, вызванных AAV, и/или приводить к уничтожению клеток, которые были трансдуцированы, что может сделать пациентов с предсуществующим иммунитетом против AAV не подходящими для лечения с применением генной терапии на основе AVV. Кроме того, имеются данные, свидетельствующие о том, что T-образные шпилечные петли ITR AAV подвержены подавлению белками/белковыми комплексами клетки-хозяина, которые связывают T-образные шпилечные структуры ITR AAV. См., например, Zhou et al., Scientific Reports 7:5432 (July 14, 2017).
[6] Таким образом, в данной области техники существует потребность в эффективной и устойчивой экспрессии целевых последовательностей, например, терапевтических белков и/или miRNA, в условиях in vitro и in vivo, избегая при этом некоторых из нежелательных последствий и ограничений, присущих существующей технологии векторов на основе AAV.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[7] В некоторых аспектах предусмотрена молекула нуклеиновой кислоты, содержащая первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188, или ее функциональное производное.
[8] В определенных иллюстративных вариантах осуществления первый ITR содержит нуклеотидную последовательность, представленную под SEQ ID NO: 180, и второй ITR содержит нуклеотидную последовательность, представленную под SEQ ID NO: 181. В определенных иллюстративных вариантах осуществления первый ITR содержит нуклеотидную последовательность, представленную под SEQ ID NO: 183, и второй ITR содержит нуклеотидную последовательность, представленную под SEQ ID NO: 184. В определенных иллюстративных вариантах осуществления первый ITR содержит нуклеотидную последовательность, представленную под SEQ ID NO: 185, и второй ITR содержит нуклеотидную последовательность, представленную под SEQ ID NO: 186. В определенных иллюстративных вариантах осуществления первый ITR содержит нуклеотидную последовательность, представленную под SEQ ID NO: 187, и второй ITR содержит нуклеотидную последовательность, представленную под SEQ ID NO: 188.
[9] В определенных иллюстративных вариантах осуществления первый ITR и/или второй ITR состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188. В определенных иллюстративных вариантах осуществления первый ITR и второй ITR представляют собой последовательности, обратно комплементарные друг другу.
[10] В определенных иллюстративных вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит промотор. В определенных иллюстративных вариантах осуществления промотор представляет собой тканеспецифический промотор. В определенных иллюстративных вариантах осуществления промотор управляет экспрессией гетерологичной полинуклеотидной последовательности в органе, выбранном из мышцы, центральной нервной системы (ЦНС), глаза, печени, сердца, почки, поджелудочной железы, легких, кожи, мочевого пузыря, мочевыводящих путей или любой их комбинации. В определенных иллюстративных вариантах осуществления промотор управляет экспрессией гетерологичной полинуклеотидной последовательности в гепатоцитах, эндотелиальных клетках, клетках сердечной мышцы, клетках скелетных мышц, клетках синусоидных сосудов, афферентных нейронах, эфферентных нейронах, вставочных нейронах, глиальных клетках, астроцитах, олигодендроцитах, микроглии, эпендимальных клетках, эпителиальных клетках легкого, шванновских клетках, сателлитных клетках, фоторецепторных клетках, ганглиозных клетках сетчатки или любой их комбинации. В определенных иллюстративных вариантах осуществления промотор расположен в направлении 5'-конца относительно гетерологичной полинуклеотидной последовательности. В определенных иллюстративных вариантах осуществления промотор выбран из группы, состоящей из промотора тиретина мыши (mTTR), эндогенного промотора фактора VIII человека (F8), промотора альфа-1-антитрипсина человека (hAAT), минимального промотора альбумина человека, промотора альбумина мыши, промотора тристетрапролина (TTP), промотора CASI, промотора CAG, промотора цитомегаловируса (CMV), промотора α1-антитрипсина (AAT), мышечной креатинкиназы (MCK), тяжелой цепи миозина альфа (αMHC), миоглобина (MB), десмина (DES), SPc5-12, 2R5Sc5-12, dMCK, tMCK и промотора фосфоглицераткиназы (PGK).
[11] В определенных иллюстративных вариантах осуществления гетерологичная полинуклеотидная последовательность дополнительно содержит интронную последовательность. В определенных иллюстративных вариантах осуществления интронная последовательность расположена в направлении 5'-конца относительно гетерологичной полинуклеотидной последовательности. В определенных иллюстративных вариантах осуществления интронная последовательность расположена в направлении 3'-конца относительно промотора. В определенных иллюстративных вариантах осуществления интронная последовательность предусматривает синтетическую интронную последовательность. В определенных иллюстративных вариантах осуществления интронная последовательность содержит SEQ ID NO: 115 или 192.
[12] В определенных иллюстративных вариантах осуществления генная кассета дополнительно содержит посттранскрипционный регуляторный элемент. В определенных иллюстративных вариантах осуществления посттранскрипционный регуляторный элемент расположен в направлении 3'-конца относительно гетерологичной полинуклеотидной последовательности. В определенных иллюстративных вариантах осуществления посттранскрипционный регуляторный элемент содержит мутантный посттранскрипционный регуляторный элемент вируса гепатита сурков (WPRE), сайт связывания микроРНК, последовательность, направляющую ДНК к ядру, или любую их комбинацию. В определенных иллюстративных вариантах осуществления сайт связывания микроРНК содержит сайт связывания с miR142-3p.
[13] В определенных иллюстративных вариантах осуществления генная кассета дополнительно содержит 3'-UTR-последовательность поли(A)-хвоста. В определенных иллюстративных вариантах осуществления 3'-UTR-последовательность поли(А)-хвоста выбрана из группы, состоящей из поли(A)-последовательности bGH, поли(A)-последовательности актина, поли(A)-последовательности гемоглобина и любой их комбинации. В определенных иллюстративных вариантах осуществления 3'-UTR-последовательность поли(А)-хвоста предусматривает поли(A)-последовательность bGH.
[14] В определенных иллюстративных вариантах осуществления генная кассета дополнительно содержит энхансерную последовательность. В определенных иллюстративных вариантах осуществления энхансерная последовательность расположена между первым ITR и вторым ITR.
[15] В определенных иллюстративных вариантах осуществления молекула нуклеиновой кислоты содержит в направлении от 5' к 3': первый ITR, генную кассету и второй ITR; где генная кассета содержит тканеспецифическую промоторную последовательность, интронную последовательность, гетерологичную полинуклеотидную последовательность, посттранскрипционный регуляторный элемент и 3'-UTR-последовательность поли(А)-хвоста. В определенных иллюстративных вариантах осуществления генная кассета содержит в направлении от 5' к 3': тканеспецифическую промоторную последовательность, интронную последовательность, гетерологичную полинуклеотидную последовательность, посттранскрипционный регуляторный элемент и 3'-UTR-последовательность поли(А)-хвоста. В определенных иллюстративных вариантах осуществления тканеспецифическая промоторная последовательность предусматривает промотор TTT; интрон представляет собой синтетический интрон; посттранскрипционный регуляторный элемент предусматривает WPRE; и 3'-UTR-последовательность поли(А)-хвоста предусматривает bGHpA.
[16] В определенных иллюстративных вариантах осуществления генная кассета содержит однонитевую нуклеиновую кислоту. В определенных иллюстративных вариантах осуществления генная кассета содержит двухнитевую нуклеиновую кислоту.
[17] В определенных иллюстративных вариантах осуществления гетерологичная полинуклеотидная последовательность кодирует фактор свертывания крови, фактор роста, гормон, цитокин, антитело, его фрагмент или любую их комбинацию.
[18] В определенных вариантах осуществления гетерологичная полинуклеотидная последовательность кодирует фактор роста, выбранный из группы, состоящей из адреномедуллина (AM), ангиопоэтина (Ang), аутокринного фактора подвижности, костного морфогенетического белка (BMP) (например, BMP2, BMP4, BMP5, BMP7), представителя семейства цилиарных нейротрофических факторов (например, цилиарного нейротрофического фактора (CNTF), фактора ингибирования лейкоза (LIF), интерлейкина-6 (IL-6)), колониестимулирующего фактора (например, макрофагального колониестимулирующего фактора (m-CSF), гранулоцитарного колониестимулирующего фактора (G-CSF), гранулоцитарно-макрофагального колониестимулирующего фактора (GM-CSF)), эпидермального фактора роста (EGF), эфрина (например, эфрина A1, эфрина A2, эфрина A3, эфрина A4, эфрина A5, эфрина B1, эфрина B2, эфрина B3), эритропоэтина (EPO), фактора роста фибробластов (FGF) (например, FGF1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22, FGF23), фетального бычьего соматотропина (FBS), представителя семейства GDNF (например, нейротрофического фактора линии глиальных клеток (GDNF), нейротурина, персефина и артемина), фактора роста и дифференцировки-9 (GDF9), фактора роста гепатоцитов (HGF), фактора роста, происходящего из гепатомы (HDGF), инсулина, инсулиноподобных факторов роста (например, инсулиноподобного фактора роста-1 (IGF-1) или IGF-2, интерлейкина (IL) (например, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7), фактора роста кератиноцитов (KGF), фактора, стимулирующего миграцию (MSF), белка, стимулирующего макрофаги (MSP), или белка, подобного фактору роста гепатоцитов (HGFLP)), миостатина (GDF-8), нейрегулина (например, нейрегулина 1 (NRG1), NRG2, NRG3, NRG4), нейротрофина (например, нейротрофического фактора головного мозга (BDNF), фактора роста нервов (NGF), нейротрофина-3 (NT-3), NT-4, плацентарного фактора роста (PGF), тромбоцитарного фактора роста (PDGF), реналазы (RNLS), фактора роста Т-клеток (TCGF), тромбопоэтина (TPO), трансформирующего фактора роста (например, трансформирующего фактора роста-альфа (TGF-α), TGF-β, фактора некроза опухоли-альфа (TNF-α) и фактора роста эндотелия сосудов (VEGF)) и любой их комбинации.
[19] В определенных иллюстративных вариантах осуществления гетерологичная полинуклеотидная последовательность кодирует гормон.
[20] В определенных иллюстративных вариантах осуществления гетерологичная полинуклеотидная последовательность кодирует цитокин.
[21] В определенных иллюстративных вариантах осуществления гетерологичная полинуклеотидная последовательность кодирует антитело или его фрагмент.
[22] В определенных иллюстративных вариантах осуществления гетерологичная полинуклеотидная последовательность кодирует ген, выбранный из X-сцепленного гена дистрофина, MTM1 (миотубулярина), тирозингидроксилазы, AADC, циклогидролазы, SMN1, FXN (фратаксина), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (кислой альфа-глюкозидазы) и любой их комбинации.
[23] В определенных иллюстративных вариантах осуществления гетерологичная полинуклеотидная последовательность кодирует микроРНК (miRNA). В определенных иллюстративных вариантах осуществления miRNA понижает экспрессию целевого гена, выбранного из SOD1, HTT, RHO и любой их комбинации.
[24] В определенных иллюстративных вариантах осуществления гетерологичная полинуклеотидная последовательность кодирует фактор свертывания крови, выбранный из группы, состоящей из фактора I (FI), фактора II (FII), фактора III (FIII), фактора IV (FVI), фактора V (FV), фактора VI (FVI), фактора VII (FVII), фактора VIII (FVIII), фактора IX (FIX), фактора X (FX), фактора XI (FXI), фактора XII (FXII), фактора XIII (FVIII), фактора фон Виллебранда (VWF), прекалликреина, высокомолекулярного кининогена, фибронектина, антитромбина III, кофактора II гепарина, белка C, белка S, белка Z, ингибитора протеазы, связанного с белком Z (ZPI), плазминогена, альфа-2-антиплазмина, тканевого активатора плазминогена (tPA), урокиназы, ингибитора-1 активатора плазминогена (PAI-1), ингибитора-2 активатора плазминогена (PAI2) и любой их комбинации.
[25] В определенных иллюстративных вариантах осуществления фактор свертывания крови представляет собой FVIII. В определенных иллюстративных вариантах осуществления FVIII предусматривает полноразмерный зрелый FVIII. В определенных иллюстративных вариантах осуществления FVIII содержит аминокислотную последовательность, которая на по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична аминокислотной последовательности под SEQ ID NO: 106.
[26] В определенных иллюстративных вариантах осуществления FVIII содержит домен A1, домен A2, домен A3, домен C1, домен C2 и частичный домен B или вообще не содержит его. В определенных иллюстративных вариантах осуществления FVIII содержит аминокислотную последовательность, которая на по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична аминокислотной последовательности под SEQ ID NO:109.
[27] В определенных иллюстративных вариантах осуществления фактор свертывания крови содержит гетерологичный компонент. В определенных иллюстративных вариантах осуществления гетерологичный компонент выбран из группы, состоящей из альбумина или его фрагмента, Fc-области иммуноглобулина, C-концевого пептида (CTP) β-субъединицы хорионического гонадотропина человека, последовательности PAS, последовательности HAP, трансферрина или его фрагмента, альбумин-связывающего компонента, их производного или любой их комбинации. В определенных иллюстративных вариантах осуществления гетерологичный компонент связан с N-концом или C-концом FVIII или вставлен между двумя аминокислотами в FVIII. В определенных иллюстративных вариантах осуществления гетерологичный компонент вставлен между двумя аминокислотами в одном или нескольких сайтах вставки, выбранных из сайтов вставки, перечисленных в таблице 4.
[28] В определенных иллюстративных вариантах осуществления FVIII дополнительно содержит домен A1, домен A2, домен C1, домен C2, необязательный домен B и гетерологичный компонент, где гетерологичный компонент вставлен непосредственно ниже аминокислоты 745, что соответствует зрелому FVIII (SEQ ID NO:106).
[29] В определенных иллюстративных вариантах осуществления FVIII дополнительно содержит партнера по связыванию FcRn. В определенных иллюстративных вариантах осуществления партнер по связыванию FcRn предусматривает Fc-область константного домена иммуноглобулина.
[30] В определенных иллюстративных вариантах осуществления последовательность нуклеиновой кислоты, кодирующая FVIII, является кодон-оптимизированной. В определенных иллюстративных вариантах осуществления последовательность нуклеиновой кислоты, кодирующая FVIII, является кодон-оптимизированной для экспрессии у человека.
[31] В определенных иллюстративных вариантах осуществления последовательность нуклеиновой кислоты, кодирующая FVIII, содержит нуклеотидную последовательность, которая на по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентична нуклеотидной последовательности под SEQ ID NO: 107.
[32] В определенных иллюстративных вариантах осуществления последовательность нуклеиновой кислоты, кодирующая FVIII, содержит нуклеотидную последовательность, которая на по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентична нуклеотидной последовательности под SEQ ID NO: 71.
[33] В определенных иллюстративных вариантах осуществления гетерологичная полинуклеотидная последовательность является кодон-оптимизированной. В определенных иллюстративных вариантах осуществления гетерологичная полинуклеотидная последовательность является кодон-оптимизированной для экспрессии у человека.
[34] В определенных иллюстративных вариантах осуществления молекула нуклеиновой кислоты составлена со средством доставки. В определенных иллюстративных вариантах осуществления средство доставки предусматривает липидную наночастицу. В определенных иллюстративных вариантах осуществления средство доставки выбрано из группы, состоящей из липосом, нелипидных полимерных молекул и эндосом и любой их комбинации.
[35] В определенных иллюстративных вариантах осуществления молекула нуклеиновой кислоты составлена для внутривенной, трансдермальной, внутрикожной, подкожной, легочной или пероральной доставки или любой их комбинации. В определенных иллюстративных вариантах осуществления молекула нуклеиновой кислоты составлена для внутривенной доставки.
[36] В определенных аспектах предусмотрен вектор, содержащий молекулу нуклеиновой кислоты, описанную в данном документе.
[37] В определенных аспектах предусмотрена клетка-хозяин, содержащая молекулу нуклеиновой кислоты, описанную в данном документе.
[38] В определенных аспектах предусмотрена фармацевтическая композиция, содержащая молекулу нуклеиновой кислоты или вектор, описанные в данном документе, и фармацевтически приемлемое вспомогательное вещество.
[39] В определенных аспектах предусмотрена фармацевтическая композиция, содержащая клетку-хозяина, описанную в данном документе, и фармацевтически приемлемое вспомогательное вещество.
[40] В определенных аспектах предусмотрен набор, содержащий молекулу нуклеиновой кислоты, описанную в данном документе, и инструкции для введения молекулы нуклеиновой кислоты нуждающемуся в этом субъекту.
[41] В определенных аспектах предусмотрена система на основе бакуловируса для продуцирования молекулы нуклеиновой кислоты, описанной в данном документе.
[42] В определенных иллюстративных вариантах осуществления молекула нуклеиновой кислоты, описанная в данном документе, продуцируется в клетках насекомого.
[43] В определенных аспектах предусмотрена система доставки на основе наночастиц, содержащая молекулу нуклеиновой кислоты, описанную в данном документе.
[44] В определенных аспектах предусмотрен способ получения полипептида, включающий культивирование клетки-хозяина, описанной в данном документе, при подходящих условиях и извлечение полипептида.
[45] В определенных аспектах предусмотрен способ получения полипептида со свертывающей активностью, включающий культивирование клетки-хозяина, описанной в данном документе, при подходящих условиях и извлечение полипептида со свертывающей активностью.
[46] В определенных аспектах предусмотрен способ экспрессии гетерологичной полинуклеотидной последовательности у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, описанной в данном документе, вектора, описанного в данном документе, или фармацевтической композиции, описанной в данном документе.
[47] В определенных аспектах предусмотрен способ экспрессии фактора свертывания крови у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, описанной в данном документе, вектора, описанного в данном документе, полипептида, описанного в данном документе, или фармацевтической композиции, описанной в данном документе.
[48] В определенных аспектах предусмотрен способ лечения заболевания или нарушения у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, описанной в данном документе, вектора, описанного в данном документе, или фармацевтической композиции, описанной в данном документе.
[49] В определенных аспектах предусмотрен способ лечения субъекта, имеющего дефицит фактора свертывания крови, включающий введение субъекту молекулы нуклеиновой кислоты, описанной в данном документе, вектора, описанного в данном документе, полипептида, описанного в данном документе, или фармацевтической композиции, описанной в данном документе.
[50] В определенных аспектах предусмотрен способ лечения дефицита фактора свертывания крови у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, описанной в данном документе, вектора, описанного в данном документе, полипептида, описанного в данном документе, или фармацевтической композиции, описанной в данном документе.
[51] В определенных иллюстративных вариантах осуществления молекулу нуклеиновой кислоты вводят внутривенно, трансдермально, внутрикожно, подкожно, перорально, посредством легочного пути или с помощью любой их комбинации. В определенных иллюстративных вариантах осуществления молекулу нуклеиновой кислоты вводят внутривенно.
[52] В определенных иллюстративных вариантах осуществления способ дополнительно включает введение субъекту второго средства.
[53] В определенных иллюстративных вариантах осуществления субъектом является млекопитающее. В определенных иллюстративных вариантах осуществления субъектом является человек.
[54] В определенных иллюстративных вариантах осуществления введение молекулы нуклеиновой кислоты субъекту приводит к увеличению активности FVIII относительно активности FVIII у субъекта до введения, где активность FVIII увеличивается в по меньшей мере приблизительно 2 раза, по меньшей мере приблизительно 3 раза, по меньшей мере приблизительно 4 раза, по меньшей мере приблизительно 5 раз, по меньшей мере приблизительно 6 раз, по меньшей мере приблизительно 7 раз, по меньшей мере приблизительно 8 раз, по меньшей мере приблизительно 9 раз, по меньшей мере приблизительно 10 раз, по меньшей мере приблизительно 11 раз, по меньшей мере приблизительно 12 раз, по меньшей мере приблизительно 13 раз, по меньшей мере приблизительно 14 раз, по меньшей мере приблизительно 15 раз, по меньшей мере приблизительно 20 раз, по меньшей мере приблизительно 25 раз, по меньшей мере приблизительно 30 раз, по меньшей мере приблизительно 35 раз, по меньшей мере приблизительно 40 раз, по меньшей мере приблизительно 50 раз, по меньшей мере приблизительно 60 раз, по меньшей мере приблизительно 70 раз, по меньшей мере приблизительно 80 раз, по меньшей мере приблизительно 90 раз или по меньшей мере приблизительно 100 раз.
[55] В определенных иллюстративных вариантах осуществления у субъекта имеется нарушение свертываемости крови. В определенных иллюстративных вариантах осуществления нарушение свертываемости крови представляет собой гемофилию. В определенных иллюстративных вариантах осуществления нарушение свертываемости крови представляет собой гемофилию А.
[56] В определенных аспектах предусмотрен способ лечения нарушения свертываемости крови у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фактор свертывания крови, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188, или ее функциональное производное.
[57] В определенных аспектах предусмотрен способ лечения гемофилии A у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фактор VIII (FVIII), где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188, или ее функциональное производное.
[58] В определенных аспектах предусмотрен способ лечения метаболического нарушения печени у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую ассоциированный с печенью метаболический фермент, дефицит которого наблюдается у субъекта, где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV).
[59] В определенных иллюстративных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную, последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188, или ее функциональное производное.
[60] В определенных аспектах предусмотрен способ лечения метаболического нарушения печени у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность кодирующую ассоциированный с печенью метаболический фермент, дефицит которого наблюдается у субъекта, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188,, или ее функциональное производное.
[61] В определенных иллюстративных вариантах осуществления генная кассета содержит однонитевую нуклеиновую кислоту. В определенных иллюстративных вариантах осуществления генная кассета содержит двухнитевую нуклеиновую кислоту.
[62] В определенных иллюстративных вариантах осуществления метаболическое нарушение печени выбрано из группы, состоящей из фенилкетонурии (PKU), заболевания, связанного с циклом мочевины, лизосомной болезни накопления и болезни накопления гликогена. В определенных иллюстративных вариантах осуществления метаболическое нарушение печени представляет собой фенилкетонурию (PKU).
[63] В определенных иллюстративных вариантах осуществления молекулу нуклеиновой кислоты вводят внутривенно, трансдермально, внутрикожно, подкожно, перорально, посредством легочного пути или с помощью любой их комбинации. В определенных иллюстративных вариантах осуществления молекулу нуклеиновой кислоты вводят внутривенно.
[64] В определенных иллюстративных вариантах осуществления способ дополнительно включает введение субъекту второго средства.
[65] В определенных иллюстративных вариантах осуществления субъектом является млекопитающее. В определенных иллюстративных вариантах осуществления субъектом является человек.
[66] В определенных аспектах предусмотрен способ лечения фенилкетонурии (PKU) у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фенилаланингидроксилазу, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188, или ее функциональное производное.
[67] В определенных иллюстративных вариантах осуществления генная кассета содержит однонитевую нуклеиновую кислоту. В определенных иллюстративных вариантах осуществления генная кассета содержит двухнитевую нуклеиновую кислоту.
[68] В определенных иллюстративных вариантах осуществления молекула нуклеиновой кислоты составлена со средством доставки. В определенных иллюстративных вариантах осуществления средство доставки предусматривает липидную наночастицу.
[69] В определенных аспектах предусмотрен способ клонирования молекулы нуклеиновой кислоты, включающий вставку молекулы нуклеиновой кислоты, способной к образованию сложных вторичных структур, в подходящий вектор и введение полученного вектора в штамм бактерии-хозяина, характеризующийся нарушением в комплексе SbcCD.
[70] В определенных иллюстративных вариантах осуществления нарушение в комплексе SbcCD предусматривает генетическое нарушение в гене SbcC и/или гене SbcD. В определенных иллюстративных вариантах осуществления нарушение в комплексе SbcCD предусматривает генетическое нарушение в гене SbcC. В определенных иллюстративных вариантах осуществления нарушение в комплексе SbcCD предусматривает генетическое нарушение в гене SbcD.
[71] В определенных иллюстративных вариантах осуществления молекула нуклеиновой кислоты содержит первый инвертированный концевой повтор (ITR) и второй ITR, где первый и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV) .
[72] В определенных иллюстративных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную, последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188, или ее функциональное производное.
[73] В определенных иллюстративных вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит генную кассету, где генная кассета фланкирована первым ITR и вторым ITR.
[74] В определенных иллюстративных вариантах осуществления генная кассета содержит гетерологичную полинуклеотидную последовательность.
[75] В определенных иллюстративных вариантах осуществления подходящий вектор представляет собой низкокопийный вектор. В определенных иллюстративных вариантах осуществления подходящий вектор представляет собой pBR322.
[76] В определенных иллюстративных вариантах осуществления штамм бактерии-хозяина не способен к расщеплению крестообразных структур ДНК.
[77] В определенных иллюстративных вариантах осуществления штамм бактерии-хозяина представляет собой PMC103, содержащий генотип sbcC, recD, mcrA, ΔmcrBCF. В определенных иллюстративных вариантах осуществления штамм бактерии-хозяина представляет собой PMC107, содержащий генотип recBC, recJ, sbcBC, mcrA, ΔmcrBCF. В определенных иллюстративных вариантах осуществления штамм бактерии-хозяина представляет собой SURE, содержащий генотип recB, recJ, sbcC, mcrA, ΔmcrBCF, umuC, uvrC.
[78] В определенных аспектах предусмотрен способ клонирования молекулы нуклеиновой кислоты, включающий вставку молекулы нуклеиновой кислоты, способной к образованию сложных вторичных структур, в подходящий вектор и введение полученного вектора в штамм бактерии-хозяина, характеризующийся нарушением в комплексе SbcCD, где молекула нуклеиновой кислоты содержит первый инвертированный концевой повтор (ITR) и второй ITR, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188,, или ее функциональное производное.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
[79] На фиг. 1A-1B показано схематическое изображение однонитевой кассеты экспрессии фактора свертывания крови (например, FVIII). Показаны местоположения 5'-ITR от вируса, отличного от AAV (со шпилечной петлей на конце ssDNA-структуры), 3'-ITR от вируса, отличного от AAV (со шпилечной петлей), промоторной последовательности (например, TTPp или CAGp) и трансгенной последовательности, например последовательности FVIIIco6XTEN с XTEN144, вставленным в пределах домена B. В иллюстративных кассетах экспрессии также показаны дополнительные возможные элементы, например интронная последовательность, последовательность WPREmut и последовательность bGHpA.
[80] На фиг. 1C-1F показано схематическое изображение плазмид, применяемых для получения однонитевых кассет экспрессии фактора свертывания крови, таких как кассета, показанная на фиг. 1A-1B, где ITR кассеты получены из AAV2 (фиг. 1C), B19 (фиг. 1D), GPV (фиг. 1E) или представляют собой последовательность ITR B19 дикого типа (фиг. 1F). Плазмидную конструкцию, содержащую кассету экспрессии ssFVIII, показанную в данном документе, расщепляли посредством PvuII (в сайтах PvuII) (фиг. 1C) или LguI (в сайтах LguI) (фиг. 1D-1F) для точного высвобождения последовательности, содержащей ITR и кассету экспрессии. Двухнитевую ДНК подвергали термической денатурации при 95°C с получением ssDNA, а затем инкубировали при 4°C для обеспечения образования структуры ITR.
[81] На фиг. 2A показано филогенетическое древо, иллюстрирующее взаимосвязи между различными представителями семейства парвовирусов. B19, AAV-2 и GPV обозначены посредством очерченных рамок.
[82] На фиг. 2B показано схематическое изображение различных кассет, включающих шпилечные структуры.
[83] На фиг. 3A и 3B показаны выравнивания для ITR B19, GPV и AAV2 (фиг. 3A) и B19 и GPV (фиг. 3B). Области, выделенные серым, показывают гомологию.
[84] На фиг. 4A-4C показана активность FVIII в плазме крови после введения однонитевой "голой" ДНК FVIII-AAV (ssAAV-FVIII; фиг. 1C), ssDNA-B19 FVIII (фиг. 1D) или ssDNA-GPV FVIII (фиг. 1E) посредством гидродинамической инъекции (HDI) в мышей с Hem A. Активность FVIII измеряли (как процентную долю от нормальных физиологических уровней у людей) в образцах плазмы крови через 24 часа, 3 дня, 2 недели, 3 недели, 1 месяц, 2 месяца, 3 месяца, 4 месяца, 5 месяцев и 6 месяцев у мышей, обработанных с помощью одной HDI ssDNA из расчета 50 мкг/мышь (фиг. 4C), 20 мкг/мышь (фиг. 4A и 4B), 10 мкг/мышь (фиг. 4A, 4B, и 4C) или 5 мкг/мышь (фиг. 4A). HDI, содержащую 5 мкг плазмидной ДНК/мышь, вводили в качестве контроля (фиг. 4A, 4B и 4C).
[85] На фиг. 5 показана активность FVIII в плазме крови мышей с гемофилией A после одной гидродинамической инъекции равного молярного количества однонитевой "голой" ДНК (ssAAV-FVIII, фиг. 1A), двухнитевой ДНК AAV-FVIII, содержащей последовательность ITR (dsDNA), двухнитевой ДНК FVIII без последовательности ITR (dsDNA без ITR) или замкнутой в кольцо двухнитевой ДНК FVIII без ITR или бактериальных последовательностей (мини-кольца). dsDNA получали посредством ферментного расщепления плазмиды AAV-FVIII (фиг. 2C) с помощью PvuII, но без термической денатурации. dsDNA без ITR получали посредством ферментного расщепления плазмиды AAV-FVIII (фиг. 2C) с помощью AflII и дальнейшей очистки. Мини-кольца ДНК получали посредством лигирования ДНК, являющейся dsDNA без ITR, в сайты AflII. Плазму крови мышей собирали через 3 месяца или 4 месяца и активность FVIII определяли посредством хромогенного анализа.
[86] На фиг. 6 показана активность FVIII в плазме крови мышей с гемофилией A после гидродинамической инъекции 30 мкг однонитевой "голой" ДНК FVIII (фиг. 1A, фиг. 1D-1F). Плазму крови собирали еженедельно в течение 7 недель и активность FVIII определяли с помощью хромогенного анализа. Через 35 дней (обозначено как черная стрелка) мышам, получавшим ssDNA FVIII-B19d135 и FVIII-GPVd162, повторно вводили 30 мкг посредством гидродинамической инъекции.
[87] На фиг. 7A показано схематическое изображение однонитевой кассеты экспрессии фенилаланингидроксилазы мыши (например, PAH). Показаны местоположения 5'-ITR от вируса, отличного от AAV (со шпилечной петлей на конце ssDNA-структуры), 3'-ITR от вируса, отличного от AAV (со шпилечной петлей), промоторной последовательности (например CAGp) и трансгенной последовательности, например, последовательности 3xFLAG_mPAH. В иллюстративных кассетах экспрессии также показаны дополнительные возможные элементы, например, последовательность WPREmut и последовательность bGHpA.
[88] На фиг. 7B-7D показаны концентрации фенилаланина (Phe) в плазме крови мышей с фенилкетонурией (PKU) перед (день 0) и после однократного введения однонитевой ДНК, содержащей кДНК PAH мыши и ITR B19d135 или GPVd162 вируса, отличного от AAV, посредством гидродинамической инъекции. Плазму собирали в дни 3, 7, 14, 28, 42 и 56 после введения ssDNA. Остаточные уровни фенилаланина показаны как концентрация в мкг/мл (фиг. 7B-7C) или как процент от уровня перед введением (фиг. 7D). Горизонтальная линия отображает исходные уровни Phe перед введением.
[89] На фиг. 7E показан вестерн-блоттинг лизатов образцов печени от мышей с PKU, обработанных с помощью ssDNA, содержащей трансген PAH мыши и ITR B19d135 или GPVd165. Образцы печени собирали в день 81 после обработки и экстрагировали белковые лизаты. Каждая лунка представляет отдельное животное. Белок PAH мыши с FLAG-меткой обнаруживали с применением M2, антитела к FLAG, и для сравнения включали контроль загрузки, GAPDH.
[90] На фиг. 8A-B показаны уровни активности FVIII в супернатантах клеток Huh7 после трансдукции с помощью ДНК FVIII-AAV (фиг. 1A-1C), инкапсулированной в липидных наночастицах. Плазмиду FVIII-AAV под контролем промотора CAGp (фиг. 1B) инкапсулировали при трех соотношениях амина и фосфата (NP) и применяли к клеткам Huh7 при различных концентрациях, определенных посредством анализа picogreen (фиг. 8A). Плазмиду, двухнитевую линейную (ds) и однонитевую (ss) ДНК AAV-FVIII под контролем промотора TTPp (фиг. 1A) также инкапсулировали в липидные наночастицы при двух соотношениях NP и применяли для трансдукции клеток Huh7 при различных концентрациях ДНК (фиг. 8B). Активность FVIII измеряли с помощью хромогенного анализа при сравнении со стандартом FACT плазмы крови человека.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[91] В настоящем изобретении описаны плазмидоподобные молекулы нуклеиновой кислоты, содержащие первый инвертированный концевой повтор (ITR), второй ITR и генную кассету, например, кодирующую целевую последовательность (также называемую в данном документе гетерологичной полинуклеотидной последовательностью), например, терапевтический белок или miRNA, где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (например, первый ITR и/или второй ITR получены от вируса, отличного от AAV). В некоторых вариантах осуществления генная кассета кодирует терапевтический белок, например, целевая последовательность кодирует терапевтический белок. В некоторых вариантах осуществления терапевтический белок предусматривает белок, выбранный из фактора свертывания крови, фактора роста, гормона, цитокина, антитела, его фрагмента или их комбинации. В некоторых вариантах осуществления генная кассета кодирует X-сцепленный дистрофина, MTM1 (миотубулярин), тирозингидроксилазу, AADC, циклогидролазу, SMN1, FXN (фратаксин), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (кислую альфа-глюкозидазу) или любую их комбинацию.
[92] В некоторых вариантах осуществления терапевтический белок предусматривает фактор свертывания крови. В одном конкретном варианте осуществления терапевтический белок предусматривает белок FVIII или FIX.
[93] В некоторых вариантах осуществления генная кассета кодирует miRNA. В определенных вариантах осуществления miRNA понижает экспрессию целевого гена, выбранного из SOD1, HTT, RHO или любой их комбинации.
[94] В определенных вариантах осуществления вирус, отличный от AAV, выбран из группы, состоящей из представителей семейства вирусов Parvoviridae и любой их комбинации. Настоящее изобретение дополнительно направлено на способы обеспечения экспрессии терапевтического белка, например фактора свертывания крови, например FVIII, у нуждающегося в этом субъекта, включающие введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR), второй ITR и генную кассету, например, кодирующую терапевтический белок или miRNA, где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV). В определенных вариантах осуществления в настоящем изобретении описывается выделенная молекула нуклеиновой кислоты, содержащая нуклеотидную последовательность, которая характеризуется гомологией последовательностей с нуклеотидной последовательностью, выбранной из SEQ ID NO: 113 и 120.
[95] В определенных вариантах осуществления в настоящем изобретении предусмотрены молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, где первый и/или второй ITR получены из парвовируса B19 или парвовируса гусей (GPV).
[96] Иллюстративные конструкции согласно настоящему изобретению проиллюстрированы в прилагаемых фигурах и перечне последовательностей. В целях обеспечения четкого понимания описания и формулы изобретения следующие определения представлены ниже.
I. Определения
[97] Следует отметить, что форма единственного числа объекта относится к одному или нескольким таким объектам; например, под "нуклеотидной последовательностью" понимают одну или несколько нуклеотидных последовательностей. Аналогичным образом, под "терапевтическим белком" и "miRNA" понимают один или несколько терапевтических белков и одну или несколько miRNA соответственно. В связи с этим формы единственного числа, термины "один или несколько" и "по меньшей мере один" могут использоваться в данном документе взаимозаменяемо.
[98] Термин "приблизительно" используется в данном документе в значении примерно, порядка, около или ориентировочно. Если термин "приблизительно" используется в сочетании с числовым диапазоном, то он модифицирует данный диапазон, расширяя границы выше и ниже изложенных числовых значений. В целом, термин "приблизительно" применяют в данном документе для модификации числового значения выше и ниже заявленного значения с отклонением на 10 процентов, вверх или вниз (выше или ниже).
[99] Также используемый в данном документе "и/или" относится к и охватывает любые и все возможные комбинации одного или нескольких соответствующих перечисленных объектов, а также отсутствие комбинаций в случае интерпретации как альтернативы ("или").
[100] "Нуклеиновые кислоты", "молекулы нуклеиновой кислоты", "нуклеотиды", "нуклеотидная(-ые) последовательность(-и)" и "полинуклеотид" применяются взаимозаменяемо и относятся к полимерной форме сложных фосфатных эфиров рибонуклеозидов (аденозина, гуанозина, уридина или цитидина; "молекулам РНК") или дезоксирибонуклеозидов (дезоксиаденозина, дезоксигуанозина, дезокситимидина или дезоксицитидина; "молекулам ДНК") или любым сложным фосфатным эфирам их аналогов, как например фосфоротиоаты и сложные тиоэфиры, находящимся либо в однонитевой форме, либо в виде двухнитевой спирали. Последовательности однонитевой нуклеиновой кислоты относятся к однонитевой ДНК (ssDNA) или однонитевой РНК (ssRNA). Возможны двухнитевые спирали ДНК-ДНК, ДНК-РНК и РНК-РНК. Термин "молекула нуклеиновой кислоты", и в частности "молекула ДНК или РНК", относится только к первичной и вторичной структуре молекулы и не ограничивает ее какими-либо конкретными третичными формами. Таким образом, данный термин включает двухнитевую ДНК, обнаруживаемую, среди прочего, в линейных или кольцевых молекулах ДНК (например, фрагментах рестрикции), плазмидах, сверхспиральной ДНК и хромосомах. В рамках обсуждения структуры конкретной двухнитевой молекулы ДНК последовательности могут описываться в данном документе в соответствии с обычными правилами, предусматривающими приведение только одной последовательности в направлении 5'-3' вдоль нетранскрибируемый нити ДНК (т. е. нити, имеющей последовательность, гомологичную mRNA). "Рекомбинантная молекула ДНК" представляет собой молекулу ДНК, которая была подвергнута молекулярно-биологической манипуляции. ДНК включает без ограничения кДНК, геномную ДНК, плазмидную ДНК, синтетическую ДНК и полусинтетическую ДНК. "Композиция на основе нуклеиновой кислоты" согласно настоящему изобретению содержит одну или несколько нуклеиновых кислот, описанных в данном документе.
[101] Используемый в данном документе "инвертированный концевой повтор" (или "ITR") относится к подподпоследовательности нуклеиновой кислоты, расположенной на либо 5'-, либо 3'-конце последовательности однонитевой нуклеиновой кислоты, которая содержит набор нуклеотидов (начальную последовательность), ниже которой следует обратно комплементарная последовательность, т. е. к палиндромной последовательности. Длина промежуточной последовательности нуклеотидов между начальной последовательностью и обратно комплементарной последовательностью может быть любой, в том числе нулевой. В одном варианте осуществления ITR, пригодный в настоящем изобретении, содержит одну или несколько "палиндромных последовательностей". ITR может выполнять любое количество функций. В некоторых вариантах осуществления ITR, описанный в данном документе, образует шпилечную структуру. В некоторых вариантах осуществления ITR образует T-образную шпилечную структуру. В некоторых вариантах осуществления ITR образует отличную от T-образной шпилечную структуру, например U-образную шпилечную структуру. В некоторых вариантах осуществления ITR способствует долговременному сохранению молекулы нуклеиновой кислоты в ядре клетки. В некоторых вариантах осуществления ITR способствует постоянному сохранению молекулы нуклеиновой кислоты в ядре клетки (например, в течение всей продолжительности жизни клетки). В некоторых вариантах осуществления ITR способствует стабильности молекулы нуклеиновой кислоты в ядре клетки. В некоторых вариантах осуществления ITR способствует удерживанию молекулы нуклеиновой кислоты в ядре клетки. В некоторых вариантах осуществления ITR способствует непрерывности нахождения молекулы нуклеиновой кислоты в ядре клетки. В некоторых вариантах осуществления ITR подавляет или предупреждает разрушение молекулы нуклеиновой кислоты в ядре клетки.
[102] В одном варианте осуществления начальная последовательность и/или обратно комплементарная последовательность содержат приблизительно 2-600 нуклеотидов, приблизительно 2-550 нуклеотидов, приблизительно 2-500 нуклеотидов, приблизительно 2-450 нуклеотидов, приблизительно 2-400 нуклеотидов, приблизительно 2-350 нуклеотидов, приблизительно 2-300 нуклеотидов или приблизительно 2-250 нуклеотидов. В некоторых вариантах осуществления начальная последовательность и/или обратно комплементарная последовательность содержат приблизительно 5-600 нуклеотидов, приблизительно 10-600 нуклеотидов, приблизительно 15-600 нуклеотидов, приблизительно 20-600 нуклеотидов, приблизительно 25-600 нуклеотидов, приблизительно 30-600 нуклеотидов, приблизительно 35-600 нуклеотидов, приблизительно 40-600 нуклеотидов, приблизительно 45-600 нуклеотидов, приблизительно 50-600 нуклеотидов, приблизительно 60-600 нуклеотидов, приблизительно 70-600 нуклеотидов, приблизительно 80-600 нуклеотидов, приблизительно 90-600 нуклеотидов, приблизительно 100-600 нуклеотидов, приблизительно 150-600 нуклеотидов, приблизительно 200-600 нуклеотидов, приблизительно 300-600 нуклеотидов, приблизительно 350-600 нуклеотидов, приблизительно 400-600 нуклеотидов, приблизительно 450-600 нуклеотидов, приблизительно 500-600 нуклеотидов или приблизительно 550-600 нуклеотидов. В некоторых вариантах осуществления начальная последовательность и/или обратно комплементарная последовательность содержат приблизительно 5-550 нуклеотидов, приблизительно 5-500 нуклеотидов, приблизительно 5-450 нуклеотидов, приблизительно 5-400 нуклеотидов, приблизительно 5-350 нуклеотидов, приблизительно 5-300 нуклеотидов или приблизительно 5-250 нуклеотидов. В некоторых вариантах осуществления начальная последовательность и/или обратно комплементарная последовательность содержат приблизительно 10-550 нуклеотидов, приблизительно 15-500 нуклеотидов, приблизительно 20-450 нуклеотидов, приблизительно 25-400 нуклеотидов, приблизительно 30-350 нуклеотидов, приблизительно 35-300 нуклеотидов или приблизительно 40-250 нуклеотидов. В определенных вариантах осуществления начальная последовательность и/или обратно комплементарная последовательность содержат приблизительно 225 нуклеотидов, приблизительно 250 нуклеотидов, приблизительно 275 нуклеотидов, приблизительно 300 нуклеотидов, приблизительно 325 нуклеотидов, приблизительно 350 нуклеотидов, приблизительно 375 нуклеотидов, приблизительно 400 нуклеотидов, приблизительно 425 нуклеотидов, приблизительно 450 нуклеотидов, приблизительно 475 нуклеотидов, приблизительно 500 нуклеотидов, приблизительно 525 нуклеотидов, приблизительно 550 нуклеотидов, приблизительно 575 нуклеотидов или приблизительно 600 нуклеотидов. В конкретных вариантах осуществления начальная последовательность и/или обратно комплементарная последовательность содержат приблизительно 400 нуклеотидов.
[103] В других вариантах осуществления начальная последовательность и/или обратно комплементарная последовательность содержат приблизительно 2-200 нуклеотидов, приблизительно 5-200 нуклеотидов, приблизительно 10-200 нуклеотидов, приблизительно 20-200 нуклеотидов, приблизительно 30-200 нуклеотидов, приблизительно 40-200 нуклеотидов, приблизительно 50-200 нуклеотидов, приблизительно 60-200 нуклеотидов, приблизительно 70-200 нуклеотидов, приблизительно 80-200 нуклеотидов, приблизительно 90-200 нуклеотидов, приблизительно 100-200 нуклеотидов, приблизительно 125-200 нуклеотидов, приблизительно 150-200 нуклеотидов или приблизительно 175-200 нуклеотидов. В других вариантах осуществления начальная последовательность и/или обратно комплементарная последовательность содержат приблизительно 2-150 нуклеотидов, приблизительно 5-150 нуклеотидов, приблизительно 10-150 нуклеотидов, приблизительно 20-150 нуклеотидов, приблизительно 30-150 нуклеотидов, приблизительно 40-150 нуклеотидов, приблизительно 50-150 нуклеотидов, приблизительно 75-150 нуклеотидов, приблизительно 100-150 нуклеотидов или приблизительно 125-150 нуклеотидов. В других вариантах осуществления начальная последовательность и/или обратно комплементарная последовательность содержат приблизительно 2-100 нуклеотидов, приблизительно 5-100 нуклеотидов, приблизительно 10-100 нуклеотидов, приблизительно 20-100 нуклеотидов, приблизительно 30-100 нуклеотидов, приблизительно 40-100 нуклеотидов, приблизительно 50-100 нуклеотидов или приблизительно 75-100 нуклеотидов. В других вариантах осуществления начальная последовательность и/или обратно комплементарная последовательность содержат приблизительно 2-50 нуклеотидов, приблизительно 10-50 нуклеотидов, приблизительно 20-50 нуклеотидов, приблизительно 30-50 нуклеотидов, приблизительно 40-50 нуклеотидов, приблизительно 3-30 нуклеотидов, приблизительно 4-20 нуклеотидов или приблизительно 5-10 нуклеотидов. В другом варианте осуществления начальная последовательность и/или обратно комплементарная последовательность состоят из двух нуклеотидов, трех нуклеотидов, четырех нуклеотидов, пяти нуклеотидов, шести нуклеотидов, семи нуклеотидов, восьми нуклеотидов, девяти нуклеотидов, десяти нуклеотидов, 11 нуклеотидов, 12 нуклеотидов, 13 нуклеотидов, 14 нуклеотидов, 15 нуклеотидов, 16 нуклеотидов, 17 нуклеотидов, 18 нуклеотидов, 19 нуклеотидов или 20 нуклеотидов. В других вариантах осуществления промежуточный нуклеотид между начальной последовательностью и обратно комплементарной последовательностью предусматривает (например, состоит из) 0 нуклеотидов, 1 нуклеотид, два нуклеотида, три нуклеотида, четыре нуклеотида, пять нуклеотидов, шесть нуклеотидов, семь нуклеотидов, восемь нуклеотидов, девять нуклеотидов, 10 нуклеотидов, 11 нуклеотидов, 12 нуклеотидов, 13 нуклеотидов, 14 нуклеотидов, 15 нуклеотидов, 16 нуклеотидов, 17 нуклеотидов, 18 нуклеотидов, 19 нуклеотидов или 20 нуклеотидов.
[104] Следовательно, "ITR", используемый в данном документе, может заворачиваться на себя и образовывать двухнитевой сегмент. Например, последовательность GATCXXXXGATC содержит начальную последовательность GATC и комплементарную ей последовательность (3'CTAG5'), которые при сворачивании образуют двойную спираль. В некоторых вариантах осуществления ITR содержит непрерывную палиндромную последовательность (например, GATCGATC) между начальной последовательностью и обратно комплементарной последовательностью. В некоторых вариантах осуществления ITR содержит прерывистую палиндромную последовательность (например, GATCXXXXGATC) между начальной последовательностью и обратно комплементарной последовательностью. В некоторых вариантах осуществления комплементарные участки непрерывной или прерывистой палиндромной последовательности взаимодействуют друг с другом с образованием структуры "шпилечной петли". Применяемая в данном документе структура "шпилечной петли" образуется, когда по меньшей мере две комплементарные последовательности в однонитевой нуклеотидной молекуле подвергаются спариванию оснований с образованием двухнитевого участка. В некоторых вариантах осуществления только часть ITR образует шпилечную петлю. В других вариантах осуществления весь ITR образует шпилечную петлю.
[105] В настоящем изобретении по меньшей мере один ITR представляет собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV). В определенных вариантах осуществления ITR представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства вирусов Parvoviridae. В некоторых вариантах осуществления ITR представляет собой ITR вируса, отличного от AAV, являющегося представителем рода Dependovirus или рода Erythrovirus. В конкретных вариантах осуществления ITR представляет собой ITR парвовируса гусей (GPV), парвовируса мускусных уток (MDPV) или эритровируса, представляющего собой парвовирус B19 (также известного как парвовирус B19, эритропарвовирус приматов 1, вирус B19 и эритровирус). В определенных вариантах осуществления один ITR из двух ITR представляет собой ITR AAV. В других вариантах осуществления один ITR из двух ITR в конструкции представляет собой ITR из серотипа AAV, выбранного из серотипа 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 и любой их комбинации. В одном конкретном варианте осуществления ITR получен из AAV серотипа 2, например ITR AAV серотипа 2.
[106] В определенных аспектах настоящего изобретения молекула нуклеиновой кислоты содержит два ITR, представляющие собой 5'-ITR и 3'-ITR, где 5'-ITR располагается на 5'-конце молекулы нуклеиновой кислоты, и 3'-ITR располагается на 3'-конце молекулы нуклеиновой кислоты. 5'-ITR и 3'-ITR могут быть получены из одного и того же вируса или различных вирусов. В определенных вариантах осуществления 5'-ITR получен из AAV, а 3'-ITR не получен из вируса AAV (например, получен из вируса, отличного от AAV). В некоторых вариантах осуществления 3'-ITR получен из AAV, а 5'-ITR не получен из вируса AAV (например, получен из вируса, отличного от AAV). В других вариантах осуществления 5'-ITR не получен из вируса AAV (например, получен из вируса, отличного от AAV), а 3'-ITR получен из того же или другого вируса, отличного от вируса AAV.
[107] Термин "парвовирус", используемый в данном документе, охватывает семейство Parvoviridae, в том числе без ограничения автономно реплицирующиеся парвовирусы и депендовирусы. Автономные парвовирусы включают, например, представителей родов Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus и Penstyldensovirus.
[108] Иллюстративные автономные парвовирусы включают без ограничения парвовирус свиней, мелкий вирус мышей, собачий парвовирус, вирус энтерита норок, парвовирус крупного рогатого скота, куриный парвовирус, вирус панлейкопении у кошек, кошачий парвовирус, парвовирус гусей, парвовирус H1, парвовирус мускусных уток, парвовирус змей и вирус B19. Другие автономные парвовирусы известны специалистам в данной области техники. См., например, FIELDS et al. VIROLOGY, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers).
[109] Термин "вирус, отличный от AAV", используемый в данном документе, охватывает нуклеиновые кислоты, белки и вирусы семейства Parvoviridae, за исключением любых аденоассоциированных вирусов (AAV) семейства Parvoviridae. "Вирус, отличный от AAV," включает без ограничения автономно реплицирующихся представителей родов Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus и Penstyldensovirus.
[110] Используемый в данном документе термин "аденоассоциированный вирус" (AAV) включает без ограничения AAV типа 1, AAV типа 2, AAV типа 3 (в том числе типов 3A и 3B), AAV типа 4, AAV типа 5, AAV типа 6, AAV типа 7, AAV типа 8, AAV типа 9, AAV типа 10, AAV типа 11, AAV типа 12, AAV типа 13, AAV змей, AAV птиц, AAV крупного рогатого скота, AAV собак, AAV лошадей, AAV овец, AAV коз, AAV креветок, серотипы и клады AAV, раскрытые в Gao et al. (J. Virol. 78:6381 (2004)) и Moris et al. (Virol. 33:375 (2004)), и любой другой AAV, известный в настоящее время или открытый впоследствии. См., например, FIELDS et al. VIROLOGY, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers).
[111] Термин "полученный из", используемый в данном документе, относится к компоненту, который выделен из или изготовлен с применением указанных молекулы или организма, или информации (например, аминокислотной последовательности или последовательности нуклеиновой кислоты), полученной из указанных молекулы или организма. Например, последовательность нуклеиновой кислоты (например, ITR), которая получена из второй последовательности нуклеиновой кислоты (например, ITR), может предусматривать нуклеотидную последовательность, которая является идентичной или по сути аналогичной нуклеотидной последовательности второй последовательности нуклеиновой кислоты. В случае нуклеотидов или полипептидов производные молекулы могут быть получены путем, например, естественного мутагенеза, искусственного направленного мутагенеза или искусственного случайного мутагенеза. Мутагенез, применяемый для получения нуклеотидов или полипептидов, может являться преднамеренно направленным, или преднамеренно случайным, или их комбинацией. Мутагенез нуклеотида или полипептида с созданием отличающегося нуклеотида или полипептида, полученного из первого, может быть случайным событием (например, обусловленным неточностью работы полимеразы), и идентификация полученного нуклеотида или полипептида может быть осуществлена путем подходящих способов скрининга, например, как рассматривается в данном документе. Мутагенез полипептида, как правило, предусматривает манипуляции с полинуклеотидом, который кодирует полипептид. В некоторых вариантах осуществления нуклеотидная или аминокислотная последовательность, которая получена из второй нуклеотидной или аминокислотной последовательности, характеризуется по меньшей мере 50%, по меньшей мере 51%, по меньшей мере 52%, по меньшей мере 53%, по меньшей мере 54%, по меньшей мере 55%, по меньшей мере 56%, по меньшей мере 57%, по меньшей мере 58%, по меньшей мере 59%, по меньшей мере 60%, по меньшей мере 61%, по меньшей мере 62%, по меньшей мере 63%, по меньшей мере 64%, по меньшей мере 65%, по меньшей мере 66%, по меньшей мере 67%, по меньшей мере 68%, по меньшей мере 69%, по меньшей мере 70%, по меньшей мере 71%, по меньшей мере 72%, по меньшей мере 73%, по меньшей мере 74%, по меньшей мере 75%, по меньшей мере 76%, по меньшей мере 77%, по меньшей мере 78%, по меньшей мере 79%, по меньшей мере 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентичностью последовательности со второй нуклеотидной или аминокислотной последовательностью соответственно, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В других вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 90% идентичностью с ITR вируса, отличного от AAV (или ITR AAV соответственно), где ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 80% идентичностью с ITR вируса, отличного от AAV (или ITR AAV соответственно), где ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 70% идентичностью с ITR вируса, отличного от AAV (или ITR AAV соответственно), где ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 60% идентичностью с ITR вируса, отличного от AAV (или ITR AAV соответственно), где ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 50% идентичностью с ITR вируса, отличного от AAV (или ITR AAV соответственно), где ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно).
[112] В определенных вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), содержит или состоит из фрагмента ITR вируса, отличного от AAV (или AAV). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), содержит или состоит из фрагмента ITR вируса, отличного от AAV (или AAV), где фрагмент содержит по меньшей мере приблизительно 5 нуклеотидов, по меньшей мере приблизительно 10 нуклеотидов, по меньшей мере приблизительно 15 нуклеотидов, по меньшей мере приблизительно 20 нуклеотидов, по меньшей мере приблизительно 25 нуклеотидов, по меньшей мере приблизительно 30 нуклеотидов, по меньшей мере приблизительно 35 нуклеотидов, по меньшей мере приблизительно 40 нуклеотидов, по меньшей мере приблизительно 45 нуклеотидов, по меньшей мере приблизительно 50 нуклеотидов, по меньшей мере приблизительно 55 нуклеотидов, по меньшей мере приблизительно 60 нуклеотидов, по меньшей мере приблизительно 65 нуклеотидов, по меньшей мере приблизительно 70 нуклеотидов, по меньшей мере приблизительно 75 нуклеотидов, по меньшей мере приблизительно 80 нуклеотидов, по меньшей мере приблизительно 85 нуклеотидов, по меньшей мере приблизительно 90 нуклеотидов, по меньшей мере приблизительно 95 нуклеотидов, по меньшей мере приблизительно 100 нуклеотидов, по меньшей мере приблизительно 125 нуклеотидов, по меньшей мере приблизительно 150 нуклеотидов, по меньшей мере приблизительно 175 нуклеотидов, по меньшей мере приблизительно 200 нуклеотидов, по меньшей мере приблизительно 225 нуклеотидов, по меньшей мере приблизительно 250 нуклеотидов, по меньшей мере приблизительно 275 нуклеотидов, по меньшей мере приблизительно 300 нуклеотидов, по меньшей мере приблизительно 325 нуклеотидов, по меньшей мере приблизительно 350 нуклеотидов, по меньшей мере приблизительно 375 нуклеотидов, по меньшей мере приблизительно 400 нуклеотидов, по меньшей мере приблизительно 425 нуклеотидов, по меньшей мере приблизительно 450 нуклеотидов, по меньшей мере приблизительно 475 нуклеотидов, по меньшей мере приблизительно 500 нуклеотидов, по меньшей мере приблизительно 525 нуклеотидов, по меньшей мере приблизительно 550 нуклеотидов, по меньшей мере приблизительно 575 нуклеотидов или по меньшей мере приблизительно 600 нуклеотидов; где ITR, полученный из ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В определенных вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), содержит или состоит из фрагмента ITR вируса, отличного от AAV (или AAV), где фрагмент содержит по меньшей мере приблизительно 129 нуклеотидов, и где ITR, полученный из ITR вируса, отличного от AAV (или AAV) сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В определенных вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), содержит или состоит из фрагмента ITR вируса, отличного от AAV (или AAV), где фрагмент содержит по меньшей мере приблизительно 102 нуклеотидов, и где ITR, полученный из ITR вируса, отличного от AAV (или AAV) сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно).
[113] В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), содержит или состоит из фрагмента ITR вируса, отличного от AAV (или AAV), где фрагмент составляет по меньшей мере приблизительно 5%, по меньшей мере приблизительно 10%, по меньшей мере приблизительно 15%, по меньшей мере приблизительно 20%, по меньшей мере приблизительно 25%, по меньшей мере приблизительно 30%, по меньшей мере приблизительно 35%, по меньшей мере приблизительно 40%, по меньшей мере приблизительно 45%, по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% от длины ITR вируса, отличного от AAV (или AAV).
[114] В определенных вариантах осуществления нуклеотидная или аминокислотная последовательность, которая получена из второй нуклеотидной или аминокислотной последовательности, характеризуется по меньшей мере 50%, по меньшей мере 51%, по меньшей мере 52%, по меньшей мере 53%, по меньшей мере 54%, по меньшей мере 55%, по меньшей мере 56%, по меньшей мере 57%, по меньшей мере 58%, по меньшей мере 59%, по меньшей мере 60%, по меньшей мере 61%, по меньшей мере 62%, по меньшей мере 63%, по меньшей мере 64%, по меньшей мере 65%, по меньшей мере 66%, по меньшей мере 67%, по меньшей мере 68%, по меньшей мере 69%, по меньшей мере 70%, по меньшей мере 71%, по меньшей мере 72%, по меньшей мере 73%, по меньшей мере 74%, по меньшей мере 75%, по меньшей мере 76%, по меньшей мере 77%, по меньшей мере 78%, по меньшей мере 79%, по меньшей мере 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентичностью последовательности с гомологичной частью второй нуклеотидной или аминокислотной последовательности соответственно, когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В других вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 90% идентичностью с гомологичной частью ITR вируса, отличного от AAV (или ITR AAV соответственно), когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 80% идентичностью с гомологичной частью ITR вируса, отличного от AAV (или ITR AAV соответственно), когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 70% идентичностью с гомологичной частью ITR вируса, отличного от AAV (или ITR AAV соответственно), когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 60% идентичностью с гомологичной частью ITR вируса, отличного от AAV (или ITR AAV соответственно), когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 50% идентичностью с гомологичной частью ITR вируса, отличного от AAV (или ITR AAV соответственно), когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности.
[115] "Не имеющие капсида" или "безкапсидные" вектор или молекула нуклеиновой кислоты относятся к векторной конструкции, не предусматривающей наличия капсида. В некоторых вариантах осуществления безкапсидный вектор или молекула нуклеиновой кислоты не содержат последовательностей, кодирующих, например, белок Rep AAV.
[116] Как используется в данном документе, "кодирующая область" или "кодирующая последовательность" представляют собой часть полинуклеотида, состоящую из кодонов, транслируемых в аминокислоты. Хотя "стоп-кодон" (TAG, TGA или TAA), как правило, не транслируется в аминокислоту, он может считаться частью кодирующей области, однако любые фланкирующие последовательности, например промоторы, сайты связывания рибосом, терминаторы транскрипции, интроны и т. п., не составляют часть кодирующей области. Границы кодирующей области обычно определяются старт-кодоном на 5'-конце, кодирующим амино-конец получаемого полипептида, и стоп-кодоном трансляции на 3'-конце, кодирующим карбоксильный конец получаемого полипептида. Две или более кодирующие области могут присутствовать в одной полинуклеотидной конструкции, например, в одном векторе, или в отдельных полинуклеотидных конструкциях, например, в отдельных (различных) векторах. Отсюда следует, что один вектор может содержать только одну кодирующую область или содержать две или более кодирующие области.
[117] Определенные белки, секретируемые клетками млекопитающих, связаны с секреторным сигнальным пептидом, отщепляющимся от зрелого белка после начала экспорта растущей белковой цепи через гранулярный эндоплазматический ретикулум. Средним специалистам в данной области техники известно, что сигнальные полипептиды обычно слиты с N-концом полипептида, и отщепляются от полного или "полноразмерного" полипептида с образованием секретируемой или "зрелой" формы полипептида. В определенных вариантах осуществления применяют нативный сигнальный пептид или функциональное производное такой последовательности, которое сохраняет способность к управлению секрецией полипептида, функционально связанного с ним. В качестве альтернативы, можно применять гетерологичный сигнальный пептид млекопитающего, например, тканевой активатор плазминогена (ТРА) человека или сигнальный пептид β-глюкуронидазы мыши или его функциональное производное.
[118] Термин "ниже" относится к нуклеотидной последовательности, которая расположена в направлении 3'-конца относительно эталонной нуклеотидной последовательности. В определенных вариантах осуществления расположенные ниже нуклеотидные последовательности относятся к последовательностям, которые следуют за точкой начала транскрипции. Например, кодон инициации трансляции гена расположен ниже относительно сайта начала транскрипции.
[119] Термин "выше" относится к нуклеотидной последовательности, которая расположена в направлении 5'-конца относительно эталонной нуклеотидной последовательности. В определенных вариантах осуществления расположенные выше нуклеотидные последовательности относятся к последовательностям, которые расположены со стороны 5'-конца относительно кодирующей области или точки начала транскрипции. Например, большинство промоторов расположены выше сайта начала транскрипции.
[120] Как используется в данном документе, термин "регуляторная область гена" или "регуляторная область" относится к нуклеотидным последовательностям, расположенным выше (5'-некодирующие последовательности), в пределах или ниже (3'-некодирующие последовательности) кодирующей области, и которые влияют на транскрипцию, процессинг РНК, стабильность или трансляцию связанной кодирующей области. Регуляторные области могут включать промоторы, лидерные последовательности трансляции, интроны, последовательности, узнающие сайты полиаденилирования, сайты процессинга РНК, сайты связывания эффекторов и структуры "стебель-петля". Если кодирующая область предназначена для экспрессии в эукариотической клетке, сигнал полиаденилирования и последовательность терминации транскрипции обычно будут размещены в направлении 3'-конца относительно кодирующей последовательности.
[121] Полинуклеотид, который кодирует продукт, например miRNA или продукт гена (например, полипептид, такой как терапевтический белок), может содержать промотор и/или другие элементы, осуществляющие контроль экспрессии (например, транскрипции или трансляции), функционально связанные с одной или несколькими кодирующими областями. В функциональной связи кодирующая область для продукта гена, например полипептида, связана с одной или несколькими регуляторными областями таким образом, что экспрессия продукта гена находится под влиянием или контролем регуляторной(-ых) области(-ей). Например, кодирующая область и промотор считаются "функционально связанными", если индуцирование функции промотора приводит к транскрипции мРНК, кодирующей продукт гена, кодируемого кодирующей областью, и если природа связи между промотором и кодирующей областью не препятствует способности промотора управлять экспрессией продукта гена или не препятствует способности ДНК-матрицы транскрибироваться. Другие элементы, контролирующие экспрессию, помимо промотора, например энхансеры, операторы, репрессоры и сигналы терминации транскрипции, также могут быть функционально связаны с кодирующей областью для управления экспрессией продукта гена.
[122] "Последовательности, осуществляющие контроль транскрипции", относятся к регуляторным последовательностям ДНК, таким как промоторы, энхансеры, терминаторы и т. п., которые обеспечивают осуществление экспрессии кодирующей последовательности в клетке-хозяине. Специалистам в данной области техники известны разнообразные области, осуществляющие контроль транскрипции. Они включают без ограничения области, осуществляющие контроль транскрипции, функционирующие в клетках позвоночных, такие как без ограничения промоторные и энхансерные сегменты цитомегаловирусов (промотор гена немедленного раннего ответа вместе с интроном A), вируса обезьян 40 (промотор гена раннего ответа) и ретровирусов (таких как вирус саркомы Рауса). Другие области, осуществляющие контроль транскрипции, включают области, полученные из генов позвоночных, таких как гены актина, белка теплового шока, бычьего гормона роста и β-глобина кролика, а также другие последовательности, способные осуществлять контроль экспрессии генов в эукариотических клетках. Дополнительные подходящие области, осуществляющие контроль транскрипции, включают тканеспецифические промоторы и энхансеры, а также индуцируемые лимфокинами промоторы (например, промоторы, индуцируемые интерферонами или интерлейкинами).
[123] Аналогично, разнообразные элементы, осуществляющие контроль трансляции, известны средним специалистам в данной области техники. Они включают без ограничения сайты связывания рибосомы, кодоны инициации и терминации трансляции и элементы, полученные из пикорнавирусов (в частности, сайт внутренней посадки рибосомы или IRES, также называемый CITE-последовательностью).
[124] Термин "экспрессия", используемый в данном документе, относится к процессу, посредством которого из полинуклеотида вырабатывается продукт гена, например, РНК или полипептид. Она включает без ограничения транскрипцию полинуклеотида с образованием матричной РНК (mRNA), транспортной РНК (tRNA), малой шпилечной РНК (shRNA), малой интерферирующей РНК (siRNA) или любого другого продукта, представляющего собой РНК, и трансляцию mRNA с образованием полипептида. Экспрессия приводит к образованию "продукта гена". Как используется в данном документе, продукт гена может представлять собой либо нуклеиновую кислоту, например, матричную РНК, получаемую путем транскрипции гена, либо полипептид, который транслируется с транскрипта. Продукты гена, описанные в данном документе, дополнительно включают нуклеиновые кислоты с посттранскрипционными модификациями, например, полиаденилированием или сплайсингом, или полипептиды с посттрансляционными модификациями, например, метилированием, гликозилированием, добавлением липидов, ассоциацией с другими белковыми субъединицами или протеолитическим расщеплением. Термин "выход", используемый в данном документе, относится к количеству полипептида, полученному посредством экспрессии гена.
[125] "Вектор" относится к любому носителю для клонирования нуклеиновой кислоты и/или ее переноса в клетку-хозяина. Вектор может представлять собой репликон, к которому может быть присоединен другой сегмент нуклеиновой кислоты так, чтобы обеспечить репликацию присоединенного сегмента. "Репликон" относится к любому генетическому элементу (например, плазмиде, фагу, космиде, хромосоме, вирусу), который функционирует как автономная единица репликации in vivo, т. e. способен реплицироваться под своим собственным контролем. Термин "вектор" включает носители для введения нуклеиновой кислоты в клетку in vitro, ex vivo или in vivo. В данной области техники известно и используется большое количество векторов, в том числе, например, плазмиды, модифицированные вирусы эукариот или модифицированные бактериофаги. Вставка полинуклеотида в подходящий вектор может быть осуществлена посредством лигирования соответствующих полинуклеотидных фрагментов в выбранный вектор, который имеет комплементарные "липкие" концы.
[126] Векторы могут быть сконструированы так, чтобы кодировать селектируемые маркеры или репортерные гены, которые обеспечивают отбор или идентификацию клеток, в которые встроился вектор. Экспрессия селектируемых маркеров или репортерных генов обеспечивает идентификацию и/или отбор клеток-хозяев, которые содержат и экспрессируют другие кодирующие области, содержащиеся в векторе. Примеры генов селектируемых маркеров, известных и применяемых в данной области техники, включают гены, обеспечивающие устойчивость к ампициллину, стрептомицину, гентамицину, канамицину, гигромицину, гербициду биалафосу, сульфонамиду и т. п.; и гены, которые применяют в качестве фенотипических маркеров, т. е. гены, регулирующие синтез антоцианов, ген изопентанилтрансферазы и т. п. Примеры репортерных генов, известных и применяемых в данной области техники, включают люциферазу (Luc), зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансферазу (CAT), β-галактозидазу (LacZ), β-глюкуронидазу (Gus) и т. п. Селектируемые маркеры также можно рассматривать как репортерные гены.
[127] Термин "клетка-хозяин", используемый в данном документе, относится, например, к микроорганизмам, клеткам дрожжей, клеткам насекомых и клеткам млекопитающих, которые можно применять или применяются в качестве реципиентов ssDNA или векторов. Термин включает потомство исходной клетки, которая была трансдуцирована. Таким образом, применяемая в данном документе "клетка-хозяин", как правило, относится к клетке, которая была трансдуцирована последовательностью экзогенной ДНК. Следует понимать, что потомство одной родительской клетки может не обязательно быть полностью идентичным исходному родителю по морфологии или комплементарности геномной или общей ДНК вследствие естественной, случайной или преднамеренной мутации. В некоторых вариантах осуществления клетка-хозяин может представлять собой клетку-хозяина in vitro.
[128] Термин "селектируемый маркер" относится к идентифицирующему фактору, обычно гену антибиотика или устойчивости к химическому воздействию, по которому можно осуществлять отбор на основе эффекта маркерного гена, например устойчивость к антибиотику, устойчивость к гербициду, колориметрические маркеры, ферменты, флуоресцентные маркеры и т. п., где эффект применяют для отслеживания наследования представляющей интерес нуклеиновой кислоты и/или идентификации клетки или организма, которые унаследовали представляющую интерес нуклеиновую кислоту. Примеры генов селектируемых маркеров, известных и применяемых в данной области техники, включают гены, обеспечивающие устойчивость к ампициллину, стрептомицину, гентамицину, канамицину, гигромицину, гербициду биалафосу, сульфонамиду и т. п.; и гены, которые применяют в качестве фенотипических маркеров, т. е. гены, регулирующие синтез антоцианов, ген изопентанилтрансферазы и т. п.
[129] Термин "репортерный ген" относится к нуклеиновой кислоте, кодирующей идентифицирующий фактор, который можно идентифицировать на основе эффекта репортерного гена, где эффект применяют для отслеживания наследования представляющей интерес нуклеиновой кислоты, идентификации клетки или организма, которые унаследовали представляющую интерес нуклеиновую кислоту, и/или для измерения индуцирования экспрессии или транскрипции гена. Примеры репортерных генов, известных и применяемых в данной области техники, включают люциферазу (Luc), зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансферазу (CAT), β-галактозидазу (LacZ), β-глюкуронидазу (Gus) и т. п. Гены селективных маркеров также можно рассматривать как репортерные гены.
[130] "Промотор" и "промоторная последовательность" применяют взаимозаменяемо и относятся к последовательности ДНК, способной к осуществлению контроля экспрессии кодирующей последовательности или функциональной РНК. В целом, кодирующая последовательность расположена в направлении 3'-конца относительно промоторной последовательности. Промоторы могут быть получены целиком из нативного гена или состоять из различных элементов, полученных из различных промоторов, встречающихся в природе, или даже содержать сегменты синтетической ДНК. Специалистам в данной области техники будет понятно, что различные промоторы могут управлять экспрессией гена в различных тканях или типах клеток, или на различных стадиях развития, или в ответ на различные условия окружающей среды или физиологические условия. Промоторы, которые обуславливают экспрессию гена в большинстве типов клеток в большинстве случаев, обычно называют "конститутивными промоторами". Промоторы, которые обуславливают экспрессию гена в конкретном типе клеток, обычно называют "клеточноспецифическими промоторами" или "тканеспецифическими промоторами". Промоторы, которые обуславливают экспрессию гена на конкретной стадии развития или дифференцировки клеток, обычно называют "промоторами, специфическими для стадии развития" или "промоторами, специфическими в отношении дифференцировки клеток". Промоторы, которые являются индуцируемыми и обуславливают экспрессию гена после подвергания воздействию или обработки клетки средством, биологической молекулой, химическим веществом, лигандом, светом или т. п., которые индуцируют промотор, обычно называют "индуцибельными промоторами" или "регулируемыми промоторами". Кроме того, следует понимать, что поскольку в большинстве случаев точные границы регуляторных последовательностей полностью определены не были, фрагменты ДНК различной длины могут характеризоваться идентичной промоторной активностью.
[131] Промоторная последовательность, как правило, ограничена со стороны своего 3'-конца сайтом инициации транскрипции и продолжается выше (в 5'-направлении) с включением минимального числа оснований или элементов, необходимых для инициации транскрипции на поддающихся обнаружению находящихся выше фонового уровнях. В пределах промоторной последовательности можно будет обнаружить сайт инициации транскрипции (в подходящем случае определенный, например, посредством картирования с помощью нуклеазы S1), а также домены связывания белка (консенсусные последовательности), ответственные за связывание РНК-полимеразы.
[132] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит тканеспецифический промотор. В определенных вариантах осуществления тканеспецифический промотор управляет экспрессией терапевтического белка, например фактора свертывания крови, в печени, например в гепатоцитах и/или эндотелиальных клетках. В конкретных вариантах осуществления промотор выбран из группы, состоящей из промотора тиретина мыши (mTTR), эндогенного промотора фактора VIII человека (F8), промотора альфа-1-антитрипсина человека (hAAT), минимального промотора альбумина человека, промотора альбумина мыши, промотора тристетрапролина (TTP), промотора CASI, промотора CAG, промотора цитомегаловируса (CMV), промотора фосфоглицераткиназы (PGK) и любой их комбинации. В некоторых вариантах осуществления промотор выбран из специфического для печени промотора (например, α1-антитрипсина (AAT)), специфического для мышц промотора (например, мышечной креатинкиназы (MCK), тяжелой цепи миозина альфа (αMHC), миоглобина (MB) и десмина (DES)), синтетического промотора (например, SPc5-12, 2R5Sc5-12, dMCK и tMCK) и любой их комбинации. В одном конкретном варианте осуществления промотор предусматривает промотор TTP.
[133] Термины "рестрикционная эндонуклеаза" и "рестрикционный фермент" применяются взаимозаменяемо и относятся к ферменту, который связывается и вносит разрывы в пределах конкретной нуклеотидной последовательности в пределах двухнитевой ДНК.
[134] Термин "плазмида" относится к внехромосомному элементу, зачастую несущему ген, который не является частью центрального метаболизма клетки, и обычно имеющему форму кольцевых двухнитевых молекул ДНК. Такие элементы могут представлять собой автономно реплицирующиеся последовательности, интегрирующиеся в геном последовательности, фаговые или нуклеотидные последовательности, линейные, кольцевые или сверхспиральные, из одно- или двухнитевой ДНК или РНК, полученные из любого источника, к которым присоединен или добавлен путем рекомбинации ряд нуклеотидных последовательностей с образованием уникальной конструкции, которая способна вводить промоторный фрагмент и последовательность ДНК, кодирующую выбранный продукт гена, вместе с соответствующей 3'-нетранслируемой последовательностью в клетку.
[135] Векторы на основе вирусов эукариот, которые можно применять, включают без ограничения векторы на основе аденовируса, векторы на основе ретровируса, векторы на основе аденоассоциированного вируса, на основе поксвируса, например, векторы на основе вируса осповакцины, векторы на основе бакуловируса или векторы на основе герпесвируса. Отличные от вирусных векторы включают плазмиды, липосомы, электрически заряженные липиды (цитофектины), комплексы ДНК-белок и биополимеры.
[136] "Клонирующий вектор" относится к "репликону", который представляет собой единицу длины нуклеиновой кислоты, которая реплицируется последовательно и которая содержит точку начала репликации, такую как плазмида, фаг или космида, к которой может быть присоединен другой сегмент нуклеиновой кислоты так, чтобы обеспечить репликацию присоединенного сегмента. Определенные клонирующие векторы способны реплицироваться в одном типе клеток, например бактериях, а экспрессироваться в другом, например эукариотических клетках. Клонирующие векторы обычно содержат одну или несколько последовательностей, которые можно применять для отбора клеток, содержащих вектор, и/или один или несколько сайтов множественного клонирования для вставки последовательностей нуклеиновых кислот, представляющих интерес.
[137] Термин "вектор экспрессии" относится к носителю, сконструированному с возможностью обеспечения экспрессии вставленной последовательности нуклеиновой кислоты после вставки в клетку-хозяина. Вставленная последовательность нуклеиновой кислоты находится в функциональной связи с регуляторными областями, как описано выше.
[138] Векторы вводят в клетки-хозяева с помощью способов, хорошо известных из уровня техники, например, посредством трансфекции, электропорации, микроинъекции, трансдукции, слияния клеток, DEAE-декстрана, осаждения с фосфатом кальция, липофекции (слияния лизосом), применения генной пушки или транспортера ДНК-вектора. Термины "культура", "культивировать" и "культивирование", как используется в данном документе, означают инкубацию клеток в условиях in vitro, которые обеспечивают рост или деление клеток или поддержание клеток в живом состоянии. Используемый в данном документе термин "культивируемые клетки" означает клетки, которые размножаются in vitro.
[139] Подразумевается, что используемый в данном документе термин "полипептид" охватывает "полипептид" в единственном числе, а также "полипептиды" во множественном числе и относится к молекуле, состоящей из мономеров (аминокислот), линейно связанных амидными связями (также известными как пептидные связи). Термин "полипептид" относится к любой цепи или цепям из двух или более аминокислот и не относится к конкретной длине продукта. Таким образом, пептиды, дипептиды, трипептиды, олигопептиды, "белок", "аминокислотная цепь" или любой другой термин, используемый для обозначения цепи или цепей из двух или более аминокислот, включены в определение "полипептида", и термин "полипептид" можно использовать вместо любого из этих терминов или взаимозаменяемо с любым из них. Также подразумевается, что термин "полипептид" относится к продуктам постэкспрессионных модификаций полипептида, включая без ограничения гликозилирование, ацетилирование, фосфорилирование, амидирование, получение производных с помощью известных защитных/блокирующих групп, протеолитическое расщепление или модификацию с помощью аминокислот, не встречающихся в природе. Полипептид может происходить из природного биологического источника или быть получен с помощью рекомбинантной технологии, но не обязательно транслирован с определенной последовательности нуклеиновой кислоты. Он может быть получен любым способом, в том числе путем химического синтеза.
[140] Термин "аминокислота" включает аланин (Ala или A); аргинин (Arg или R); аспарагин (Asn или N); аспарагиновую кислоту (Asp или D); цистеин (Cys или C); глутамин (Gln или Q); глутаминовую кислоту (Glu или E); глицин (Gly или G); гистидин (His или H); изолейцин (Ile или I): лейцин (Leu или L); лизин (Lys или K); метионин (Met или M); фенилаланин (Phe или F); пролин (Pro или P); серин (Ser или S); треонин (Thr или T); триптофан (Trp или W); тирозин (Tyr или Y) и валин (Val или V). Нетрадиционные аминокислоты также находятся в пределах объема настоящего изобретения и включают норлейцин, орнитин, норвалин, гомосерин и другие аналоги аминокислотных остатков, такие как описанные в Ellman et al. Meth. Enzym. 202:301-336 (1991). Для получения таких не встречающихся в природе аминокислотных остатков можно использовать процедуры согласно вышеуказанному Noren et al. Science 244:182 (1989) и Ellman et al. Вкратце, такие процедуры предусматривают химическую активацию супрессорной tRNA с помощью не встречающегося в природе аминокислотного остатка с последующими транскрипцией и трансляцией РНК in vitro. Введения нетрадиционной аминокислоты можно также достигать с применением химических способов образования пептидной связи, известных из уровня техники. Используемый в данном документе термин "полярная аминокислота" включает аминокислоты, которые характеризуются нулевым суммарным зарядом, однако характеризуются отличными от нуля частичными зарядами в различных частях своих боковых цепей (например, M, F, W, S, Y, N, Q, C). Такие аминокислоты могут участвовать в гидрофобных взаимодействиях и электростатических взаимодействиях. Используемый в данном документе термин "заряженная аминокислота" включает аминокислоты, которые характеризуются отличным от нуля суммарным зарядом на своих боковых цепях (например, R, K, H, E, D). Такие аминокислоты могут участвовать в гидрофобных взаимодействиях и электростатических взаимодействиях.
[141] Также в настоящее изобретение включены фрагменты или варианты полипептидов и любая их комбинация. Термины "фрагмент" или "вариант" в отношении полипептидных связывающих доменов или связывающих молекул по настоящему изобретению, включают любые полипептиды, которые сохраняют по меньшей мере некоторые из свойств эталонного полипептида (например, аффинность связывания FcRn для FcRn-связывающего домена или варианта Fc, коагуляционную активность для варианта FVIII или FVIII-связывающую активность для фрагмента VWF). Фрагменты полипептидов включают фрагменты, полученные посредством протеолиза, а также фрагменты, полученные посредством делеции, в дополнение к конкретным фрагментам антитела, обсуждаемым в данном документе в другом месте, но не включают встречающийся в природе полноразмерный полипептид (или зрелый полипептид). Варианты полипептидных связывающих доменов или связывающих молекул по настоящему изобретению, включают фрагменты, описанные выше, а также полипептиды с аминокислотными последовательностями, измененными в результате аминокислотных замен, делеций или вставок. Варианты могут быть встречающимися в природе или не встречающимися в природе. Не встречающиеся в природе варианты можно получить с помощью известных из уровня техники методик мутагенеза. Вариантные полипептиды могут содержать консервативные или неконсервативные аминокислотные замены, делеции или добавления.
[142] "Консервативная аминокислотная замена" представляет собой замену, при которой аминокислотный остаток замещается аминокислотным остатком, имеющим сходную боковую цепь. Семейства аминокислотных остатков, имеющих сходные боковые цепи, определены в уровне техники, включая основные боковые цепи (например, лизин, аргинин, гистидин), кислые боковые цепи (например, аспарагиновая кислота, глутаминовая кислота), незаряженные полярные боковые цепи (например, глицин, аспарагин, глутамин, серин, треонин, тирозин, цистеин), неполярные боковые цепи (например, аланин, валин, лейцин, изолейцин, пролин, фенилаланин, метионин, триптофан), бета-разветвленные боковые цепи (например, треонин, валин, изолейцин) и ароматические боковые цепи (например, тирозин, фенилаланин, триптофан, гистидин). Таким образом, если аминокислота в полипептиде замещается другой аминокислотой из того же семейства боковых цепей, то замена считается консервативной. В другом варианте осуществления нить из аминокислот можно подвергнуть консервативному замещению сходной в структурном отношении нитью, которая отличается порядком расположения и/или составом представителей семейства боковых цепей.
[143] Термин "процентная идентичность", известный из уровня техники, означает взаимосвязь между двумя или более полипептидными последовательностями или двумя или более полинуклеотидными последовательностями, определенную путем сравнения последовательностей. В уровне техники "идентичность" также означает степень сходства последовательности между полипептидными или полинуклеотидными последовательностями, в соответствующих случаях, определенную по степени соответствия между нитями таких последовательностей. "Идентичность" может быть легко рассчитана с помощью известных способов, в том числе без ограничения тех, которые описаны в Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, New York (1988); Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, New York (1993); Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, New Jersey (1994); Sequence Analysis in Molecular Biology (von Heinje, G., ed.) Academic Press (1987) и Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Stockton Press, New York (1991). Предпочтительные способы определения идентичности разработаны с обеспечением самой высокой степени соответствия между исследуемыми последовательностями. Способы определения идентичности запрограммированы в находящихся в открытом доступе компьютерных программах. Выравнивание последовательностей и расчеты процентной идентичности можно осуществлять с применением программного обеспечения для анализа последовательностей, такого как программа Megalign из программного пакета для биоинформационных вычислений LASERGENE (DNASTAR Inc., Мадисон, Висконсин), пакет программ GCG (Wisconsin Package версии 9.0, Genetics Computer Group (GCG), Мадисон, Висконсин), BLASTP, BLASTN, BLASTX (Altschul et al., J. Mol. Biol. 215:403 (1990)) и DNASTAR (DNASTAR, Inc. 1228 S. Park St., Мадисон, Висконсин 53715, США). В контексте настоящей заявки будет понятно, что в случаях применения программного обеспечения для анализа последовательностей результаты анализа будут основываться на "значениях по умолчанию" рассматриваемой программы, если не указано иное. Используемые в данном документе "значения по умолчанию" будут означать любой набор значений или параметров, которые изначально загружаются с программным обеспечением при первом запуске. Для целей определения процентной идентичности между последовательностью терапевтического белка, например фактора свертывания крови, согласно настоящему изобретению и эталонной последовательностью только нуклеотиды в эталонной последовательности, соответствующие нуклеотидам в последовательности терапевтического белка, например фактора свертывания крови, согласно настоящему изобретению, используют для расчета процентной идентичности. Например, при сравнении нуклеотидной последовательности полноразмерного FVIII, содержащего домен B, с оптимизированной нуклеотидной последовательностью FVIII с удаленным доменом B (BDD) согласно настоящему изобретению часть выравнивания, включающая домен A1, A2, A3, C1 и C2, будет использоваться для расчета процентной идентичности. Нуклеотиды в части последовательности полноразмерного FVIII, кодирующей домен B (что приведет к большому "гэпу" в выравнивании), не будут учитываться в качестве несовпадений. Кроме того, при определении процентной идентичности между оптимизированной последовательностью FVIII с BDD согласно настоящему изобретению или ее указанной частью (например, нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO:3) и эталонной последовательностью процентная идентичность будет рассчитана при выравнивании с делением числа совпадающих нуклеотидов на общее число нуклеотидов в полной последовательности оптимизированной последовательности FVIII с BDD или ее указанной части, как указано в данном документе.
[144] Как используется в данном документе, нуклеотиды, соответствующие нуклеотидам в конкретной последовательности согласно настоящему изобретению, идентифицированы путем выравнивания последовательности согласно настоящему изобретению с обеспечением максимальной идентичности с эталонной последовательностью. Номер, используемый для идентификации эквивалентной аминокислоты в эталонной последовательности соответствует номеру, используемому для идентификации соответствующей аминокислоты в последовательности согласно настоящему изобретению.
[145] "Слитый" или "химерный" белок содержит первую аминокислотную последовательность, соединенную со второй аминокислотной последовательностью, с которой она естественным образом не соединена в природе. Аминокислотные последовательности, которые в обычных условиях существуют в отдельных белках, могут быть объединены в слитом полипептиде, или аминокислотные последовательности, которые в обычных условиях существуют в одном и том же белке, могут быть размещены в новом порядке в слитом полипептиде, например, при слиянии домена фактора VIII по настоящему изобретению с Fc-доменом Ig. Слитый белок создают, например, путем химического синтеза или путем создания полинуклеотида, в котором области пептида кодируются в необходимом взаиморасположении, и обеспечения его трансляции. Химерный белок может дополнительно содержать вторую аминокислотную последовательность, связанную с первой аминокислотной последовательностью с помощью ковалентной непептидной связи или нековалентной связи.
[146] Используемый в данном документе термин "сайт вставки" относится к положению в полипептиде или его фрагменте, варианте или производном, которое находится непосредственно выше положения, в которое может быть вставлен гетерологичный компонент. "Сайт вставки" указан в виде числа, причем число является номером аминокислоты в эталонной последовательности. Например, "сайт вставки" в FVIII относится к номеру аминокислоты в последовательности в зрелом нативном FVIII (SEQ ID NO: 15), которому соответствует сайт вставки, который располагается непосредственно за положением вставки в направлении N-конца. Например, фраза "a3 содержит гетерологичный компонент в сайте вставки, который соответствует аминокислоте 1656 из SEQ ID NO: 15" указывает на то, что гетерологичный компонент расположен между двумя аминокислотами, соответствующими аминокислоте 1656 и аминокислоте 1657 из SEQ ID NO: 15.
[147] Используемая в данном документе фраза "непосредственно ниже аминокислоты" относится к положению сразу возле концевой карбоксильной группы аминокислоты. Аналогично, фраза "непосредственно выше аминокислоты" относится к положению сразу возле концевой аминогруппы аминокислоты.
[148] Термины "вставленный", "вставлен", "вставлен в" или грамматически родственные термины, используемые в данном документе, относятся к положению гетерологичного компонента в полипептиде, например, фактора свертывания крови, относительно аналогичного положения в родительском полипептиде. Например, в определенном варианте осуществления "вставлен" и т. п. относятся к положению гетерологичного компонента в полипептиде рекомбинантного FVIII относительно аналогичного положения в нативном зрелом FVIII человека. Используемые в данном документе термины относятся к характеристикам полипептида и не указывают, не подразумевают или не предполагают каких-либо способов или процесса, с помощью которых был получен полипептид.
[149] Используемый в данном документе термин "период полужизни" относится к биологическому периоду полужизни конкретного полипептида in vivo. Период полужизни можно выразить в виде времени, необходимого для выведения из кровотока и/или других тканей животного половины количества, введенного субъекту. Если кривую клиренса данного полипептида строят в виде функции времени, кривая обычно является двухфазной с быстрой α-фазой и более длинной β-фазой. Обычно α-фаза отображает уравновешивание содержания введенного полипептида Fc между внутри- и внесосудистым пространством и частично определяется размером полипептида. Обычно β-фаза отображает катаболизм полипептида во внутрисосудистом пространстве. В некоторых вариантах осуществления терапевтический белок, например фактор свертывания крови, например FVIII, и химерные белки, содержащие его, являются монофазными и, таким образом, характеризуются отсутствием альфа-фазы и наличием только отдельной бета-фазы. Следовательно, в определенных вариантах осуществления термин период полужизни, используемый в данном документе, относится к периоду полужизни полипептида в β-фазе.
[150] Термин "соединенный", используемый в данном документе, относится к первой аминокислотной последовательности или нуклеотидной последовательности, ковалентно или нековалентно присоединенной соответственно ко второй аминокислотной последовательности или нуклеотидной последовательности. Первая аминокислотная или нуклеотидная последовательность может быть непосредственно присоединена ко второй аминокислотной или нуклеотидной последовательности или объединена с ней, или, в качестве альтернативы, промежуточная последовательность может ковалентно соединять первую последовательность со второй последовательностью. Термин "соединенный" означает не только слияние первой аминокислотной последовательности со второй аминокислотной последовательностью на С-конце или N-конце, но также включает вставку всей первой аминокислотной последовательности (или второй аминокислотной последовательности) между любыми двумя аминокислотами во второй аминокислотной последовательности (или соответственно в первой аминокислотной последовательности). В одном варианте осуществления первая аминокислотная последовательность может быть соединена со второй аминокислотной последовательностью с помощью пептидной связи или линкера. Первая нуклеотидная последовательность может быть соединена со второй нуклеотидной последовательностью с помощью фосфодиэфирной связи или линкера. Линкер может представлять собой пептид или полипептид (в случае полипептидных цепей), или нуклеотид или цепь нуклеотидов (в случае цепей нуклеотидов), или любой химический компонент (как в случае полипептидных, так и полинуклеотидных цепей). Термин "соединенный" также обозначается дефисом (-).
[151] Гемостаз, используемый в данном документе, означает остановку или замедление кровотечения или кровоизлияния; или остановку или замедление кровотока через кровеносный сосуд или часть тела.
[152] Гемостатическое нарушение, как используется в данном документе, означает генетически наследуемое или приобретенное состояние, характеризующееся склонностью к кровоизлиянию, происходящему спонтанно либо в результате травмы, из-за нарушенной способности или неспособности образовывать фибриновый сгусток. Примеры таких нарушений включают формы гемофилии. Тремя основными формами являются гемофилия A (дефицит фактора VIII), гемофилия B (дефицит фактора IX или "болезнь Кристмаса") и гемофилия C (дефицит фактора XI, легкая склонность к кровотечению). Другие гемостатические нарушения включают, например, болезнь фон Виллебранда, дефицит фактора XI (дефицит PTA), дефицит фактора XII, дефициты или аномалии структуры фибриногена, протромбина, фактора V, фактора VII, фактора X или фактора XIII, синдром Бернара-Сулье, который представляет собой дефект или дефицит GPIb. GPIb, рецептор vWF, может быть дефектным и приводить к невозможности образования первичного сгустка (первичного гемостаза) и повышенной склонности к кровотечению, а также к тромбастении Гланцманна-Негели (тромбастении Гланцманна). При печеночной недостаточности (острой и хронической формах) имеет место недостаточная выработка печенью факторов коагуляции; это может увеличивать риск кровотечения.
[153] Выделенные молекулы нуклеиновой кислоты, выделенные полипептиды или векторы, содержащие выделенную молекулу нуклеиновой кислоты, согласно настоящему изобретению можно применять профилактически. Используемый в данном документе термин "профилактическое лечение" относится к введению молекулы до эпизода кровотечения. В одном варианте осуществления субъект, нуждающийся в гемостатическом средстве общего действия, подвергается или вскоре подвергнется хирургическому вмешательству. Полинуклеотид, полипептид или вектор согласно настоящему изобретению можно вводить до или после хирургического вмешательства в качестве профилактического средства. Полинуклеотид, полипептид или вектор согласно настоящему изобретению можно вводить во время или после хирургического вмешательства для контроля эпизода острого кровотечения. Хирургическое вмешательство может включать без ограничения трансплантацию печени, резекцию печени, стоматологические процедуры или трансплантацию стволовых клеток.
[154] Выделенные молекулы нуклеиновой кислоты, выделенные полипептиды или векторы согласно настоящему изобретению также применяют для лечения по необходимости. Термин "лечение по необходимости" относится к введению выделенной молекулы нуклеиновой кислоты, выделенного полипептида или вектора в ответ на симптомы эпизода кровотечения или перед действием, которое может вызвать кровотечение. В одном аспекте лечение по необходимости может быть назначено субъекту, когда начинается кровотечение, например после травмы, или когда ожидается кровотечение, например перед хирургическим вмешательством. В другом аспекте лечение по необходимости может быть назначено перед действиями, которые увеличивают риск кровотечения, такими как контактные виды спорта.
[155] Используемый в данном документе термин "острое кровотечение" относится к эпизоду кровотечения независимо от первопричины. Например, у субъекта может быть травма, уремия, наследственное нарушение гемостаза (например, дефицит фактора VII), тромбоцитарное нарушение или устойчивость вследствие развития антител к факторам свертывания крови.
[156] "Лечить", "лечение" или "осуществление лечения", как используется в данном документе, относится, например, к уменьшению тяжести заболевания или состояния; уменьшению продолжительности течения заболевания; уменьшению интенсивности проявлений одного или нескольких симптомов, ассоциированных с заболеванием или состоянием; обеспечению благоприятных эффектов у субъекта с заболеванием или состоянием, при этом не обязательно с излечением заболевания или состояния, или профилактике одного или нескольких симптомов, связанных с заболеванием или состоянием. В одном варианте осуществления термин "осуществление лечения" или "лечение" означает поддержание у субъекта, например, остаточного уровня содержания FVIII на уровне по меньшей мере приблизительно 1 МЕ/дл, 2 МЕ/дл, 3 МЕ/дл, 4 МЕ/дл, 5 МЕ/дл, 6 МЕ/дл, 7 МЕ/дл, 8 МЕ/дл, 9 МЕ/дл, 10 МЕ/дл, 11 МЕ/дл, 12 МЕ/дл, 13 МЕ/дл, 14 МЕ/дл, 15 МЕ/дл, 16 МЕ/дл, 17 МЕ/дл, 18 МЕ/дл, 19 МЕ/дл, 20 МЕ/дл, 25 МЕ/дл, 30 МЕ/дл, 35 МЕ/дл, 40 МЕ/дл, 45 МЕ/дл, 50 МЕ/дл, 55 МЕ/дл, 60 МЕ/дл, 65 МЕ/дл, 70 МЕ/дл, 75 МЕ/дл, 80 МЕ/дл, 85 МЕ/дл, 90 МЕ/дл, 95 МЕ/дл, 100 МЕ/дл, 105 МЕ/дл, 110 МЕ/дл, 115 МЕ/дл, 120 МЕ/дл, 125 МЕ/дл, 130 МЕ/дл, 135 МЕ/дл, 140 МЕ/дл, 145 МЕ/дл или 150 МЕ/дл путем введения выделенной молекулы нуклеиновой кислоты, выделенного полипептида или вектора согласно настоящему изобретению. В другом варианте осуществления осуществление лечения или лечение означает поддержание остаточного уровня содержания FVIII на уровне от приблизительно 1 до приблизительно 150 МЕ/дл, от приблизительно 1 до приблизительно 125 МЕ/дл, от приблизительно 1 до приблизительно 100 МЕ/дл, от приблизительно 1 до приблизительно 90 МЕ/дл, от приблизительно 1 до приблизительно 85 МЕ/дл, от приблизительно 1 до приблизительно 80 МЕ/дл, от приблизительно 1 до приблизительно 75 МЕ/дл, от приблизительно 1 до приблизительно 70 МЕ/дл, от приблизительно 1 до приблизительно 65 МЕ/дл, от приблизительно 1 до приблизительно 60 МЕ/дл, от приблизительно 1 до приблизительно 55 МЕ/дл, от приблизительно 1 до приблизительно 50 МЕ/дл, от приблизительно 1 до приблизительно 45 МЕ/дл, от приблизительно 1 до приблизительно 40 МЕ/дл, от приблизительно 1 до приблизительно 35 МЕ/дл, от приблизительно 1 до приблизительно 30 МЕ/дл, от приблизительно 1 до приблизительно 25 МЕ/дл, от приблизительно 25 до приблизительно 125 МЕ/дл, от приблизительно 50 до приблизительно 100 МЕ/дл, от приблизительно 50 до приблизительно 75 МЕ/дл, от приблизительно 75 до приблизительно 100 МЕ/дл, от приблизительно 1 до приблизительно 20 МЕ/дл, от приблизительно 2 до приблизительно 20 МЕ/дл, от приблизительно 3 до приблизительно 20 МЕ/дл, от приблизительно 4 до приблизительно 20 МЕ/дл, от приблизительно 5 до приблизительно 20 МЕ/дл, от приблизительно 6 до приблизительно 20 МЕ/дл, от приблизительно 7 до приблизительно 20 МЕ/дл, от приблизительно 8 до приблизительно 20 МЕ/дл, от приблизительно 9 до приблизительно 20 МЕ/дл или от приблизительно 10 до приблизительно 20 МЕ/дл. Лечение или осуществление лечения заболевания или состояния может также включать поддержание активности FVIII у субъекта на уровне, сравнимом по меньшей мере приблизительно с 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145% или 150% активности FVIII у субъекта, не страдающего гемофилией. Минимальный остаточный уровень, необходимый для лечения, может быть измерен с помощью одного или нескольких известных способов и может быть скорректирован (увеличен или уменьшен) для каждого человека.
[157] "Введение", как используется в данном документе, означает предоставление фармацевтически приемлемой молекулы нуклеиновой кислоты, полипептида, экспрессируемого посредством нее, или вектора, содержащего молекулу нуклеиновой кислоты, согласно настоящему изобретению субъекту фармацевтически приемлемым путем. Пути введения могут быть внутривенными, например внутривенной инъекцией и внутривенной инфузией. Дополнительные пути введения включают, например, подкожное, внутримышечное, пероральное, назальное и легочное введение. Молекулы нуклеиновой кислоты, полипептиды и векторы можно вводить в составе фармацевтической композиции, содержащей по меньшей мере одно вспомогательное вещество.
[158] Термин "фармацевтически приемлемый", используемый в данном документе, относится к молекулярным объектам и композициям, которые являются физиологически переносимыми и, как правило, не вызывают токсичности или аллергической или подобной нежелательной реакции, такой как расстройство желудка, головокружение и т. п., при введении человеку. Необязательно, используемый в данном документе термин" фармацевтически приемлемый" означает одобрение регулирующим органом федерального правительства или правительства штатов или приведение в Фармакопее США или другой общепризнанной фармакопее для применения у животных, и более конкретно у людей.
[159] Используемая в данном документе фраза "нуждающийся в этом субъект" включает субъектов, таких как субъекты-млекопитающие, которые получат пользу от введения молекулы нуклеиновой кислоты, полипептида или вектора согласно настоящему изобретению, например в отношении улучшения гемостаза. В одном варианте осуществления субъекты включают без ограничения индивидуумов с гемофилией. В другом варианте осуществления субъекты включают без ограничения индивидуумов, у которых выработался ингибитор терапевтического белка, например фактора свертывания крови, например FVIII, и которые, таким образом, нуждаются в терапии шунтирующего действия. Субъектом может являться взрослый или несовершеннолетний (например, в возрасте до 12 лет).
[160] Используемый в данном документе термин "терапевтический белок" относится к любому полипептиду, известному из уровня техники, который можно вводить субъекту. В некоторых вариантах осуществления терапевтический белок предусматривает белок, выбранный из фактора свертывания крови, фактора роста, антитела, их функционального фрагмента или их комбинации. Используемый в данном документе термин "фактор свертывания крови" относится к молекулам или их аналогам, встречающимся в природе или полученным рекомбинантным путем, которые предупреждают или снижают продолжительность эпизода кровотечения у субъекта. Другими словами, он подразумевает молекулы, характеризующиеся положительной свертывающей активностью, т. е. отвечающими за превращение фибриногена в сеть из нерастворимого фибрина, обуславливающую коагулирование или свертывание крови. "Фактор свертывания крови", используемый в данном документе, включает активированный фактор свертывания крови, его зимоген или активируемый фактор свертывания крови. "Активируемый фактор свертывания крови" представляет собой фактор свертывания крови в неактивной форме (например, в форме его зимогена), который способен к переходу в активную форму. Термин "фактор свертывания крови" включает без ограничения фактор I (FI), фактор II (FII), фактор V (FV), FVII, FVIII, FIX, фактор X (FX), фактор XI (FXI), фактор XII (FXII), фактор XIII (FXIII), фактор фон Виллебранда (VWF), прекалликреин, высокомолекулярный кининоген, фибронектин, антитромбин III, кофактор гепарина II, белок C, белок S, белок Z, ингибитор протеазы, связанный с белком Z (ZPI), плазминоген, альфа-2-антиплазмин, тканевой активатор плазминогена (tPA), урокиназу, ингибитор-1 активатора плазминогена (PAI-1), ингибитор-2 активатора плазминогена(PAI2), их зимогены, их активированные формы или любую их комбинацию.
[161] Свертывающая активность, применяемая в данном документе, означает способность принимать участие в каскаде биохимических реакций, который приводит к образованию фибринового сгустка и/или уменьшает тяжесть, продолжительность или частоту кровоизлияния или эпизода кровотечения.
[162] "Фактор роста", используемый в данном документе, включает любой фактор роста, известный из уровня техники, в том числе цитокины и гормоны. В некоторых вариантах осуществления фактор роста выбран из адреномедуллина (AM), ангиопоэтина (Ang), аутокринного фактора подвижности, костного морфогенетического белка (BMP) (например, BMP2, BMP4, BMP5, BMP7), представителя семейства цилиарных нейротрофических факторов (например, цилиарного нейротрофического фактора (CNTF), фактора ингибирования лейкоза (LIF), интерлейкина-6 (IL-6)), колониестимулирующего фактора (например, макрофагального колониестимулирующего фактора (m-CSF), гранулоцитарного колониестимулирующего фактора (G-CSF), гранулоцитарно-макрофагального колониестимулирующего фактора (GM-CSF)), эпидермального фактора роста (EGF), эфрина (например, эфрина A1, эфрина A2, эфрина A3, эфрина A4, эфрина A5, эфрина B1, эфрина B2, эфрина B3), эритропоэтина (EPO), фактора роста фибробластов (FGF) (например, FGF1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22, FGF23), фетального бычьего соматотропина (FBS), представителя семейства GDNF (например, нейротрофического фактора линии глиальных клеток (GDNF), нейротурина, персефина и артемина), фактора роста и дифференцировки-9 (GDF9), фактора роста гепатоцитов (HGF), фактора роста, происходящего из гепатомы (HDGF), инсулина, инсулиноподобных факторов роста (например, инсулиноподобного фактора роста-1 (IGF-1) или IGF-2, интерлейкина (IL) (например, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7), фактора роста кератиноцитов (KGF), фактора, стимулирующего миграцию (MSF), белка, стимулирующего макрофаги (MSP или белка, подобного фактору роста гепатоцитов (HGFLP)), миостатина (GDF-8), нейрегулина (например, нейрегулина 1 (NRG1), NRG2, NRG3, NRG4), нейротрофина (например, нейротрофического фактора головного мозга (BDNF), фактора роста нервов (NGF), нейротрофина-3 (NT-3), NT-4, плацентарного фактора роста (PGF), тромбоцитарного фактора роста (PDGF), реналазы (RNLS), фактора роста Т-клеток (TCGF), тромбопоэтина (TPO), трансформирующего фактора роста (например, трансформирующего фактора роста-альфа (TGF-α), TGF-β, фактора некроза опухоли-альфа (TNF-α) и фактора роста эндотелия сосудов (VEGF).
[163] В некоторых вариантах осуществления терапевтический белок кодируется геном, выбранным из X-сцепленного дистрофина, MTM1 (миотубулярина), тирозингидроксилазы, AADC, циклогидролазы, SMN1, FXN (фратаксина), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (кислой альфа-глюкозидазы) или любой их комбинации.
[164] Используемые в данном документе термины "гетерологичный" или "экзогенный" относятся к таким молекулам, которые, в данном контексте, обычно не встречаются, например, в клетке или в полипептиде. Например, экзогенная или гетерологичная молекула может быть введена в клетку и присутствуют только после проведения манипуляции с клеткой, например, путем трансфекции или других способов генной инженерии, или гетерологичная аминокислотная последовательность может быть представлена в белке, в котором она обычно не встречается.
[165] Используемый в данном документе термин "гетерологичная нуклеотидная последовательность" относится к нуклеотидной последовательности, которая не встречается в природе с данной полинуклеотидной последовательностью. В одном варианте осуществления гетерологичная нуклеотидная последовательность кодирует полипептид, способный обеспечивать увеличение периода полужизни терапевтического белка, например фактора свертывания крови, например FVIII. В другом варианте осуществления гетерологичная нуклеотидная последовательность кодирует полипептид, который увеличивает гидродинамический радиус терапевтического белка, например фактора свертывания крови, например FVIII. В других вариантах осуществления гетерологичная нуклеотидная последовательность кодирует полипептид, который улучшает одно или несколько фармакокинетических свойств терапевтического белка без значительного влияния на его биологическую активность или функцию (например, прокоагулянтную активность). В некоторых вариантах осуществления терапевтический белок связан с кодируемым гетерологичной нуклеотидной последовательностью полипептидом или присоединен к нему с помощью линкера. Неограничивающие примеры полипептидных компонентов, кодируемых гетерологичными нуклеотидными последовательностями, включают константную область иммуноглобулина или ее часть, альбумин или его фрагмент, альбумин-связывающий компонент, трансферрин, полипептиды PAS согласно заявке на патент США № 20100292130, последовательность HAP, трансферрин или его фрагмент, C-концевой пептид (CTP) β-субъединицы хорионического гонадотропина человека, альбумин-связывающую малую молекулу, последовательность XTEN, компоненты, связывающие FcRn (например, полные Fc-области или их части, которые связываются с FcRn), одноцепочечные Fc-области (ScFc-области, например, описанные в US 2008/0260738, WO 2008/012543 или WO 2008/1439545), полиглициновые линкеры, полисериновые линкеры, пептиды и короткие полипептиды из 6-40 аминокислот на основе двух типов аминокислот, выбранных из глицина (G), аланина (A), серина (S), треонина (T), глутамата (E) и пролина (P), характеризующиеся различной степенью образования вторичной структуры, составляющей от менее 50% до более 50%, среди прочего, или две или более их комбинаций. В некоторых вариантах осуществления полипептид, кодируемый гетерологичной нуклеотидной последовательностью, связан с компонентом, не являющимся полипептидом. Неограничивающие примеры компонентов, не являющихся полипептидом, включают полиэтиленгликоль (PEG), альбумин-связывающие малые молекулы, полисиаловую кислоту, гидроксиэтилкрахмал (HES), их производное или любые их комбинации.
[166] Используемый в данном документе термин "Fc-область" определяется как часть полипептида, которая соответствует Fc-области нативного Ig, т. e. образована путем димерной ассоциации соответствующих Fc-доменов двух его тяжелых цепей. Нативная Fc-область образует гомодимер с другой Fc-областью. В отличие от этого, термины "генетически слитая Fc-область" или "одноцепочечная Fc-область" (scFc-область), используемые в данном документе, относятся к синтетической димерной Fc-области, состоящей из Fc-доменов, генетически соединенных в одну полипептидную цепь (т. е. кодируемых одной непрерывной генетической последовательностью).
[167] В одном варианте осуществления "Fc-область" относится к части одной тяжелой цепи Ig, начинающейся в шарнирной области непосредственно выше сайта расщепления папаином (т. е. остатком 216 в IgG, если принять первый остаток константной области тяжелой цепи за 114) и заканчивающейся на С-конце антитела. Соответственно, полный Fc-домен содержит по меньшей мере шарнирный домен, домен CH2 и домен CH3.
[168] Fc-область константной области Ig в зависимости от изотипа Ig может включать в себя домены CH2, CH3 и CH4, а также шарнирную область. Химерные белки, содержащие Fc-область Ig, наделяют химерный белок несколькими необходимыми свойствами, включая увеличенную стабильность, увеличенный период полужизни в сыворотке крови (см. Capon et al., 1989, Nature 337:525), а также связывание с Fc-рецепторами, такими как неонатальный Fc-рецептор (FcRn) (патенты США №№ 6086875, 6485726, 6030613; WO 03/077834; US2003-0235536A1, которые включены в данный документ посредством ссылки во всей своей полноте).
[169] "Эталонная нуклеотидная последовательность", при использовании в данном документе для сравнения с нуклеотидной последовательностью согласно настоящему изобретению, представляет собой полинуклеотидную последовательность, по сути идентичную нуклеотидной последовательности согласно настоящему изобретению, за исключением того, что последовательность не является оптимизированной. Например, эталонная нуклеотидная последовательность для молекулы нуклеиновой кислоты, состоящей из кодон-оптимизированной FVIII с BDD под SEQ ID NO: 1 и гетерологичной нуклеотидной последовательности, которая кодирует одноцепочечную Fc-область, связанную с SEQ ID NO: 1 со стороны своего 3'-конца, представляет собой молекулу нуклеиновой кислоты, состоящую из исходной (или "родительской") FVIII с BDD под SEQ ID NO: 16 и идентичной гетерологичной нуклеотидной последовательности, которая кодирует одноцепочечную Fc-область, связанную с SEQ ID NO: 16 со стороны своего 3'-конца.
[170] Используемый в данном документе в отношении нуклеотидных последовательностей термин "оптимизированный" относится к полинуклеотидной последовательности, которая кодирует полипептид, где полинуклеотидная последовательность была подвергнута мутации для улучшения какого-либо свойства данной полинуклеотидной последовательности. В некоторых вариантах осуществления оптимизацию выполняют для повышения уровней транскрипции, повышения уровней трансляции, повышения устойчивых уровней mRNA, повышения или снижения связывания регуляторных белков, таких как общие факторы транскрипции, повышения или снижения сплайсинга или повышения выхода полипептида, получаемого из полинуклеотидной последовательности. Примеры изменений, которые можно вносить в полинуклеотидную последовательность для ее оптимизации, включают оптимизацию в отношении кодонов, оптимизацию содержания G/C, удаление последовательностей повторов, удаление богатых AT элементов, удаление криптических сайтов сплайсинга, удаление элементов, действующих в цис-положении, которые подавляют транскрипцию или трансляцию, добавление или удаление последовательностей поли-T или поли-A, добавление последовательностей около сайта инициации транскрипции, которые усиливают транскрипцию, как например консенсусные последовательности Козак, удаление последовательностей, которые могут образовывать структуры "стебель-петля", удаление дестабилизирующих последовательностей и две или более их комбинаций.
II. Молекулы нуклеиновой кислоты
[171] Настоящее изобретение направлено на плазмидоподобную не предусматривающую наличия капсида молекулу нуклеиновой кислоты, которая кодирует целевую последовательность, где целевая последовательность кодирует терапевтический белок или ген, которые могут модулировать экспрессию целевого белка, например, miRNA. Капсид, представляющий собой белковую оболочку вируса, заключает в себе генетический материал вируса. Известно, что капсиды способствуют выполнению функций вириона путем защиты вирусного генома, доставки генома к хозяину и взаимодействия с хозяином. Тем не менее, вирусные капсиды могут являться фактором, ограничивающим пакующую способность векторов и/или индуцирующим иммунные ответы, особенно при применении в генной терапии.
[172] Векторы на основе AAV стали одним из наиболее распространенных типов геннотерапевтических векторов. Однако наличие капсида ограничивает применимость вектора на основе AAV в генной терапии. В частности, капсид сам по себе может ограничивать размер трансгена, который включают в вектор, до менее 4,5 т. о. Различные терапевтические белки, которые могут быть применимыми в генной терапии, легко могут превышать данный размер даже до добавления регуляторных элементов.
[173] Кроме того, белки, из которых состоит капсид, могут выступать в качестве антигенов, которые могут становиться мишенью для иммунной системы субъекта. AAV широко распространен среди населения в целом, при этом большинство людей подвергались воздействию AAV в течение своей жизни. В результате этого у большинства потенциальных реципиентов генной терапии, по всей вероятности, уже развился иммунный ответ в отношении AAV, и, таким образом, для них с большей долей вероятности терапия окажется неэффективной.
[174] Определенные аспекты настоящего изобретения направлены на преодоление таких недостатков векторов на основе AAV. В частности, определенные аспекты настоящего изобретения направлены на молекулу нуклеиновой кислоты, содержащую первый ITR, второй ITR и генную кассету, например, кодирующую терапевтический белок и/или miRNA. В некоторых вариантах осуществления первый ITR и второй ITR фланкируют генную кассету, содержащую гетерологичную полинуклеотидную последовательность. В некоторых вариантах осуществления молекула нуклеиновой кислоты не содержит ген, кодирующий капсидный белок, белок репликации и/или белок сборки. В некоторых вариантах осуществления генная кассета кодирует терапевтический белок. В некоторых вариантах осуществления терапевтический белок предусматривает фактор свертывания крови. В некоторых вариантах осуществления генная кассета кодирует miRNA. В определенных вариантах осуществления генная кассета расположена между первым ITR и вторым ITR. В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит одну или несколько некодирующих областей. В определенных вариантах осуществления одна или несколько некодирующих областей включают промоторную последовательность, интрон, посттранскрипционный регуляторный элемент, 3'-UTR последовательность поли(А) или любую их комбинацию.
[175] В одном варианте осуществления генная кассета содержит однонитевую нуклеиновую кислоту. В другом варианте осуществления генная кассета предусматривает двухнитевую нуклеиновую кислоту.
[176] В одном варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR, который представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae (например, ITR B19 или GPV);
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) нуклеотид, кодирующий miRNA или терапевтический белок, например фактор свертывания крови;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA;
(g) второй ITR, который представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae (например, ITR B19 или GPV).
[177] В одном варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR, который представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) нуклеотид, кодирующий miRNA, где miRNA понижает экспрессию целевого гена, выбранного из SOD1, HTT, RHO и любой их комбинации;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA;
(g) второй ITR, который представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae.
[178] В одном варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR, который представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) нуклеотид, кодирующий X-сцепленный дистрофин, MTM1 (миотубулярин), тирозингидроксилазу, AADC, циклогидролазу, SMN1, FXN (фратаксин), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (кислую альфа-глюкозидазу) или любую их комбинацию;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA;
(g) второй ITR, который представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae.
[179] В одном варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR, который представляет собой ITR AAV, например из генома AAV серотипа 2;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) нуклеотид, кодирующий FVIII; где нуклеотид характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидной последовательностью, выбранной из SEQ ID NO: 1-14 или SEQ ID NO: 71, при этом FVIII, кодируемый нуклеотидом, сохраняет активность FVIII;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и
(g) второй ITR, который представляет собой ITR AAV, например из генома AAV серотипа 2.
[180] В одном варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR, который представляет собой ITR AAV, например из генома AAV серотипа 2;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) нуклеотид, кодирующий miRNA, где miRNA понижает экспрессию целевого гена, например SOD1, HTT, RHO и любой их комбинации;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и
(g) второй ITR, который представляет собой ITR AAV, например из генома AAV серотипа 2.
[181] В одном варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR, который представляет собой ITR AAV, например из генома AAV серотипа 2;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) нуклеотид, кодирующий X-сцепленный дистрофин, MTM1 (миотубулярин), тирозингидроксилазу, AADC, циклогидролазу, SMN1, FXN (фратаксин), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (кислую альфа-глюкозидазу) или любую их комбинацию;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и
(g) второй ITR, который представляет собой ITR AAV, например из генома AAV серотипа 2.
[182] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) нуклеотид, кодирующий miRNA или терапевтический белок, например фактор свертывания крови;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и
(g) второй ITR,
где один из первого ITR или второго ITR представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae, и другой ITR представляет собой ITR AAV, например из генома AAV серотипа 2.
[183] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) 5'-ITR, имеющий последовательность 5'-ITR AAV2, представленную под SEQ ID NO: 111;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую FVIII, например, FVIIIco6XTEN;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) 3'-ITR, имеющий последовательность 3'-ITR AAV2, представленную под SEQ ID NO: 124.
[184] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) 5'-ITR, имеющий последовательность 5'-ITR AAV2, представленную под SEQ ID NO: 111;
(b) тканеспецифическую промоторную последовательность, например промотор CAG;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую FVIII, например, FVIIIco6XTEN;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) 3'-ITR, имеющий последовательность 3'-ITR AAV2, представленную под SEQ ID NO: 193.
[185] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR;
(b) тканеспецифическую промоторную последовательность, промотор TTP;
(c) интрон, например синтетический интрон;
(d) нуклеотид, кодирующий miRNA или терапевтический белок, например фактор свертывания крови;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и
(g) второй ITR,
где первый ITR является синтетическим ITR, второй ITR является синтетическим ITR, или как первый ITR, так и второй ITR являются синтетическими ITR.
[186] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR B19;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую терапевтический белок, выбранный из группы, состоящей из фактора свертывания крови, фактора роста, гормона, цитокина, антитела, его фрагмента и их комбинации;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) второй ITR B19.
[187] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR GPV;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую терапевтический белок, выбранный из группы, состоящей из фактора свертывания крови, фактора роста, гормона, цитокина, антитела, его фрагмента и их комбинации;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) второй ITR GPV.
[188] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR B19;
(b) универсальную промоторную последовательность, например промотор CAG;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую терапевтический белок, выбранный из группы, состоящей из фактора свертывания крови, фактора роста, гормона, цитокина, антитела, его фрагмента и их комбинации;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) второй ITR B19.
[189] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR GPV;
(b) универсальную промоторную последовательность, например промотор CAG;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую терапевтический белок, выбранный из группы, состоящей из фактора свертывания крови, фактора роста, гормона, цитокина, антитела, его фрагмента и их комбинации;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) второй ITR GPV.
[190] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR B19;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую фенилаланингидроксилазу (PAH);
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) второй ITR B19.
[191] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) первый ITR GPV;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую фенилаланингидроксилазу (PAH);
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) второй ITR GPV.
[192] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) 5'-ITR, имеющий последовательность 5'-ITR B19d135, представленную под SEQ ID NO: 180;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую FVIII, например, FVIIIco6XTEN;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) 3'-ITR, имеющий последовательность 3'-ITR B19d135, представленную под SEQ ID NO: 181.
[193] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) 5'-ITR, имеющий последовательность 5'-ITR GPVd162, представленную под SEQ ID NO: 183;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую FVIII, например, FVIIIco6XTEN;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) 3'-ITR, имеющий последовательность 3'-ITR GPVd162, представленную под SEQ ID NO: 184.
[194] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) 5'-ITR, несущий последовательность полноразмерного 5'-ITR B19, представленную под SEQ ID NO: 185;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую FVIII, например, FVIIIco6XTEN;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) 3'-ITR, несущий последовательность полноразмерного 3'-ITR B19, представленную под SEQ ID NO: 186.
[195] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) 5'-ITR, несущий последовательность полноразмерного 5'-ITR GPV, представленную под SEQ ID NO: 187;
(b) тканеспецифическую промоторную последовательность, например промотор TTP;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую FVIII, например, FVIIIco6XTEN;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) 3'-ITR, несущий последовательность полноразмерного 3'-ITR GPV, представленную под SEQ ID NO: 188.
[196] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) 5'-ITR, имеющий последовательность 5'-ITR B19d135, представленную под SEQ ID NO: 180;
(b) тканеспецифическую промоторную последовательность, например промотор CAG;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую PAH;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) 3'-ITR, имеющий последовательность 3'-ITR B19d135, представленную под SEQ ID NO: 181.
[197] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) 5'-ITR, имеющий последовательность 5'-ITR GPVd162, представленную под SEQ ID NO: 183;
(b) тканеспецифическую промоторную последовательность, например промотор CAG;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую PAH;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) 3'-ITR, имеющий последовательность 3'-ITR GPVd162, представленную под SEQ ID NO: 184.
[198] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) 5'-ITR, несущий последовательность полноразмерного 5'-ITR B19, представленную под SEQ ID NO: 185;
(b) тканеспецифическую промоторную последовательность, например промотор CAG;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую PAH;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) 3'-ITR, несущий последовательность полноразмерного 3'-ITR B19, представленную под SEQ ID NO: 186.
[199] В другом варианте осуществления молекула нуклеиновой кислоты содержит:
(a) 5'-ITR, несущий последовательность полноразмерного 5'-ITR GPV, представленную под SEQ ID NO: 187;
(b) тканеспецифическую промоторную последовательность, например промотор CAG;
(c) интрон, например синтетический интрон;
(d) гетерологичную полинуклеотидную последовательность, кодирующую PAH;
(e) посттранскрипционный регуляторный элемент, например WPRE;
(f) 3'-UTR-последовательность поли(А)-хвоста, например bGHpA; и/или
(g) 3'-ITR, несущий последовательность полноразмерного 3'-ITR GPV, представленную под SEQ ID NO: 188.
A. Инвертированные концевые повторы
[200] Определенные аспекты настоящего изобретения направлены на молекулу нуклеиновой кислоты, содержащую первый ITR, например 5'-ITR, и второй ITR, например 3'-ITR. Как правило, ITR вовлечены в репликацию и спасение ДНК парвовируса (например, AAV) или вырезание из прокариотических плазмид (Samulski et al., 1983, 1987; Senapathy et al., 1984; Gottlieb and Muzyczka, 1988). Кроме того, ITR, очевидно, представляют собой минимальные последовательности, требующиеся для провирусной интеграции AAV и для упаковки ДНК AAV в вирионы (McLaughlin et al., 1988; Samulski et al., 1989). Такие элементы являются ключевыми для эффективного размножения генома парвовируса. Выдвинули гипотезу, что минимальные определяющие элементы, совершенно необходимые для функции ITR, представляют собой Rep-связывающий сайт (например, RBS; GCGCGCTCGCTCGCTC (SEQ ID NO: 104) для AAV2) и сайт концевого разрешения (например, TRS; AGTTGG (SEQ ID NO: 105) для AAV2) с вариабельной палиндромной последовательностью, обеспечивающей возможность образования шпилечной структуры. Палиндромные нуклеотидные области, как правило, осуществляют свою функцию вместе в цис-положении в качестве точки начала репликации ДНК и в качестве сигнальных последовательностей упаковки для вируса. Комплементарные последовательности в ITR подвергаются укладке в шпилечную структуру в ходе репликации ДНК. В некоторых вариантах осуществления ITR подвергаются укладке в шпилечную T-образную структуру. В других вариантах осуществления ITR подвергаются укладке в шпилечные структуры, отличные от T-образной, например, в U-образную шпилечную структуру. Данные свидетельствуют о том, что T-образные шпилечные структуры в ITR AAV могут подавлять экспрессию трансгена, фланкированного ITR. См., например, Zhou et al., Scientific Reports 7:5432 (July 14, 2017). За счет использования ITR, которые не образует T-образные шпилечные структуры, этой формы подавления можно избежать. Следовательно, в определенных аспектах полинуклеотид, содержащий ITR вируса, отличного от AAV, характеризуется улучшенной экспрессией трансгена по сравнению с полинуклеотидом, содержащим ITR AAV, который образует T-образную шпильку.
[201] В некоторых вариантах осуществления ITR содержит встречающийся в природе ITR, например, ITR содержит весь ITR парвовируса или его часть. В некоторых вариантах осуществления ITR содержит синтетическую последовательность. В одном варианте осуществления первый ITR или второй ITR содержат синтетическую последовательность. В другом варианте осуществления каждый из первого ITR и второго ITR содержит синтетическую последовательность. В некоторых вариантах осуществления первый ITR или второй ITR содержат встречающуюся в природе последовательность. В другом варианте осуществления каждый из первого ITR и второго ITR содержит встречающуюся в природе последовательность.
[202] В некоторых вариантах осуществления ITR содержит часть встречающегося в природе ITR, например усеченного ITR, или состоит из нее. В некоторых вариантах осуществления ITR содержит фрагмент встречающегося в природе ITR или состоит из него, где фрагмент содержит по меньшей мере приблизительно 5 нуклеотидов, по меньшей мере приблизительно 10 нуклеотидов, по меньшей мере приблизительно 15 нуклеотидов, по меньшей мере приблизительно 20 нуклеотидов, по меньшей мере приблизительно 25 нуклеотидов, по меньшей мере приблизительно 30 нуклеотидов, по меньшей мере приблизительно 35 нуклеотидов, по меньшей мере приблизительно 40 нуклеотидов, по меньшей мере приблизительно 45 нуклеотидов, по меньшей мере приблизительно 50 нуклеотидов, по меньшей мере приблизительно 55 нуклеотидов, по меньшей мере приблизительно 60 нуклеотидов, по меньшей мере приблизительно 65 нуклеотидов, по меньшей мере приблизительно 70 нуклеотидов, по меньшей мере приблизительно 75 нуклеотидов, по меньшей мере приблизительно 80 нуклеотидов, по меньшей мере приблизительно 85 нуклеотидов, по меньшей мере приблизительно 90 нуклеотидов, по меньшей мере приблизительно 95 нуклеотидов, по меньшей мере приблизительно 100 нуклеотидов, по меньшей мере приблизительно 125 нуклеотидов, по меньшей мере приблизительно 150 нуклеотидов, по меньшей мере приблизительно 175 нуклеотидов, по меньшей мере приблизительно 200 нуклеотидов, по меньшей мере приблизительно 225 нуклеотидов, по меньшей мере приблизительно 250 нуклеотидов, по меньшей мере приблизительно 275 нуклеотидов, по меньшей мере приблизительно 300 нуклеотидов, по меньшей мере приблизительно 325 нуклеотидов, по меньшей мере приблизительно 350 нуклеотидов, по меньшей мере приблизительно 375 нуклеотидов, по меньшей мере приблизительно 400 нуклеотидов, по меньшей мере приблизительно 425 нуклеотидов, по меньшей мере приблизительно 450 нуклеотидов, по меньшей мере приблизительно 475 нуклеотидов, по меньшей мере приблизительно 500 нуклеотидов, по меньшей мере приблизительно 525 нуклеотидов, по меньшей мере приблизительно 550 нуклеотидов, по меньшей мере приблизительно 575 нуклеотидов или по меньшей мере приблизительно 600 нуклеотидов; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В определенных вариантах осуществления ITR содержит фрагмент встречающегося в природе ITR или состоит из него, где фрагмент содержит по меньшей мере приблизительно 129 нуклеотидов; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В определенных вариантах осуществления ITR содержит фрагмент встречающегося в природе ITR или состоит из него, где фрагмент содержит по меньшей мере приблизительно 102 нуклеотида; где ITR сохраняет функциональное свойство встречающегося в природе ITR.
[203] В некоторых вариантах осуществления ITR содержит часть встречающегося в природе ITR вируса или состоит из нее, где фрагмент составляет по меньшей мере приблизительно 5%, по меньшей мере приблизительно 10%, по меньшей мере приблизительно 15%, по меньшей мере приблизительно 20%, по меньшей мере приблизительно 25%, по меньшей мере приблизительно 30%, по меньшей мере приблизительно 35%, по меньшей мере приблизительно 40%, по меньшей мере приблизительно 45%, по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% от длины встречающегося в природе ITR; где фрагмент сохраняет функциональное свойство встречающегося в природе ITR.
[204] В определенных вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 50%, по меньшей мере 51%, по меньшей мере 52%, по меньшей мере 53%, по меньшей мере 54%, по меньшей мере 55%, по меньшей мере 56%, по меньшей мере 57%, по меньшей мере 58%, по меньшей мере 59%, по меньшей мере 60%, по меньшей мере 61%, по меньшей мере 62%, по меньшей мере 63%, по меньшей мере 64%, по меньшей мере 65%, по меньшей мере 66%, по меньшей мере 67%, по меньшей мере 68%, по меньшей мере 69%, по меньшей мере 70%, по меньшей мере 71%, по меньшей мере 72%, по меньшей мере 73%, по меньшей мере 74%, по меньшей мере 75%, по меньшей мере 76%, по меньшей мере 77%, по меньшей мере 78%, по меньшей мере 79%, по меньшей мере 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их надлежащем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В других вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 90% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их надлежащем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В некоторых вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 80% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их надлежащем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В некоторых вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 70% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их надлежащем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В некоторых вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 60% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их надлежащем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В некоторых вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 50% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их надлежащем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR.
[205] В некоторых вариантах осуществления ITR содержит ITR из генома AAV. В некоторых вариантах осуществления ITR представляет собой ITR из генома AAV, выбранного из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 и любой их комбинации. В конкретном варианте осуществления ITR представляет собой ITR из генома AAV2. В другом варианте осуществления ITR представляет собой синтетическую последовательность, генетически сконструированную с включением на ее 5′- и 3′-концах ITR, полученных из одного или нескольких геномов AAV.
[206] В некоторых вариантах осуществления ITR не получен из генома AAV. В некоторых вариантах осуществления ITR представляет собой ITR вируса, отличного от AAV. В некоторых вариантах осуществления ITR представляет собой ITR из генома вируса, отличного от AAV, из семейства вирусов Parvoviridae, выбранного из группы, состоящей без ограничения из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus и любой их комбинации. В определенных вариантах осуществления ITR получен из эритровируса, представляющего собой парвовирус B19 (вирус человека). В другом варианте осуществления ITR получен из штамма парвовируса мускусных уток (MDPV). В определенных вариантах осуществления штамм MDPV является аттенуированным, например, представляет собой штамм FZ91-30 MDPV. В других вариантах осуществления штамм MDPV является патогенным, например, представляет собой штамм YY MDPV. В некоторых вариантах осуществления ITR получен из парвовируса свиней, например, парвовируса U44978 свиней. В некоторых вариантах осуществления ITR получен из мелкого вируса мышей, например, мелкого вируса мышей U34256. В некоторых вариантах осуществления ITR получен из собачьего парвовируса, например, собачьего парвовируса M19296. В некоторых вариантах осуществления ITR получен из вируса энтерита норок, например, вируса энтерита норок D00765. В некоторых вариантах осуществления ITR получен из вируса рода Dependoparvovirus. В одном варианте осуществления Dependoparvovirus представляет собой штамм парвовируса гусей (GPV) рода Dependovirus. В конкретном варианте осуществления штамм GPV является аттенуированным, например, представляет собой штамм 82-0321V GPV. В другом конкретном варианте осуществления штамм GPV является патогенным, например, представляет собой штамм B GPV.
[207] Первый ITR и второй ITR молекулы нуклеиновой кислоты могут быть получены из одного и того же генома, например, из генома одного и того же вируса, или из различных геномов, например, из геномов двух или более различных геномов вирусов. В определенных вариантах осуществления первый ITR и второй ITR получены из одного и того же генома AAV. В конкретном варианте осуществления два ITR, присутствующих в молекуле нуклеиновой кислоты по настоящему изобретению, являются одинаковыми, и могут, в частности, представлять собой ITR AAV2. В других вариантах осуществления первый ITR получен из генома AAV, а второй ITR не получен из генома AAV (например, получен из генома вируса, отличного от AAV). В других вариантах осуществления первый ITR не получен из генома AAV (например, получен из генома вируса, отличного от AAV), а второй ITR получен из генома AAV. В еще одних вариантах осуществления как первый ITR, так и второй ITR не получены из генома AAV (например, получены из генома вируса, отличного от AAV). В одном конкретном варианте осуществления первый ITR и второй ITR являются идентичными.
[208] В некоторых вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из генома, выбранного из группы, состоящей из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus и любой их комбинации. В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из генома, выбранного из группы, состоящей из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus, и любой их комбинации. В других вариантах осуществления первый ITR и второй ITR получены из генома, выбранного из группы, состоящей из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus, и любой их комбинации, где первый ITR и второй ITR получены из одного и того же генома. В других вариантах осуществления первый ITR и второй ITR получены из генома, выбранного из группы, состоящей из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus и любой их комбинации, где первый ITR и второй ITR получены из различных геномов.
[209] В некоторых вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из эритровируса, представляющего собой парвовирус B19 (вирус человека). В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из эритровируса, представляющего собой парвовирус B19 (вирус человека).
[210] В определенных вариантах осуществления первый ITR и/или второй ITR содержат весь или часть ITR, полученного из B19, или состоят из них. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 167, 168, 169, 170 и 171, где первый ITR и/или второй ITR сохраняют функциональное свойство ITR B19, из которого они были получены. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 167, 168, 169, 170 и 171, где первый ITR и/или второй ITR способны образовывать шпилечную структуру. В определенных вариантах осуществления шпилечная структура не предусматривает T-образную шпильку.
[211] В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, выбранной из SEQ ID NO: 167, 168, 169, 170 и 171. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 167. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 168. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 169. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 170. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 171.
Таблица 1. Выборочные последовательностей ITR парвовируса
(нуклеотиды)
[212] В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 167. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 167. В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 168. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 168. В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, представленную под SEQ ID NO: 169, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 167, и сохраняет функциональное свойство ITR B19, из которого она получена. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, представленную под SEQ ID NO: 169, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 167, где первый ITR и/или второй ITR способы образовывать шпилечную структуру. В определенных вариантах осуществления шпилечная структура не предусматривает T-образную шпильку.
[213] В определенных вариантах осуществления первый ITR и/или второй ITR содержат весь или часть ITR, полученного из B19, или состоят из них. В некоторых вариантах осуществления второй ITR представляет собой последовательность, обратно комплементарную последовательности первого ITR. В некоторых вариантах осуществления первый ITR представляет собой последовательность, обратно комплементарную последовательности второго ITR. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 180, 181, 185 и 186 или их функционального производного. В некоторых вариантах осуществления функциональное производное сохраняет функциональное свойство ITR B19, из которого оно получено. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 180, 181, 185 и 186 или их функционального производного. В некоторых вариантах осуществления функциональное производное способно образовывать шпилечную структуру. В определенных вариантах осуществления шпилечная структура не предусматривает T-образную шпильку.
[214] В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 180. В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 181. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 181. В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 185. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 185. В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 186. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 186.
[215] В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, выбранной из SEQ ID NO: 180, 181, 185 и 186. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 180. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 181. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 185. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 186. В некоторых вариантах осуществления второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 180. В некоторых вариантах осуществления второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 181. В некоторых вариантах осуществления второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 185. В некоторых вариантах осуществления второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 186.
[216] В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO:180, и второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 181. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO:181, и второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 180. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO:185, и второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 186. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO:186, и второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 185.
[217] В некоторых вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из GPV. В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из GPV.
[218] В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 172. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 172. В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 173. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 173. В определенных вариантах осуществления первый ITR и/или второй ITR содержат весь или часть ITR, полученного из GPV, или состоят из них. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 172, 173, 174, 175 и 176, где первый ITR и/или второй ITR сохраняют функциональное свойство ITR GPV, из которого они были получены. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат весь или часть ITR, полученного из GPV, или состоят из них. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 172, 173, 174, 175 и 176, где первый ITR и/или второй ITR способны образовывать шпилечную структуру. В определенных вариантах осуществления шпилечная структура не предусматривает T-образную шпильку. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, выбранной из SEQ ID NO: 172, 173, 174, 175 и 176. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 172. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 173. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 174. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 175. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 176.
[219] В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, представленную под SEQ ID NO: 174, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 172, где первый ITR и/или второй ITR сохраняют функциональное свойство ITR GPV, из которого они были получены. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, представленную под SEQ ID NO: 174, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 172, где первый ITR и/или второй ITR способы образовывать шпилечную структуру. В определенных вариантах осуществления шпилечная структура не предусматривает T-образную шпильку.
[220] В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, представленную под SEQ ID NO: 176, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 172, где первый ITR и/или второй ITR сохраняют функциональное свойство ITR GPV, из которого они были получены. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, представленную под SEQ ID NO: 176, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 172, где первый ITR и/или второй ITR способы образовывать шпилечную структуру. В определенных вариантах осуществления шпилечная структура не предусматривает T-образную шпильку.
[221] В определенных вариантах осуществления первый ITR и/или второй ITR содержат весь или часть ITR, полученного из GPV, или состоят из них. В некоторых вариантах осуществления второй ITR представляет собой последовательность, обратно комплементарную последовательности первого ITR. В некоторых вариантах осуществления первый ITR представляет собой последовательность, обратно комплементарную последовательности второго ITR. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 183, 184, 187 и 188, или ее функционального производного. В некоторых вариантах осуществления функциональное производное сохраняет функциональное свойство ITR GPV, из которого оно получены. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 183, 184, 187 и 188, или ее функционального производного. В некоторых вариантах осуществления функциональное производное способно образовывать шпилечную структуру. В определенных вариантах осуществления шпилечная структура не предусматривает T-образную шпильку.
[222] В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 183. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 183. В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 184. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 184. В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 187. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 187. В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 188. В определенных вариантах осуществления первый ITR и/или второй ITR состоят из SEQ ID NO: 188.
[223] В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, выбранной из SEQ ID NO: 183, 184, 187 и 188. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 183. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 184. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 187. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 188. В некоторых вариантах осуществления второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 183. В некоторых вариантах осуществления второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 184. В некоторых вариантах осуществления второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 187. В некоторых вариантах осуществления второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 188.
[224] В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO:183, и второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 184. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO:184, и второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 183. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO:187, и второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 188. В некоторых вариантах осуществления первый ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO:188, и второй ITR содержит или состоит из нуклеотидной последовательности, представленной под SEQ ID NO: 187.
[225] В определенных вариантах осуществления один из первого ITR или второго ITR содержит весь или часть ITR, полученного из AAV2, или состоит из них. В некоторых вариантах осуществления первый ITR или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 177 или 178, где первый ITR и/или второй ITR сохраняют функциональное свойство ITR AAV2, из которого они были получены. В некоторых вариантах осуществления первый ITR или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 177 или 178, где первый ITR и/или второй ITR способны образовывать шпилечную структуру. В определенных вариантах осуществления шпилечная структура не предусматривает T-образную шпильку. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 177 или 178. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 177. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, представленной под SEQ ID NO: 178.
[226] В некоторых вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из штамма парвовируса мускусных уток (MDPV). В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из штамма парвовируса мускусных уток (MDPV). В определенных вариантах осуществления штамм MDPV является аттенуированным, например, представляет собой штамм FZ91-30 MDPV. В других вариантах осуществления штамм MDPV является патогенным, например, представляет собой штамм YY MDPV.
[227] В некоторых вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из Dependoparvovirus. В некоторых вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из Dependoparvovirus. В других вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из штамма парвовируса гусей (GPV), относящегося к роду Dependovirus. В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из штамма GPV, относящегося к роду Dependovirus. В определенных вариантах осуществления штамм GPV является аттенуированным, например, представляет собой штамм 82-0321V GPV. В других вариантах осуществления штамм GPV является патогенным, например, представляет собой штамм В GPV.
[228] В определенных вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из генома, выбранного из группы, состоящей из парвовируса свиней, например, штамма U44978 парвовируса свиней; мелкого вируса мышей, например, штамма U34256 мелкого вируса мышей; собачьего парвовируса, например, штамма M19296 собачьего парвовируса; вируса энтерита норок, например, штамма D00765 вируса энтерита норок; и любой их комбинации. В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из генома, выбранного из группы, состоящей из парвовируса свиней, например, штамма U44978 парвовируса свиней; мелкого вируса мышей, например, штамма U34256 мелкого вируса мышей; собачьего парвовируса, например, штамма M19296 собачьего парвовируса; вируса энтерита норок, например, штамма D00765 вируса энтерита норок; и любой их комбинации.
[229] В другом конкретном варианте осуществления ITR представляет собой синтетическую последовательность, генетически сконструированную с включением на ее 5′- и 3′-концах ITR, не полученных из генома AAV. В другом конкретном варианте осуществления ITR представляет собой синтетическую последовательность, генетически сконструированную с включением на ее 5′- и 3′-концах ITR, полученных из одного или нескольких геномов вирусов, отличных от AAV. Два ITR, присутствующих в молекуле нуклеиновой кислоты по настоящему изобретению, могут быть из одного и того же или различных геномов вирусов, отличных от AAV. В частности, ITR могут быть получены из одного и того же генома вируса, отличного от AAV. В конкретном варианте осуществления два ITR, присутствующих в молекуле нуклеиновой кислоты по настоящему изобретению, являются одинаковыми, и могут, в частности, представлять собой ITR AAV2.
[230] В некоторых вариантах осуществления последовательность ITR содержит одну или несколько палиндромных последовательностей. Палиндромная последовательность ITR, раскрытого в данном документе, включает без ограничения нативные палиндромные последовательности (т. е. последовательности, выявленные в природе), синтетические последовательности (т. е. последовательности, не выявленные в природе), такие как псевдопалиндромные последовательности, и их комбинации или модифицированные формы. "Псевдопалиндромная последовательность" представляет собой палиндромную последовательность ДНК, включающую несовершенную палиндромную последовательность, которая обладает менее 80%, в том числе менее 70%, 60%, 50%, 40%, 30%, 20%, 10% или 5% идентичностью или не обладает идентичностью последовательности нуклеиновой кислоты c последовательностями в нативной AAV или отличной от AAV палиндромной последовательности, которая образует вторичную структуру. Нативные палиндромные последовательности могут быть получены или выделены из любого генома, раскрытого в данном документе. Синтетическая палиндромная последовательность может быть основана на любом геноме, раскрытом в данном документе.
[231] Палиндромная последовательность может быть непрерывный или прерывистой. В некоторых вариантах осуществления палиндромная последовательность является прерывистой, при этом палиндромная последовательность содержит вставку в виде второй последовательность. В некоторых вариантах осуществления вторая последовательность содержит промотор, энхансер, сайт интеграции для интегразы (например, сайты для рекомбиназы Cre или Flp), открытую рамку считывания для продукта гена или их комбинацию.
[232] В некоторых вариантах осуществления ITR образует структуры "шпилечной петли". В одном варианте осуществления первый ITR образует шпилечную структуру. В другом варианте осуществления второй ITR образует шпилечную структуру. Еще в одном варианте осуществления как первый ITR, так и второй ITR образуют шпилечные структуры. В некоторых вариантах осуществления первый ITR и/или второй ITR не образуют T-образную шпилечную структуру. В определенных вариантах осуществления первый ITR и/или второй ITR образуют шпилечную структуру, отличную от T-образной. В некоторых вариантах осуществления шпилечная структура, отличная от T-образной, предусматривает U-образную шпилечную структуру.
[233] В некоторых вариантах осуществления ITR в молекуле нуклеиновой кислоты, описанной в данном документе, может представлять собой транскрипционно активируемый ITR. Транскрипционно активируемый ITR может содержать весь ITR дикого типа или его часть, которые были транскрипционно активированы за счет включения по меньшей мере одного транскрипционно активного элемента. Различные типы транскрипционно активных элементов подходят для применения в данном контексте. В некоторых вариантах осуществления транскрипционно активный элемент представляет собой конститутивный транскрипционно активный элемент. Конститутивные транскрипционно активные элементы обеспечивает уровень транскрипции гена на постоянной основе, и они являются предпочтительными, если требуется, чтобы трансген экспрессировался на постоянной основе. В других вариантах осуществления транскрипционно активный элемент является индуцируемым транскрипционно активным элементом. Индуцируемые транскрипционно активные элементы в целом проявляют низкую активность в отсутствие индуктора (или индуцирующего условия), но стимулируются в присутствии индуктора (или переключении на индуцирующее условие). Индуцируемые транскрипционно активные элементы могут быть предпочтительными, если экспрессия требуется лишь в течение определенных периодов времени или в определенных местоположениях, или если требуется повысить уровень экспрессии с применением индуцирующего средства. Транскрипционно активные элементы также могут быть тканеспецифическими; то есть они проявляют активность только в определенных типах тканей или клеток.
[234] Транскрипционно активные элементы могут быть встроены в ITR посредством различных способов. В некоторых вариантах осуществления транскрипционно активный элемент встроен на 5′-конце относительно любой части ITR или 3′-конце относительно любой части ITR. В других вариантах осуществления транскрипционно активный элемент транскрипционно активируемого ITR расположен между двумя последовательностями ITR. Если транскрипционно активный элемент содержит два или более элемента, которые должны быть расположены раздельно друг от друга, тогда эти элементы могут чередоваться с частями ITR. В некоторых вариантах осуществления шпилечная структура ITR удалена и заменена инвертированными повторами транскрипционного элемента. Данная последняя структура будет формировать шпильку, имитирующую удаленную часть в структуре. Множественные тандемные транскрипционно активные элементы также могут присутствовать в транскрипционно активируемом ITR, при этом они могут быть расположены смежно или раздельно друг от друга. Кроме того, сайты связывания белка (например, Rep-связывающие сайты) можно вводить в транскрипционно активные элементы транскрипционно активируемых ITR. Транскрипционно активный элемент может содержать любую последовательность, обеспечивающую возможность контролируемой транскрипции ДНК за счет РНК-полимеразы с образованием РНК, и может содержать, например, транскрипционно активный элемент, который определен ниже.
[235] Транскрипционно активируемые ITR обеспечивают как транскрипционную активацию, так и функции ITR в молекуле нуклеиновой кислоты при относительно ограниченной длине нуклеотидной последовательности, что эффективно увеличивает до максимума длину трансгена, который может переноситься, и экспрессироваться с молекулы нуклеиновой кислоты. Встраивание транскрипционно активного элемента в ITR может быть выполнено посредством множества способов. Сравнение последовательности ITR и требований транскрипционно активного элемента в отношении последовательности может обеспечить возможность понимания способов кодирования данного элемента в пределах ITR. Например, транскрипционную активность можно добавлять в ITR посредством введения специфических изменений в последовательность ITR, которые копируют функциональные элементы транскрипционно активного элемента. В данной области техники существует ряд методик эффективного добавления, удаления и/или изменения конкретных нуклеотидных последовательностей в специфических сайтах (см., например, Deng and Nickoloff (1992) Anal. Biochem. 200:81-88). Другой способ создания транскрипционно активируемых ITR включает введение сайта для рестриктазы в требуемое местоположение в ITR. Кроме того, множественные транскрипционно активные элементы могут быть включены в транскрипционно активируемый ITR с применением способов, известных из уровня техники.
[236] В качестве примера транскрипционно активируемые ITR могут быть получены путем включения одного или нескольких транскрипционно активных элементов, таких как TATA-бокс, GC-бокс, CCAAT-бокс, сайт Sp1, область Inr, сайт CRE (регуляторный элемент cAMP), сайт ATF-1/CRE, APBβ-бокс, APBα-бокс, CArG-бокс, CCAC-бокс, или любого другого элемента, вовлеченного в транскрипцию и известного из уровня техники.
[237] В аспектах настоящего описания предусмотрен способ клонирования молекулы нуклеиновой кислоты, описанной в данном документе, включающий вставку молекулы нуклеиновой кислоты, способной к образованию сложных вторичных структур, в подходящий вектор и введение полученного вектора в подходящий штамм бактерии-хозяина. Как известно из уровня техники сложные вторичные структуры (например, длинные палиндромные области) нуклеиновых кислот могут быть нестабильными, и их сложно клонировать в штаммах бактерий-хозяев. Например, молекулы нуклеиновой кислоты, содержащие первый ITR и второй ITR (например, области ITR парвовирусов, отличных от AAV, например, ITR B19 или GPV), по настоящему изобретению может быть сложно клонировать с применением стандартных методов. Длинные палиндромы ДНК ингибируют репликацию ДНК и являются нестабильными в геномах E. coli, Bacillus, Steptococcus, Streptomyces, S. cerevisiae, мышей и людей. Такие эффекты являются результатом образования шпилечных или крестообразных структур за счет внутринитевого спаривания оснований. В случае E. coli ингибирование репликации ДНК может преодолеваться в значительной степени у мутантов с SbcC или SbcD. SbcD представляет собой субъединицу нуклеазы, а SbcC представляет собой субъединицу АТФазы комплекса SbcCD. Комплекс SbcCD E. coli представляет собой экзонуклеазный комплекс, отвечающий за предотвращение репликации длинных палиндромов. Комплекс SbcCD представляет собой нуклеазу с АТФ-зависимой экзонуклеазной активностью в отношении двухнитевой ДНК и АТФ-независимой эндoнуклеазной активностью в отношении однонитевой ДНК. SbcCD может распознавать палиндромы ДНК и разрушать репликационные вилки за счет воздействия на возникающие шпилечные структуры.
[238] В определенных вариантах осуществления подходящий штамм бактерии-хозяина не способен к расщеплению крестообразных структур ДНК. В определенных вариантах осуществления подходящий штамм бактерии-хозяина содержит нарушение в комплексе SbcCD. В некоторых вариантах осуществления нарушение в комплексе SbcCD предусматривает генетическое нарушение в гене SbcC и/или гене SbcD. В определенных вариантах осуществления нарушение в комплексе SbcCD предусматривает генетическое нарушение в гене SbcC. Различные штаммы бактерий-хозяев, которые содержат генетическое нарушение в гене SbcC, известны из уровня техники. К примеру и без ограничений, штамм бактерии-хозяина PMC103 характеризуется генотипом sbcC, recD, mcrA, ΔmcrBCF; штамм бактерии-хозяина PMC107 характеризуется генотипом recBC, recJ, sbcBC, mcrA, ΔmcrBCF; а штамм бактерии-хозяина SURE характеризуется генотипом recB, recJ, sbcC, mcrA, ΔmcrBCF, umuC, uvrC. Соответственно, в некоторых вариантах осуществления способ клонирования молекулы нуклеиновой кислоты, описанной в данном документе, включает вставку молекулы нуклеиновой кислоты, способной к образованию сложных вторичных структур, в подходящий вектор и введение полученного вектора штамм хозяина PMC103, PMC107 или SURE. В некоторых вариантах осуществления способ клонирования молекулы нуклеиновой кислоты, описанной в данном документе, включает вставку молекулы нуклеиновой кислоты, способной к образованию сложных вторичных структур, в подходящий вектор и введение полученного вектора в штамм хозяина PMC103.
[239] Подходящие векторы известны из уровня техники и описаны в других разделах данного документа. В определенных вариантах осуществления вектор, подходящий для применения в методе клонирования по настоящему изобретению, представляет собой низкокопийный вектор. В определенных вариантах осуществления вектор, подходящий для применения в методах клонирования по настоящему изобретению, представляет собой pBR322.
[240] Соответственно, в настоящем изобретении предусмотрен способ клонирования молекулы нуклеиновой кислоты, включающий вставку молекулы нуклеиновой кислоты, способной к образованию сложных вторичных структур, в подходящий вектор и введение полученного вектора в штамм бактерии-хозяина, характеризующийся нарушением в комплексе SbcCD, где молекула нуклеиновой кислоты содержит первый инвертированный концевой повтор (ITR) и второй ITR, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188, или ее функциональное производное.
B. Терапевтические белки
[241] Определенные аспекты настоящего изобретения направлены на молекулу нуклеиновой кислоты, содержащую первый ITR, второй ITR и генную кассету, кодирующую целевую последовательность, где целевая последовательность кодирует терапевтический белок. В некоторых вариантах осуществления генная кассета кодирует один терапевтический белок. В некоторых вариантах осуществления генная кассета кодирует более одного терапевтического белка. В некоторых вариантах осуществления генная кассета кодирует две или более копии одного и того же терапевтического белка. В некоторых вариантах осуществления генная кассета кодирует два или более варианта одного и того же терапевтического белка. В некоторых вариантах осуществления генная кассета кодирует два или более различных терапевтических белка.
[242] Определенные варианты осуществления настоящего изобретения направлены на молекулу нуклеиновой кислоты, содержащую первый ITR, второй ITR и генную кассету, кодирующую терапевтический белок, где терапевтический белок предусматривает фактор свертывания крови. В некоторых вариантах осуществления фактор свертывания крови выбран из группы, состоящей из FI, FII, FIII, FIV, FV, FVI, FVII, FVIII, FIX, FX, FXI, FXII, FXIII), VWF, прекалликреина, высокомолекулярного кининогена, фибронектина, антитромбина III, кофактора II гепарина, белка C, белка S, белка Z, ингибитора протеазы, связанного с Z-белком (ZPI), плазминогена, альфа-2-антиплазмина, тканевого активатора плазминогена (tPA), урокиназы, ингибитора-1 активатора плазминогена (PAI-1), ингибитора-2 активатора плазминогена (PAI2), их любого зимогена, их любой активной формы и любой их комбинации. В одном варианте осуществления фактор свертывания крови представляет собой FVIII или его вариант или фрагмент. В другом варианте осуществления фактор свертывания крови представляет собой FIX или его вариант или фрагмент. В другом варианте осуществления фактор свертывания крови представляет собой FVII или его вариант или фрагмент. В другом варианте осуществления фактор свертывания крови представляет собой VWF или его вариант или фрагмент.
1. Факторы свертывания крови
[243] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую целевую последовательность, где целевая последовательность кодирует терапевтический белок, где терапевтический белок содержит полипептид фактора VIII. Используемый в данном документе "фактор VIII", сокращенно называемый по всей настоящей заявке как "FVIII", означает функциональный полипептид FVIII с его нормальной ролью в коагуляции, если не указано иное. Таким образом, термин "FVIII" включает варианты полипептидов, которые являются функциональными. "Белок FVIII" используется взаимозаменяемо с полипептидом (или белком) FVIII или FVIII. Примеры функций FVIII включают без ограничения способность активировать коагуляцию, способность действовать в качестве кофактора для фактора IX или способность образовывать теназный комплекс с фактором IX в присутствии Ca2+ и фосфолипидов, который затем обеспечивает превращение фактора X в активированную форму Xa. Белок FVIII может представлять собой белок FVIII человека, свиньи, собаки, крысы или мыши. Кроме того, путем сравнения FVIII от людей и других биологических видов идентифицировали консервативные остатки, которые, вероятно, необходимы для функционирования (Cameron et al., Thromb. Haemost. 79:317-22 (1998); US 6251632). Известны полноразмерные полипептидные и полинуклеотидные последовательности, а также многие функциональные фрагменты, мутантные и модифицированные варианты. Различные аминокислотные и нуклеотидные последовательности FVIII раскрыты, например, в публикациях заявок на патент США №№ 2015/0158929 A1, 2014/0308280 A1 и 2014/0370035 A1 и в международной публикации № WO 2015/106052 A1. Полипептиды FVIII включают, например, полноразмерный FVIII, полноразмерный FVIII без Met на N-конце, зрелый FVIII (без сигнальной последовательности), зрелый FVIII с дополнительным Met на N-конце и/или FVIII с полной или частичной делецией домена B. Варианты FVIII содержат делеции домена B, будь то частичные или полные делеции.
a. FVIII и полинуклеотидные последовательности, кодирующие белок FVIII
[244] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую целевую последовательность, где целевая последовательность кодирует терапевтический белок, где терапевтический белок содержит полипептид фактора VIII. Используемый в данном документе "фактор VIII", сокращенно называемый по всей настоящей заявке как "FVIII", означает функциональный полипептид FVIII с его нормальной ролью в коагуляции, если не указано иное. Таким образом, термин "FVIII" включает варианты полипептидов, которые являются функциональными. "Белок FVIII" используется взаимозаменяемо с полипептидом (или белком) FVIII или FVIII. Примеры функций FVIII включают без ограничения способность активировать коагуляцию, способность действовать в качестве кофактора для фактора IX или способность образовывать теназный комплекс с фактором IX в присутствии Ca2+ и фосфолипидов, который затем обеспечивает превращение фактора X в активированную форму Xa. Белок FVIII может представлять собой белок FVIII человека, свиньи, собаки, крысы или мыши. Кроме того, путем сравнения FVIII от людей и других биологических видов идентифицировали консервативные остатки, которые, вероятно, необходимы для функционирования (Cameron et al., Thromb. Haemost. 79:317-22 (1998); US 6251632). Известны полноразмерные полипептидные и полинуклеотидные последовательности, а также многие функциональные фрагменты, мутантные и модифицированные варианты. Различные аминокислотные и нуклеотидные последовательности FVIII раскрыты, например, в публикациях заявок на патент США №№ 2015/0158929 A1, 2014/0308280 A1 и 2014/0370035 A1 и в международной публикации № WO 2015/106052 A1. Полипептиды FVIII включают, например, полноразмерный FVIII, полноразмерный FVIII без Met на N-конце, зрелый FVIII (без сигнальной последовательности), зрелый FVIII с дополнительным Met на N-конце и/или FVIII с полной или частичной делецией домена B. Варианты FVIII содержат делеции домена B, будь то частичные или полные делеции.
[245] Часть FVIII в химерном белке, используемом в данном документе, обладает активностью FVIII. Активность FVIII можно измерять с помощью любых способов, известных из уровня техники. Доступен ряд тестов для оценки функции системы коагуляции: определение активированного частичного тромбопластинового времени (aPTT), хромогенный анализ, анализ ROTEM, определение протромбинового времени (PT) (также используется для определения INR), определение концентрации фибриногена (чаще всего с помощью метода Клаусса), подсчет количества тромбоцитов, определение тромбоцитарной функции (чаще всего с помощью PFA-100), TCT, определение времени свертывания крови, тест смешивания (устраняется ли аномалия при смешивании плазмы крови пациента с нормальной плазмой крови), анализы факторов коагуляции, определение антител к фосфолипидам, D-димера, генетические тесты (например, определение фактора V Лейдена, мутации протромбина G20210A), определение времени свертывания с разбавленным ядом гадюки Рассела (dRVVT), различные тесты тромбоцитарной функции, тромбоэластография (TEG или Sonoclot), тромбоэластометрия (TEM®, например ROTEM®) или определение времени лизиса эуглобулина (ELT).
[246] Тест aPTT является показателем функционирования, измеряющим эффективность как "внутреннего" (также называемого контактным путем активации), так и общего путей коагуляции. Этот тест обычно используют для измерения свертывающей активности коммерчески доступных рекомбинантных факторов свертывания крови, например, FVIII. Он используется в сочетании с протромбиновым временем (PT), с помощью которого измеряют внешний путь.
[247] Анализ ROTEM предоставляет информацию обо всех кинетических показателях гемостаза: времени свертывания крови, образовании сгустка, стабильности и лизисе сгустка. Различные параметры тромбоэластометрии зависят от активности системы коагуляции плазмы крови, функции тромбоцитов, фибринолиза или многих факторов, которые влияют на эти взаимодействия. Этот анализ может дать полное представление о вторичном гемостазе.
[248] Механизм хромогенного анализа основан на принципах каскада коагуляции крови, где активированный FVIII ускоряет превращение фактора X в фактор Xa в присутствии активированного фактора IX, фосфолипидов и ионов кальция. Активность фактора Ха оценивают путем гидролиза п-нитроанилидного (pNA) субстрата, специфичного для фактора Ха. Начальная скорость высвобождения п-нитроанилина, измеренная при 405 нм, прямо пропорциональна активности фактора Xa и, следовательно, активности FVIII в образце.
[249] Хромогенный анализ рекомендован подкомитетом по FVIII и фактору IX научного и стандартизационного комитета (SSC) Международного общества по тромбозу и гемостазу (ISTH). С 1994 года хромогенный анализ также являлся эталонным способом определения эффективности концентрата FVIII в Европейской фармакопее. Таким образом, в одном варианте осуществления химерный полипептид, содержащий FVIII, обладает активностью FVIII, сопоставимой с таковой у химерного полипептида, содержащего зрелый FVIII или BDD FVIII (например, ADVATE®, REFACTO® или ELOCTATE®).
[250] В другом варианте осуществления химерный белок, содержащий FVIII, согласно настоящему изобретению характеризуется скоростью образования фактора Xa, сопоставимой с таковой у химерного белка, содержащего зрелый FVIII или BDD FVIII (например, ADVATE®, REFACTO® или ELOCTATE®).
[251] Чтобы активировать фактор X в фактор Xa, активированный фактор IX (фактор IXa) гидролизует одну связь между аргинином и изолейцином в факторе X с образованием фактора Xa в присутствии Ca2+, мембранных фосфолипидов и кофактора FVIII. Следовательно, взаимодействие FVIII с фактором IX является критически важным в пути коагуляции. В определенных вариантах осуществления химерный полипептид, содержащий FVIII, может взаимодействовать с фактором IXa со скоростью, сопоставимой с таковой у химерного полипептида, содержащего зрелую последовательность FVIII или BDD FVIII (например, ADVATE®, REFACTO® или ELOCTATE®).
[252] Кроме того, FVIII связывается с фактором фон Виллебранда, находясь в неактивной форме в кровотоке. FVIII быстро разрушается, если он не связан с VWF, и высвобождается от VWF под действием тромбина. В некоторых вариантах осуществления химерный полипептид, содержащий FVIII, связывается с фактором фон Виллебранда на уровне, сопоставимом с таковым у химерного полипептида, содержащего последовательность зрелого FVIII или BDD FVIII (например, ADVATE®, REFACTO® или ELOCTATE®).
[253] FVIII можно инактивировать с помощью активированного белка С в присутствии кальция и фосфолипидов. Активированный белок C расщепляет тяжелую цепь FVIII после аргинина 336 в домене A1, что разрушает сайт взаимодействия с субстратом фактора X, и расщепляет после аргинина 562 в домене A2, что усиливает диссоциацию домена A2, а также разрушает сайт взаимодействия с фактором IXa. Это расщепление также приводит к разделению пополам домена A2 (43 кДа) и образованию доменов A2-N (18 кДа) и A2-C (25 кДа). Таким образом, активированный белок C может катализировать расщепление в нескольких сайтах тяжелой цепи. В одном варианте осуществления химерный полипептид, содержащий FVIII, инактивируется активированным белком С на уровне, сопоставимом с таковым у химерного полипептида, содержащего зрелую последовательность FVIII или BDD FVIII (например, ADVATE®, REFACTO® или ELOCTATE®).
[254] В других вариантах осуществления химерный белок, содержащий FVIII, обладает активностью FVIII in vivo, сопоставимой с таковой у химерного полипептида, содержащего зрелую последовательность FVIII или BDD FVIII (например, ADVATE®, REFACTO® или ELOCTATE®). В конкретном варианте осуществления химерный полипептид, содержащий FVIII, способен обеспечивать защиту у мыши с HemA на уровне, сопоставимом с таковым у химерного полипептида, содержащего зрелую последовательность FVIII или BDD FVIII (например, ADVATE®, REFACTO® или ELOCTATE®), на модели рассечения хвостовой вены у мыши с HemA.
[255] Используемый в данном документе "домен B" в FVIII представляет собой то же самое, что и домен B, известный из уровня техники, который определяется по внутренней идентичности аминокислотной последовательности и сайтам протеолитического расщепления тромбином, например, содержит остатки Ser741-Arg1648 зрелого FVIII человека. Другие домены FVIII человека определяются по следующим аминокислотным остаткам относительно зрелого FVIII человека: A1, остатки Ala1-Arg372; A2, остатки Ser373-Arg740; A3, остатки Ser1690-Ile2032; C1, остатки Arg2033-Asn2172; C2, остатки Ser2173-Tyr2332 зрелого FVIII. Номера остатков в последовательности, используемые в данном документе без ссылки на какие-либо номера SEQ ID, соответствуют последовательности FVIII без последовательности сигнального пептида (19 аминокислот), если не указано иное. Последовательность A3-C1-C2, также известная как тяжелая цепь FVIII, включает остатки Ser1690-Tyr2332. Оставшаяся последовательность, остатки Glu1649-Arg1689, обычно относится к активационному пептиду легкой цепи FVIII. Из уровня техники также известны местоположения границ всех доменов, в том числе доменов B, для FVIII свиньи, мыши и собаки. В одном варианте осуществления домен B в FVIII подвергнут делеции ("FVIII с делецией домена В" или "BDD FVIII"). Примером BDD FVIII является REFACTO® (рекомбинантный BDD FVIII). В одном конкретном варианте осуществления вариант FVIII с делецией домена B содержит делецию аминокислотных остатков 746-1648 зрелого FVIII.
[256] "FVIII с делецией домена B" может характеризоваться полной или частичной делециями, раскрытыми в патентах США №№ 6316226, 6346513, 7041635, 5789203, 6060447, 5595886, 6228620, 5972885, 6048720, 5543502, 5610278, 5171844, 5112950, 4868112 и 6458563 и в международной публикации № WO 2015106052 A1 (PCT/US2015/010738). В некоторых вариантах осуществления последовательность FVIII с делецией домена B, используемая в способах согласно настоящему изобретению, содержит любую из делеций, раскрытых от столбца 4, строки 4 до столбца 5, строки 28 и в примерах 1-5 патента США № 6316226 (также в US 6346513). В другом варианте осуществления фактор VIII с делецией домена В представляет собой фактор VIII с делецией домена В S743/Q1638 (SQ BDD FVIII) (например, фактор VIII, имеющий делецию от аминокислоты 744 до аминокислоты 1637, например, фактор VIII, содержащий аминокислоты 1-743 и аминокислоты 1638-2332 зрелого FVIII). В некоторых вариантах осуществления FVIII с делецией домена B, используемый в способах согласно настоящему изобретению, имеет делецию, раскрытую в столбце 2, строках 26-51 и в примерах 5-8 патента США № 5789203 (также в US 6060447, US 5595886 и US 6228620). В некоторых вариантах осуществления фактор VIII с делецией домена В имеет делецию, описанную от столбца 1, строки 25 до столбца 2, строки 40 в патенте США № 5972885; в столбце 6, строках 1-22 и в примере 1 патента США № 6048720; в столбце 2, строках 17-46 патента США № 5543502; от столбца 4, строки 22 до столбца 5, строки 36 патента США № 5171844; в столбце 2, строках 55-68, на фигуре 2 и в примере 1 патента США № 5112950; от столбца 2, строки 2 до столбца 19, строки 21 и в таблице 2 патента США № 4868112; от столбца 2, строки 1 до столбца 3, строки 19, от столбца 3, строки 40 до столбца 4, строки 67, от столбца 7, строки 43 до столбца 8, строки 26 и от столбца 11, строки 5 до столбца 13, строки 39 патента США № 7041635 или в столбце 4, строках 25-53 патента США № 6458563. В некоторых вариантах осуществления FVIII с делецией домена B имеет делецию большей части домена В, но все еще содержит аминоконцевые последовательности домена В, которые необходимы для протеолитического процессинга in vivo первичного продукта трансляции в две полипептидные цепи, как это раскрыто в WO 91/09122. В некоторых вариантах осуществления FVIII с делецией домена B конструируют с делецией аминокислот 747-1638, т. е. практически с полной делецией домена В. Hoeben R.C., et al. J. Biol. Chem. 265 (13): 7318-7323 (1990). Фактор VIII с делецией домена В также может содержать делецию аминокислот 771-1666 или аминокислот 868-1562 FVIII. Meulien P., et al. Protein Eng. 2(4): 301-6 (1988). Дополнительные делеции домена В, которые являются частью настоящего изобретения, включают делецию аминокислот 982-1562 или 760-1639 (Toole et al., Proc. Natl. Acad. Sci. U.S.A. (1986) 83, 5939-5942)), 797-1562 (Eaton, et al. Biochemistry (1986) 25:8343-8347)), 741-1646 (Kaufman (опубликованная заявка согласно PCT № WO 87/04187)), 747-1560 (Sarver, et al., DNA (1987) 6:553-564)), 741-1648 (Pasek (заявка согласно PCT № 88/00831)) или 816-1598 или 741-1648 (Lagner (Behring Inst. Mitt. (1988) No 82:16-25, EP 295597)). В одном конкретном варианте осуществления FVIII с делецией домена B содержит делецию аминокислотных остатков 746-1648 зрелого FVIII. В другом варианте осуществления FVIII с делецией домена B содержит делецию аминокислотных остатков 745-1648 зрелого FVIII. В некоторых вариантах осуществления BDD FVIII предусматривает одноцепочечный FVIII, который содержит делецию аминокислот 765-1652, соответствующих зрелому полноразмерному FVIII (также известный как одноцепочечный rVIII и AFSTYLA®). См. патент США № 7041635.
[257] В других вариантах осуществления BDD FVIII включает полипептид FVIII, содержащий фрагменты домена В, в которых сохранены один или несколько сайтов N-связанного гликозилирования, например, остатки 757, 784, 828, 900, 963 или необязательно 943, которые соответствуют аминокислотной последовательности полноразмерного FVIII. Примеры фрагментов домена В включают 226 аминокислот или 163 аминокислоты из домена В, как это раскрыто в Miao, H.Z., et al., Blood 103(a): 3412-3419 (2004), Kasuda, A, et al., J. Thromb. Haemost. 6. 1352-1359 (2008) и Pipe, S.W., et al., J. Thromb. Haemost. 9. 2235-2242 (2011) (т. e. первые 226 аминокислот или 163 аминокислоты из домена В сохранены). В еще одних вариантах осуществления BDD FVIII дополнительно содержит точковую мутацию в остатке 309 (из Phe в Ser) для улучшения экспрессии белка BDD FVIII. См. Miao, H.Z., et al., Blood 103(a): 3412-3419 (2004). В еще одних вариантах осуществления BDD FVIII включает полипептид FVIII, содержащий часть домена В, но не содержащий один или несколько сайтов расщепления фурином (например, Arg1313 и Arg 1648). См. Pipe, S.W., et al., J. Thromb. Haemost. 9. 2235-2242 (2011). В некоторых вариантах осуществления BDD FVIII предусматривает одноцепочечный FVIII, который содержит делецию аминокислот 765-1652, соответствующих зрелому полноразмерному FVIII (также известный как одноцепочечный rVIII и AFSTYLA®). См. патент США № 7041635. Каждая из вышеизложенных делеций может быть осуществлена в любой последовательности FVIII.
[258] Известно множество функциональных вариантов FVIII, обсуждаемых выше и ниже. Кроме того, у пациентов с гемофилией были идентифицированы сотни нефункциональных мутаций в FVIII, и было определено, что воздействие данных мутаций на функцию FVIII обусловлено в большей степени их местоположением в пределах 3-мерной структуры FVIII, а не природой замены (Cutler et al., Hum. Mutat. 19:274-8 (2002), включенная в данный документ посредством ссылки во всей своей полноте). Кроме того, путем сравнения FVIII человека и других биологических видов были идентифицированы консервативные остатки, которые, вероятно, необходимы для функционирования (Cameron et al., Thromb. Haemost. 79:317-22 (1998); US 6251632, включенные в данный документ посредством ссылки во всей своей полноте).
[259] В некоторых вариантах осуществления полипептид FVIII предусматривает вариант FVIII или его фрагмент, где вариант FVIII или его фрагмент обладают активностью FVIII. В некоторых вариантах осуществления генная кассета кодирует полноразмерный полипептид FVIII. В других вариантах осуществления генная кассета кодирует полипептид FVIII с удаленным доменом B (BDD), где весь домен B FVIII или его часть удалены. В одном конкретном варианте осуществления генная кассета кодирует полипептид, содержащий аминокислотную последовательность, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с SEQ ID NO: 106, 107, 109, 110, 111 или 112. В некоторых вариантах осуществления генная кассета кодирует полипептид, имеющий аминокислотную последовательностью под SEQ ID NO: 17 или ее фрагмент. В некоторых вариантах осуществления генная кассета кодирует полипептид, имеющий аминокислотную последовательностью под SEQ ID NO: 106 или ее фрагмент. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 107. В некоторых вариантах осуществления генная кассета кодирует полипептид, имеющий аминокислотную последовательностью под SEQ ID NO: 109 или ее фрагмент. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 16. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 109.
[260] В некоторых вариантах осуществления генная кассета по настоящему изобретению кодирует полипептид FVIII, содержащий сигнальный пептид или его фрагмент. В других вариантах осуществления генная кассета кодирует полипептид FVIII, в котором отсутствует сигнальный пептид. В некоторых вариантах осуществления сигнальный пептид содержит аминокислоты 1-19 из SEQ ID NO: 17.
[261] В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, кодирующую полипептид FVIII, где нуклеотидная последовательность является кодон-оптимизированной. В определенных вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая раскрыта в международной заявке PCT/US2017/015879, которая включена посредством ссылки во всей своей полноте. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, кодирующую полипептид FVIII, где нуклеотидная последовательность является кодон-оптимизированной. В определенных вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидной последовательностью, выбранной из SEQ ID NO: 1-14. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 71. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 19.
i. Кодон-оптимизированные нуклеотидные последовательности, кодирующие полипептиды FVIII
[262] В некоторых вариантах осуществления молекула нуклеиновой кислоты по настоящему изобретению содержит первый ITR, второй ITR и генную кассету, кодирующую целевую последовательность, где целевая последовательность кодирует терапевтический белок, где первый ITR и второй ITR получены из генома AAV, и где генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII. В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность кодирует полипептид полноразмерного FVIII. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность кодирует полипептид FVIII с удаленным доменом B (BDD), где весь домен B FVIII или его часть удалены. В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность кодирует полипептид, содержащий аминокислотную последовательность, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с SEQ ID NO: 17, или ее фрагмент. В одном варианте осуществления кодон-оптимизированная нуклеотидная последовательность кодирует полипептид, имеющий аминокислотную последовательность под SEQ ID NO: 17 или ее фрагмент.
[263] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность кодирует полипептид FVIII, содержащий сигнальный пептид или его фрагмент. В других вариантах осуществления кодон-оптимизированная последовательность кодирует полипептид FVIII, в котором отсутствует сигнальный пептид. В некоторых вариантах осуществления сигнальный пептид содержит аминокислоты 1-19 из SEQ ID NO: 17.
[264] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3 или (ii) нуклеотидами 58-1791 из SEQ ID NO: 4; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В одном конкретном варианте осуществления первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-1791 из SEQ ID NO: 3. В другом варианте осуществления первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-1791 из SEQ ID NO: 4. В других вариантах осуществления первая нуклеотидная последовательность содержит нуклеотиды 58-1791 из SEQ ID NO: 3 или нуклеотиды 58-1791 из SEQ ID NO: 4.
[265] В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1-1791 из SEQ ID NO: 3 или (ii) нуклеотидами 1-1791 из SEQ ID NO: 4; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В одном варианте осуществления первая нуклеотидная последовательность содержит нуклеотиды 1-1791 из SEQ ID NO: 3 или нуклеотиды 1-1791 из SEQ ID NO: 4. В другом варианте осуществления вторая нуклеотидная последовательность характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-4374 из SEQ ID NO: 3 или 1792-4374 из SEQ ID NO: 4. В одном конкретном варианте осуществления вторая нуклеотидная последовательность содержит нуклеотиды 1792-4374 из SEQ ID NO: 3 или 1792-4374 из SEQ ID NO: 4. В еще одном варианте осуществления вторая нуклеотидная последовательность характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 3 или 1792-2277 и 2320-4374 из SEQ ID NO: 4 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 3 или 1792-4374 из SEQ ID NO: 4 без нуклеотидов, кодирующих домен B или фрагмент домена B). В одном конкретном варианте осуществления вторая нуклеотидная последовательность содержит нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 3 или 1792-2277 и 2320-4374 из SEQ ID NO: 4 (т. е. нуклеотиды 1792-4374 из SEQ ID NO: 3 или 1792-4374 из SEQ ID NO: 4 без нуклеотидов, кодирующих домен B или фрагмент домена B).
[266] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5 или (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В определенных вариантах осуществления вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-4374 из SEQ ID NO: 5. В других вариантах осуществления вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-4374 из SEQ ID NO: 6. В одном конкретном варианте осуществления вторая последовательность нуклеиновой кислоты содержит нуклеотиды 1792-4374 из SEQ ID NO: 5 или 1792-4374 из SEQ ID NO: 6. В некоторых вариантах осуществления первая последовательность нуклеиновой кислоты, связанная со второй последовательностью нуклеиновой кислоты, приведенной выше, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-1791 из SEQ ID NO: 5 или нуклеотидами 58-1791 из SEQ ID NO: 6. В других вариантах осуществления первая последовательность нуклеиновой кислоты, связанная со второй последовательностью нуклеиновой кислоты, приведенной выше, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1-1791 из SEQ ID NO: 5 или нуклеотидами 1-1791 из SEQ ID NO: 6.
[267] В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (ii) 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В определенных вариантах осуществления вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B). В других вариантах осуществления вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B). В одном конкретном варианте осуществления вторая последовательность нуклеиновой кислоты содержит нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 5 или 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотиды 1792-4374 из SEQ ID NO: 5 или 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B). В некоторых вариантах осуществления первая последовательность нуклеиновой кислоты, связанная со второй последовательностью нуклеиновой кислоты, приведенной выше, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-1791 из SEQ ID NO: 5 или нуклеотидами 58-1791 из SEQ ID NO: 6. В других вариантах осуществления первая последовательность нуклеиновой кислоты, связанная со второй последовательностью нуклеиновой кислоты, приведенной выше, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1-1791 из SEQ ID NO: 5 или нуклеотидами 1-1791 из SEQ ID NO: 6.
[268] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 1, (ii) нуклеотидами 58-1791 из SEQ ID NO: 2, (iii) нуклеотидами 58-1791 из SEQ ID NO: 70 или (iv) нуклеотидами 58-1791 из SEQ ID NO: 71; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В других вариантах осуществления первая нуклеотидная последовательность содержит нуклеотиды 58-1791 из SEQ ID NO: 1, нуклеотиды 58-1791 из SEQ ID NO: 2, (iii) нуклеотиды 58-1791 из SEQ ID NO: 70 или (iv) нуклеотиды 58-1791 из SEQ ID NO: 71.
[269] В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1-1791 из SEQ ID NO: 1, (ii) нуклеотидами 1-1791 из SEQ ID NO: 2, (iii) нуклеотидами 1-1791 из SEQ ID NO: 70 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 71; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В одном варианте осуществления первая нуклеотидная последовательность содержит нуклеотиды 1-1791 из SEQ ID NO: 1, нуклеотиды 1-1791 из SEQ ID NO: 2, (iii) нуклеотиды 1-1791 из SEQ ID NO: 70 или (iv) нуклеотиды 1-1791 из SEQ ID NO: 71. В другом варианте осуществления вторая нуклеотидная последовательность, связанная с первой нуклеотидной последовательностью, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-4374 из SEQ ID NO: 1, 1792-4374 из SEQ ID NO: 2, (iii) нуклеотидами 1792-4374 из SEQ ID NO: 70 или (iv) нуклеотидами 1792-4374 из SEQ ID NO: 71. В одном конкретном варианте осуществления вторая нуклеотидная последовательность, связанная с первой нуклеотидной последовательностью, содержит (i) нуклеотиды 1792-4374 из SEQ ID NO: 1, (ii) нуклеотиды 1792-4374 из SEQ ID NO: 2, (iii) нуклеотиды 1792-4374 из SEQ ID NO: 70 или (iv) нуклеотиды 1792-4374 из SEQ ID NO: 71. В других вариантах осуществления вторая нуклеотидная последовательность, связанная с первой нуклеотидной последовательностью, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 1, (ii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 2, (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 70 или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 71. В одном варианте осуществления вторая нуклеотидная последовательность содержит (i) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 1, (ii) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 2, (iii) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 70 или (iv) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 71.
[270] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 1, (ii) нуклеотидами 1792-4374 из SEQ ID NO: 2, (iii) нуклеотидами 1792-4374 из SEQ ID NO: 70 или (iv) нуклеотидами 1792-4374 из SEQ ID NO: 71; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В одном конкретном варианте осуществления вторая последовательность нуклеиновой кислоты содержит (i) нуклеотиды 1792-4374 из SEQ ID NO: 1, (ii) нуклеотиды 1792-4374 из SEQ ID NO: 2, (iii) нуклеотиды 1792-4374 из SEQ ID NO: 70 или (iv) нуклеотиды 1792-4374 из SEQ ID NO: 71. В некоторых вариантах осуществления кодон-оптимизированная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 1, (ii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 2, (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 70 или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 71 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 1, нуклеотидами 1792-4374 из SEQ ID NO: 2, нуклеотидами 1792-4374 из SEQ ID NO: 70 или нуклеотидами 1792-4374 из SEQ ID NO: 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В одном варианте осуществления вторая последовательность нуклеиновой кислоты содержит (i) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 1, (ii) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 2, (iii) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 70 или (iv) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 71 (т. е. нуклеотиды 1792-4374 из SEQ ID NO: 1, нуклеотиды 1792-4374 из SEQ ID NO: 2, нуклеотиды 1792-4374 из SEQ ID NO: 70 или нуклеотиды 1792-4374 из SEQ ID NO: 71 без нуклеотидов, кодирующих домен B или фрагмент домена B).
[271] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 1. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 1 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1 без нуклеотидов, кодирующих домен B или фрагмент домена B). В других вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 1. В других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 1 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 1 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 1. В еще одних вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 1 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 1 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 1.
[272] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 2. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 2. В других вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 2. В других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 2 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 2 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 2. В еще одних вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 2 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 2 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 2.
[273] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 70. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 70 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 70 без нуклеотидов, кодирующих домен B или фрагмент домена B). В других вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 70. В других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 70 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 70 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 70. В еще одних вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 70 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 70 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 70.
[274] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 71. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 71 без нуклеотидов, кодирующих домен B или фрагмент домена B). В других вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 71. В других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 71 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 71 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 71. В еще одних вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 71 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 71 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 71.
[275] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 3. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 3 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 3 без нуклеотидов, кодирующих домен B или фрагмент домена B). В определенных вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 3. В некоторых вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 3 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 3 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 3. В еще одних вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 3 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 3 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 3.
[276] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 4. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 4 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 4 без нуклеотидов, кодирующих домен B или фрагмент домена B). В других вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 4. В других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 4 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 4 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 4. В еще одних вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 4 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 4 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 4.
[277] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 5. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B). В определенных вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 5. В некоторых вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 5. В еще одних вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 5.
[278] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 6. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B). В определенных вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 6. В некоторых вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 6. В еще одних вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 6.
[279] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность кодирует полипептид FVIII, содержащий последовательность нуклеиновой кислоты, кодирующую сигнальный пептид. В определенных вариантах осуществления сигнальный пептид представляет собой сигнальный пептид FVIII. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая сигнальный пептид, является кодон-оптимизированной. В одном конкретном варианте осуществления последовательность нуклеиновой кислоты, кодирующая сигнальный пептид, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98, по меньшей мере 99% или по меньшей мере 100% идентичностью последовательности с (i) нуклеотидами 1-57 из SEQ ID NO: 1; (ii) нуклеотидами 1-57 из SEQ ID NO: 2; (iii) нуклеотидами 1-57 из SEQ ID NO: 3; (iv) нуклеотидами 1-57 из SEQ ID NO: 4; (v) нуклеотидами 1-57 из SEQ ID NO: 5; (vi) нуклеотидами 1-57 из SEQ ID NO: 6; (vii) нуклеотидами 1-57 из SEQ ID NO: 70; (viii) нуклеотидами 1-57 из SEQ ID NO: 71 или (ix) нуклеотидами 1-57 из SEQ ID NO: 68.
[280] SEQ ID NO: 1-6, 70 и 71 являются оптимизированными вариантами SEQ ID NO: 16, являющейся исходной, или "родительской" нуклеотидной последовательностью FVIII, или последовательностью FVIII "дикого типа". SEQ ID NO: 16 кодирует FVIII человека с удаленным доменом B. Хотя SEQ ID NO: 1-6, 70 и 71 получены из конкретной формы FVIII с удаленным доменом B (SEQ ID NO: 16), следует понимать, что настоящее изобретение также включает оптимизированные варианты нуклеиновых кислот, кодирующих другие варианты FVIII. Например, другие варианты FVIII могут включать полноразмерный FVIII, FVIII с другими делециями домена B (описанные в данном документе) или другие фрагменты FVIII, сохраняющие активность FVIII.
[281] В одном варианте осуществления генная кассета содержит конструкцию FVIII, которая включает полинуклеотидную последовательность, приведенную в таблицах 2A-2F. В одном варианте осуществления генная кассета содержит конструкцию FVIII, которая включает полинуклеотидную последовательность, приведенную в таблице 2A. В одном варианте осуществления генная кассета содержит конструкцию FVIII, которая включает полинуклеотидную последовательность, приведенную в таблице 2B. В одном варианте осуществления генная кассета содержит конструкцию FVIII, которая включает полинуклеотидную последовательность, приведенную в таблице 2C. В одном варианте осуществления генная кассета содержит конструкцию FVIII, которая включает полинуклеотидную последовательность, приведенную в таблице 2D. В одном варианте осуществления генная кассета содержит конструкцию FVIII, которая включает полинуклеотидную последовательность, приведенную в таблице 2E. В одном варианте осуществления генная кассета содержит конструкцию FVIII, которая включает полинуклеотидную последовательность, приведенную в таблице 2F.
[282] В определенных вариантах осуществления выделенная молекула нуклеиновой кислоты содержит нуклеотидную последовательность, характеризующуюся по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентичностью последовательности с нуклеотидной последовательностью под SEQ ID NO: 179, 182, 189 или 194. В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит нуклеотидную последовательность, характеризующуюся по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентичностью последовательности с нуклеотидной последовательностью под SEQ ID NO: 179. В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит нуклеотидную последовательность, характеризующуюся по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентичностью последовательности с нуклеотидной последовательностью под SEQ ID NO: 182. В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит нуклеотидную последовательность, характеризующуюся по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентичностью последовательности с нуклеотидной последовательностью под SEQ ID NO: 189. В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит нуклеотидную последовательность, характеризующуюся по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентичностью последовательности с нуклеотидной последовательностью под SEQ ID NO: 194. В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты сохраняет способность к экспрессии функционального белка FVIII.
Таблица 2A. Пример конструкции AAV-FVIII (нуклеотиды 1-6526; SEQ ID NO: 110)
Таблица 2B. Пример конструкции B19-FVIII, содержащей ITR B19d135 (нуклеотиды 1-6762; SEQ ID NO: 179)
Таблица 2C. Пример конструкции GPV-FVIII, содержащей ITR GPVd162 (нуклеотиды 1-6830; SEQ ID NO: 182)
Таблица 2D. Пример конструкции B19-FVIII, содержащей полноразмерные ITR B19 (нуклеотиды 1-7032; SEQ ID NO: 189)
Таблица 2E. Пример конструкции AAV-FVIII (нуклеотиды 1-6824; SEQ ID NO: 190)
Таблица 2F. Пример конструкции GPV-FVIII, содержащей полноразмерные ITR GPV (нуклеотиды 1-7154; SEQ ID NO: 194)
[283] В одном варианте осуществления генная кассета содержит конструкцию фенилаланингидроксилазы (PAH), которая включает полинуклеотидную последовательность, приведенную в таблицах 10A и 10B. В одном варианте осуществления генная кассета содержит конструкцию PAH, которая включает полинуклеотидную последовательность, приведенную в таблице 10A. В одном варианте осуществления генная кассета содержит конструкцию PAH, которая включает полинуклеотидную последовательность, приведенную в таблице 10B.
[284] В определенных вариантах осуществления выделенная молекула нуклеиновой кислоты содержит нуклеотидную последовательность, характеризующуюся по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентичностью последовательности с нуклеотидной последовательностью под SEQ ID NO: 197 или 198. В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит нуклеотидную последовательность, характеризующуюся по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентичностью последовательности с нуклеотидной последовательностью под SEQ ID NO: 197. В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты содержит нуклеотидную последовательность, характеризующуюся по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентичностью последовательности с нуклеотидной последовательностью под SEQ ID NO: 198. В некоторых вариантах осуществления выделенная молекула нуклеиновой кислоты сохраняет способность к экспрессии функциональной фенилаланингидроксилазы.
A. Индекс адаптации кодонов
[285] В одном варианте осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где индекс адаптации кодонов для человека в кодон-оптимизированной нуклеотидной последовательности повышен по сравнению с SEQ ID NO: 16. Например, кодон-оптимизированная нуклеотидная последовательность может характеризоваться индексом адаптации кодонов для человека, составляющим по меньшей мере приблизительно 0,75 (75%), по меньшей мере приблизительно 0,76 (76%), по меньшей мере приблизительно 0,77 (77%), по меньшей мере приблизительно 0,78 (78%), по меньшей мере приблизительно 0,79 (79%), по меньшей мере приблизительно 0,80 (80%), по меньшей мере приблизительно 0,81 (81%), по меньшей мере приблизительно 0,82 (82%), по меньшей мере приблизительно 0,83 (83%), по меньшей мере приблизительно 0,84 (84%), по меньшей мере приблизительно 0,85 (85%), по меньшей мере приблизительно 0,86 (86%), по меньшей мере приблизительно 0,87 (87%), по меньшей мере приблизительно 0,88 (88%), по меньшей мере приблизительно 0,89 (89%), по меньшей мере приблизительно 0,90 (90%), по меньшей мере приблизительно 0,91 (91%), по меньшей мере приблизительно 0,92 (92%), по меньшей мере приблизительно 0,93 (93%), по меньшей мере приблизительно 0,94 (94%), по меньшей мере приблизительно 0,95 (95%), по меньшей мере приблизительно 0,96 (96%), по меньшей мере приблизительно 0,97 (97%), по меньшей мере приблизительно 0,98 (98%) или по меньшей мере приблизительно 0,99 (99%). В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,88 (88%). В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,91 (91%). В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,91 (97%).
[286] В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где индекс адаптации кодонов для человека в нуклеотидной последовательности повышен по сравнению с SEQ ID NO: 16. В некоторых вариантах осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, составляющим по меньшей мере приблизительно 0,75 (75%), по меньшей мере приблизительно 0,76 (76%), по меньшей мере приблизительно 0,77 (77%), по меньшей мере приблизительно 0,78 (78%), по меньшей мере приблизительно 0,79 (79%), по меньшей мере приблизительно 0,80 (80%), по меньшей мере приблизительно 0,81 (81%), по меньшей мере приблизительно 0,82 (82%), по меньшей мере приблизительно 0,83 (83%), по меньшей мере приблизительно 0,84 (84%), по меньшей мере приблизительно 0,85 (85%), по меньшей мере приблизительно 0,86 (86%), по меньшей мере приблизительно 0,87 (87%), по меньшей мере приблизительно 0,88 (88%), по меньшей мере приблизительно 0,89 (89%), по меньшей мере приблизительно 0,90 (90%) или по меньшей мере приблизительно 0,91 (91%). В одном конкретном варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,88 (88%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,91 (91%).
[287] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 или (ii) 1792-2277 и 2320-4374 из SEQ ID NO: 6; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где индекс адаптации кодонов для человека в нуклеотидной последовательности повышен по сравнению с SEQ ID NO: 16. В некоторых вариантах осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, составляющим по меньшей мере приблизительно 0,75 (75%), по меньшей мере приблизительно 0,76 (76%), по меньшей мере приблизительно 0,77 (77%), по меньшей мере приблизительно 0,78 (78%), по меньшей мере приблизительно 0,79 (79%), по меньшей мере приблизительно 0,80 (80%), по меньшей мере приблизительно 0,81 (81%), по меньшей мере приблизительно 0,82 (82%), по меньшей мере приблизительно 0,83 (83%), по меньшей мере приблизительно 0,84 (84%), по меньшей мере приблизительно 0,85 (85%), по меньшей мере приблизительно 0,86 (86%), по меньшей мере приблизительно 0,87 (87%) или по меньшей мере приблизительно 0,88 (88%). В одном конкретном варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,83 (83%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,88 (88%).
[288] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где индекс адаптации кодонов для человека в нуклеотидной последовательности повышен по сравнению с SEQ ID NO: 16. В некоторых вариантах осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, составляющим по меньшей мере приблизительно 0,75 (75%), по меньшей мере приблизительно 0,76 (76%), по меньшей мере приблизительно 0,77 (77%), по меньшей мере приблизительно 0,78 (78%), по меньшей мере приблизительно 0,79 (79%), по меньшей мере приблизительно 0,80 (80%), по меньшей мере приблизительно 0,81 (81%), по меньшей мере приблизительно 0,82 (82%), по меньшей мере приблизительно 0,83 (83%), по меньшей мере приблизительно 0,84 (84%), по меньшей мере приблизительно 0,85 (85%), по меньшей мере приблизительно 0,86 (86%), по меньшей мере приблизительно 0,87 (87%) или по меньшей мере приблизительно 0,88 (88%). В одном конкретном варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,75 (75%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,83 (83%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,88 (88%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,91 (91%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов для человека, который составляет по меньшей мере приблизительно 0,97 (97%).
[289] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII по настоящему изобретению, характеризуется повышенной частотой используемости оптимальных кодонов (FOP) по сравнению с SEQ ID NO: 16. В определенных вариантах осуществления FOP для кодон-оптимизированной нуклеотидной последовательности, кодирующей полипептид FVIII, составляет по меньшей мере приблизительно 40, по меньшей мере приблизительно 45, по меньшей мере приблизительно 50, по меньшей мере приблизительно 55, по меньшей мере приблизительно 60, по меньшей мере приблизительно 64, по меньшей мере приблизительно 65, по меньшей мере приблизительно 70, по меньшей мере приблизительно 75, по меньшей мере приблизительно 79, по меньшей мере приблизительно 80, по меньшей мере приблизительно 85 или по меньшей мере приблизительно 90.
[290] В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII по настоящему изобретению, характеризуется повышенной относительной частотой используемости синонимичных кодонов (RCSU) по сравнению с SEQ ID NO: 16. В некоторых вариантах осуществления RCSU для выделенной молекулы нуклеиновой кислоты составляет более 1,5. В других вариантах осуществления RCSU для выделенной молекулы нуклеиновой кислоты составляет более 2,0. В определенных вариантах осуществления RCSU для выделенной молекулы нуклеиновой кислоты составляет по меньшей мере приблизительно 1,5, по меньшей мере приблизительно 1,6, по меньшей мере приблизительно 1,7, по меньшей мере приблизительно 1,8, по меньшей мере приблизительно 1,9, по меньшей мере приблизительно 2,0, по меньшей мере приблизительно 2,1, по меньшей мере приблизительно 2,2, по меньшей мере приблизительно 2,3, по меньшей мере приблизительно 2,4, по меньшей мере приблизительно 2,5, по меньшей мере приблизительно 2,6 или по меньшей мере приблизительно 2,7.
[291] В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII по настоящему изобретению, характеризуется пониженным эффективным количеством кодонов по сравнению с SEQ ID NO: 16. В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется эффективным количеством кодонов, составляющим менее приблизительно 50, менее приблизительно 45, менее приблизительно 40, менее приблизительно 35, менее приблизительно 30 или менее приблизительно 25. В одном конкретном варианте осуществления выделенная молекула нуклеиновой кислоты характеризуется эффективным количеством кодонов, составляющим приблизительно 40, приблизительно 35, приблизительно 30, приблизительно 25 или приблизительно 20.
B. Оптимизация содержания G/C
[292] В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующий полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит более высокую процентную долю нуклеотидов G/C по сравнению с процентной долей нуклеотидов G/C в SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 45%, по меньшей мере приблизительно 46%, по меньшей мере приблизительно 47%, по меньшей мере приблизительно 48%, по меньшей мере приблизительно 49%, по меньшей мере приблизительно 50%, по меньшей мере приблизительно 51%, по меньшей мере приблизительно 52%, по меньшей мере приблизительно 53%, по меньшей мере приблизительно 54%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 56%, по меньшей мере приблизительно 57%, по меньшей мере приблизительно 58%, по меньшей мере приблизительно 59% или по меньшей мере приблизительно 60%.
[293] В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где нуклеотидная последовательность содержит более высокую процентную долю нуклеотидов G/C по сравнению с процентной долей нуклеотидов G/C в SEQ ID NO: 16. В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 45%, по меньшей мере приблизительно 46%, по меньшей мере приблизительно 47%, по меньшей мере приблизительно 48%, по меньшей мере приблизительно 49%, по меньшей мере приблизительно 50%, по меньшей мере приблизительно 51%, по меньшей мере приблизительно 52%, по меньшей мере приблизительно 53%, по меньшей мере приблизительно 54%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 56%, по меньшей мере приблизительно 57% или по меньшей мере приблизительно 58%. В одном конкретном варианте осуществления нуклеотидная последовательность, которая кодирует полипептид с активностью FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 58%.
[294] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5; (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6; (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (iv) 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен В или фрагмент домена В); где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит более высокую процентную долю нуклеотидов G/C по сравнению с процентной долей нуклеотидов G/C в SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 45%, по меньшей мере приблизительно 46%, по меньшей мере приблизительно 47%, по меньшей мере приблизительно 48%, по меньшей мере приблизительно 49%, по меньшей мере приблизительно 50%, по меньшей мере приблизительно 51%, по меньшей мере приблизительно 52%, по меньшей мере приблизительно 53%, по меньшей мере приблизительно 54%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 56% или по меньшей мере приблизительно 57%. В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 52%. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 55%. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 57%.
[295] В других вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где нуклеотидная последовательность содержит более высокую процентную долю нуклеотидов G/C по сравнению с процентной долей нуклеотидов G/C в SEQ ID NO: 16. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 45%. В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 52%. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 55%. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 57%. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 58%. В еще одном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 60%.
[296] "Содержание G/C" (или содержание гуанина-цитозина) или "процентная доля нуклеотидов G/C" относится к процентной доле азотистых оснований в молекуле ДНК, которые представляют собой либо гуанин, либо цитозин. Содержание G/C можно рассчитать с использованием следующей формулы:
[297] Гены человека являются очень неоднородными по содержанию в них G/C, при этом некоторые гены характеризуются содержанием G/C, составляющим всего лишь 20%, а другие гены характеризуются содержанием G/C, составляющим вплоть до 95%. В целом гены, богатые G/C, имеют более высокий уровень экспрессии. В действительности было продемонстрировано, что повышение содержания G/C в гене может привести к повышенной экспрессии данного гена, главным образом из-за повышения транскрипции и более высоких уровней mRNA в состоянии равновесия. См. Kudla et al., PLoS Biol., 4(6): e180 (2006).
C. Последовательности, подобные области прикрепления к матриксу
[298] В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит меньше последовательностей MARS/ARS по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 6, не более 5, не более 4, не более 3 или не более 2 последовательностей MARS/ARS. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 1 последовательности MARS/ARS. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит последовательность MARS/ARS.
[299] В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше последовательностей MARS/ARS по сравнению с SEQ ID NO: 16. В других вариантах осуществления нуклеотидная последовательность, кодирующая полипептид с активностью FVIII, содержит не более 6, не более 5, не более 4, не более 3 или не более 2 последовательностей MARS/ARS. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 1 последовательности MARS/ARS. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит последовательность MARS/ARS.
[300] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5; (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6, (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен В или фрагмент домена В); где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше последовательностей MARS/ARS по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 6, не более 5, не более 4, не более 3 или не более 2 последовательностей MARS/ARS. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 1 последовательности MARS/ARS. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит последовательность MARS/ARS.
[301] В других вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 или (ii) нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность содержит меньше последовательностей MARS/ARS по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 6, не более 5, не более 4, не более 3 или не более 2 последовательностей MARS/ARS. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 1 последовательности MARS/ARS. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит последовательность MARS/ARS.
[302] В нуклеотидной последовательности FVIII человека были идентифицированы богатые AT элементы, которые обладают сходством последовательности с автономно реплицирующимися последовательностями (ARS) и областями прикрепления к матриксу (MAR) Saccharomyces cerevisiae. (Fallux et al., Mol. Cell. Biol. 16:4264-4272 (1996). Один из данных элементов продемонстрировал связывание с ядерными факторами in vitro и подавление экспрессии репортерного гена хлорамфеникол-ацетилтрансферазы (CAT). Id. Выдвинули гипотезу, что такие последовательности могут способствовать подавлению транскрипции гена FVIII человека. Таким образом, в одном варианте осуществления все последовательности MAR/ARS удалены в кодон-оптимизированной нуклеотидной последовательности, кодирующей полипептид FVIII по настоящему изобретению. Существует четыре последовательности MAR/ARS ATATTT (SEQ ID NO: 21) и три последовательности MAR/ARS AAATAT (SEQ ID NO: 22) в родительской последовательности FVIII (SEQ ID NO: 16). Все данные сайты подвергали мутации для разрушения последовательностей MAR/ARS в оптимизированных последовательностях FVIII (SEQ ID NO: 1-6). Местоположение каждого из данных элементов и последовательность соответствующих нуклеотидов в оптимизированных последовательностях показаны в таблице 3 ниже.
Таблица 3. Краткое описание изменений в репрессорных элементах
NO: 16)
NO: 2
NO: 3
NO: 4
NO: 5
NO: 6
NO: 70
NO: 71
D. Дестабилизирующие последовательности
[303] В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит меньше дестабилизирующих элементов по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 дестабилизирующих элементов. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 дестабилизирующего элемента. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит дестабилизирующий элемент.
[304] В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше дестабилизирующих элементов по сравнению с SEQ ID NO: 16. В других вариантах осуществления нуклеотидная последовательность, кодирующая полипептид с активностью FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 дестабилизирующих элементов. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 дестабилизирующего элемента. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит дестабилизирующий элемент.
[305] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5; (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6; (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен В или фрагмент домена В); где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше дестабилизирующих элементов по сравнению с SEQ ID NO: 16. В других вариантах осуществления нуклеотидная последовательность, кодирующая полипептид с активностью FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 дестабилизирующих элементов. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 дестабилизирующего элемента. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит дестабилизирующий элемент.
[306] В других вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность содержит меньше дестабилизирующих элементов по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 дестабилизирующих элементов. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 дестабилизирующего элемента. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит дестабилизирующий элемент.
[307] Существует десять дестабилизирующих элементов в родительской последовательности FVIII (SEQ ID NO: 16): шесть последовательностей ATTTA (SEQ ID NO: 23) и четыре последовательности TAAAT (SEQ ID NO: 24). В одном варианте осуществления последовательности данных сайтов подвергали мутации с целью разрушения дестабилизирующих элементов в оптимизированных FVIII под SEQ ID NO: 1-6, 70 и 71. Местоположение каждого из данных элементов и последовательность соответствующих нуклеотидов в оптимизированных последовательностях показаны в таблице 3.
Е. Потенциальные сайты связывания промотора
[308] В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где нуклеотидная последовательность содержит меньше потенциальных сайтов связывания промотора по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 потенциальных сайтов связывания промотора. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 потенциального сайта связывания промотора. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит потенциальный сайт связывания промотора.
[309] В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше потенциальных сайтов связывания промотора по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 потенциальных сайтов связывания промотора. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 потенциального сайта связывания промотора. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит потенциальный сайт связывания промотора.
[310] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5; (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6; (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен В или фрагмент домена В); где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше потенциальных сайтов связывания промотора по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 потенциальных сайтов связывания промотора. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 потенциального сайта связывания промотора. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит потенциальный сайт связывания промотора.
[311] В других вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность содержит меньше потенциальных сайтов связывания промотора по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 потенциальных сайтов связывания промотора. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 потенциального сайта связывания промотора. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит потенциальный сайт связывания промотора.
[312] TATA-боксы представляют собой регуляторные последовательности, часто выявляемые в промоторных областях у эукариот. Они служат в качестве сайта связывания TATA-связывающего белка (TBP), общего фактора транскрипции. TATA-боксы обычно содержат последовательность TATAA (SEQ ID NO: 28) или ее близкий вариант. Однако TATA-боксы в пределах кодирующей последовательности могут подавлять трансляцию полноразмерного белка. Существует десять потенциальных последовательностей связывания промотора в последовательности BDD FVIII дикого типа (SEQ ID NO: 16): пять последовательностей TATAA (SEQ ID NO: 28) и пять последовательностей TTATA (SEQ ID NO: 29). В некоторых вариантах осуществления по меньшей мере 1, по меньшей мере 2, по меньшей мере 3 или по меньшей мере 4 сайта связывания промотора удалены в генах FVIII по настоящему изобретению. В некоторых вариантах осуществления по меньшей мере 5 сайтов связывания промотора удалены в генах FVIII по настоящему изобретению. В других вариантах осуществления по меньшей мере 6, по меньшей мере 7 или по меньшей мере 8 сайтов связывания промотора удалены в генах FVIII по настоящему изобретению. В одном варианте осуществления по меньшей мере 9 сайтов связывания промотора удалены в генах FVIII по настоящему изобретению. В одном конкретном варианте осуществления все сайты связывания промотора удалены в генах FVIII по настоящему изобретению. Местоположение каждого потенциального сайта связывания промотора и последовательность соответствующих нуклеотидов в оптимизированных последовательностях показаны в таблице 3.
F. Другие отрицательные регуляторные элементы, действующие в цис-положении
[313] В дополнение к последовательностям MAR/ARS, дестабилизирующим элементам и потенциальным сайтам связывания промотора, описанным выше, некоторые дополнительные потенциально ингибиторные последовательности можно идентифицировать в последовательности BDD FVIII дикого типа (SEQ ID NO: 16). Можно идентифицировать две последовательности элементов с высоким содержанием AU (ARE) (ATTTTATT (SEQ ID NO: 30) и ATTTTTAA (SEQ ID NO: 31), наряду с сайтом поли-A (AAAAAAA; SEQ ID NO: 26), сайтом поли-T (TTTTTT; SEQ ID NO: 25) и сайтом сплайсинга (GGTGAT; SEQ ID NO: 27) в неоптимизированной последовательности BDD FVIII. Один или несколько таких элементов можно удалить из оптимизированных последовательностей FVIII. Местоположение каждого из данных сайтов и последовательность соответствующих нуклеотидов в оптимизированных последовательностях показаны в таблице 3.
[314] В определенных вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит одного или нескольких отрицательных регуляторных элементов, действующих в цис-положении, например, сайт сплайсинга, последовательность поли-T, последовательность поли-A, последовательность ARE или любые их комбинации.
[315] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5; (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6; (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен В и фрагмент домена В; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит одного или нескольких отрицательных регуляторных элементов, действующих в цис-положении, например, сайт сплайсинга, последовательность поли-Т, последовательность поли-A, последовательность ARE или любые их комбинации.
[316] В других вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность не содержит одного или нескольких отрицательных регуляторных элементов, действующих в цис-положении, например, сайт сплайсинга, последовательность поли-Т, последовательность поли-A, последовательность ARE или любые их комбинации.
[317] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит сайт сплайсинга GGTGAT (SEQ ID NO: 27). В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит последовательности поли-T (SEQ ID NO: 25). В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит последовательность поли-A (SEQ ID NO: 26). В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит элемент ARE (SEQ ID NO: 30 или SEQ ID NO: 31).
[318] В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность не содержит сайт сплайсинга GGTGAT (SEQ ID NO: 27). В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность не содержит последовательность поли-T (SEQ ID NO: 25). В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность не содержит последовательность поли-A (SEQ ID NO: 26). В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность не содержит элемент ARE (SEQ ID NO: 30 или SEQ ID NO: 31).
[319] В других вариантах осуществления оптимизированная последовательность FVIII по настоящему изобретению не содержит один или несколько из противовирусных мотивов, структур "cтебель-петля" и последовательностей повтора.
[320] В еще одних других вариантах осуществления нуклеотиды, окружающие сайт инициации транскрипции, заменены на консенсусную последовательность Козак (GCCGCCACCATGC (SEQ ID NO: 32), где подчеркнутые нуклеотиды представляют собой старт-кодон). В других вариантах осуществления для облегчения процесса клонирования могут быть добавлены или удалены сайты для рестриктаз.
b. FIX и полинуклеотидные последовательности, кодирующие белок FIX
[321] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую целевую последовательность, где целевая последовательность кодирует терапевтический белок, где терапевтический белок содержит полипептид FIX. В некоторых вариантах осуществления полипептид FIX предусматривает FIX или его вариант или фрагмент, где FIX или его вариант или фрагмент характеризуются активностью FIX.
[322] FIX человека представляет собой сериновую протеазу, которая является важным компонентом внутреннего пути каскада коагуляции крови. "Фактор IX" или "FIX", как используется в данном документе, относится к белку, представляющему собой фактор коагуляции, и его разновидностям и вариантам с отличающейся последовательностью и включает без ограничения одноцепочечную последовательность полипептида-предшественника FIX человека из 461 аминокислоты ("препро"-форму), одноцепочечную последовательность зрелого FIX человека из 415 аминокислот (SEQ ID NO: 125) и вариант FIX с R338L (Padua) (SEQ ID NO: 126). FIX включает любую форму молекулы FIX с типичными характеристиками фактора коагуляции крови FIX. Подразумевается, что "фактор IX" и "FIX", как используется в данном документе, охватывают полипептиды, которые содержат домены Gla (область, содержащую остатки γ-карбоксиглутаминовой кислоты), EGF1 и EGF2 (области, содержащие последовательности, гомологичные эпидермальному фактору роста человека), активационный пептид ("AP", образованный остатками R136-R180 зрелого FIX) и C-концевой протеазный домен ("Pro") или эти домены под синонимичными названиями, известными из уровня техники, или могут представлять собой усеченный фрагмент или вариант с отличающейся последовательностью, сохраняющий по меньшей мере часть биологической активности нативного белка. FIX или варианты с отличающейся последовательностью были клонированы, как описано в патентах США №№ 4770999 и 7700734, и кДНК, кодирующая FIX человека, была выделена, охарактеризована и клонирована в векторы экспрессии (см., например, Choo et al., Nature 299:178-180 (1982); Fair et al., Blood 64:194-204 (1984); и Kurachi et al., Proc. Natl. Acad. Sci., U.S.A. 79:6461-6464 (1982)). Один конкретный вариант FIX, вариант FIX с R338L (Padua) (SEQ ID NO: 2), охарактеризованный Simioni et al., 2009, содержит мутацию, обуславливающую приобретение функции, что коррелирует с увеличением активности варианта Padua почти в 8 раз по сравнению с нативным FIX (таблица 4). Варианты FIX также могут включать любой полипептид FIX, имеющий одну или несколько консервативных аминокислотных замен, которые не влияют на активность полипептида FIX в качестве FIX. В некоторых вариантах осуществления вариант FIX содержит rFIX-альбумин, слитый с помощью расщепляемого линкера, например, IDELVION®. См. US 7939632, включенный в данный документ посредством ссылки во всей своей полноте.
Таблица 4. Примеры последовательностей FIX
61:SCKDDINSYE CWCPFGFEGK NCELDVTCNI KNGRCEQFCK NSADNKVVCS CTEGYRLAEN 121:QKSCEPAVPF PCGRVSVSQT SKLTRAETVF PDVDYVNSTE AETILDNITQ STQSFNDFTR
181:VVGGEDAKPG QFPWQVVLNG KVDAFCGGSI VNEKWIVTAA HCVETGVKIT VVAGEHNIEE
241:TEHTEQKRNV IRIIPHHNYN AAINKYNHDI ALLELDEPLV LNSYVTPICI ADKEYTNIFL
301:KFGSGYVSGW GRVFHKGRSA LVLQYLRVPL VDRATCLRST KFTIYNNMFC AGFHEGGRDS
361:CQGDSGGPHV TEVEGTSFLT GIISWGEECA MKGKYGIYTK VSRYVNWIKE KTKLT
61:SCKDDINSYE CWCPFGFEGK NCELDVTCNI KNGRCEQFCK NSADNKVVCS CTEGYRLAEN 121:QKSCEPAVPF PCGRVSVSQT SKLTRAETVF PDVDYVNSTE AETILDNITQ STQSFNDFTR
181:VVGGEDAKPG QFPWQVVLNG KVDAFCGGSI VNEKWIVTAA HCVETGVKIT VVAGEHNIEE
241:TEHTEQKRNV IRIIPHHNYN AAINKYNHDI ALLELDEPLV LNSYVTPICI ADKEYTNIFL
301:KFGSGYVSGW GRVFHKGRSA LVLQYLRVPL VDRATCLLST KFTIYNNMFC AGFHEGGRDS
361:CQGDSGGPHV TEVEGTSFLT GIISWGEECA MKGKYGIYTK VSRYVNWIKE KTKLT
CESNPCLNGG SCKDDINSYE CWCPFGFEGK NCELDVTCNI KNGRCEQFCK 100
NSADNKVVCS CTEGYRLAEN QKSCEPAVPF PCGRVSVSQT SKLTRAETVF 150
PDVDYVNSTE AETILDNITQ STQSFNDFTR VVGGEDAKPG QFPWQVVLNG 200
KVDAFCGGSI VNEKWIVTAA HCVETGVKIT VVAGEHNIEE TEHTEQKRNV 250
IRIIPHHNYN AAINKYNHDI ALLELDEPLV LNSYVTPICI ADKEYTNIFL 300
KFGSGYVSGW GRVFHKGRSA LVLQYLRVPL VDRATCLRST KFTIYNNMFC 350
AGFHEGGRDS CQGDSGGPHV TEVEGTSFLT GIISWGEECA MKGKYGIYTK 400
VSRYVNWIKE KTKLTPVSQT SKLTRAETVF PDVDAHKSEV AHRFKDLGEE 450
NFKALVLIAF AQYLQQCPFE DHVKLVNEVT EFAKTCVADE SAENCDKSLH 500
TLFGDKLCTV ATLRETYGEM ADCCAKQEPE RNECFLQHKD DNPNLPRLVR 550
PEVDVMCTAF HDNEETFLKK YLYEIARRHP YFYAPELLFF AKRYKAAFTE 600
CCQAADKAAC LLPKLDELRD EGKASSAKQR LKCASLQKFG ERAFKAWAVA 650
RLSQRFPKAE FAEVSKLVTD LTKVHTECCH GDLLECADDR ADLAKYICEN 700
QDSISSKLKE CCEKPLLEKS HCIAEVENDE MPADLPSLAA DFVESKDVCK 750
NYAEAKDVFL GMFLYEYARR HPDYSVVLLL RLAKTYETTL EKCCAAADPH 800
ECYAKVFDEF KPLVEEPQNL IKQNCELFEQ LGEYKFQNAL LVRYTKKVPQ 850
VSTPTLVEVS RNLGKVGSKC CKHPEAKRMP CAEDYLSVVL NQLCVLHEKT 900
PVSDRVTKCC TESLVNRRPC FSALEVDETY VPKEFNAETF TFHADICTLS 950
EKERQIKKQT ALVELVKHKP KATKEQLKAV MDDFAAFVEK CCKADDKETC 1000
FAEEGKKLVA ASQAALGL 1018
* Серая штриховка=сигнальный пептид; подчеркивание=последовательность XTEN; жирный шрифт=Fc.
** SEQ ID NO: 67 из патента США № 9856468, включенного в данный документ посредством ссылки во всей своей полноте.
[323] Полипептид FIX имеет размер 55 кДа, синтезируется в виде полипептидной цепи, представляющей собой препроформу (SEQ ID NO: 125), которая состоит из трех следующих областей: сигнального пептида из 28 аминокислот (аминокислоты с 1 по 28 из SEQ ID NO: 127), пропептида из 18 аминокислот (аминокислоты с 29 по 46), который необходим для гамма-карбоксилирования остатков глутаминовой кислоты, и зрелого фактора IX из 415 аминокислот (SEQ ID NO: 125 или 126). Пропептид представляет собой последовательность из 18 аминокислотных остатков, расположенную в направлении N-конца от гамма-карбоксиглутаматного домена. Пропептид связывает витамин K-зависимую гамма-карбоксилазу и затем отщепляется от полипептида-предшественника FIX под действием эндогенной протеазы, наиболее вероятно PACE (фермента, расщепляющего белок в месте спаренных основных аминокислот), также известной как фурин или PCSK3. Без гамма-карбоксилирования домен Gla не способен связать кальций, чтобы принять правильную конформацию, необходимую для заякоривания белка в отрицательно заряженных фосфолипидных поверхностях, что тем самым делает фактор IX нефункциональным. Даже в случае, когда домен Gla является карбоксилированным, его надлежащее функционирование также зависит от отщепления пропептида, поскольку остающийся пропептид препятствует конформационным изменениям домена Gla, необходимым для оптимального связывания с кальцием и фосфолипидами. У людей образующийся в результате зрелый фактор IX секретируется клетками печени в кровоток в виде неактивного зимогена, одноцепочечного белка из 415 аминокислотных остатков, который содержит примерно 17% по весу углеводов (Schmidt, A. E., et al. (2003) Trends Cardiovasc Med, 13: 39).
[324] Зрелый FIX состоит из нескольких доменов, которыми в конфигурации от N- к C-концу являются: домен Gla, домен EGF1, домен EGF2, домен активационного пептида (AP) и протеазный (или каталитический) домен. Короткий линкер соединяет домен EGF2 с доменом AP. FIX содержит два активационных пептида, образованные из R145-A146 и R180-V181 соответственно. После активации одноцепочечный FIX становится 2-цепочечной молекулой, в которой две цепи связаны дисульфидной связью. Факторы свертывания крови можно сконструировать путем замещения их активационных пептидов, что в результате приводит к изменению специфичности активации. У млекопитающих зрелый FIX должен быть активирован активированным фактором XI с образованием фактора IXa. После активации FIX до FIXa протеазный домен обеспечивает каталитическую активность FIX. Активированный фактор VIII (FVIIIa) представляет собой специфический кофактор, необходимый для полного проявления активности FIXa.
[325] В определенных вариантах осуществления полипептид FIX представляет собой плазматический FIX в виде его аллельной формы с Thr148 и обладает структурными и функциональными характеристиками, сходными с характеристиками эндогенного FIX.
[326] Многие функциональные варианты FIX известны из уровня техники. В международной публикации № WO 02/040544 A3 на странице 4 в строках 9-30 и на странице 15 в строках 6-31 раскрыты мутантные формы, демонстрирующие увеличенную устойчивость к ингибированию гепарином. В международной публикации № WO 03/020764 A2 в таблицах 2 и 3 (на страницах 14-24) и на странице 12 в строках 1-27 раскрыты мутантные формы FIX с пониженной T-клеточной иммуногенностью. В международной публикации № WO 2007/149406 A2 от страницы 4, строки 1 до страницы 19, строки 11 раскрыты функциональные мутантные молекулы FIX, демонстрирующие увеличенную стабильность белков, увеличенный период полужизни in vivo и in vitro и увеличенную устойчивость к протеазам. В WO 2007/149406 A2 от страницы 19, строки 12 до страницы 20, строки 9 также раскрыты химерные и другие вариантные молекулы FIX. В международной публикации № WO 08/118507 A2 от страницы 5, строки 14 до страницы 6, строки 5 раскрыты мутантные формы FIX, демонстрирующие увеличенную свертывающую активность. В международной публикации № WO 09/051717 A2 от страницы 9, строки 11 до страницы 20, строки 2 раскрыты мутантные формы FIX, имеющие увеличенное количество сайтов N-связанного и/или O-связанного гликозилирования, что приводит к увеличению периода полужизни и/или степени обнаружения. В международной публикации № WO 09/137254 A2 от страницы 2, абзаца [006] до страницы 5, абзаца [011] и от страницы 16, абзаца [044] до страницы 24, абзаца [057] также раскрыты мутантные формы фактора IX с увеличенным количеством сайтов гликозилирования. В международной публикации № WO 09/130198 A2 от страницы 4, строки 26 до страницы 12, строки 6 раскрыты функциональные мутантные молекулы FIX, которые имеют увеличенное количество сайтов гликозилирования, что приводит к увеличению периода полужизни. В международной публикации № WO 09/140015 A2 от страницы 11, абзаца [0043] до страницы 13, абзаца [0053] раскрыты функциональные мутантные формы FIX, имеющие увеличенное количество остатков Cys, которые можно использовать для конъюгирования с полимером (например, PEG). Полипептиды FIX, описанные в международной заявке № PCT/US2011/043569, поданной 11 июля 2011 г. и опубликованной как WO 2012/006624 12 января 2012 г., также включены в данный документ посредством ссылки во всей своей полноте. В некоторых вариантах осуществления полипептид FIX содержит полипептид FIX, слитый с альбумином, например, FIX-альбумин. В определенных вариантах осуществления полипептид FIX представляет собой IDELVION® или rIX-FP.
[327] В дополнение, у субъектов с гемофилией были идентифицированы сотни нефункциональных мутаций в FIX, многие из которых раскрыты в таблице 6 на страницах 11-14 международной публикации № WO 09/137254 A2. Такие нефункциональные мутации не включены в настоящее изобретение, но обеспечивают дополнительные указания в отношении того, какие мутации с большей или меньшей долей вероятности приводят к образованию функционального полипептида FIX.
[328] В одном варианте осуществления полипептид FIX (или часть слитого полипептида, представляющая собой фактор IX) содержит аминокислотную последовательность, которая на по меньшей мере 70%, на по меньшей мере 80%, на по меньшей мере 85%, на по меньшей мере 90%, на по меньшей мере 95%, на по меньшей мере 96%, на по меньшей мере 97%, на по меньшей мере 98%, на по меньшей мере 99% или на 100% идентична последовательности, представленной под SEQ ID NO: 1 или 2 (аминокислоты с 1 по 415 из SEQ ID NO: 125 или 126), или в качестве альтернативы последовательность пропептида или последовательность пропептида и сигнальную последовательность (полноразмерный FIX). В другом варианте осуществления полипептид FIX содержит аминокислотную последовательность, которая на по меньшей мере 70%, на по меньшей мере 80%, на по меньшей мере 85%, на по меньшей мере 90%, на по меньшей мере 95%, на по меньшей мере 96%, на по меньшей мере 97%, на по меньшей мере 98%, на по меньшей мере 99% или на 100% идентична последовательности, представленной под SEQ ID NO: 2.
[329] Коагулянтная активность FIX выражается в международных единицах (МЕ). Одна МЕ активности FIX примерно соответствует количеству FIX в одном миллилитре нормальной плазмы крови человека. Доступны несколько анализов для измерения активности FIX, в том числе одностадийный анализ свертывания крови (активированного частичного тромбопластинового времени; aPTT), анализ времени образования тромбина (TGA) и ротационная тромбоэластометрия (ROTEM®). Настоящее изобретение охватывает последовательности, характеризующиеся гомологией с последовательностями FIX, фрагменты последовательностей, которые являются природными, как, например, полученными от людей, приматов, отличных от человека, млекопитающих (в том числе домашних животных), и неприродные варианты последовательностей, которые сохраняют по меньшей мере часть биологической активности или биологической функции FIX и/или которые являются применимыми для предупреждения, лечения заболевания, дефицита, нарушения или состояния, связанного с фактором коагуляции (например, эпизодов кровотечения, связанных с травмой, хирургической операцией, при дефиците фактора коагуляции), опосредованного влияния на него или уменьшения интенсивности его проявлений. Последовательности, характеризующиеся гомологией с FIX человека, можно найти с помощью стандартных методик поиска гомологии, таких как BLAST от NCBI.
[330] В определенных вариантах осуществления последовательность FIX является кодон-оптимизированной. Примеры кодон-оптимизированных последовательностей FIX включают без ограничения SEQ ID NO: 1 и 54-58 из международной публикации № WO 2016/004113 А1, которая включена в данный документ посредством ссылки во всей своей полноте.
c. FVII и полинуклеотидные последовательности, кодирующие белок FVII
[331] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую целевую последовательность, где целевая последовательность кодирует терапевтический белок, где терапевтический белок содержит полипептид фактора VII. В некоторых вариантах осуществления полипептид FVII предусматривает FVII или его вариант или фрагмент, где его вариант или фрагмент характеризуются активностью FVII.
[332] "Фактор VII" ("FVII" или "F7"; также упоминается как фактор 7, фактор свертывания крови VII, сывороточный фактор VII, сывороточный ускоритель превращения протромбина, SPCA, проконвертин и эптаког альфа) представляет собой сериновую протеазу, которая является частью каскада коагуляции крови. В одном варианте осуществления фактор свертывания крови, кодируемый нуклеиновой кислотой, описанной в данном документе, представляет собой FVII. Рекомбинантный активированный фактор VII ("FVII") стал широко использоваться для лечения массивного кровотечения, такого как возникающее у пациентов с гемофилией A или B, дефицитом фактора свертывания крови XI, FVII, нарушением функции тромбоцитов, тромбоцитопенией или болезнью фон Виллебранда.
[333] Рекомбинантный активированный FVII (rFVIIa; NovoSeven®) используется для лечения эпизодов кровотечения у (i) пациентов с гемофилией с нейтрализующими антителами к FVIII или FIX (ингибиторами), (ii) пациентов с дефицитом FVII или (iii) пациентов с гемофилией A или B с ингибиторами, проходящими хирургические процедуры. Однако, NovoSeven® демонстрирует низкую эффективность. Часто требуются повторные дозы FVIIa в высокой концентрации для контроля кровотечения из-за его низкого сродства к активированным тромбоцитам, короткого периода полужизни и низкой ферментативной активности в отсутствие тканевого фактора. Соответственно, существует неудовлетворенная медицинская потребность в лучших вариантах лечения и предупреждения для пациентов с гемофилией с ингибиторами FVIII и FIX и/или с дефицитом FVII.
[334] В одном варианте осуществления генная кассета кодирует зрелую форму FVII или его вариант. FVII содержит домен Gla, два домена EGF (EGF-1 и EGF-2) и домен сериновой протеазы (или домен пептидазы S1), который является высококонсервативным среди всех представителей сериновых протеаз семейства пептидаз S1, таких как, например, химотрипсин. FVII встречается в виде одноцепочечного зимогена (т. е. активируемого FVII) и полностью активированной двухцепочечной формы.
C. Факторы роста
[335] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую целевую последовательность, где целевая последовательность кодирует терапевтический белок, и где терапевтический белок предусматривает фактор роста. Фактор роста может быть выбран из любого фактора роста, известного из уровня техники. В некоторых вариантах осуществления фактор роста представляет собой гормон. В других вариантах осуществления фактор роста представляет собой цитокин. В некоторых вариантах осуществления фактор роста представляет собой хемокин.
[336] В некоторых вариантах осуществления фактор роста представляет собой адреномедуллин (AM). В некоторых вариантах осуществления фактор роста представляет собой ангиопоэтин (Ang). В некоторых вариантах осуществления фактор роста представляет собой аутокринный фактор подвижности. В некоторых вариантах осуществления фактор роста представляет собой костный морфогенетический белок (BMP). В некоторых вариантах осуществления BMP выбран из BMP2, BMP4, BMP5 и BMP7. В некоторых вариантах осуществления фактор роста является представителем семейства цилиарных нейротрофических факторов. В некоторых вариантах осуществления представитель семейства цилиарных нейротрофических факторов выбран из цилиарного нейротрофического фактора (CNTF), фактора ингибирования лейкоза (LIF), интерлейкина-6 (IL-6). В некоторых вариантах осуществления фактор роста представляет собой колониестимулирующий фактор. В некоторых вариантах осуществления колониестимулирующий фактор выбран из макрофагального колониестимулирующего фактора (m-CSF), гранулоцитарного колониестимулирующего фактора (G-CSF) и гранулоцитарно-макрофагального колониестимулирующего фактора (GM-CSF). В некоторых вариантах осуществления фактор роста представляет собой эпидермальный фактор роста (EGF). В некоторых вариантах осуществления фактор роста представляет собой эфрин. В некоторых вариантах осуществления эфрин выбран из эфрина А1, эфрина А2, эфрина А3, эфрина А4, эфрина А5, эфрина В1, эфрина В2 и эфрина В3. В некоторых вариантах осуществления фактор роста представляет собой эритропоэтин (EPO). В некоторых вариантах осуществления фактор роста представляет собой фактор роста фибробластов (FGF). В некоторых вариантах осуществления FGF выбран из FGF1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22 и FGF23. В некоторых вариантах осуществления фактор роста представляет собой фетальный бычий соматотропин (FBS). В некоторых вариантах осуществления фактор роста является представителем семейства GDNF. В некоторых вариантах осуществления представитель семейства GDNF выбран из нейротрофического фактора линии глиальных клеток (GDNF), нейротурина, персефина и артемина. В некоторых вариантах осуществления фактор роста представляет собой фактор роста и дифференцировки-9 (GDF9). В некоторых вариантах осуществления фактор роста представляет собой фактор роста гепатоцитов (HGF). В некоторых вариантах осуществления фактор роста представляет собой фактор роста, происходящий из гепатомы (HDGF). В некоторых вариантах осуществления фактор роста представляет собой инсулин. В некоторых вариантах осуществления фактор роста представляет собой инсулиноподобный фактор роста. В некоторых вариантах осуществления инсулиноподобный фактор роста представляет собой инсулиноподобный фактор роста-1 (IGF-1) или IGF-2. В некоторых вариантах осуществления фактор роста представляет собой интерлейкин (IL). В некоторых вариантах осуществления IL выбран из IL-1, IL-2, IL-3, IL-4, IL-5, IL-6 и IL-7. В некоторых вариантах осуществления фактор роста представляет собой фактор роста кератиноцитов (KGF). В некоторых вариантах осуществления фактор роста представляет собой фактор, стимулирующий миграцию (MSF). В некоторых вариантах осуществления фактор роста представляет собой белок, стимулирующий макрофаги (MSP или белок, подобный фактору роста гепатоцитов (HGFLP)). В некоторых вариантах осуществления фактор роста представляет собой миостатин (GDF-8). В некоторых вариантах осуществления фактор роста представляет собой нейрегулин. В некоторых вариантах осуществления нейрегулин выбран из нейрегулина 1 (NRG1), NRG2, NRG3 и NRG4. В некоторых вариантах осуществления фактор роста представляет собой нейротрофин. В некоторых вариантах осуществления фактор роста представляет собой нейротрофический фактор головного мозга (BDNF). В некоторых вариантах осуществления фактор роста представляет собой фактор роста нервов (NGF). В некоторых вариантах осуществления NGF представляет собой нейротрофин-3 (NT-3) или NT-4. В некоторых вариантах осуществления фактор роста представляет собой плацентарный фактор роста (PGF). В некоторых вариантах осуществления фактор роста представляет собой фактор роста тромбоцитов (PDGF). В некоторых вариантах осуществления фактор роста представляет собой реналазу (RNLS). В некоторых вариантах осуществления фактор роста представляет собой фактор роста Т-клеток (TCGF). В некоторых вариантах осуществления фактор роста представляет собой тромбопоэтин (TPO). В некоторых вариантах осуществления фактор роста представляет собой трансформирующий фактор роста. В некоторых вариантах осуществления трансформирующий фактор роста представляет собой трансформирующий фактор роста-альфа (TGF-α) или TGF-β. В некоторых вариантах осуществления фактор роста представляет собой фактор некроза опухоли-альфа (TNF-α). В некоторых вариантах осуществления фактор роста представляет собой фактор роста эндотелия сосудов (VEGF).
D. МикроРНК (miRNA)
[337] МикроРНК (miRNA) представляют собой небольшие некодирующие молекулы РНК (приблизительно 18-22 нуклеотидов), которые отрицательно регулируют экспрессию генов, ингибируя трансляцию или индуцируя деградацию матричной РНК (mRNA). С момента их открытия стало известно, что miRNA участвуют в различных клеточных процессах, в том числе в апоптозе, дифференцировке и пролиферации клеток, и они, как было показано, играют ключевую роль в канцерогенезе. Способность miRNA регулировать экспрессию генов делает экспрессию miRNA in vivo ценным инструментом в генной терапии.
[338] Определенные аспекты настоящего изобретения относятся к плазмидоподобным молекулам нуклеиновой кислоты, содержащим первый ITR, второй ITR и генную кассету, кодирующую целевую последовательность, где целевая последовательность кодирует miRNA, и где первый ITR и/или второй ITR представляют собой ITR, полученные из вируса, отличного от аденоассоциированного вируса (например, первый ITR и/или второй ITR получены из вируса, отличного от AAV). miRNA может представлять собой любую miRNA, известную из уровня техники. В некоторых вариантах осуществления miRNA понижает экспрессию гена-мишени. В определенных вариантах осуществления ген-мишень выбран из SOD1, HTT, RHO или любой их комбинации.
[339] В некоторых вариантах осуществления генная кассета кодирует одну miRNA. В некоторых вариантах осуществления генная кассета кодирует более одной miRNA. В некоторых вариантах осуществления генная кассета кодирует две или более различные miRNA. В некоторых вариантах осуществления генная кассета кодирует две или более копии одной и той же miRNA. В некоторых вариантах осуществления генная кассета кодирует два или более варианта одного и того же терапевтического белка. В определенных вариантах осуществления генная кассета кодирует одну или несколько miRNA и один или несколько терапевтических белков.
[340] В некоторых вариантах осуществления miRNA представляет собой miRNA, встречающуюся в природе. В некоторых вариантах осуществления miRNA представляет собой сконструированную miRNA. В некоторых вариантах осуществления miRNA представляет собой искусственную miRNA. В определенных вариантах осуществления miRNA включает сконструированную miRNA для miHTT, раскрытую в Evers et al., Molecular Therapy 26(9):1-15 (электронная публикация до выхода в печать в июне 2018 г.). В определенных вариантах осуществления miRNA предусматривает искусственную miRNA miR-SOD1, раскрытую в Dirren et al., Annals of Clinical and Translational Neurology 2(2):167-84 (февраль 2015 г.). В определенных вариантах осуществления miRNA включает в себя miR-708, которая нацеливается на RHO (см. Behrman et al., JCB 192(6):919-27 (2011).
[341] В некоторых вариантах осуществления miRNA повышает экспрессию гена путем понижения экспрессии ингибитора гена. В некоторых вариантах осуществления ингибитор представляет собой природный ингибитор, например, ингибитор дикого типа. В некоторых вариантах осуществления ингибитор образуется на мутантном, гетерологичном и/или неправильно экспрессирующемся гене.
E. Гетерологичные компоненты
[342] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую целевую последовательность, где целевая последовательность кодирует терапевтический белок и где терапевтический белок содержит по меньшей мере один гетерологичный компонент. В некоторых вариантах осуществления гетерологичный компонент слит с N-концом или C-концом терапевтического белка. В других вариантах осуществления гетерологичный компонент вставлен между двумя аминокислотами в пределах терапевтического белка.
[343] В некоторых вариантах осуществления терапевтический белок содержит полипептид FVIII и гетерологичный компонент, который вставлен между двумя аминокислотами в пределах полипептида FVIII. В некоторых вариантах осуществления гетерологичный компонент вставлен в пределах полипептида FVIII в один или несколько сайтов вставки, выбранных из таблицы 5. В некоторых вариантах осуществления гетерологичная аминокислотная последовательность может быть вставлена в пределах полипептида, представляющего собой фактор свертывания крови, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению, в любой сайт, раскрытый в международной публикации № WO 2013/123457 A1, WO 2015/106052 A1 или публикации заявки на патент США № 2015/0158929 А1, которые включены в данный документ посредством ссылки во всей своей полноте. В одном конкретном варианте осуществления терапевтический белок содержит FVIII и гетерологичный компонент, где гетерологичный компонент вставлен в пределах FVIII непосредственно ниже аминокислоты 745 относительно зрелого FVIII. В одном конкретном варианте осуществления терапевтический белок содержит FVIII и XTEN, где XTEN вставлен в пределах FVIII непосредственно ниже аминокислоты 745 относительно зрелого FVIII. В одном конкретном варианте осуществления FVIII содержит делецию аминокислот 746-1646, соответствующих зрелому FVIII человека (SEQ ID NO:15), и гетерологичный компонент вставлен непосредственно ниже аминокислоты 745, соответствующей зрелому FVIII человека (SEQ ID NO:15).
Таблица 5. Сайты вставки гетерологичного компонента в FVIII
вставки
вставки
[344] В некоторых вариантах осуществления терапевтический белок содержит полипептид FIX и гетерологичный компонент, который вставлен между двумя аминокислотами в пределах полипептида FIX. В некоторых вариантах осуществления гетерологичный компонент вставлен в пределах полипептида FIX в один или несколько сайтов вставки, выбранных из таблицы 5. В некоторых вариантах осуществления гетерологичная аминокислотная последовательность может быть вставлена в пределах полипептида, представляющего собой фактор свертывания крови, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению, в любой сайт, раскрытый в международной заявке № PCT/US2017/015879, которая включена в данный документ посредством ссылки во всей своей полноте. В одном конкретном варианте осуществления терапевтический белок содержит полипептид FIX и гетерологичный компонент, где гетерологичный компонент вставлен в пределах полипептида FIX непосредственно ниже аминокислоты 166 относительно зрелого FIX. В одном конкретном варианте осуществления терапевтический белок содержит полипептид FIX и XTEN, где XTEN вставлен в пределах FIX непосредственно ниже аминокислоты 166 относительно зрелого FVIII.
Таблица 6. Сайты вставки гетерологичного компонента в FIX
вставки
вставки
[345] В других вариантах осуществления терапевтические белки по настоящему изобретению дополнительно содержат две, три, четыре, пять, шесть, семь или восемь гетерологичных нуклеотидных последовательностей. В некоторых вариантах осуществления все гетерологичные компоненты являются идентичными. В некоторых вариантах осуществления по меньшей мере один гетерологичный компонент отличается от других гетерологичных компонентов. В некоторых вариантах осуществления настоящее изобретение может включать два, три, четыре, пять, шесть или более семи гетерологичных компонентов в тандеме.
[346] В некоторых вариантах осуществления гетерологичный компонент увеличивает период полужизни (является "средством, удлиняющим период полужизни") терапевтического белка.
[347] В некоторых вариантах осуществления гетерологичный компонент представляет собой пептид или полипептид с не обусловленными структурой или обусловленными структурой характеристиками, которые ассоциированы с продлением периода полужизни in vivo при встраивании в белок по настоящему изобретению. Неограничивающие примеры включают альбумин, фрагменты альбумина, Fc-фрагменты иммуноглобулинов, C-концевой пептид (CTP) β-субъединицы хорионического гонадотропина человека, последовательность HAP, последовательность XTEN, трансферрин или его фрагмент, полипептид PAS, полиглициновые линкеры, полисериновые линкеры, альбумин-связывающие компоненты или любые фрагменты, производные, варианты или комбинации этих полипептидов. В одном конкретном варианте осуществления гетерологичная аминокислотная последовательность представляет собой константную область иммуноглобулина или ее часть, трансферрин, альбумин или последовательность PAS. В некоторых аспектах гетерологичный компонент включает фактор фон Виллебранда или его фрагмент. В других связанных аспектах гетерологичный компонент может включать сайт присоединения (например, аминокислоту цистеин) компонента, не являющегося полипептидом, такого как полиэтиленгликоль (PEG), гидроксиэтилкрахмал (HES), полисиаловая кислота или любые производные, варианты или комбинации этих элементов. В некоторых аспектах гетерологичный компонент включает аминокислоту цистеин, которая функционирует как сайт присоединения компонента, не являющегося полипептидом, такого как полиэтиленгликоль (PEG), гидроксиэтилкрахмал (HES), полисиаловая кислота или любые производные, варианты или комбинации этих элементов.
[348] В одном конкретном варианте осуществления первый гетерологичный компонент представляет собой молекулу, удлиняющую период полужизни, которая известна из уровня техники, и второй гетерологичный компонент представляет собой молекулу, удлиняющую период полужизни, которая известна из уровня техники. В определенных вариантах осуществления первый гетерологичный компонент (например, первый Fc-компонент) и второй гетерологичный компонент (например, второй Fc-компонент) связываются друг с другом с образованием димера. В одном варианте осуществления второй гетерологичный компонент представляет собой второй Fc-компонент, где второй Fc-компонент соединен или связан с первым гетерологичным компонентом, например, с первым Fc-компонентом. Например, второй гетерологичный компонент (например, второй Fc-компонент) может быть связан с первым гетерологичным компонентом (например, первым Fc-компонентом) с помощью линкера или связан с первым гетерологичным компонентом ковалентной или нековалентной связью.
[349] В некоторых вариантах осуществления гетерологичный компонент представляет собой полипептид, содержащий по меньшей мере приблизительно 10, по меньшей мере приблизительно 100, по меньшей мере приблизительно 200, по меньшей мере приблизительно 300, по меньшей мере приблизительно 400, по меньшей мере приблизительно 500, по меньшей мере приблизительно 600, по меньшей мере приблизительно 700, по меньшей мере приблизительно 800, по меньшей мере приблизительно 900, по меньшей мере приблизительно 1000, по меньшей мере приблизительно 1100, по меньшей мере приблизительно 1200, по меньшей мере приблизительно 1300, по меньшей мере приблизительно 1400, по меньшей мере приблизительно 1500, по меньшей мере приблизительно 1600, по меньшей мере приблизительно 1700, по меньшей мере приблизительно 1800, по меньшей мере приблизительно 1900, по меньшей мере приблизительно 2000, по меньшей мере приблизительно 2500, по меньшей мере приблизительно 3000 или по меньшей мере приблизительно 4000 аминокислот, состоящий по сути из них или состоящий из них. В других вариантах осуществления гетерологичный компонент представляет собой полипептид, содержащий от приблизительно 100 до приблизительно 200 аминокислот, от приблизительно 200 до приблизительно 300 аминокислот, от приблизительно 300 до приблизительно 400 аминокислот, от приблизительно 400 до приблизительно 500 аминокислот, от приблизительно 500 до приблизительно 600 аминокислот, от приблизительно 600 до приблизительно 700 аминокислот, от приблизительно 700 до приблизительно 800 аминокислот, от приблизительно 800 до приблизительно 900 аминокислот или от приблизительно 900 до приблизительно 1000 аминокислот, состоящий по сути из них или состоящий из них.
[350] В определенных вариантах осуществления гетерологичный компонент улучшает одно или несколько фармакокинетических свойств терапевтического белка без значительного влияния на его биологическую активность или функцию.
[351] В определенных вариантах осуществления гетерологичный компонент увеличивает период полужизни in vivo и/или in vitro терапевтического белка по настоящему изобретению. В других вариантах осуществления гетерологичный компонент способствует визуализации или локализации терапевтического белка по настоящему изобретению или его фрагмента (например, фрагмента, содержащего гетерологичный компонент после протеолитического расщепления белка FVIII). Визуализация и/или локализация терапевтического белка по настоящему изобретению или его фрагмента может выполняться в условиях in vivo, in vitro, ex vivo или в их комбинациях.
[352] В других вариантах осуществления гетерологичный компонент увеличивает стабильность терапевтического белка по настоящему изобретению или его фрагмента (например, фрагмента, содержащего гетерологичный компонент после протеолитического расщепления терапевтического белка, например, фактора свертывания крови). Используемый в данном документе термин "стабильность" относится к принятому в данной области техники показателю, отображающему поддержание одного или нескольких физических свойств терапевтического белка в ответ на условия окружающей среды (например, повышенную или пониженную температуру). В определенных аспектах физическое свойство может представлять собой поддержание структуры ковалентных связей терапевтического белка (например, отсутствие протеолитического расщепления, нежелательного окисления или дезамидирования). В других аспектах физическое свойство также может представлять собой присутствие терапевтического белка в правильно свернутом состоянии (например, отсутствие растворимых или нерастворимых агрегатов или осадков). В одном аспекте стабильность терапевтического белка измеряют путем анализа биофизического свойства терапевтического белка, например, термостабильности, профиля разворачивания под действием pH, стабильного удаления сайтов гликозилирования, растворимости, биохимической функции (например, способности связываться с белком, рецептором или лигандом) и т. д. и/или их комбинации. В другом аспекте биохимическая функция демонстрируется по аффинности связывания при взаимодействии. В одном аспекте показателем стабильности белка является термостабильность, т. е. устойчивость к тепловой нагрузке. Стабильность можно измерять с применением способов, известных из уровня техники, таких как HPLC (высокоэффективная жидкостная хроматография), SEC (эксклюзионная хроматография), DLS (динамическое рассеяние света) и т. д. Способы измерения термостабильности включают без ограничения дифференциальную сканирующую калориметрию (DSC), дифференциальную сканирующую флуориметрию (DSF), круговой дихроизм (CD) и анализ стабильности при тепловой нагрузке.
[353] В определенных аспектах терапевтический белок, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению, содержит по меньшей мере одно средство, удлиняющее период полужизни, т. е. гетерологичный компонент, который увеличивает период полужизни in vivo терапевтического белка по сравнению с периодом полужизни in vivo соответствующего терапевтического белка, в котором отсутствует такой гетерологичный компонент. Период полужизни терапевтического белка in vivo может быть определен с помощью любых способов, известных специалистам в данной области, например, посредством анализов активности (например, хромогенного анализа или одностадийного анализа свертывания крови с определением aPTT, где терапевтический белок предусматривает полипептид FVIII), ELISA, ROTEM® и т. д.
[354] В некоторых вариантах осуществления присутствие одного или нескольких средств, удлиняющих период полужизни, приводит к увеличению периода полужизни терапевтического белка по сравнению с периодом полужизни соответствующего белка, в котором отсутствуют такие одно или несколько средств, удлиняющих период полужизни. Период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, в по меньшей мере приблизительно 1,5 раза, по меньшей мере приблизительно 2 раза, по меньшей мере приблизительно 2,5 раза, по меньшей мере приблизительно 3 раза, по меньшей мере приблизительно 4 раза, по меньшей мере приблизительно 5 раз, по меньшей мере приблизительно 6 раз, по меньшей мере приблизительно 7 раз, по меньшей мере приблизительно 8 раз, по меньшей мере приблизительно 9 раз, по меньшей мере приблизительно 10 раз, по меньшей мере приблизительно 11 раз или по меньшей мере приблизительно 12 раз превышает период полужизни in vivo соответствующего терапевтического белка, в котором отсутствует такое средство, удлиняющее период полужизни.
[355] В одном варианте осуществления период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, в от приблизительно 1,5 раза до приблизительно 20 раз, от приблизительно 1,5 раза до приблизительно 15 раз или от приблизительно 1,5 раза до приблизительно 10 раз превышает период полужизни in vivo соответствующего белка, в котором отсутствует такое средство, удлиняющее период полужизни. В другом варианте осуществления период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, удлинен в от приблизительно 2 раз до приблизительно 10 раз, от приблизительно 2 раз до приблизительно 9 раз, от приблизительно 2 раз до приблизительно 8 раз, от приблизительно 2 раз до приблизительно 7 раз, от приблизительно 2 раз до приблизительно 6 раз, от приблизительно 2 раз до приблизительно 5 раз, от приблизительно 2 раз до приблизительно 4 раз, от приблизительно 2 раз до приблизительно 3 раз, от приблизительно 2,5 раза до приблизительно 10 раз, от приблизительно 2,5 раза до приблизительно 9 раз, от приблизительно 2,5 раза до приблизительно 8 раз, от приблизительно 2,5 раза до приблизительно 7 раз, от приблизительно 2,5 раза до приблизительно 6 раз, от приблизительно 2,5 раза до приблизительно 5 раз, от приблизительно 2,5 раза до приблизительно 4 раз, от приблизительно 2,5 раза до приблизительно 3 раз, от приблизительно 3 раз до приблизительно 10 раз, от приблизительно 3 раз до приблизительно 9 раз, от приблизительно 3 раз до приблизительно 8 раз, от приблизительно 3 раз до приблизительно 7 раз, от приблизительно 3 раз до приблизительно 6 раз, от приблизительно 3 раз до приблизительно 5 раз, от приблизительно 3 раз до приблизительно 4 раз, от приблизительно 4 раз до приблизительно 6 раз, от приблизительно 5 раз до приблизительно 7 раз или от приблизительно 6 раз до приблизительно 8 раз по сравнению с периодом полужизни in vivo соответствующего белка, в котором отсутствует такое средство, удлиняющее период полужизни.
[356] В других вариантах осуществления период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, составляет по меньшей мере приблизительно 17 часов, по меньшей мере приблизительно 18 часов, по меньшей мере приблизительно 19 часов, по меньшей мере приблизительно 20 часов, по меньшей мере приблизительно 21 час, по меньшей мере приблизительно 22 часа, по меньшей мере приблизительно 23 часа, по меньшей мере приблизительно 24 часа, по меньшей мере приблизительно 25 часов, по меньшей мере приблизительно 26 часов, по меньшей мере приблизительно 27 часов, по меньшей мере приблизительно 28 часов, по меньшей мере приблизительно 29 часов, по меньшей мере приблизительно 30 часов, по меньшей мере приблизительно 31 час, по меньшей мере приблизительно 32 часа, по меньшей мере приблизительно 33 часа, по меньшей мере приблизительно 34 часа, по меньшей мере приблизительно 35 часов, по меньшей мере приблизительно 36 часов, по меньшей мере приблизительно 48 часов, по меньшей мере приблизительно 60 часов, по меньшей мере приблизительно 72 часа, по меньшей мере приблизительно 84 часа, по меньшей мере приблизительно 96 часов или по меньшей мере приблизительно 108 часов.
[357] В еще одних вариантах осуществления период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, составляет от приблизительно 15 часов до приблизительно двух недель, от приблизительно 16 часов до приблизительно одной недели, от приблизительно 17 часов до приблизительно одной недели, от приблизительно 18 часов до приблизительно одной недели, от приблизительно 19 часов до приблизительно одной недели, от приблизительно 20 часов до приблизительно одной недели, от приблизительно 21 часа до приблизительно одной недели, от приблизительно 22 часов до приблизительно одной недели, от приблизительно 23 часов до приблизительно одной недели, от приблизительно 24 часов до приблизительно одной недели, от приблизительно 36 часов до приблизительно одной недели, от приблизительно 48 часов до приблизительно одной недели, от приблизительно 60 часов до приблизительно одной недели, от приблизительно 24 часов до приблизительно шести дней, от приблизительно 24 часов до приблизительно пяти дней, от приблизительно 24 часов до приблизительно четырех дней, от приблизительно 24 часов до приблизительно трех дней или от приблизительно 24 часов до приблизительно двух дней.
[358] В некоторых вариантах осуществления средний период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, у субъекта составляет приблизительно 15 часов, приблизительно 16 часов, приблизительно 17 часов, приблизительно 18 часов, приблизительно 19 часов, приблизительно 20 часов, приблизительно 21 час, приблизительно 22 часа, приблизительно 23 часа, приблизительно 24 часа (1 день), приблизительно 25 часов, приблизительно 26 часов, приблизительно 27 часов, приблизительно 28 часов, приблизительно 29 часов, приблизительно 30 часов, приблизительно 31 час, приблизительно 32 часа, приблизительно 33 часа, приблизительно 34 часа, приблизительно 35 часов, приблизительно 36 часов, приблизительно 40 часов, приблизительно 44 часа, приблизительно 48 часов (2 дня), приблизительно 54 часа, приблизительно 60 часов, приблизительно 72 часа (3 дня), приблизительно 84 часа, приблизительно 96 часов (4 дня), приблизительно 108 часов, приблизительно 120 часов (5 дней), приблизительно шесть дней, приблизительно семь дней (одну неделю), приблизительно восемь дней, приблизительно девять дней, приблизительно 10 дней, приблизительно 11 дней, приблизительно 12 дней, приблизительно 13 дней или приблизительно 14 дней.
[359] Одно или несколько средств, удлиняющих период полужизни, могут быть слиты с С-концом или N-концом терапевтического белка или вставлены в пределах терапевтического белка.
1. Константная область иммуноглобулина или ее часть
[360] В другом аспекте гетерологичный компонент содержит одну или несколько константных областей иммуноглобулина или их частей (например, Fc-область). В одном варианте осуществления выделенная молекула нуклеиновой кислоты по настоящему изобретению дополнительно содержит гетерологичную последовательность нуклеиновой кислоты, которая кодирует константную область иммуноглобулина или ее часть. В некоторых вариантах осуществления константная область иммуноглобулина или ее часть представляют собой Fc-область.
[361] Константная область иммуноглобулина состоит из доменов, обозначенных как домены СН (константные домены тяжелой цепи) (СН1, СН2 и т. д.). В зависимости от изотипа (т. е. IgG, IgM, IgA, IgD или IgE) константная область может состоять из трех или четырех доменов СН. Константные области некоторых изотипов (например, IgG) также содержат шарнирную область. См. Janeway et al. 2001, Immunobiology, Garland Publishing, N.Y., N.Y.
[362] Константная область иммуноглобулина или ее часть по настоящему изобретению могут быть получены из ряда различных источников. В одном варианте осуществления константная область иммуноглобулина или ее часть получены из иммуноглобулина человека. Однако, следует понимать, что константная область иммуноглобулина или ее часть могут быть получены из иммуноглобулина другого вида млекопитающего, в том числе, например, вида грызуна (например, мыши, крысы, кролика, морской свинки) или примата, отличного от человека (например, шимпанзе, макака). Кроме того, константная область иммуноглобулина или ее часть могут быть получены из любого класса иммуноглобулинов, в том числе IgM, IgG, IgD, IgA и IgE, и любого изотипа иммуноглобулинов, в том числе IgG1, IgG2, IgG3 и IgG4. В одном варианте осуществления применяют изотип IgG1 человека.
[363] Разнообразные последовательности генов константных областей иммуноглобулинов (например, последовательности генов константных областей человека) доступны в форме общедоступных депонирований. Можно выбрать последовательность домена константной области, обладающую конкретной эффекторной функцией (или не обладающую конкретной эффекторной функцией) или имеющую конкретную модификацию для снижения иммуногенности. Было опубликовано большое количество последовательностей антител и генов, кодирующих антитела, и подходящие последовательности константных областей Ig (например, последовательности шарнирных областей, СН2 и/или СН3 или их части) могут быть получены из этих последовательностей с применением методик, принятых в данной области техники. Генетический материал, полученный с применением любого из вышеуказанных способов, можно затем подвергать изменению или синтезу с получением полипептидов по настоящему изобретению. Дополнительно следует понимать, что объем настоящего изобретения охватывает аллели, варианты и мутации последовательностей ДНК константных областей.
[364] Последовательности константной области иммуноглобулина или ее части могут быть клонированы, например, с применением полимеразной цепной реакции и праймеров, выбранных для амплификации представляющего интерес домена. Для клонирования последовательности константной области иммуноглобулина или ее части из антитела можно выделить мРНК из клеток гибридомы, селезенки или лимфатических клеток, подвергнуть ее обратной транскрипции в ДНК и амплифицировать гены антитела с помощью ПЦР. Способы ПЦР-амплификации подробно описаны в патентах США №№ 4683195; 4683202; 4800159; 4965188 и, например, в "PCR Protocols: A Guide to Methods and Applications" Innis et al. eds., Academic Press, San Diego, CA (1990); Ho et al. 1989. Gene 77:51; Horton et al. 1993. Methods Enzymol. 217:270). ПЦР можно инициировать с помощью консенсусных праймеров для константной области или с помощью более специфических праймеров на основе опубликованных последовательностей ДНК и аминокислотных последовательностей, соответствующих тяжелым и легким цепям. ПЦР также можно применять для выделения ДНК-клонов, кодирующих легкие и тяжелые цепи антител. В этом случае можно осуществлять скрининг библиотек с помощью консенсусных праймеров или более крупных гомологичных зондов, таких как зонды для константных областей мыши. Из уровня техники известны многочисленные наборы праймеров, подходящие для амплификации генов антител (например, 5'-праймеры на основе N-концевой последовательности очищенных антител (Benhar and Pastan. 1994. Protein Engineering 7:1509); праймеры для быстрой амплификации концов кДНК (Ruberti, F. et al. 1994. J. Immunol. Methods 173:33); праймеры для лидерных последовательностей антител (Larrick et al. 1989 Biochem. Biophys. Res. Commun. 160:1250). Клонирование последовательностей антител дополнительно описано в выданном Newman et al. патенте США № 5658570, заявка на который была подана 25 января 1995 г., который включен в данный документ посредством ссылки.
[365] Используемая в данном документе константная область иммуноглобулина может включать все домены и шарнирную область или их части. В одном варианте константная область иммуноглобулина или ее часть содержат домен СН2, домен СН3 и шарнирную область, т. е. Fc-область или партнера по связыванию FcRn.
[366] Используемый в данном документе термин "Fc-область" определяется как часть полипептида, которая соответствует Fc-области нативного Ig, т. e. образована путем димерной ассоциации соответствующих Fc-доменов двух его тяжелых цепей. Нативная Fc-область образует гомодимер с другой Fc-областью. В отличие от этого, термины "генетически слитая Fc-область" или "одноцепочечная Fc-область" (scFc-область), используемые в данном документе, относятся к синтетической димерной Fc-области, состоящей из Fc-доменов, генетически соединенных в одну полипептидную цепь (т. е. кодируемых одной непрерывной генетической последовательностью). См. международную публикацию № WO 2012/006635, включенную в данный документ посредством ссылки во всей своей полноте.
[367] В одном варианте осуществления "Fc-область" относится к части одной тяжелой цепи Ig, начинающейся в шарнирной области непосредственно выше сайта расщепления папаином (т. е. остатком 216 в IgG, если принять первый остаток константной области тяжелой цепи за 114) и заканчивающейся на С-конце антитела. Соответственно, полная Fc-область содержит по меньшей мере шарнирный домен, домен CH2 и домен CH3.
[368] Константная область иммуноглобулина или ее часть могут быть партнером по связыванию FcRn. FcRn является активным в зрелых эпителиальных тканях и экспрессируется в просвете кишечника, дыхательных путях легких, поверхностях носа, поверхностях влагалища, поверхностях толстой и прямой кишки (патент США № 6485726). Партнером по связыванию FcRn является часть иммуноглобулина, которая связывается с FcRn.
[369] Рецептор FcRn был выделен у некоторых видов млекопитающих, в том числе у людей. Известны последовательности FcRn человека, FcRn обезьяны, FcRn крысы и FcRn мыши (Story et al. 1994, J. Exp. Med. 180:2377). Рецептор FcRn связывает IgG (но не иммуноглобулины из других классов, таких как IgA, IgM, IgD и IgE) при относительно низком значении pH, осуществляет активный транспорт IgG через клетки по направлению от просвета к серозной оболочке, а затем высвобождает IgG при относительно более высоком значении pH, обнаруживаемом в интерстициальных жидкостях. Он экспрессируется в зрелой эпителиальной ткани (патенты США №№ 6485726, 6030613, 6086875; WO 03/077834; US2003-0235536A1), в том числе в эпителии легких и кишечника (Israel et al. 1997, Immunology 92:69), эпителии проксимальных канальцев почки (Kobayashi et al. 2002, Am. J. Physiol. Renal Physiol. 282:F358), а также эпителии полости носа, на поверхностях влагалища и поверхностях системы желчных протоков.
[370] Партнеры по связыванию FcRn, применимые в настоящем изобретении, охватывают молекулы, которые могут специфически связываться с рецептором FcRn, в том числе целый IgG, Fc-фрагмент IgG и другие фрагменты, которые включают полную связывающую область для рецептора FcRn. Область Fc-части IgG, которая связывается с рецептором FcRn, была описана с использованием рентгеноструктурной кристаллографии (Burmeister et al. 1994, Nature 372:379). Основная область контакта Fc с FcRn находится вблизи места соединения доменов CH2 и CH3. Все области контакта Fc-FcRn находятся в пределах одной тяжелой цепи Ig. Партнеры по связыванию FcRn включают целый IgG, Fc-фрагмент IgG и другие фрагменты IgG, которые содержат полную связывающую область для FcRn. Основные сайты контакта включают аминокислотные остатки 248, 250-257, 272, 285, 288, 290-291, 308-311 и 314 из домена CH2 и аминокислотные остатки 385-387, 428 и 433-436 из домена CH3. Все ссылки на нумерацию аминокислот иммуноглобулинов или фрагментов или областей иммуноглобулинов приведены согласно Kabat et al. 1991, Sequences of Proteins of Immunological Interest, U.S. Department of Public Health, Bethesda, Md.
[371] Fc-области или партнеры по связыванию FcRn, связанные с FcRn, могут эффективно переноситься через эпителиальные барьеры с помощью FcRn, за счет чего обеспечивается неинвазивный способ системного введения необходимой терапевтической молекулы. Кроме того, слитые белки, содержащие Fc-область или партнера по связыванию FcRn, подвергаются эндоцитозу клетками, экспрессирующими FcRn. Но вместо маркировки для деградации эти слитые белки снова возвращаются в кровоток, что, таким образом, увеличивает период полужизни этих белков in vivo. В определенных вариантах осуществления части константных областей иммуноглобулина представляют собой Fc-область или партнера по связыванию FcRn, которые обычно связаны посредством дисульфидных связей и других неспецифических взаимодействий с другой Fc-областью или другим партнером по связыванию FcRn с образованием димеров и мультимеров более высокого порядка.
[372] Два рецептора FcRn могут связывать одну молекулу Fc. Кристаллографические данные позволяют предположить, что каждая молекула FcRn связывает один полипептид гомодимера Fc. В одном варианте осуществления связывание партнера по связыванию FcRn, например, Fc-фрагмента IgG, с биологически активной молекулой обеспечивает средство доставки биологически активной молекулы перорально, трансбуккально, сублингвально, ректально, вагинально, в виде аэрозоля, вводимого назально или посредством легочного пути, или посредством глазного пути. В другом варианте осуществления белок, представляющий собой фактор свертывания крови, можно вводить инвазивным способом, например, подкожным, внутривенным путем.
[373] Область партнера по связыванию FcRn представляет собой молекулу или ее часть, которая может специфически связываться рецептором FcRn с последующим активным транспортом Fc-области с помощью рецептора FcRn. "Специфически связанные" относится к двум молекулам, образующим комплекс, который является относительно стабильным при физиологических условиях. Специфическое связывание характеризуется высокой аффинностью и емкостью от низкой до умеренной, в отличие от неспецифического связывания, которое обычно характеризуется низкой аффинностью и емкостью от умеренной до высокой. Как правило, связывание считается специфическим, если константа аффинности KA превышает 106 M-1 или превышает 108 M-1. При необходимости неспецифическое связывание можно снизить без существенного влияния на специфическое связывание путем изменения условий связывания. Соответствующие условия связывания, такие как концентрация молекул, ионная сила раствора, температура, допустимое время связывания, концентрация блокирующего средства (например, сывороточного альбумина, казеина молока) и т. д., могут быть оптимизированы специалистом в данной области с применением обычных методик.
[374] В определенных вариантах осуществления терапевтический белок, кодируемый молекулой нуклеиновой кислоты согласно настоящему изобретению, содержит одну или несколько усеченных Fc-областей, которые, тем не менее, являются достаточными для придания Fc-области свойств связывания с Fc-рецептором (FcR). Например, часть Fc-области, которая связывается с FcRn (т. e. FcRn-связывающая часть), содержит приблизительно аминокислоты 282-438 из IgG1 согласно нумерации EU (при этом основными сайтами контакта являются аминокислоты 248, 250-257, 272, 285, 288, 290-291, 308-311 и 314 из домена CH2 и аминокислотные остатки 385-387, 428 и 433-436 из домена CH3). Таким образом, Fc-область согласно настоящему изобретению может содержать FcRn-связывающую часть или состоять из нее. FcRn-связывающие части могут быть получены из тяжелых цепей любого изотипа, в том числе IgG1, IgG2, IgG3 и IgG4. В одном варианте осуществления применяют FcRn-связывающую часть из антитела изотипа IgG1 человека. В другом варианте осуществления применяют FcRn-связывающую часть из антитела изотипа IgG4 человека.
[375] Fc-область может быть получена из ряда различных источников. В одном варианте осуществления Fc-область полипептида получена из иммуноглобулина человека. Однако следует понимать, что Fc-компонент может быть получен из иммуноглобулина другого вида млекопитающего, в том числе, например, вида грызуна (например, мыши, крысы, кролика, морской свинки) или примата, отличного от человека (например, шимпанзе, макака). Более того, полипептид доменов Fc или их части может быть получен из любого класса иммуноглобулинов, в том числе IgM, IgG, IgD, IgA и IgE, и любого изотипа иммуноглобулинов, в том числе IgG1, IgG2, IgG3 и IgG4. В другом варианте осуществления применяют изотип IgG1 человека.
[376] В определенных вариантах осуществления вариант Fc обеспечивает изменение по меньшей мере одной эффекторной функции, придаваемой Fc-компонентом, содержащим указанный домен Fc дикого типа (например, улучшение или снижение способности Fc-области к связыванию с Fc-рецепторами (например, FcγRI, FcγRII или FcγRIII) или белками системы комплемента (например, C1q) или к запуску антителозависимой цитотоксичности (ADCC), фагоцитоза или комплементзависимой цитотоксичности (CDCC)). В других вариантах осуществления в варианте Fc представлен сконструированный цистеиновый остаток.
[377] В качестве Fc-области по настоящему изобретению можно использовать известные из уровня техники варианты Fc, которые, как известно, придают изменение (например, усиление или снижение) эффекторной функции и/или связывания FcR или FcRn. В частности, Fc-область по настоящему изобретению может содержать, например, изменение (например, замену) в одном или нескольких аминокислотных положениях, раскрытых в международных публикациях согласно PCT WO88/07089A1, WO96/14339A1, WO98/05787A1, WO98/23289A1, WO99/51642A1, WO99/58572A1, WO00/09560A2, WO00/32767A1, WO00/42072A2, WO02/44215A2, WO02/060919A2, WO03/074569A2, WO04/016750A2, WO04/029207A2, WO04/035752A2, WO04/063351A2, WO04/074455A2, WO04/099249A2, WO05/040217A2, WO04/044859, WO05/070963A1, WO05/077981A2, WO05/092925A2, WO05/123780A2, WO06/019447A1, WO06/047350A2 и WO06/085967A2; публикациях заявок на патент США №№ US2007/0231329, US2007/0231329, US2007/0237765, US2007/0237766, US2007/0237767, US2007/0243188, US20070248603, US20070286859, US20080057056 или патентах США №№ 5648260; 5739277; 5834250; 5869046; 6096871; 6121022; 6194551; 6242195; 6277375; 6528624; 6538124; 6737056; 6821505; 6998253; 7083784; 7404956 и 7317091, каждый из которых включен в данный документ посредством ссылки. В одном варианте осуществления специфическое изменение (например, специфическая замена одной или нескольких аминокислот, раскрытых в уровне техники) может быть осуществлено в одном или нескольких раскрытых аминокислотных положениях. В другом варианте осуществления может быть осуществлено другое изменение в одном или нескольких раскрытых аминокислотных положениях (например, другая замена в одном или нескольких аминокислотных положениях, раскрытых в уровне техники).
[378] Fc-область IgG или его партнер по связыванию FcRn могут быть модифицированы в соответствии с хорошо известными процедурами, такими как сайт-направленный мутагенез и т. п., с получением модифицированных IgG или Fc-фрагментов или их частей, которые будут связываться с FcRn. Такие модификации включают модификации в отдалении от сайтов контакта с FcRn, а также модификации в пределах сайтов контакта, которые обеспечивают сохранение или даже усиление связывания с FcRn. Например, следующие отдельные аминокислотные остатки в Fc IgG1 человека (Fc γ1) могут быть заменены без значительной потери аффинности связывания Fc с FcRn: P238A, S239A, K246A, K248A, D249A, M252A, T256A, E258A, T260A, D265A, S267A, H268A, E269A, D270A, E272A, L274A, N276A, Y278A, D280A, V282A, E283A, H285A, N286A, T289A, K290A, R292A, E293A, E294A, Q295A, Y296F, N297A, S298A, Y300F, R301A, V303A, V305A, T307A, L309A, Q311A, D312A, N315A, K317A, E318A, K320A, K322A, S324A, K326A, A327Q, P329A, A330Q, P331A, E333A, K334A, T335A, S337A, K338A, K340A, Q342A, R344A, E345A, Q347A, R355A, E356A, M358A, T359A, K360A, N361A, Q362A, Y373A, S375A, D376A, A378Q, E380A, E382A, S383A, N384A, Q386A, E388A, N389A, N390A, Y391F, K392A, L398A, S400A, D401A, D413A, K414A, R416A, Q418A, Q419A, N421A, V422A, S424A, E430A, N434A, T437A, Q438A, K439A, S440A, S444A и K447A, где, например, P238A представляет собой пролин в последовательности дикого типа, замененный аланином в положении номер 238. В качестве примера, специфический вариант осуществления включает мутацию N297A, удаляющую высококонсервативный сайт N-гликозилирования. Аминокислоты в последовательности дикого типа в вышеуказанных положениях могут быть заменены другими аминокислотами, в дополнение к аланину. Мутации могут быть введены в Fc по отдельности, что приводит к образованию более ста Fc-областей, отличных от нативного Fc. Кроме того, комбинации из двух, трех или более из этих отдельных мутаций могут быть введены вместе, что приводит к образованию еще нескольких сотен Fc-областей.
[379] Определенные из вышеуказанных мутаций могут придавать новое функциональное свойство Fc-области или партнеру по связыванию FcRn. Например, один вариант осуществления включает N297A, удаляющую высококонсервативный сайт N-гликозилирования. Эффект данной мутации заключается в снижении иммуногенности, за счет чего увеличивается период полужизни Fc-области в кровотоке, и обеспечении неспособности Fc-области связываться с FcγRI, FcγRIIA, FcγRIIB и FcγRIIIA без нарушения аффинности в отношении FcRn (Routledge et al. 1995, Transplantation 60:847; Friend et al. 1999, Transplantation 68:1632; Shields et al. 1995, J. Biol. Chem. 276:6591). В качестве дополнительного примера нового функционального свойства, возникающего в результате вышеописанных мутаций, аффинность в отношении FcRn в некоторых случаях может увеличиваться, превышая таковую у дикого типа. Эту увеличенную аффинность могут отражать увеличенная скорость ассоциации, уменьшенная скорость диссоциации или как увеличенная скорость ассоциации, так и уменьшенная скорость диссоциации. Примеры мутаций, которые, как полагают, придают увеличенную аффинность в отношении FcRn, включают без ограничения T256A, T307A, E380A и N434A (Shields et al. 2001, J. Biol. Chem. 276:6591).
[380] Кроме того, по меньшей мере три Fc-гамма-рецептора человека, по-видимому, распознают сайт связывания на IgG в пределах нижней части шарнирной области, обычно аминокислоты 234-237. Следовательно, другой пример нового функционального свойства и потенциальной сниженной иммуногенности может возникать в результате мутаций в этой области, как, например, за счет замещения аминокислот 233-236 "ELLG" IgG1 человека (SEQ ID NO: 45) соответствующей последовательностью "PVA" из IgG2 (с удалением одной аминокислоты). Было показано, что FcγRI, FcγRII, и FcγRIII, которые опосредуют различные эффекторные функции, не будут связываться с IgG1 при введении таких мутаций. Ward and Ghetie 1995, Therapeutic Immunology 2:77 и Armour et al. 1999, Eur. J. Immunol. 29:2613.
[381] В другом варианте осуществления константная область иммуноглобулина или ее часть содержат аминокислотную последовательность в шарнирной области или ее части, которая образует одну или несколько дисульфидных связей со второй константной областью иммуноглобулина или ее частью. Вторая константная область иммуноглобулина или ее часть могут быть связаны со вторым полипептидом с объединением терапевтического белка и второго полипептида. В некоторых вариантах осуществления второй полипептид представляет собой энхансерный компонент. Используемый в данном документе термин "энхансерный компонент" относится к молекуле, ее фрагменту или компоненту полипептида, которые способны усиливать активность терапевтического белка. Энхансерный компонент может представлять собой кофактор, как, например, в случае, когда терапевтический белок представляет собой фактор свертывания крови, растворимый тканевой фактор (sTF) или прокоагулянтный пептид. Таким образом, после активации фактора свертывания крови энхансерный компонент доступен для усиления активности фактора свертывания крови.
[382] В определенных вариантах осуществления терапевтический белок, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению, содержит аминокислотную замену в константной области иммуноглобулина или ее части (например, варианты Fc), обеспечивающую изменение антигеннезависимых эффекторных функций константной области Ig, в частности периода полужизни белка в кровотоке.
2. scFc-области
[383] В другом аспекте гетерологичный компонент содержит scFc-область (одноцепочечную Fc-область). В одном варианте осуществления выделенная молекула нуклеиновой кислоты по настоящему изобретению дополнительно содержит гетерологичную последовательность нуклеиновой кислоты, которая кодирует scFc-область. scFc-область содержит по меньшей мере две константные области иммуноглобулина или их части (например, Fc-компоненты или домены (например, 2, 3, 4, 5, 6 или более Fc-компонентов или доменов)) в пределах одной и той же линейной полипептидной цепи, которые способны к сворачиванию (например, внутримолекулярному или межмолекулярному сворачиванию) с образованием одной функциональной scFc-области, при этом они связаны пептидным линкером для Fc. Например, в одном варианте осуществления полипептид по настоящему изобретению через свою scFc-область способен связываться с по меньшей мере одним Fc-рецептором (например, FcRn, рецептором FcγR (например, FcγRIII) или белком системы комплемента (например, C1q)) для увеличения периода полужизни или запуска иммунной эффекторной функции (например, антителозависимой цитотоксичности (ADCC), фагоцитоза или комплементзависимой цитотоксичности (CDCC)) и/или для улучшения технологичности.
3. CTP
[384] В другом аспекте гетерологичный компонент содержит один C-концевой пептид (CTP) β-субъединицы хорионического гонадотропина человека или его фрагмент, вариант или производное. Известно, что один или несколько CTP-пептидов, вставленных в рекомбинантный белок, увеличивают период полужизни in vivo этого белка. См., например, патент США № 5712122, включенный в данный документ посредством ссылки во всей своей полноте.
[385] Иллюстративные CTP-пептиды включают DPRFQDSSSSKAPPPSLPSPSRLPGPSDTPIL (SEQ ID NO: 33) или SSSSKAPPPSLPSPSRLPGPSDTPILPQ (SEQ ID NO: 34). См., например, публикацию заявки на патент США № US 2009/0087411 A1, включенную посредством ссылки.
4. Последовательность XTEN
[386] В некоторых вариантах осуществления гетерологичный компонент содержит одну или несколько последовательностей XTEN, их фрагментов, вариантов или производных. Как используется в данном документе, "последовательность XTEN" относится к полипептидам увеличенной длины с не встречающимися в природе по сути неповторяющимися последовательностями, которые состоят в основном из небольших гидрофильных аминокислот, при этом последовательность характеризуется низкой степенью образования или отсутствием вторичной или третичной структуры при физиологических условиях. Являясь гетерологичным компонентом, XTEN могут служить в качестве компонента, удлиняющего период полужизни. Кроме того, XTEN может обеспечивать необходимые свойства, в том числе без ограничения улучшенные фармакокинетические параметры и характеристики растворимости.
[387] Встраивание гетерологичного компонента, содержащего последовательность XTEN, в белок по настоящему изобретению может придавать белку одно или несколько из следующих преимущественных свойств: конформационную гибкость, повышенную растворимость в воде, высокую степень устойчивости к протеазам, низкую иммуногенность, низкую степень связывания с рецепторами млекопитающих или увеличенные значения гидродинамического радиуса (или радиуса Стокса).
[388] В некоторых аспектах последовательность XTEN может обеспечивать улучшение фармакокинетических свойств, как, например, увеличение длительности периода полужизни in vivo или увеличение площади под кривой (AUC), так что белок по настоящему изобретению остается in vivo и обладает прокоагулянтной активностью в течение увеличенного периода времени по сравнению с таким же белком, но без гетерологичного компонента XTEN.
[389] В некоторых вариантах осуществления последовательность XTEN, применимая в настоящем изобретении, представляет собой пептид или полипептид, содержащий более приблизительно 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800 или 2000 аминокислотных остатков. В определенных вариантах осуществления XTEN представляет собой пептид или полипептид, содержащий более чем от приблизительно 20 до приблизительно 3000 аминокислотных остатков, более чем от 30 до приблизительно 2500 остатков, более чем от 40 до приблизительно 2000 остатков, более чем от 50 до приблизительно 1500 остатков, более чем от 60 до приблизительно 1000 остатков, более чем от 70 до приблизительно 900 остатков, более чем от 80 до приблизительно 800 остатков, более чем от 90 до приблизительно 700 остатков, более чем от 100 до приблизительно 600 остатков, более чем от 110 до приблизительно 500 остатков или более чем от 120 до приблизительно 400 остатков. В одном конкретном варианте осуществления XTEN содержит аминокислотную последовательность длиной более 42 аминокислоты и менее 144 аминокислоты.
[390] Последовательность XTEN по настоящему изобретению может содержать один или несколько мотивов последовательности из 5-14 (например, 9-14) аминокислотных остатков или аминокислотную последовательность, которая на по меньшей мере 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% идентична мотиву последовательности, где мотив содержит 4-6 типов аминокислот (например, 5 аминокислот), выбранных из группы, состоящей из глицина (G), аланина (A), серина (S), треонина (T), глутамата (E) и пролина (P), состоит по сути из них или состоит из них. См. US 2010-0239554 A1.
[391] В некоторых вариантах осуществления XTEN содержит неперекрывающиеся мотивы последовательностей, в которых приблизительно 80%, или по меньшей мере приблизительно 85%, или по меньшей мере приблизительно 90%, или приблизительно 91%, или приблизительно 92%, или приблизительно 93%, или приблизительно 94%, или приблизительно 95%, или приблизительно 96%, или приблизительно 97%, или приблизительно 98%, или приблизительно 99%, или приблизительно 100% последовательности состоит из нескольких звеньев неперекрывающихся последовательностей, выбранных из одного семейства мотивов, выбранного из таблицы 7, что в результате дает последовательность, характерную для определенного семейства. Используемый в данном документе термин "семейство" означает, что XTEN содержит мотивы, выбранные только из одной категории мотивов из таблицы 7, т. е. XTEN на основе AD, AE, AF, AG, AM, AQ, BC или BD, и что любые другие аминокислоты в XTEN, не относящиеся к мотиву из семейства, выбраны для достижения необходимого свойства, как, например, для обеспечения встраивания сайта для рестриктаз рядом с кодирующими нуклеотидами, встраивания последовательности для расщепления или для достижения лучшего связывания с терапевтическим белком. В некоторых вариантах осуществления семейств XTEN последовательность XTEN содержит несколько звеньев неперекрывающихся мотивов последовательностей из семейства мотивов AD, или семейства мотивов AE, или семейства мотивов AF, или семейства мотивов AG, или семейства мотивов AM, или семейства мотивов AQ, или семейства BC, или семейства BD, в результате чего XTEN демонстрирует диапазон гомологии, описанный выше. В других вариантах осуществления XTEN содержит несколько звеньев последовательностей мотивов из двух или более семейств мотивов из таблицы 7. Эти последовательности могут быть выбраны для достижения необходимых физических/химических характеристик, в том числе таких свойств, как суммарный заряд, гидрофильность, отсутствие вторичной структуры или отсутствие повторяемости, которые определяются аминокислотным составом мотивов, которые более полно описаны ниже. В вариантах осуществления, описанных выше в данном абзаце данного документа, мотивы, встраиваемые в XTEN, могут быть отобраны и собраны с применением способов, описанных в данном документе, для получения XTEN из от приблизительно 36 до приблизительно 3000 аминокислотных остатков.
Таблица 7. Мотивы последовательностей XTEN из 12 аминокислот и семейства мотивов
* Обозначает отдельные последовательности мотивов, которые при совместном применении в различных перестановках дают в результате "последовательность, характерную для определенного семейства".
[392] Примеры последовательностей XTEN, которые можно применять в качестве гетерологичных компонентов в терапевтических белках по настоящему изобретению, раскрыты, например, в публикациях заявок на патент США №№ 2010/0239554 A1, 2010/0323956 A1, 2011/0046060 A1, 2011/0046061 A1, 2011/0077199 A1 или 2011/0172146 A1 или публикациях международных заявок на патент №№ WO 2010091122 A1, WO 2010144502 A2, WO 2010144508 A1, WO 2011028228 A1, WO 2011028229 A1 или WO 2011028344 A2, каждая из которых включена в данный документ посредством ссылки во всей своей полноте.
[393] XTEN может иметь различную длину в случае вставки в терапевтический белок или связывания с ним. В одном варианте осуществления длину последовательности(последовательностей) XTEN выбирают с учетом свойства или функции, которые должны быть достигнуты в слитом белке. В зависимости от предполагаемого свойства или функции XTEN может представлять собой короткую последовательность, или последовательность средней длины, или более длинную последовательность, которые могут служить в качестве носителей. В определенных вариантах осуществления XTEN включает короткие сегменты из от приблизительно 6 до приблизительно 99 аминокислотных остатков, сегменты средней длины из от приблизительно 100 до приблизительно 399 аминокислотных остатков и более длинные сегменты из от приблизительно 400 до приблизительно 1000 и не более чем приблизительно 3000 аминокислотных остатков. Таким образом, XTEN, вставленный в терапевтический белок или связанный с ним, может иметь длину, составляющую приблизительно 6, приблизительно 12, приблизительно 36, приблизительно 40, приблизительно 42, приблизительно 72, приблизительно 96, приблизительно 144, приблизительно 288, приблизительно 400, приблизительно 500, приблизительно 576, приблизительно 600, приблизительно 700, приблизительно 800, приблизительно 864, приблизительно 900, приблизительно 1000, приблизительно 1500, приблизительно 2000, приблизительно 2500 или не более чем приблизительно 3000 аминокислотных остатков. В других вариантах осуществления длина последовательностей XTEN составляет от приблизительно 6 до приблизительно 50, от приблизительно 50 до приблизительно 100, от приблизительно 100 до 150, от приблизительно 150 до 250, от приблизительно 250 до 400, от приблизительно 400 до приблизительно 500, от приблизительно 500 до приблизительно 900, от приблизительно 900 до 1500, от приблизительно 1500 до 2000 или от приблизительно 2000 до приблизительно 3000 аминокислотных остатков. Точная длина XTEN, вставленного в терапевтический белок или связанного с ним, может варьироваться, не оказывая при этом отрицательного влияния на активность терапевтического белка. В одном варианте осуществления один или несколько из XTEN, применяемых в данном документе, имеют длину 42 аминокислоты, 72 аминокислоты, 144 аминокислоты, 288 аминокислот, 576 аминокислот или 864 аминокислоты и могут быть выбраны из одной или нескольких последовательностей, характерных для определенного семейства XTEN, т. е. AD, AE, AF, AG, AM, AQ, BC или BD.
[394] В некоторых вариантах осуществления терапевтический белок содержит полипептид FVIII и XTEN, где XTEN содержит 288 аминокислот. В одном варианте осуществления терапевтический белок содержит полипептид FVIII и XTEN, где XTEN содержит 288 аминокислот, и XTEN вставлен в пределах домена B полипептида FVIII. В одном конкретном варианте осуществления терапевтический белок содержит полипептид FVIII и XTEN, содержащий SEQ ID NO:109, и XTEN вставлен в пределах домена B полипептида FVIII. В одном конкретном варианте осуществления терапевтический белок содержит полипептид FVIII и XTEN, содержащий SEQ ID NO:109, и XTEN вставлен в пределах полипептида FVIII непосредственно ниже аминокислоты 745 зрелого FVIII.
[395] В некоторых вариантах осуществления терапевтический белок содержит полипептид FIX и XTEN, где XTEN содержит 72 аминокислоты. В одном варианте осуществления терапевтический белок содержит полипептид FIX и XTEN, где XTEN содержит 72 аминокислоты, и XTEN вставлен в пределах полипептида FIX непосредственно ниже аминокислоты 166 зрелого FIX.
[396] В некоторых вариантах осуществления последовательность XTEN, применяемая в настоящем изобретении, на по меньшей мере 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности, выбранной из группы, состоящей из AE42, AG42, AE48, AM48, AE72, AG72, AE108, AG108, AE144, AF144, AG144, AE180, AG180, AE216, AG216, AE252, AG252, AE288, AG288, AE324, AG324, AE360, AG360, AE396, AG396, AE432, AG432, AE468, AG468, AE504, AG504, AF504, AE540, AG540, AF540, AD576, AE576, AF576, AG576, AE612, AG612, AE624, AE648, AG648, AG684, AE720, AG720, AE756, AG756, AE792, AG792, AE828, AG828, AD836, AE864, AF864, AG864, AM875, AE912, AM923, AM1318, BC864, BD864, AE948, AE1044, AE1140, AE1236, AE1332, AE1428, AE1524, AE1620, AE1716, AE1812, AE1908, AE2004A, AG948, AG1044, AG1140, AG1236, AG1332, AG1428, AG1524, AG1620, AG1716, AG1812, AG1908, AG2004 и любой их комбинации. См. US 2010-0239554 A1. В одном конкретном варианте осуществления XTEN содержит AE42, AE72, AE144, AE288, AE576, AE864, AG 42, AG72, AG144, AG288, AG576, AG864, или любую их комбинацию.
[397] Иллюстративные последовательности XTEN, которые можно применять в качестве гетерологичных компонентов в терапевтическом белке по настоящему изобретению, включают XTEN AE42-4 (SEQ ID NO: 46, кодируемую SEQ ID NO: 47), XTEN AE144-2A (SEQ ID NO: 48, кодируемую SEQ ID NO: 49), XTEN AE144-3B (SEQ ID NO: 50, кодируемую SEQ ID NO: 51), XTEN AE144-4A (SEQ ID NO: 52, кодируемую SEQ ID NO: 53), XTEN AE144-5A (SEQ ID NO: 54, кодируемую SEQ ID NO: 55), XTEN AE144-6B (SEQ ID NO: 56, кодируемую SEQ ID NO: 57), XTEN AG144-1 (SEQ ID NO: 58, кодируемую SEQ ID NO: 59), XTEN AG144-A (SEQ ID NO: 60, кодируемую SEQ ID NO: 61), XTEN AG144-B (SEQ ID NO: 62, кодируемую SEQ ID NO: 63), XTEN AG144-C (SEQ ID NO: 64, кодируемую SEQ ID NO: 65), а также XTEN AG144-F (SEQ ID NO: 66, кодируемую SEQ ID NO: 67). В одном конкретном варианте осуществления XTEN кодируется SEQ ID NO:18.
[398] В другом варианте осуществления последовательность XTEN выбрана из группы, состоящей из AE36 (SEQ ID NO: 130), AE42 (SEQ ID NO: 131), AE72 (SEQ ID NO: 132), AE78 (SEQ ID NO: 133), AE144 (SEQ ID NO: 134), AE144_2A (SEQ ID NO: 48), AE144_3B (SEQ ID NO: 50), AE144_4A (SEQ ID NO: 52), AE144_5A (SEQ ID NO: 54), AE144_6B (SEQ ID NO: 135), AG144 (SEQ ID NO: 136), AG144_A (SEQ ID NO: 137), AG144_B (SEQ ID NO: 62), AG144_C (SEQ ID NO: 64), AG144_F (SEQ ID NO: 66), AE288 (SEQ ID NO: 138), AE288_2 (SEQ ID NO: 139), AG288 (SEQ ID NO: 140), AE576 (SEQ ID NO: 141), AG576 (SEQ ID NO: 142), AE864 (SEQ ID NO: 143), AG864 (SEQ ID NO: 144), XTEN_AE72_2A_1 (SEQ ID NO:145), XTEN_AE72_2A_2 (SEQ ID NO: 146), XTEN_AE72_3B_1 (SEQ ID NO: 147), XTEN_AE72_3B_2 (SEQ ID NO: 148), XTEN_AE72_4A_2 (SEQ ID NO: 149), XTEN_AE72_5A_2 (SEQ ID NO: 150), XTEN_AE72_6B_1 (SEQ ID NO: 151), XTEN_AE72_6B_2 (SEQ ID NO: 152), XTEN_AE72_1A_1 (SEQ ID NO: 153), XTEN_AE72_1A_2 (SEQ ID NO: 154), XTEN_AE144_1A (SEQ ID NO: 155), AE150 (SEQ ID NO: 156), AG150 (SEQ ID NO: 157), AE294 (SEQ ID NO: 158), AG294 (SEQ ID NO: 159) и любых их комбинаций. В конкретном варианте осуществления последовательность XTEN выбрана из группы, состоящей из AE72, AE144 и AE288. Аминокислотные последовательности для определенных последовательностей XTEN по настоящему изобретению показаны в таблице 8.
Таблица 8. Последовательности XTEN
(SEQ ID NO: 130)
(SEQ ID NO: 131)
(SEQ ID NO: 132)
(SEQ ID NO: 133)
(SEQ ID NO: 134)
(SEQ ID NO: 135)
(SEQ ID NO:136)
(SEQ ID NO: 137)
(SEQ ID NO: 138)
(SEQ ID NO: 139)
(SEQ ID NO: 140)
(SEQ ID NO: 141)
(SEQ ID NO: 142)
(SEQ ID NO: 143)
(SEQ ID NO: 144)
(SEQ ID NO: 145)
(SEQ ID NO: 146)
(SEQ ID NO:147)
(SEQ ID NO: 148)
(SEQ ID NO: 149)
(SEQ ID NO: 150)
(SEQ ID NO: 152)
(SEQ ID NO: 153)
(SEQ ID NO: 154)
(SEQ ID NO: 155)
(SEQ ID NO: 156)
(SEQ ID NO: 157)
(SEQ ID NO: 158)
(SEQ ID NO: 159)
[399] В некоторых вариантах осуществления менее 100% аминокислот XTEN выбраны из глицина (G), аланина (A), серина (S), треонина (T), глутамата (E) и пролина (P) или менее чем 100% последовательности состоит из мотивов последовательностей из таблицы 7 или последовательностей XTEN, представленных в данном документе. В таких вариантах осуществления остальные аминокислотные остатки XTEN выбраны из любых других 14 природных L-аминокислот, но могут быть предпочтительно выбраны из гидрофильных аминокислот, так чтобы последовательность XTEN содержала по меньшей мере приблизительно 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или по меньшей мере приблизительно 99% гидрофильных аминокислот. Содержание гидрофобных аминокислот в XTEN, используемом в конструкциях для конъюгации, может представлять собой содержание гидрофобных аминокислот, составляющее менее 5%, или менее 2%, или менее 1%. Гидрофобные остатки, которые являются менее предпочтительными при конструировании XTEN, включают триптофан, фенилаланин, тирозин, лейцин, изолейцин, валин и метионин. Кроме того, последовательности XTEN могут содержать менее 5%, или менее 4%, или менее 3%, или менее 2%, или менее 1%, или не содержать следующих аминокислот: метионина (например, во избежание окисления) или аспарагина и глутамина (во избежание дезамидирования).
[400] Одна или несколько последовательностей XTEN могут быть вставлены на С-конце или на N-конце терапевтического белка или вставлены между двумя аминокислотами в аминокислотной последовательности терапевтического белка. Например, если терапевтический белок содержит полипептид FVIII, XTEN может быть вставлен между двумя аминокислотами в одном или нескольких сайтах вставки, выбранных из таблицы 5. Если терапевтический белок содержит полипептид FIX, XTEN может быть вставлен между двумя аминокислотами в одном или нескольких сайтах вставки, выбранных из таблицы 5.
[401] Дополнительные примеры последовательностей XTEN, которые можно применять согласно настоящему изобретению, раскрыты в публикациях заявок на патент США №№ 2010/0239554 A1, 2010/0323956 A1, 2011/0046060 A1, 2011/0046061 A1, 2011/0077199 A1 или 2011/0172146 A1 или международных заявках на патент №№ WO 2010091122 A1, WO 2010144502 A2, WO 2010144508 A1, WO 2011028228 A1, WO 2011028229 A1, WO 2011028344 A2, WO 2014/011819 A2 или WO 2015/023891.
5. Альбумин или его фрагмент, производное или его вариант
[402] В некоторых вариантах осуществления гетерологичный компонент включает альбумин или его функциональный фрагмент. Сывороточный альбумин человека (HSA или HA), белок из 609 аминокислот в своей полноразмерной форме, отвечает за значительную долю осмотического давления сыворотки крови, а также выполняет функцию носителя эндогенных и экзогенных лигандов. Термин "альбумин", используемый в данном документе, включает полноразмерный альбумин или его функциональный фрагмент, вариант, производное или аналог. Примеры альбумина или его фрагментов или вариантов раскрыты в публикациях заявок на патент США №№ 2008/0194481A1, 2008/0004206 A1, 2008/0161243 A1, 2008/0261877 A1 или 2008/0153751 A1 или в публикациях заявок согласно PCT №№ 2008/033413 A2, 2009/058322 A1 или 2007/021494 A2, которые включены в данный документ посредством ссылки во всей своей полноте.
[403] В одном варианте осуществления терапевтический белок по настоящему изобретению содержит альбумин, его фрагмент или вариант, которые дополнительно связаны со вторым гетерологичным компонентом, выбранным из группы, состоящей из константной области иммуноглобулина или ее части (например, Fc-области), последовательности PAS, HES, PEG и любой их комбинации.
6. Альбумин-связывающий компонент
[404] В определенных вариантах осуществления гетерологичный компонент представляет собой альбумин-связывающий компонент, который включает альбумин-связывающий пептид, бактериальный альбумин-связывающий домен, фрагмент альбумин-связывающего антитела или любые их комбинации.
[405] Например, альбумин-связывающий белок может представлять собой бактериальный альбумин-связывающий белок, антитело или фрагмент антитела, в том числе доменные антитела (см. патент США № 6696245). Альбумин-связывающий белок, например, может представлять собой бактериальный альбумин-связывающий домен, такой как домен стрептококкового белка G (Konig, T. и Skerra, A. (1998) J. Immunol. Methods 218, 73-83). Другими примерами альбумин-связывающих пептидов, которые можно применять в качестве партнера по конъюгации, являются, например, пептиды, имеющие консенсусную последовательность Cys-Xaa1-Xaa2-Xaa3-Xaa4-Cys, где Xaa1 представляет собой Asp, Asn, Ser, Thr или Trp; Xaa2 представляет собой Asn, Gln, His, Ile, Leu или Lys; Xaa3 представляет собой Ala, Asp, Phe, Trp или Tyr; и Xaa4 представляет собой Asp, Gly, Leu, Phe, Ser или Thr, как описано в заявке на патент США 2003/0069395 или у Dennis et al. (Dennis et al. (2002) J. Biol. Chem. 277, 35035-35043).
[406] Домен 3 из стрептококкового белка G, раскрытого в Kraulis et al., FEBS Lett. 378:190-194 (1996) и Linhult et al., Protein Sci. 11:206-213 (2002), является примером бактериального альбумин-связывающего домена. Примеры альбумин-связывающих пептидов включают ряд пептидов, содержащих коровую последовательность DICLPRWGCLW (SEQ ID NO: 35). См., например, Dennis et al., J. Biol. Chem. 2002, 277: 35035-35043 (2002). Примеры фрагментов альбумин-связывающих антител раскрыты в Muller and Kontermann, Curr. Opin. Mol. Ther. 9:319-326 (2007); Roovers et al., Cancer Immunol. Immunother. 56:303-317 (2007) и Holt et al., Prot. Eng. Design Sci., 21:283-288 (2008), которые включены в данный документ посредством ссылки во всей своей полноте. Примером такого альбумин-связывающего компонента является 2-(3-малеимидопропанамидо)-6-(4-(4-йодфенил)бутанамидо)гексаноат (метка "Albu"), раскрытый в Trussel et al., Bioconjugate Chem. 20:2286-2292 (2009).
[407] Жирные кислоты, в частности длинноцепочечные жирные кислоты (LCFA) и альбумин-связывающие соединения, подобные длинноцепочечным жирным кислотам, могут применяться для удлинения периода полужизни in vivo белков, представляющих собой факторы свертывания крови, по настоящему изобретению. Примером LCFA-подобного альбумин-связывающего соединения является 16-(1-(3-(9-(((2,5-диоксопирролидин-1-илокси)карбонилокси)метил)-7-сульфо-9H-флуорен-2-иламино)-3-оксопропил)-2,5-диоксопирролидин-3-илтио)гексадекановая кислота (см., например, WO 2010/140148).
7. Последовательность PAS
[408] В других вариантах осуществления гетерологичный компонент представляет собой последовательность PAS. Последовательность PAS, используемая в данном документе, означают аминокислотную последовательность, содержащую в основном остатки аланина и серина или содержащую в основном остатки аланина, серина и пролина, при этом аминокислотная последовательность образует случайную спиральную конформацию при физиологических условиях. Соответственно, последовательность PAS представляет собой структурный блок, полимер из аминокислот или последовательность-кассету, которые содержат аланин, серин и пролин, состоят по сути из них или состоят из них, которые можно применять в качестве части гетерологичного компонента в химерном белке. Тем не менее, специалист в данной области техники знает, что полимер из аминокислот также может образовывать случайную спиральную конформацию при добавлении в последовательность PAS остатков, отличных от аланина, серина и пролина, в качестве дополнительного составляющего. Используемый в данном документе термин "дополнительное составляющее" означает, что аминокислоты, отличные от аланина, серина и пролина, могут быть добавлены в последовательность PAS в определенной мере, например, в количестве не более чем приблизительно 12%, т. е. приблизительно 12 из 100 аминокислот последовательности PAS, не более чем приблизительно 10%, т. е. приблизительно 10 из 100 аминокислот последовательности PAS, не более чем приблизительно 9%, т. е. приблизительно 9 из 100 аминокислот, не более чем приблизительно 8%, т. е. приблизительно 8 из 100 аминокислот, приблизительно 6%, т. е. приблизительно 6 из 100 аминокислот, приблизительно 5%, т. е. приблизительно 5 из 100 аминокислот, приблизительно 4%, т. е. приблизительно 4 из 100 аминокислот, приблизительно 3%, т. е. приблизительно 3 из 100 аминокислот, приблизительно 2%, т. е. приблизительно 2 из 100 аминокислот, приблизительно 1%, т. е. приблизительно 1 из 100 аминокислот. Аминокислоты, отличные от аланина, серина и пролина, могут быть выбраны из группы, состоящей из Arg, Asn, Asp, Cys, Gln, Glu, Gly, His, Ile, Leu, Lys, Met, Phe, Thr, Trp, Tyr и Val.
[409] При физиологических условиях отрезок последовательности PAS образует случайную спиральную конформацию и тем самым может опосредовать увеличение стабильности in vivo и/или in vitro у белка, представляющего собой фактор свертывания крови. Поскольку домен со случайной спиральной конформацией не принимает стабильную структуру или функцию сам по себе, биологическая активность, опосредованная белком, представляющим собой фактор свертывания крови, по существу сохраняется. В других вариантах осуществления последовательности PAS, которые образуют домен со случайной спиральной конформацией, являются биологически инертными, особенно в отношении протеолиза в плазме крови, иммуногенности, изоэлектрической точки/электростатического поведения, связывания с рецепторами клеточной поверхности или интернализации, но по-прежнему являются биоразлагаемыми, что обеспечивает явные преимущества по сравнению с синтетическими полимерами, такими как PEG.
[410] Неограничивающие примеры последовательностей PAS, образующих случайную спиральную конформацию, включают аминокислотную последовательность, выбранную из группы, состоящей из ASPAAPAPASPAAPAPSAPA (SEQ ID NO: 36), AAPASPAPAAPSAPAPAAPS (SEQ ID NO: 37), APSSPSPSAPSSPSPASPSS (SEQ ID NO: 38), APSSPSPSAPSSPSPASPS (SEQ ID NO: 39), SSPSAPSPSSPASPSPSSPA (SEQ ID NO: 40), AASPAAPSAPPAAASPAAPSAPPA (SEQ ID NO: 41), ASAAAPAAASAAASAPSAAA (SEQ ID NO: 42) и любых их комбинаций. Дополнительные примеры последовательностей PAS известны, например, из публикации заявки на патент США № 2010/0292130 A1 и публикации заявки согласно PCT № WO 2008/155134 A1.
8. Последовательность HAP
[411] В определенных вариантах осуществления гетерологичный компонент представляет собой богатый глицином гомополимер из аминокислот (HAP). Последовательность HAP может содержать последовательность из повторяющихся остатков глицина, которая имеет длину, составляющую по меньшей мере 50 аминокислот, по меньшей мере 100 аминокислот, 120 аминокислот, 140 аминокислот, 160 аминокислот, 180 аминокислот, 200 аминокислот, 250 аминокислот, 300 аминокислот, 350 аминокислот, 400 аминокислот, 450 аминокислот или 500 аминокислот. В одном варианте осуществления последовательность HAP способна обеспечивать удлинение периода полужизни компонента, слитого или связанного с последовательностью HAP. Неограничивающие примеры последовательности HAP включают без ограничения (Gly)n, (Gly4Ser)n или S(Gly4Ser)n, где n равняется 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20. В одном варианте осуществления n равняется 20, 21, 22, 23, 24, 25, 26, 26, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 или 40. В другом варианте осуществления n равняется 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 или 200. .
9. Трансферрин или его фрагмент
[412] В определенных вариантах осуществления гетерологичный компонент представляет собой трансферрин или его фрагмент. Можно применять любой трансферрин для получения белков, представляющих собой факторы свертывания крови, по настоящему изобретению. В качестве примера TF человека дикого типа (TF) представляет собой белок из 679 аминокислот массой примерно 75 кДа (без учета гликозилирования) с двумя основными доменами, N (приблизительно 330 аминокислот) и C (приблизительно 340 аминокислот), которые, по-видимому, произошли в результате дупликации гена. См. номера доступа в GenBank NM001063, XM002793, M12530, XM039845, XM 039847 и S95936 (www.ncbi.nlm.nih.gov/), все из которых включены в данный документ посредством ссылки во всей своей полноте. Трансферрин содержит два домена: домен N и домен C. Домен N содержит два субдомена: домен N1 и домен N2, а домен C содержит два субдомена: домен C1 и домен C2.
[413] В одном варианте осуществления гетерологичный компонент трансферрин включает сплайс-вариант трансферрина. В одном примере сплайс-вариант трансферрина может представлять собой сплайс-вариант трансферрина человека, например, с номером доступа в Genbank AAA61140. В другом варианте осуществления часть химерного белка, представляющая собой трансферрин, включает один или несколько доменов последовательности трансферрина, например, домен N, домен C, домен N1, домен N2, домен C1, домен C2 или любые их комбинации.
10. Рецепторы, опосредующие выведение
[414] В определенных вариантах осуществления гетерологичный компонент представляет собой рецептор, опосредующий выведение, его фрагмент, вариант или производное. LRP1 представляет собой интегральный мембранный белок массой 600 кДа, который участвует в рецептор-опосредованном выведении различных белков, таких как фактор X. См., например, Narita et al., Blood 91:555-560 (1998).
11. Фактор фон Виллебранда или его фрагменты
[415] В определенных вариантах осуществления гетерологичный компонент представляет собой фактор фон Виллебранда (VWF) или один или несколько его фрагментов.
[416] VWF (также известный как F8VWF) представляет собой крупный мультимерный гликопротеин, присутствующий в плазме крови и продуцируемый конститутивно в эндотелии (в тельцах Вайбеля-Паладе), мегакариоцитах (α-гранулах тромбоцитов) и субэндотелиальной соединительной ткани. Основным мономером VWF является белок из 2813 аминокислот. Каждый мономер содержит ряд специфических доменов с конкретной функцией - домены D' и D3 (которые связываются с фактором VIII), домен A1 (который связывается с тромбоцитарным рецептором GPIb, гепарином и/или, возможно, коллагеном), домен A3 (который связывается с коллагеном), домен C1 (в котором домен RGD связывается с тромбоцитарным интегрином αIIbβ3, когда он активирован) и домен "цистеиновый узел" на C-конце белка (который является общим для VWF и тромбоцитарного фактора роста (PDGF), трансформирующего фактора роста β (TGFβ) и β-субъединицы хорионического гонадотропина человека (βHCG)).
[417] Последовательность мономерного VWF человека из 2813 аминокислот приведена в Genbank под номером доступа NP000543.2. Нуклеотидная последовательность, кодирующая VWF человека, приведена в Genbank под номером доступа NM000552.3. SEQ ID NO: 129 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 128. Домен D' включает аминокислоты с 764 по 866 из SEQ ID NO: 129. Домен D3 включает аминокислоты с 867 по 1240 из SEQ ID NO: 44.
[418] В плазме крови 95-98% молекул FVIII циркулируют в виде плотного нековалентного комплекса с полноразмерным VWF. Образование этого комплекса важно для поддержания надлежащих уровней FVIIII в плазме крови in vivo. Lenting et al., Blood. 92(11): 3983-96 (1998); Lenting et al., J. Thromb. Haemost. 5(7): 1353-60 (2007). При активации FVIII вследствие протеолиза в положениях 372 и 740 в тяжелой цепи и в положении 1689 в легкой цепи VWF, связанный с FVIII, удаляется от активированного FVIII.
[419] В определенных вариантах осуществления гетерологичный компонент представляет собой полноразмерный фактор фон Виллебранда. В других вариантах осуществления гетерологичный фрагмент представляет собой фрагмент фактора фон Виллебранда. Используемый в данном документе термин "фрагмент VWF" или "фрагменты VWF" означает любые фрагменты VWF, которые взаимодействуют с FVIII и сохраняют по меньшей мере одно или несколько свойств, которые обычно обеспечиваются у FVIII благодаря полноразмерному VWF, например, предотвращение преждевременной активации до FVIIIa, предотвращение преждевременного протеолиза, предотвращение ассоциации с фосфолипидными мембранами, которая может привести к преждевременному выведению, предотвращение связывания с рецепторами, опосредующими выведение FVIII, которые могут связываться с "голым" FVIII, но не с FVIII, связанным с VWF, и/или стабилизацию взаимодействий тяжелой цепи и легкой цепи FVIII. В конкретном варианте осуществления гетерологичный компонент представляет собой фрагмент (VWF), содержащий домен D' и домен D3 VWF. Фрагмент VWF, содержащий домен D' и домен D3, может дополнительно содержать домен VWF, выбранный из группы, состоящей из домена A1, домена A2, домена A3, домена D1, домена D2, домена D4, домена B1, домена B2, домена B3, домена C1, домена C2, домена CK, одного или нескольких их фрагментов и любых их комбинаций. Дополнительные примеры полипептида, характеризующегося активностью FVIII, слитого с фрагментом VWF, раскрыты в предварительной заявке на патент США № 61/667901, поданной 3 июля 2012 г., и публикации заявки на патент США № 2015/0023959 А1, обе из которых включены в данный документ посредством ссылки во всей своей полноте.
12. Линкерные компоненты
[420] В определенных вариантах осуществления гетерологичный компонент представляет собой пептидный линкер.
[421] Используемые в данном документе термины "пептидные линкеры" или "линкерные компоненты" относятся к пептидной или полипептидной последовательности (например, синтетической пептидной или полипептидной последовательности), которая соединяет два домена в линейную аминокислотную последовательность полипептидной цепи.
[422] В некоторых вариантах осуществления пептидные линкеры могут быть вставлены между терапевтическим белком по настоящему изобретению и гетерологичным компонентом, описанным выше, таким как альбумин. Пептидные линкеры могут обеспечивать гибкость для молекулы химерного полипептида. Обычно линкеры не расщепляются, однако такое расщепление может быть желательным. В одном варианте осуществления эти линкеры не удаляются во время процессинга.
[423] Тип линкера, который может присутствовать в химерном белке по настоящему изобретению, представляет собой линкер, расщепляемый протеазами, который содержит сайт расщепления (т. е. субстрат с сайтом расщепления протеазами, например, фактор XIa, Xa, или сайт расщепления тромбином) и который может содержать дополнительные линкеры с N-концевой, с С-концевой либо с обеих сторон от сайта расщепления. Эти расщепляемые линкеры при встраивании в конструкцию по настоящему изобретению дают в результате химерную молекулу, имеющую гетерологичный сайт расщепления.
[424] В одном варианте осуществления терапевтический белок, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению, содержит два или более Fc-домена или компонента, связанных с помощью cscFc-линкера с образованием Fc-области, содержащейся в одной полипептидной цепи. cscFc-линкер фланкирован по меньшей мере одним сайтом внутриклеточного процессинга, т. е. сайтом, расщепляемым внутриклеточным ферментом. Расщепление полипептида в по меньшей мере одном сайте внутриклеточного процессинга приводит к образованию полипептида, который содержит по меньшей мере две полипептидные цепи.
[425] В конструкции по настоящему изобретению необязательно могут применяться другие пептидные линкеры, например, для соединения белка, представляющего собой фактор свертывания крови, с Fc-областью. Некоторые иллюстративные линкеры, которые можно применять в связи с настоящим изобретением, включают, например, полипептиды, содержащие аминокислоты GlySer, более подробно описанные ниже.
[426] В одном варианте осуществления пептидный линкер является синтетическим, т. е. не встречающимся в природе. В одном варианте осуществления пептидный линкер включает пептиды (или полипептиды) (которые могут быть встречающимися или не встречающимися в природе), которые содержат аминокислотную последовательность, которая обеспечивает связывание или генетическое слияние первой линейной последовательности аминокислот и второй линейной последовательности аминокислот, с которой она в естественных условиях не связана или генетически не слита в природе. Например, в одном варианте осуществления пептидный линкер может содержать не встречающиеся в природе полипептиды, которые являются модифицированными формами встречающихся в природе полипептидов (например, содержат мутацию, такую как добавление, замена или делеция). В другом варианте осуществления пептидный линкер может содержать не встречающиеся в природе аминокислоты. В другом варианте осуществления пептидный линкер может содержать встречающиеся в природе аминокислоты, представленные в виде линейной последовательности, которая не встречается в природе. В еще одном варианте осуществления пептидный линкер может содержать встречающуюся в природе полипептидную последовательность.
[427] Например, в определенных вариантах осуществления пептидный линкер можно применять для слияния идентичных Fc-компонентов с образованием таким образом гомодимерной scFc-области. В других вариантах осуществления пептидный линкер можно применять для слияния различных Fc-компонентов (например, Fc-компонента дикого типа и варианта Fc-компонента) с образованием таким образом гетеродимерной scFc-области.
[428] В другом варианте осуществления пептидный линкер содержит линкер Gly-Ser или состоит из него. В одном варианте осуществления scFc или cscFc-линкер содержит по меньшей мере часть шарнирной области иммуноглобулина и линкер Gly-Ser. Используемый в данном документе термин "линкер Gly-Ser" относится к пептиду, который состоит из остатков глицина и серина. В определенных вариантах осуществления указанный линкер Gly-Ser может быть вставлен между двумя другими последовательностями пептидного линкера. В других вариантах осуществления линкер Gly-Ser присоединен на одном или обоих концах другой последовательности пептидного линкера. В еще одних вариантах осуществления два или более линкера Gly-Ser последовательно встроены в пептидный линкер. В одном варианте осуществления пептидный линкер по настоящему изобретению содержит по меньшей мере часть верхней части шарнирной области (например, полученной из молекулы IgG1, IgG2, IgG3 или IgG4), по меньшей мере часть средней части шарнирной области (например, полученной из молекулы IgG1, IgG2, IgG3 или IgG4) и серию аминокислотных остатков Gly/Ser.
[429] Пептидные линкеры по настоящему изобретению имеют длину, составляющую по меньшей мере одну аминокислоту, и могут иметь различную длину. В одном варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую от приблизительно 1 до приблизительно 50 аминокислот. Как используется в данном контексте, термин "приблизительно" обозначает +/- два аминокислотных остатка. Поскольку длина линкера должна представлять собой положительное целое число, длина от приблизительно 1 до приблизительно 50 аминокислот в длину означает длину от 1-3 до 48-52 аминокислот в длину. В другом варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую от приблизительно 10 до приблизительно 20 аминокислот. В другом варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую от приблизительно 15 до приблизительно 50 аминокислот. В другом варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую от приблизительно 20 до приблизительно 45 аминокислот. В другом варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую от приблизительно 15 до приблизительно 35 или от приблизительно 20 до приблизительно 30 аминокислот. В другом варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 500, 1000 или 2000 аминокислот. В одном варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую 20 или 30 аминокислот.
[430] В некоторых вариантах осуществления пептидный линкер может содержать по меньшей мере две, по меньшей мере три, по меньшей мере четыре, по меньшей мере пять, по меньшей мере 10, по меньшей мере 20, по меньшей мере 30, по меньшей мере 40, по меньшей мере 50, по меньшей мере 60, по меньшей мере 70, по меньшей мере 80, по меньшей мере 90 или по меньшей мере 100 аминокислот. В других вариантах осуществления пептидный линкер может содержать по меньшей мере 200, по меньшей мере 300, по меньшей мере 400, по меньшей мере 500, по меньшей мере 600, по меньшей мере 700, по меньшей мере 800, по меньшей мере 900 или по меньшей мере 1000 аминокислот. В некоторых вариантах осуществления пептидный линкер может содержать по меньшей мере приблизительно 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900 или 2000 аминокислот. Пептидный линкер может содержать 1-5 аминокислот, 1-10 аминокислот, 1-20 аминокислот, 10-50 аминокислот, 50-100 аминокислот, 100-200 аминокислот, 200-300 аминокислот, 300-400 аминокислот, 400-500 аминокислот, 500-600 аминокислот, 600-700 аминокислот, 700-800 аминокислот, 800-900 аминокислот или 900-1000 аминокислот.
[431] Пептидные линкеры можно вводить в полипептидные последовательности с помощью методик, известных из уровня техники. Модификации можно подтверждать с помощью анализа последовательности ДНК. Для трансформации клеток-хозяев для стабильного продуцирования получаемых полипептидов можно применять плазмидную ДНК.
13. Мономерно-димерные гибриды
[432] В некоторых вариантах осуществления терапевтический белок по настоящему изобретению содержит мономерно-димерную гибридную молекулу, содержащую фактор свертывания крови.
[433] Используемый в данном документе термин "мономерно-димерный гибрид" относится к химерному белку, содержащему первую полипептидную цепь и вторую полипептидную цепь, которые связаны друг с другом дисульфидной связью, где первая цепь содержит фактор свертывания крови, например, FVIII, и первую Fc-область, а вторая цепь содержит вторую Fc-область без фактора свертывания крови, состоит по сути из нее или состоит из нее. Таким образом, мономерно-димерная гибридная конструкция представляет собой гибрид, содержащий мономерный компонент, содержащий только один фактор свертывания крови, и димерный компонент, имеющий две Fc-области.
14. Последовательности, контролирующие экспрессию
[434] В некоторых вариантах осуществления молекула нуклеиновой кислоты по настоящему изобретению дополнительно содержит по меньшей мере одну последовательность, контролирующую экспрессию. Последовательность, контролирующая экспрессию, как используется в данном документе, представляет собой любую регуляторную нуклеотидную последовательность, такую как промоторная последовательность или комбинация промотор-энхансер, которая способствует эффективной транскрипции и трансляции кодирующей нуклеиновой кислоты, с которой она функционально связана. Например, молекула нуклеиновой кислоты по настоящему изобретению может быть функционально связана с по меньшей мере одной последовательностью, контролирующей транскрипцию. Последовательность, контролирующая экспрессию гена, может, например, представлять собой промотор млекопитающего или вируса, такой как конститутивный или индуцируемый промотор.
[435] Конститутивные промоторы млекопитающих включают без ограничения промоторы следующих генов: гипоксантин-фосфорибозилтрансферазы (HPRT), аденозиндезаминазы, пируваткиназы, промотор бета-актина и другие конститутивные промоторы. Иллюстративные вирусные промоторы, которые функционируют конститутивно в эукариотических клетках, включают, например, промоторы из цитомегаловируса (CMV), вируса обезьян (например, SV40), вируса папилломы, аденовируса, вируса иммунодефицита человека (HIV), вируса саркомы Рауса, цитомегаловируса, длинные концевые повторы (LTR) вируса лейкоза Молони и других ретровирусов, а также промотор тимидинкиназы вируса простого герпеса. Обычным специалистам в данной области техники известны другие конститутивные промоторы. Промоторы, применимые в качестве последовательностей, контролирующих экспрессию генов, согласно настоящему изобретению, также включают индуцируемые промоторы. Индуцируемые промоторы обеспечивают экспрессию в присутствии индуцирующего средства. Например, промотор металлотионеина индуцируется, способствуя транскрипции и трансляции, в присутствии определенных ионов металлов. Обычным специалистам в данной области техники известны другие индуцируемые промоторы.
[436] В одном варианте осуществления настоящее изобретение предусматривает экспрессию трансгена под контролем тканеспецифического промотора и/или энхансера. В другом варианте осуществления промотор или другая последовательность, контролирующая экспрессию, избирательно усиливают экспрессию трансгена в клетках печени. В определенных вариантах осуществления промотор или другая последовательность, контролирующая экспрессию, избирательно усиливают экспрессию трансгена в гепатоцитах, синусоидальных клетках и/или эндотелиальных клетках. В одном конкретном варианте осуществления промотор или другая последовательность, контролирующая экспрессию, избирательно усиливают экспрессию трансгена в эндотелиальных клетках. В определенных вариантах осуществления промотор или другая последовательность, контролирующая экспрессию, избирательно усиливают экспрессию трансгена в мышечных клетках, клетках центральной нервной системы, глаза, печени, сердца или любой их комбинации. Примеры специфических для печени промоторов включают без ограничения промотор тиретина мыши (mTTR), эндогенный промотор фактора VIII человека (F8), промотор альфа-1-антитрипсина человека (hAAT), минимальный промотор альбумина человека и промотор альбумина мыши. В одном конкретном варианте осуществления промотор предусматривает промотор mTTR. Промотор mTTR описан в R. H. Costa et al., 1986, Mol. Cell. Biol. 6:4697. Промотор F8 описан в Figueiredo and Brownlee, 1995, J. Biol. Chem. 270:11828-11838. В некоторых вариантах осуществления промотор выбран из специфического для печени промотора (например, α1-антитрипсина (AAT)), специфического для мышц промотора (например, мышечной креатинкиназы (MCK), тяжелой цепи миозина альфа (αMHC), миоглобина (MB) и десмина (DES)), синтетического промотора (например, SPc5-12, 2R5Sc5-12, dMCK и tMCK) и любой их комбинации.
[437] В одном варианте осуществления промотор выбран из группы, состоящей из промотора тиретина мыши (mTTR), эндогенного промотора фактора VIII человека (F8), промотора альфа-1-антитрипсина человека (hAAT), минимального промотора альбумина человека, промотора альбумина мыши, TTPp, промотора CASI, промотора CAG, промотора цитомегаловируса (CMV), промотора α1-антитрипсина (AAT), мышечной креатинкиназы (MCK), тяжелой цепи миозина альфа (αMHC), миоглобина (MB), десмина (DES), SPc5-12, 2R5Sc5-12, dMCK и tMCK, фосфоглицераткиназы (PGK) и любой их комбинации.
[438] Уровни экспрессии можно дополнительно повысить для достижения терапевтической эффективности с применением одного или нескольких энхансеров. Один или несколько энхансеров могут обеспечиваться отдельно или вместе с одним или несколькими промоторными элементами. Как правило, последовательность, контролирующая экспрессию, содержит множество энхансерных элементов и тканеспецифический промотор. В одном варианте осуществления энхансер содержит одну или несколько копий энхансера гена α-1-микроглобулина/бикунина (Rouet et al., 1992, J. Biol. Chem. 267:20765-20773; Rouet et al., 1995, Nucleic Acids Res. 23:395-404; Rouet et al., 1998, Biochem. J. 334:577-584; Ill et al., 1997, Blood Coagulation Fibrinolysis 8:S23-S30). В другом варианте осуществления энхансер получен из сайтов связывания специфических для печени факторов транскрипции, таких как EBP, DBP, HNF1, HNF3, HNF4, HNF6, при этом Enh1 содержит HNF1 (смысловая) - HNF3 (смысловая) - HNF4 (антисмысловая) - HNF1 (антисмысловая) - HNF6 (смысловая) - EBP (антисмысловая) - HNF4 (антисмысловая).
[439] В конкретном примере промотор, применимый для настоящего изобретения, содержит SEQ ID NO: 69 (т. е. промотор ET), который также известен под номером доступа в GenBank AY661265. См. также Vigna et al., Molecular Therapy 11(5):763 (2005). Примеры других подходящих векторов и регуляторных элементов генов описаны в WO 02/092134, EP 1395293 или патентах США №№ 6808905, 7745179 или 7179903, которые включены в данный документ посредством ссылки во всей своей полноте.
[440] В одном варианте осуществления молекула нуклеиновой кислоты по настоящему изобретению дополнительно содержит интронную последовательность. В некоторых вариантах осуществления интронная последовательность расположена в направлении 5'-конца относительно последовательности нуклеиновой кислоты, кодирующей полипептид FVIII. В некоторых вариантах осуществления интронная последовательность представляет собой встречающуюся в природе интронную последовательность. В некоторых вариантах осуществления интронная последовательность представляет собой синтетическую последовательность. В некоторых вариантах осуществления интронная последовательность получена из встречающейся в природе интронной последовательности. В определенных вариантах осуществления интронная последовательность содержит малый Т-интрон SV40. В одном варианте осуществления интронная последовательность содержит SEQ ID NO: 115.
[441] В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит посттранскрипционный регуляторный элемент. В определенных вариантах осуществления посттранскрипционный регуляторный элемент предусматривает мутантный посттранскрипционный регуляторный элемент вируса гепатита сурков (WPRE). В одном конкретном варианте осуществления посттранскрипционный регуляторный элемент содержит SEQ ID NO: 120.
[442] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит сайт связывания микроРНК (miRNA). В одном варианте осуществления сайт связывания miRNA представляет собой сайт связывания miRNA для miR-142-3p. В других вариантах осуществления сайт связывания miRNA выбран из сайта связывания miRNA, раскрытого в Rennie et al., RNA Biol. 13(6):554-560 (2016) и STarMirDB, доступной по ссылке http://sfold.wadsworth.org/starmirDB.php, которые включены в данный документ посредством ссылки во всей своей полноте.
[443] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит одну или несколько последовательностей, направляющих ДНК к ядру (DTS). DTS способствует транслокации молекул ДНК, содержащих такие последовательности, в ядро. В определенных вариантах осуществления DTS содержит энхансерную последовательность SV40. В определенных вариантах осуществления DTS содержит энхансерную последовательность c-Myc. В некоторых вариантах осуществления DTS расположены между первым ITR и вторым ITR. В некоторых вариантах осуществления DTS расположена в направлении 3'-конца относительно первого ITR и в направлении 5'-конца относительно терапевтического белка. В других вариантах осуществления DTS расположена в направлении 3'-конца относительно терапевтического белка и в направлении 5'-конца относительно второго ITR.
[444] В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит 3'-UTR-последовательность поли(A)-хвоста. В одном варианте осуществления 3'-UTR-последовательность поли(A)-хвоста предусматривает поли(A) bGH. В одном варианте осуществления 3'-UTR-последовательность поли(A)-хвоста предусматривает сайт поли(A) актина. В одном варианте осуществления 3'-UTR-последовательность поли(A)-хвоста предусматривает сайт поли(A) гемоглобина.
[445] В одном конкретном варианте осуществления 3'-UTR-последовательность поли(A)-хвоста содержит SEQ ID NO: 122.
III. Тканеспецифическая экспрессия
[446] В определенных вариантах осуществления будет полезно включить в вектор одну или несколько целевых последовательностей для miRNA, которые, например, функционально связаны с трансгеном, кодирующим фактор свертывания крови. Таким образом, в настоящем изобретении также предусмотрена по меньшей мере одна последовательность-мишень для miRNA, функционально связанная с нуклеотидной последовательностью, кодирующей фактор свертывания крови, или иным образом вставленная в вектор. Более чем одна копия целевой последовательности для miRNA, включенная в вектор, может повысить эффективность системы. Также включены различные целевые последовательности для miRNA. Например, в векторах, которые экспрессируют более одного трансгена, трансген может находиться под контролем более чем одной целевой последовательности для miRNA, которые могут быть одинаковыми или разными. Целевые последовательности для miRNA могут быть расположены в тандеме, но также включены другие схемы расположения. Трансгенная кассета экспрессии, содержащая целевую последовательность для miRNA, также может быть вставлена в вектор в антисмысловой ориентации. Антисмысловая ориентация может быть применима при получении вирусных частиц во избежание экспрессии продуктов генов, которые в противном случае могут быть токсичными для клеток-продуцентов. В других вариантах осуществления вектор содержит 1, 2, 3, 4, 5, 6, 7 или 8 копий одной и той же или разных целевых последовательностей для miRNA. Однако, в определенных других вариантах осуществления вектор не будет содержать какую-либо целевую последовательность для miRNA. Выбор того, следует ли включать целевую последовательность для miRNA (и в каком количестве), будет обусловлен известными параметрами, такими как предполагаемая целевая ткань, необходимый уровень экспрессии и т. д.
[447] В одном варианте осуществления целевая последовательность представляет собой мишень для miR-223, которая, как сообщалось, наиболее эффективно блокирует экспрессию в миелоидных коммитированных клетках-предшественниках и по меньшей мере частично в более примитивных HSPC. Мишень для miR-223 может блокировать экспрессию в дифференцированных миелоидных клетках, в том числе гранулоцитах, моноцитах, макрофагах, миелоидных дендритных клетках. Мишень для miR-223 также может быть подходящей для путей применения в генной терапии, что основывается на устойчивой экспрессии трансгена в лимфоидной или эритроидной линии дифференцировки. Мишень для miR-223 также может очень эффективно блокировать экспрессию в HSC человека.
[448] В другом варианте осуществления целевая последовательность представляет собой мишень для miR142 (tccataaagt aggaaacact aca (SEQ ID NO: 43)). В одном варианте осуществления вектор содержит 4 копии целевых последовательностей для miR-142. В определенных вариантах осуществления последовательность, комплементарная microRNA, специфичной для гемопоэтических клеток, такой как miR-142 (142T), встроена в 3'-нетранслируемую область вектора, например, лентивирусных векторов (LV), что делает транскрипт, кодируемый трансгеном, чувствительным к понижению экспрессии, опосредованному miRNA. Посредством данного способа можно предотвратить экспрессию трансгена в антигенпрезентирующих клетках (АРС) гемопоэтической линии дифференцировки с поддержанием при этом ее в клетках, отличных от гемопоэтических (Brown et al., Nat Med 2006). С помощью такой стратегии можно производить строгий посттранскрипционный контроль экспрессии трансгена и, таким образом, обеспечивать стабильную доставку и долговременную экспрессию трансгенов. В некоторых вариантах осуществления посредством регуляции с помощью miR-142 предотвращается иммуноопосредованное выведение трансдуцированных клеток и/или индуцируется образование антигенспецифических регуляторных T-клеток (Treg) и опосредуется устойчивая иммунологическая толерантность к антигену, кодируемому трансгеном.
[449] В некоторых вариантах осуществления целевая последовательность представляет собой мишень для miR181. В Chen C-Z and Lodish H, Seminars in Immunology (2005) 17(2):155-165 раскрыты miR-181, miRNA, специфично экспрессирующиеся в В-клетках костного мозга мышей (Chen and Lodish, 2005). Также раскрыто, что некоторые miRNA человека связаны с формами лейкоза.
[450] Целевая последовательность может быть полностью или частично комплементарной для miRNA. Термин "полностью комплементарная" означает, что целевая последовательность имеет последовательность нуклеиновой кислоты, которая на 100% комплементарна последовательности miRNA, которая ее распознает. Термин "частично комплементарная" означает, что целевая последовательность является только частично комплементарной последовательности miRNA, которая ее распознает, при этом частично комплементарная последовательность по-прежнему распознается miRNA. Другими словами, частично комплементарная целевая последовательность в контексте настоящего изобретения эффективно распознается соответствующей miRNA и предотвращает или снижает экспрессию трансгена в клетках, экспрессирующих эту miRNA. Примеры целевых последовательностей для miRNA описаны в WO2007/000668, WO2004/094642, WO2010/055413 или WO2010/125471, которые включены в данный документ посредством ссылки во всей своей полноте.
[451] В некоторых вариантах осуществления экспрессия трансгена нацелена на печень. В определенных вариантах осуществления экспрессия трансгена нацелена на гепатоциты. В другом варианте осуществления экспрессия трансгена нацелена на эндотелиальные клетки. В одном конкретном варианте осуществления экспрессия трансгена нацелена на любую ткань, которая в естественных условиях экспрессирует эндогенный FVIII.
[452] В некоторых вариантах осуществления экспрессия трансгена нацелена на центральную нервную систему. В определенных вариантах осуществления экспрессия трансгена нацелена на нейроны. В некоторых вариантах осуществления экспрессия трансгена нацелена на афферентные нейроны. В некоторых вариантах осуществления экспрессия трансгена нацелена на эфферентные нейроны. В некоторых вариантах осуществления экспрессия трансгена нацелена на вставочные нейроны. В некоторых вариантах осуществления экспрессия трансгена нацелена на глиальные клетки. В некоторых вариантах осуществления экспрессия трансгена нацелена на астроциты. В некоторых вариантах осуществления экспрессия трансгена нацелена на олигодендроциты. В некоторых вариантах осуществления экспрессия трансгена нацелена на микроглию. В некоторых вариантах осуществления экспрессия трансгена нацелена на эпендимальные клетки. В некоторых вариантах осуществления экспрессия трансгена нацелена на шванновские клетки. В некоторых вариантах осуществления экспрессия трансгена нацелена на сателлитные клетки.
[453] В некоторых вариантах осуществления экспрессия трансгена нацелена на мышечную ткань. В некоторых вариантах осуществления экспрессия трансгена нацелена на гладкую мускулатуру. В некоторых вариантах осуществления экспрессия трансгена нацелена на сердечную мускулатуру. В некоторых вариантах осуществления экспрессия трансгена нацелена на скелетную мускулатуру.
[454] В некоторых вариантах осуществления экспрессия трансгена нацелена на глаз. В некоторых вариантах осуществления экспрессия трансгена нацелена на фоторецепторные клетки. В некоторых вариантах осуществления экспрессия трансгена нацелена на ганглиозные клетки сетчатки.
IV. Клетки-хозяева
[455] В настоящем изобретении также предусмотрена клетка-хозяин, содержащая молекулу нуклеиновой кислоты или вектор по настоящему изобретению. Используемый в данном документе термин "трансформация" должен использоваться в широком смысле для обозначения введения ДНК в реципиентную клетку-хозяина, что приводит к изменениям генотипа и, следовательно, имеет результатом изменение в реципиентной клетке.
[456] "Клетки-хозяева" относятся к клеткам, которые были трансформированы посредством векторов, сконструированных с использованием методик рекомбинантной ДНК и кодирующих по меньшей мере один гетерологичный ген. Клетки-хозяева по настоящему изобретению предпочтительно происходят от млекопитающих; наиболее предпочтительно происходят от человека или от мыши. Специалистам в данной области вменяется в заслугу способность преимущественно определять конкретные линии клеток-хозяев, которые лучше всего подходят для их цели. Иллюстративные линии клеток-хозяев включают без ограничения CHO, DG44 и DUXB11 (линии клеток яичников китайского хомячка, DHFR-отрицательные), HELA (клетки карциномы шейки матки человека), CVI (линия клеток почки обезьяны), COS (производное CVI с T-антигеном SV40), R1610 (фибробласты китайского хомячка), BALBC/3T3 (фибробласты мыши), HAK (линия клеток почки хомячка), SP2/0 (клетки миеломы мыши), P3×63-Ag3.653 (клетки миеломы мыши), BFA-1c1BPT (эндотелиальные клетки крупного рогатого скота), RAJI (лимфоциты человека), PER.C6®, NS0, CAP, BHK21 и HEK 293 (клетки почки человека). В одном конкретном варианте осуществления клетка-хозяин выбрана из группы, состоящей из клетки CHO, клетки HEK293, клетки BHK21, клетки PER.C6®, клетки NS0, клетки CAP и любой их комбинации. В некоторых вариантах осуществления клетки-хозяева по настоящему изобретению происходят от насекомых. В одном конкретном варианте осуществления клетки-хозяева представляют собой клетки SF9. Линии клеток-хозяев обычно доступны из коммерческих служб, Американской коллекции тканевых культур или из опубликованной литературы.
[457] Введение молекул нуклеиновой кислоты или векторов по настоящему изобретению в клетку-хозяина можно осуществлять посредством различных методик, хорошо известных специалистам в данной области техники. Они включают без ограничения трансфекцию (в том числе электрофорез и электропорацию), слияние протопластов, осаждение с фосфатом кальция, слияние клеток с ДНК в оболочке, микроинъекцию и инфицирование интактным вирусом. См., Ridgway, A. A. G. "Mammalian Expression Vectors" Chapter 24.2, pp. 470-472 Vectors, Rodriguez and Denhardt, Eds. (Butterworths, Boston, Mass. 1988). Более предпочтительно, введение плазмиды в хозяина осуществляют посредством электропорации. Трансформированные клетки выращивают в условиях, подходящих для продуцирования легких цепей и тяжелых цепей, и анализируют в отношении синтеза белков тяжелой и/или легкой цепи. Иллюстративные методики анализа включают иммуноферментный анализ (ELISA), радиоиммунологический анализ (RIA) или анализ по методу сортировки клеток с активированной флуоресценцией (FACS), иммуногистохимический анализ и т. п.
[458] Клетки-хозяева, содержащие выделенные молекулы нуклеиновой кислоты или векторы по настоящему изобретению, выращивают в подходящей ростовой среде. Используемый в данном документе термин "подходящая ростовая среда" означает среду, содержащую питательные вещества, необходимые для роста клеток. Питательные вещества, необходимые для роста клеток, могут включать источник углерода, источник азота, незаменимые аминокислоты, витамины, минералы и факторы роста. Среда необязательно может содержать один или несколько факторов для отбора. Среда необязательно может содержать сыворотку крови новорожденных телят или фетальную телячью сыворотку крови (FCS). В одном варианте осуществления среда по существу не содержит IgG. В ростовой среде, как правило, будет происходить отбор клеток, содержащих ДНК-конструкцию, например, путем отбора по чувствительности к лекарственному средству или дефициту незаменимого питательного вещества, что дополняется наличием селектируемого маркера, присутствующего в ДНК-конструкции или трансфицируемого совместно с ДНК-конструкцией. Культивируемые клетки млекопитающих обычно выращивают в коммерчески доступных средах, содержащих сыворотку крови, или бессывороточных средах (например, MEM, DMEM, DMEM/F12). В одном варианте осуществления среда представляет собой CD OptiCHO (Invitrogen, Карлсбад, Калифорния, США). В другом варианте осуществления среда представляет собой CD17 (Invitrogen, Карлсбад, Калифорния, США). Выбор среды, подходящей для конкретной применяемой линии клеток, находится в пределах уровня знаний средних специалистов в данной области техники.
V. Получение полипептидов
[459] В настоящем изобретении также предусмотрен полипептид, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению. В других вариантах осуществления полипептид по настоящему изобретению кодируется вектором, содержащим нуклеиновые молекулы по настоящему изобретению. В еще одних вариантах осуществления полипептид по настоящему изобретению продуцируется клеткой-хозяином, содержащей нуклеиновые молекулы по настоящему изобретению.
[460] В других вариантах осуществления в настоящем изобретении также предусмотрен способ получения полипептида с активностью фактора свертывания крови, например, FVIII, включающий культивирование клетки-хозяина по настоящему изобретению в условиях, при которых продуцируется полипептид с активностью фактора свертывания крови, например, FVIII, и извлечение полипептида с активностью фактора свертывания крови, например, FVIII. В некоторых вариантах осуществления экспрессия полипептида с активностью фактора свертывания крови, например, FVIII, увеличена относительно клетки-хозяина, культивируемой в тех же условиях, но содержащей эталонную нуклеотидную последовательность (например, SEQ ID NO: 16, родительскую последовательность гена FVIII).
[461] В других вариантах осуществления в настоящем изобретении предусмотрен способ увеличения экспрессии полипептида с активностью фактора свертывания крови, например, FVIII, включающий культивирование клетки-хозяина по настоящему изобретению в условиях, при которых полипептид с активностью фактора свертывания крови, например, FVIII, экспрессируется молекулой нуклеиновой кислоты, где экспрессия полипептида с активностью фактора свертывания крови, например, FVIII, увеличена относительно клетки-хозяина, культивируемой в тех же условиях, содержащей эталонную молекулу нуклеиновой кислоты (например, SEQ ID NO: 16, родительскую последовательность гена FVIII).
[462] В других вариантах осуществления в настоящем изобретении предусмотрен способ улучшения выхода полипептида с активностью фактора свертывания крови, например, FVIII, включающий культивирование клетки-хозяина в условиях, при которых полипептид с активностью фактора свертывания крови, например, FVIII, продуцируется молекулой нуклеиновой кислоты, раскрытой в данном документе, где выход полипептида с активностью фактора свертывания крови, например, FVIII, увеличен относительно клетки-хозяина, культивируемой в тех же условиях, содержащей эталонную последовательность нуклеиновой кислоты (например, SEQ ID NO: 16, родительскую последовательность гена FVIII).
[463] Терапевтический белок, например, фактор свертывания крови, по настоящему изобретению может синтезироваться у трансгенного животного, такого как грызун, коза, овца, свинья или корова. Термин "трансгенные животные" относится к животным, отличным от человека, в геном которых встроен чужеродный ген. Поскольку этот ген присутствует в тканях зародышевой линии, он передается от родителей к потомству. Экзогенные гены вводят в одноклеточные эмбрионы (Brinster et al. 1985, Proc. Natl. Acad.Sci. USA 82:4438). Из уровня техники известны способы получения трансгенных животных, в том числе трансгенных объектов, которые продуцируют молекулы иммуноглобулинов (Wagner et al. 1981, Proc. Natl. Acad. Sci. USA 78: 6376; McKnight et al. 1983, Cell 34: 335; Brinster et al. 1983, Nature 306: 332; Ritchie et al. 1984, Nature 312: 517; Baldassarre et al. 2003, Theriogenology 59: 831; Robl et al. 2003, Theriogenology 59: 107; Malassagne et al. 2003, Xenotransplantation 10 (3): 267).
VII. Фармацевтическая композиция
[464] Композиции, содержащие молекулу нуклеиновой кислоты, полипептид, кодируемый молекулой нуклеиновой кислоты, вектор или клетку-хозяина по настоящему изобретению, могут содержать подходящий фармацевтически приемлемый носитель. Например, они могут содержать вспомогательные вещества и/или вспомогательные средства, которые способствуют переработке активных соединений в препараты, предназначенные для доставки в место действия.
[465] В одном варианте осуществления настоящее изобретение относится к фармацевтической композиции, содержащей (а) молекулу нуклеиновой кислоты, вектор, полипептид или клетку-хозяина, раскрытые в данном документе; и (b) фармацевтически приемлемое вспомогательное вещество.
[466] В некоторых вариантах осуществления фармацевтическая композиция дополнительно содержит средство доставки. В определенных вариантах осуществления средство доставки содержит липидную наночастицу (LNP). В других вариантах осуществления фармацевтическая композиция дополнительно содержит липосомы, другие полимерные молекулы и экзосомы.
[467] Используемая в данном документе "липидная наночастица" относится к наночастице, которая содержит множество липидных молекул, физически связанных друг с другом посредством внутримолекулярных сил. Липидная наночастица может представлять собой, например, микросферы (включая однослойные и многослойные везикулы, например, липосомы), дисперсионную фазу в эмульсии, мицеллы или внутреннюю фазу в суспензии.
[468] В некоторых вариантах осуществления в настоящем изобретении предусмотрена композиция на основе инкапсулированой молекулы нуклеиновой кислоты, которая может включать липидную наночастицу-хозяина, инкапсулирующую молекулу нуклеиновой кислоты по настоящему изобретению. Липидная наночастица может содержать один или несколько липидов (например, катионных липидов, некатионных липидов и PEG-модифицированных липидов). В определенных вариантах осуществления липидная наночастица по настоящему изобретению составлена для доставки одной или нескольких молекул нуклеиновой кислоты по настоящему изобретению в одну или несколько целевым клеток. Примеры подходящих липидов включают без ограничения соединения фосфатидила (например, фосфатидилэтаноламин, сфинголипиды, фосфатидилхолин, фосфатидилсерин, фосфатидилглицерин, ганглиозиды и цереброзиды). "Катионный липид" относится к любому виду липидов, который несет суммарный положительный заряд при определенном pH (например, физиологическом pH).
[469] В определенных вариантах осуществления липидные наночастицы по настоящему изобретению характеризуются определенным соотношением N/P. Используемые в данном документе "соотношение N/P" или "соотношение NP" относятся к соотношению положительно-заряженных аминогрупп полимера к отрицательно-заряженным фосфатным группам нуклеиновой кислоты. Характеристика N/P комплекса липидная наночастица/молекула нуклеиновой кислоты может влиять на такие свойства, как суммарный заряд поверхности, стабильность и размер. Соотношение NP для липидных наночастиц, описанных в данном документе, может составлять приблизительно 1, приблизительно 2, приблизительно 3, приблизительно 4, приблизительно 5, приблизительно 6, приблизительно 7, приблизительно 8, приблизительно 9, приблизительно 10, приблизительно 15, приблизительно 20, приблизительно 25, приблизительно 30, приблизительно 35, приблизительно 40, приблизительно 45, приблизительно 50, приблизительно 55, приблизительно 60, приблизительно 65, приблизительно 70, приблизительно 75, приблизительно 80, приблизительно 85, приблизительно 90, приблизительно 95, приблизительно 100 и любое промежуточное соотношение. Например, соотношение NP для липидных наночастиц, описанных в данном документе, может составлять приблизительно 18, приблизительно 36 или приблизительно 72.
[470] Соответственно, в определенных вариантах осуществления фармацевтическая композиция содержит молекулу нуклеиновой кислоты по настоящему изобретению, инкапсулированную в липидную наночастицу и фармацевтически приемлемое вспомогательное вещество.
[471] Фармацевтическая композиция может быть составлена для парентерального введения (т. е. внутривенного, подкожного или внутримышечного) путем болюсной инъекции. Составы для инъекций могут быть представлены в стандартной лекарственной форме, например, в ампулах или в многодозовых контейнерах с добавленным консервантом. Композиции могут иметь такие формы, как суспензии, растворы или эмульсии в масляных или водных средах-носителях, и содержать средства для составления, такие как суспендирующие, стабилизирующие и/или диспергирующие средства. В качестве альтернативы, активный ингредиент может быть представлен в форме порошка для разведения подходящей средой-носителем, например, апирогенной водой.
[472] Подходящие составы для парентерального введения также включают водные растворы активных соединений в водорастворимой форме, например, водорастворимые соли. Кроме того, можно вводить суспензии активных соединений в виде подходящих масляных инъекционных суспензий. Подходящие липофильные растворители или среды-носители включают жирные масла, например, кунжутное масло, или синтетические сложные эфиры жирных кислот, например, этилолеат или триглицериды. Водные инъекционные суспензии могут содержать вещества, которые увеличивают вязкость суспензии, в том числе, например, натрий-карбоксиметилцеллюлозу, сорбит и декстран. Суспензия также необязательно может содержать стабилизаторы. Также можно применять липосомы для инкапсулирования молекул по настоящему изобретению для доставки в клетки или интерстициальные пространства. Иллюстративными фармацевтически приемлемыми носителями являются физиологически совместимые растворители, дисперсионные среды, покрытия, антибактериальные и противогрибковые средства, изотонические средства и средства, замедляющие всасывание, вода, солевой раствор, фосфатно-солевой буферный раствор, декстроза, глицерин, этанол и т. п. В некоторых вариантах осуществления композиция содержит изотонические средства, например, сахара, многоатомные спирты, такие как маннит, сорбит, или хлорид натрия. В других вариантах осуществления композиции содержат фармацевтически приемлемые вещества, такие как смачивающие средства или незначительные количества вспомогательных веществ, таких как смачивающие или эмульгирующие средства, консерванты или буферы, которые увеличивают срок годности или эффективность активных ингредиентов.
[473] Композиции по настоящему изобретению могут быть представлены в различных формах, в том числе, например, в форме жидкости (например, инъекционных и инфузионных растворов), дисперсий, суспензий, полутвердых и твердых лекарственных форм. Предпочтительная форма зависит от способа введения и терапевтического применения.
[474] Композиция может быть составлена в виде раствора, микроэмульсии, дисперсии, липосомы или другой упорядоченной структуры, подходящей для высокой концентрации лекарственного средства. Стерильные инъекционные растворы можно получить путем помещения активного ингредиента в необходимом количестве в соответствующий растворитель с одним ингредиентом или комбинацией ингредиентов, перечисленных выше, если необходимо, с последующей стерилизующей фильтрацией. Как правило, дисперсии получают путем помещения активного ингредиента в стерильную среду-носитель, которая содержит основную дисперсионную среду и необходимые другие ингредиенты из перечисленных выше. В случае со стерильными порошками для получения стерильных инъекционных растворов предпочтительные способы получения представляют собой вакуумную сушку и сублимационную сушку, которые приводят к получению порошка активного ингредиента и любого дополнительного требуемого ингредиента из их раствора, предварительно подвергнутого стерилизующей фильтрации. Надлежащую текучесть раствора можно поддерживать, например, путем применения покрытия, такого как лецитин, путем поддержания необходимого размера частиц в случае с дисперсией и путем применения поверхностно-активных веществ. Пролонгированное всасывание инъекционных композиций может обеспечиваться включением в композицию средства, которое замедляет всасывание, например, моностеаратных солей и желатина.
[475] Активный ингредиент может быть составлен в составе или устройстве с контролируемым высвобождением. Примеры таких составов и устройств включают имплантаты, трансдермальные пластыри и микроинкапсулированные системы доставки. Можно применять биоразлагаемые, биосовместимые полимеры, например, этиленвинилацетат, полиангидриды, полигликолевую кислоту, коллаген, сложные полиортоэфиры и полимолочную кислоту. Способы получения таких составов и устройств известны из уровня техники. См., например, Sustained and Controlled Release Drug Delivery Systems, J. R. Robinson, ed., Marcel Dekker, Inc., New York, 1978.
[476] Инъекционные депо-составы можно получать путем образования микроинкапсулированных матриц с лекарственным средством в биоразлагаемых полимерах, таких как сополимер лактида и гликолида. В зависимости от соотношения лекарственного средства и полимера и природы используемого полимера можно контролировать скорость высвобождения лекарственного средства. Другими иллюстративными биоразлагаемыми полимерами являются сложные полиортоэфиры и полиангидриды. Инъекционные депо-составы также можно получать путем захвата лекарственного средства в липосомы или микроэмульсии.
[477] В композиции могут быть включены дополнительные активные соединения. В одном варианте осуществления молекула нуклеиновой кислоты по настоящему изобретению составлена с фактором свертывания крови или его вариантом, фрагментом, аналогом или производным. Например, фактор свертывания крови включает без ограничения фактор V, фактор VII, фактор VIII, фактор IX, фактор X, фактор XI, фактор XII, фактор XIII, протромбин, фибриноген, фактор фон Виллебранда или рекомбинантный растворимый тканевой фактор (rsTF) или активированные формы любого из предшествующих. Фактор свертывания крови в гемостатическом средстве также может включать антифибринолитические лекарственные средства, например, эпсилон-аминокапроновую кислоту, транексамовую кислоту.
[478] Схемы дозирования могут быть скорректированы для обеспечения оптимального необходимого ответа. Например, можно вводить однократную болюсную дозу, можно вводить несколько разделенных доз на протяжении некоторого периода времени, или дозу можно пропорционально уменьшить или увеличить, как указывают потребности терапевтической ситуации. Преимущественным является составление композиций для парентерального применения в виде лекарственной формы с однократной дозировкой для удобства введения и однородности дозирования. См., например, Remington's Pharmaceutical Sciences (Mack Pub. Co., Easton, Pa. 1980).
[479] В дополнение к активному соединению жидкая лекарственная форма может содержать инертные ингредиенты, такие как вода, этиловый спирт, этилкарбонат, этилацетат, бензиловый спирт, бензилбензоат, пропиленгликоль, 1,3-бутиленгликоль, диметилформамид, масла, глицерин, тетрагидрофурфуриловый спирт, полиэтиленгликоли и сложные эфиры жирных кислот и сорбитана.
[480] Неограничивающие примеры подходящих фармацевтических носителей также описаны в Remington's Pharmaceutical Sciences, E.W. Martin. Некоторые примеры вспомогательных веществ включают крахмал, глюкозу, лактозу, сахарозу, желатин, солод, рис, муку, мел, силикагель, стеарат натрия, моностеарат глицерина, тальк, хлорид натрия, сухое обезжиренное молоко, глицерин, пропиленгликоль, воду, этанол и т. п. Композиция также может содержать рН-буферные реагенты, а также смачивающие или эмульгирующие средства.
[481] Для перорального введения фармацевтическая композиция может иметь форму таблеток или капсул, полученных с помощью традиционных способов. Композиция также может быть получена в виде жидкости, например, сиропа или суспензии. Жидкость может содержать суспендирующие средства (например, сорбитовый сироп, производные целлюлозы или гидрогенизированные пищевые жиры), эмульгирующие средства (лецитин или аравийскую камедь), неводные среды-носители (например, миндальное масло, масляные сложные эфиры, этиловый спирт или фракционированные растительные масла) и консерванты (например, метил- или пропил-п-гидроксибензоаты или сорбиновую кислоту). Препараты могут также содержать ароматизаторы, красители и подсластители. В качестве альтернативы, композиция может быть представлена в виде сухого продукта для разведения с помощью воды или другой подходящей среды-носителя.
[482] Для трансбуккального введения композиция может иметь форму таблеток или пастилок в соответствии с традиционными протоколами.
[483] Для введения путем ингаляции соединения для применения по настоящему изобретению в целях удобства доставляются в форме распыляемого аэрозоля со вспомогательными веществами или без них или в форме аэрозольного спрея из упаковки под давлением или распылителя, необязательно с пропеллентом, например, дихлордифторметаном, трихлорфторметаном, дихлортетрафторметаном, диоксидом углерода или другим подходящим газом. В случае с аэрозолем под давлением единица дозирования может определяться благодаря обеспечению наличия клапана для доставки отмеренного количества. Капсулы и картриджи из, например, желатина для применения в ингаляторе или инсуффляторе могут быть составлены так, чтобы они содержали порошковую смесь соединения и подходящей порошковой основы, такой как лактоза или крахмал.
[484] Фармацевтическая композиция также может быть составлена для ректального введения в виде суппозитория или удерживающей клизмы, например, содержащих традиционные суппозиторные основы, такие как масло какао или другие глицериды.
[485] В некоторых вариантах осуществления композицию вводят посредством пути, выбранного из группы, состоящей из местного введения, внутриглазного введения, парентерального введения, интратекального введения, субдурального введения и перорального введения. Парентеральное введение может представлять собой внутривенное или подкожное введение.
VIII. Способы лечения
[486] В некоторых аспектах настоящее изобретение направлена на способы лечения заболевания или состояния у нуждающегося в этом субъекта, включающие введение молекулы нуклеиновой кислоты, вектора, полипептида или фармацевтической композиции, раскрытых в данном документе.
[487] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, где генная кассета кодирует целевую последовательность, где целевая последовательность кодирует терапевтический белок, и где молекула нуклеиновой кислоты применяется для лечения заболевания или состояния у нуждающегося в этом субъекта. В некоторых вариантах осуществления заболевание или состояние поражают орган, выбранный из мышцы, центральной нервной системы (ЦНС), глаза, печени, сердца, почки, поджелудочной железы, легких, кожи, мочевого пузыря, мочевыводящих путей и любой их комбинации. В некоторых вариантах осуществления у субъекта имеется заболевание или состояние, выбранное из группы, состоящей из DMD (мышечная дистрофия Дюшенна), XLMTM (X-сцепленная миотубулярная миопатии), болезни Паркинсона, SMA (спинальная мышечная атрофия), атаксии Фридрейха, GUCY2D-LCA (врожденный амавроз Лебера), XLRS (X-сцепленный ретиношизис), AMD (возрастная макулярная дегенерация), ACHM (ахроматопсия), RPF65-опосредованного IRD и любой их комбинации.
[488] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, где генная кассета кодирует целевую последовательность, где целевая последовательность кодирует miRNA, и где молекулу нуклеиновой кислоты применяется для лечения заболевания или состояния у нуждающегося в этом субъекта. В некоторых вариантах осуществления заболевание или состояние предусматривают амиотрофический латеральный склероз (ALS), болезнь Хантингтона и/или аутосомно-доминантный пигментный ретинит
[489] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, где генная кассета кодирует целевую последовательность, где целевая последовательность кодирует фактор свертывания крови, и где молекула нуклеиновой кислоты применяется для лечения заболевания или состояния нарушения свертываемости крови у нуждающегося в этом субъекта. Заболевание или состояние нарушения свертываемости крови выбраны из группы, состоящей из коагуляционного нарушения свертываемости крови, гемартроза, мышечного кровотечения, кровотечения в полости рта, кровоизлияния, кровоизлияния в мышцы, кровоизлияния в полости рта, травмы, черепно-мозговой травмы, желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, внутригрудного кровоизлияния, перелома кости, кровотечения в центральной нервной системе, кровотечения в заглоточном пространстве, кровотечения в забрюшинном пространстве, кровотечения во влагалище подвздошно-поясничной мышцы и любых их комбинаций. В еще одних вариантах осуществления у субъекта запланировано проведение хирургического вмешательства. В еще одних вариантах осуществления лечение является профилактическим или проводится по необходимости.
[490] В настоящем изобретении предусмотрен способ лечения нарушения свертываемости крови, включающий введение нуждающемуся в этом субъекту молекулы нуклеиновой кислоты, вектора или полипептида по настоящему изобретению. В некоторых вариантах осуществления нарушение свертываемости крови характеризуется дефицитом фактора свертывания крови, например, FVIII. В некоторых вариантах осуществления нарушение свертываемости крови представляет собой гемофилию. В некоторых вариантах осуществления нарушение свертываемости крови представляет собой гемофилию A. В некоторых вариантах осуществления способа лечения нарушения свертываемости крови активность фактора свертывания крови, например, FVIII, в плазме крови через 24 часа после введения увеличена по сравнению с таковой у субъекта, которому вводят эталонную молекулу нуклеиновой кислоты (например, SEQ ID NO: 16, родительскую последовательность гена FVIII), вектор, содержащий эталонную молекулу нуклеиновой кислоты, или полипептид, кодируемый эталонной молекулой нуклеиновой кислоты.
[491] Настоящее изобретение также относится к способу лечения, уменьшения интенсивности проявлений или предупреждения гемостатического нарушения у субъекта, включающему введение терапевтически эффективного количества выделенной молекулы нуклеиновой кислоты по настоящему изобретению или полипептида, характеризующегося активностью фактора свертывания крови, например, FVIII, кодируемого молекулой нуклеиновой кислоты по настоящему изобретению. Лечение, уменьшение интенсивности проявлений и предупреждение посредством выделенной молекулы нуклеиновой кислоты или кодируемого полипептида может представлять собой терапию шунтирующего действия. У субъекта, получающего терапию шунтирующего действия, уже может быть выработан ингибитор фактора свертывания крови, например, FVIII, или у субъекта вырабатывается ингибитор фактора свертывания крови.
[492] Молекулы нуклеиновой кислоты, векторы или полипептиды по настоящему изобретению обеспечивают лечение или предупреждение гемостатического нарушения за счет содействия образованию фибринового сгустка. Полипептид, характеризующийся активностью фактора свертывания крови, например, FVIII, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению, может активировать элемент каскада коагуляции крови. Фактор свертывания крови может участвовать во внешнем пути, внутреннем пути или в них обоих.
[493] Молекулы нуклеиновой кислоты, векторы или полипептиды по настоящему изобретению можно применять для лечения гемостатических нарушений, которые, как известно, поддаются лечению с помощью фактора свертывания крови. Гемостатические нарушения, которые можно лечить посредством способов по настоящему изобретению, включают без ограничения гемофилию A, гемофилию B, болезнь фон Виллебранда, дефицит фактора XI (дефицит PTA), дефицит фактора XII, а также дефициты или аномалии структуры фибриногена, протромбина, фактора V, фактора VII, фактора X или фактора XIII, гемартроз, мышечное кровотечение, кровотечение в полости рта, кровоизлияние, кровоизлияние в мышцы, кровоизлияние в полости рта, травму, черепно-мозговую травму, желудочно-кишечное кровотечение, внутричерепное кровоизлияние, внутрибрюшное кровоизлияние, внутригрудное кровоизлияние, перелом кости, кровотечение в центральной нервной системе, кровотечение в заглоточном пространстве, кровотечение в забрюшинном пространстве и кровотечение во влагалище подвздошно-поясничной мышцы.
[494] В некоторых вариантах осуществления гемостатическое нарушение представляет собой наследственное нарушение. В одном варианте осуществления у субъекта имеется гемофилия А. В других вариантах осуществления гемостатическое нарушение является результатом дефицита фактора свертывания крови. В других вариантах осуществления гемостатическое нарушение является результатом дефицита FVIII. В других вариантах осуществления гемостатическое нарушение может быть результатом дефекта фактора свертывания крови FVIII.
[495] В другом варианте осуществления гемостатическое нарушение может представлять собой приобретенное нарушение. Приобретенное нарушение может быть обусловлено первопричинным вторичным заболеванием или состоянием. Несвязанное состояние может представлять собой, в качестве примера, без ограничения, рак, аутоиммунное заболевание или беременность. Приобретенное нарушение может быть обусловлено пожилым возрастом или приемом лекарственных препаратов для лечения первопричинного вторичного нарушения (например, химиотерапии рака).
[496] Настоящее изобретение также относится к способам лечения субъекта, у которого не имеется гемостатического нарушения или вторичного заболевания или состояния, приводящего к приобретению гемостатического нарушения. Таким образом, настоящее изобретение относится к способу лечения субъекта, нуждающегося в гемостатическом средстве общего действия, включающему введение терапевтически эффективного количества выделенной молекулы нуклеиновой кислоты, вектора или полипептида по настоящему изобретению. Например, в одном варианте осуществления субъект, нуждающийся в гемостатическом средстве общего действия, подвергается или вскоре подвергнется хирургическому вмешательству. Выделенную молекулу нуклеиновой кислоты, вектор или полипептид по настоящему изобретению можно вводить до или после хирургического вмешательства в качестве профилактического средства. Выделенную молекулу нуклеиновой кислоты, вектор или полипептид по настоящему изобретению можно вводить во время или после хирургического вмешательства для контроля эпизода острого кровотечения. Хирургическое вмешательство может включать без ограничения трансплантацию печени, резекцию печени или трансплантацию стволовых клеток.
[497] В другом варианте осуществления выделенную молекулу нуклеиновой кислоты, вектор или полипептид по настоящему изобретению можно применять для лечения субъекта с эпизодом острого кровотечения, у которого не имеется гемостатического нарушения. Эпизод острого кровотечения может быть результатом тяжелой травмы, например, хирургического вмешательства, автомобильной аварии, ранения, рваного огнестрельного ранения или другого травматического события, приводящего к неконтролируемому кровотечению.
[498] Выделенную молекулу нуклеиновой кислоты, вектор или белок можно применять для профилактического лечения субъекта с гемостатическим нарушением. Выделенную молекулу нуклеиновой кислоты, вектор или белок можно применения для лечения эпизода острого кровотечения у субъекта с гемостатическим нарушением.
[499] В другом варианте осуществления экспрессия белка, представляющего собой фактор свертывания крови, посредством введения выделенной молекулы нуклеиновой кислоты или вектора по настоящему изобретению не индуцирует иммунный ответ у субъекта. В некоторых вариантах осуществления иммунный ответ включает выработку антител к фактору свертывания крови. В одном варианте осуществления иммунный ответ включает выработку антител к FVIII. В некоторых вариантах осуществления иммунный ответ включает секрецию цитокинов. В некоторых вариантах осуществления иммунный ответ включает активацию B-клеток, T-клеток или как B-клеток, так и T-клеток. В некоторых вариантах осуществления иммунный ответ представляет собой ингибирующий иммунный ответ, где иммунный ответ у субъекта снижает активность белка, представляющего собой фактор свертывания крови, относительно активности фактора свертывания крови у субъекта, у которого не развился иммунный ответ. В определенных вариантах осуществления экспрессия белка, представляющего собой фактор свертывания крови, посредством введения выделенной молекулы нуклеиновой кислоты или вектора по настоящему изобретению обеспечивает предупреждение ингибирующего иммунного ответа на белок, представляющий собой фактор свертывания крови, или белок, представляющий собой фактор свертывания крови, экспрессируемый с выделенной молекулы нуклеиновой кислоты или вектора.
[500] В некоторых вариантах осуществления композицию, содержащую выделенную молекулу нуклеиновой кислоты, вектор или белок, по настоящему изобретению вводят в комбинации с по меньшей мере одним другим средством, которое способствует гемостазу. Указанное другое средство, которое способствует гемостазу, представляет собой терапевтический препарат с продемонстрированной свертывающей активностью. В качестве примера, без ограничения, гемостатическое средство может включать FV, FVII, FIX, FX, FXI, FXII, FXIII, протромбин или фибриноген или активированные формы любого из предшествующих. Фактор свертывания крови или гемостатическое средство также могут включать антифибринолитические лекарственные средства, например, эпсилон-аминокапроновую кислоту, транексамовую кислоту.
[501] В одном варианте осуществления настоящего изобретения композиция (например, выделенная молекула нуклеиновой кислоты, вектор или полипептид) представляет собой композицию, в которой фактор свертывания крови присутствует в форме, активируемой при введении субъекту. Такая активируемая молекула может активироваться in vivo в месте свертывания после введения субъекту.
[502] Соответственно, в некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения нарушения свертываемости крови у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фактор свертывания крови, где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV). В некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения нарушения свертываемости крови у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фактор свертывания крови, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, представленную под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188. В некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения нарушения свертываемости крови у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фактор свертывания крови, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188, или ее функциональное производное.
[503] Соответственно, в некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения гемофилии A у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фактор VIII, где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV). В некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения гемофилии A у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фактор VIII, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, представленную под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188. В некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения гемофилии A у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фактор VIII, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188, или ее функциональное производное.
[504] В настоящем изобретении также предусмотрен способ лечения метаболического нарушения печени, включающий введение нуждающемуся в этом субъекту молекулы нуклеиновой кислоты, вектора или полипептида по настоящему изобретению. В некоторых вариантах осуществления метаболическое нарушения печени выбрано из группы, состоящей из фенилкетонурии (
[505] На фиг. 7E показан вестерн-блоттинг лизатов образцов печени от мышей с PKU, обработанных с помощью ssDNA, содержащей трансген PAH мыши и ITR B19d135 или GPCd165. Образцы печени собирали в день 81 после обработки и экстрагировали белковые лизаты. Каждая лунка представляет отдельное животное. Белок PAH мыши с FLAG-меткой обнаруживали с применением M2, антитела к FLAG, и для сравнения включали контроль загрузки, GAPDH.
[506] ), заболевания, связанного с циклом мочевины (например, дефицита транскарбамоилазы (OTC), или аргининосукцинатсинтетазы (ASS)), лизосомной болезни накопления (например, форм мукополисахаридоза) и болезни накопления гликогена (например, болезни накопления гликогена типа I, II, III, IV). Другие метаболические нарушения печени включают без ограничения болезнь Вильсона, дефицит альфа-1 антитрипсина, гестационное аллоиммунное заболевание печени (GALD), дефекты окисления жирных кислот, галактоземию, нарушение липидного обмена, тирозинимию и пероксисомальные расстройства.
[507] В некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения метаболического нарушения печени у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую ассоциированный с печенью метаболический фермент, дефицит которого наблюдается у субъекта, где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV). В некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения метаболического нарушения печени у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую терапевтический белок (например, белок, необходимый для нормального метаболического функционирования печени), где первый ITR и/или второй ITR содержат нуклеотидную последовательность, представленную под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188. В некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения метаболического нарушения печени у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую терапевтический белок (например, белок, необходимый для нормального метаболического функционирования печени), где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188, или ее функциональное производное.
[508] В некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения фенилкетонурии (PKU) у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фенилаланингидроксилазу (PAH), где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV). В некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения фенилкетонурии (PKU) у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фенилаланингидроксилазу (PAH), где первый ITR и/или второй ITR содержат нуклеотидную последовательность, представленную под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188. В некоторых вариантах осуществления в настоящем изобретении предусмотрен способ лечения фенилкетонурии (PKU) у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фенилаланингидроксилазу, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, представленной под SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188, или ее функциональное производное.
[509] Выделенную молекулу нуклеиновой кислоты, вектор или полипептид можно вводить внутривенно, подкожно, внутримышечно или через поверхность любой слизистой оболочки, например, перорально, сублингвально, трансбуккально, сублингвально, назально, ректально, вагинально или посредством легочного пути. Белок, представляющий собой фактор свертывания крови, может быть имплантирован в твердую биополимерную подложку или связан с ней, что обеспечивает возможность медленного высвобождения химерного белка в необходимом месте.
[510] Для перорального введения фармацевтическая композиция может иметь форму таблеток или капсул, полученных с помощью традиционных способов. Композиция также может быть получена в виде жидкости, например, сиропа или суспензии. Жидкость может содержать суспендирующие средства (например, сорбитовый сироп, производные целлюлозы или гидрогенизированные пищевые жиры), эмульгирующие средства (лецитин или аравийскую камедь), неводные среды-носители (например, миндальное масло, масляные сложные эфиры, этиловый спирт или фракционированные растительные масла) и консерванты (например, метил- или пропил-п-гидроксибензоаты или сорбиновую кислоту). Препараты могут также содержать ароматизаторы, красители и подсластители. В качестве альтернативы, композиция может быть представлена в виде сухого продукта для разведения с помощью воды или другой подходящей среды-носителя.
[511] Для трансбуккального и сублингвального введения композиция может иметь форму таблеток, пастилок или быстрорастворимых пленок в соответствии с традиционными протоколами.
[512] Для введения путем ингаляции полипептид, характеризующийся активностью фактора свертывания крови, для применения по настоящему изобретению в целях удобства доставляется в форме аэрозольного спрея из упаковки под давлением или распылителя (например, в PBS) с подходящим пропеллентом, например, дихлордифторметаном, трихлорфторметаном, дихлортетрафторметаном, диоксидом углерода или другим подходящим газом. В случае с аэрозолем под давлением единица дозирования может определяться благодаря обеспечению наличия клапана для доставки отмеренного количества. Капсулы и картриджи из, например, желатина для применения в ингаляторе или инсуффляторе могут быть составлены так, чтобы они содержали порошковую смесь соединения и подходящей порошковой основы, такой как лактоза или крахмал.
[513] В одном варианте осуществления путь введения выделенной молекулы нуклеиновой кислоты, вектора или полипептида является парентеральным. Используемый в данном документе термин "парентеральный" включает внутривенное, внутриартериальное, внутрибрюшинное, внутримышечное, подкожное, ректальное или вагинальное введение. Внутривенная форма парентерального введения является предпочтительной. Хотя все эти формы введения явно рассматриваются как находящиеся в пределах объема настоящего изобретения, формой для введения будет раствор для инъекций, в частности, для внутривенной или внутриартериальной инъекции или капельного вливания. Обычно подходящая фармацевтическая композиция для инъекций может содержать буфер (например, ацетатный, фосфатный или цитратный буфер), поверхностно-активное вещество (например, полисорбат), необязательно стабилизирующее средство (например, альбумин человека) и т. д. Однако в других способах, совместимых с изложенными в данном документе идеями, выделенная молекула нуклеиновой кислоты, вектор или полипептид могут доставляться непосредственно в место локализации нежелательной клеточной популяции, за счет чего увеличивается воздействие терапевтического средства на пораженную ткань.
[514] Препараты для парентерального введения включают стерильные водные или неводные растворы, суспензии и эмульсии. Примерами неводных растворителей являются пропиленгликоль, полиэтиленгликоль, растительные масла, такие как оливковое масло, и инъекционные органические сложные эфиры, такие как этилолеат. Водные носители включают воду, спиртовые/водные растворы, эмульсии или суспензии, в том числе солевой раствор и буферные среды. В рассматриваемом изобретении фармацевтически приемлемые носители включают без ограничения 0,01-0,1 M и предпочтительно 0,05 M фосфатный буфер или 0,8% солевой раствор. Другие распространенные среды-носители для парентерального введения включают растворы фосфата натрия, раствор Рингера с декстрозой, раствор декстрозы и хлорида натрия, лактатный раствор Рингера или нелетучие масла. Среды-носители для внутривенного введения включают растворы с добавками жидкости и питательных веществ, растворы с добавками электролитов, как, например, на основе раствора Рингера с декстрозой, и т. п. Могут также присутствовать консерванты и другие добавки, такие как, например, противомикробные средства, антиоксиданты, хелатообразующие средства и инертные газы и т. п.
[515] Более конкретно, фармацевтические композиции, подходящие для инъекционного применения, включают стерильные водные растворы (в случае растворимости в воде) или дисперсии и стерильные порошки для экстемпорального приготовления стерильных инъекционных растворов или дисперсий. В таких случаях композиция должна быть стерильной и должна быть текучей до такой степени, чтобы ее легко было вводить с помощью шприца. Она должна быть стабильной в условиях производства и хранения и предпочтительно будет защищена от загрязняющего действия микроорганизмов, таких как бактерии и грибы. Носитель может представлять собой растворитель или дисперсионную среду, содержащие, например, воду, этанол, многоатомный спирт (например, глицерин, пропиленгликоль и жидкий полиэтиленгликоль и т. п.) и их подходящие смеси. Надлежащую текучесть можно поддерживать, например, путем применения покрытия, такого как лецитин, путем поддержания необходимого размера частиц в случае с дисперсией и путем применения поверхностно-активных веществ.
[516] Фармацевтическая композиция также может быть составлена для ректального введения в виде суппозитория или удерживающей клизмы, например, содержащих традиционные суппозиторные основы, такие как масло какао или другие глицериды.
[517] Эффективные дозы композиций по настоящему изобретению для лечения состояний варьируются в зависимости от множества различных факторов, включая способ введения, участок-мишень, физиологическое состояние пациента, того, является ли пациент человеком или животным, других вводимых лекарственных препаратов и того, является ли лечение профилактическим или терапевтическим. Обычно пациент является человеком, однако также можно лечить млекопитающих, отличных от человека, в том числе трансгенных млекопитающих. Для оптимизации безопасности и эффективности дозировки для лечения можно подбирать с помощью обычных способов, известных специалистам в данной области.
[518] Молекулу нуклеиновой кислоты, вектор или полипептиды по настоящему изобретению можно необязательно вводить в комбинации с другими средствами, которые являются эффективными при лечении нарушения или состояния, требующего лечения (например, профилактического или терапевтического).
[519] Как используется в данном документе, введение выделенных молекул нуклеиновой кислоты, векторов или полипептидов по настоящему изобретению в сочетании или в комбинации со вспомогательной терапией означает последовательное, одновременное, одинаковое по протяженности, сопутствующее, параллельное или совпадающее во времени введение или применение терапии и раскрытых полипептидов. Специалистам в данной области будет понятно, что введение или применение различных компонентов схемы комбинированной терапии может быть спланировано по времени для повышения общей эффективности лечения. Специалист в данной области (например, врач) сможет легко определить эффективные схемы комбинированной терапии без проведения излишних экспериментов на основании выбранной вспомогательной терапии и идей настоящего описания.
[520] Кроме того, следует понимать, что выделенную молекулу нуклеиновой кислоты, вектор или полипептид по настоящему изобретению можно применять в сочетании или в комбинации со средством или средствами (например, для обеспечения схемы комбинированной терапии). Иллюстративные средства, в комбинации с которыми можно применять полипептид или полинуклеотид по настоящему изобретению, включают средства, которые представляют современный стандарт оказания медицинской помощи при конкретном нарушении, подвергаемом лечению. Такие средства могут быть химическими или биологическими по природе. Термин "биологический препарат" или "биологическое средство" относится к любому фармацевтически активному средству, полученному из живых организмов и/или их продуктов, которое предназначено для применения в качестве терапевтического препарата.
[521] Количество средства, которое следует применять в комбинации с полинуклеотидами или полипептидами по настоящему изобретению, может варьироваться у различных субъектов или может вводиться в соответствии с тем, что известно из уровня техники. См., например, Bruce A Chabner et al., Antineoplastic Agents, в Goodman & Gilman's The Pharmacological Basis of Therapeutics 1233-1287 (Joel G. Hardman et al., eds., 9th ed. 1996). В другом варианте осуществления такое средство вводят в количестве, соответствующем стандарту оказания медицинской помощи.
[522] В одном варианте осуществления в данном документе также раскрыт набор, содержащий молекулу нуклеиновой кислоты, раскрытую в данном документе, и инструкции по введению молекулы нуклеиновой кислоты нуждающемуся в этом субъекту. В другом варианте осуществления в данном документе раскрыта бакуловирусная система для получения молекулы нуклеиновой кислоты, представленной в данном документе. Молекулу нуклеиновой кислоты получают в клетках насекомых. В другом варианте осуществления предусмотрена система доставки на основе наночастиц для экспрессионных конструкций. Экспрессионная конструкция содержит молекулу нуклеиновой кислоты, раскрытую в данном документе.
IX. Генная терапия
[523] В определенных аспектах настоящего изобретения предусмотрен способ обеспечения экспрессии генетической конструкции у субъекта, включающий введение выделенной молекулы нуклеиновой кислоты по настоящему изобретению нуждающемуся в этом субъекту. В некоторых аспектах в настоящем изобретении предусмотрен способ увеличения экспрессии полипептида у субъекта, включающий введение выделенной молекулы нуклеиновой кислоты по настоящему изобретению нуждающемуся в этом субъекту. В других аспектах в настоящем изобретении предусмотрен способ модулирования экспрессии полипептида у нуждающегося в этом субъекта, включающий введение субъекту выделенной молекулы нуклеиновой кислоты по настоящему изобретению, например, последовательности нуклеиновой кислоты, содержащей miRNA. В некоторых аспектах в настоящем изобретении предусмотрен способ понижения экспрессии целевого гена у нуждающегося в этом субъекта, включающий введение субъекту выделенной молекулы нуклеиновой кислоты по настоящему изобретению, например, последовательности нуклеиновой кислоты, содержащей miRNA.
[524] Генную терапию соматических клеток исследовали как возможный метод лечения различных состояний, в том числе без ограничения гемофилии А. Генная терапия является особенно привлекательным методом лечения гемофилии, поскольку она обладает потенциалом излечения заболевания благодаря непрерывному эндогенному продуцированию фактора свертывания крови, например, FVIII, после однократного введения вектора. Гемофилия А является особенно пригодной для подхода на основе генной заместительной терапии, поскольку ее клинические проявления в полной мере объясняются отсутствием одного продукта гена (например, FVIII), который циркулирует в плазме крови в незначительных количествах (200 нг/мл).
[525] Было показано, что применение традиционных способов доставки генов на основе вирусов, индуцирует иммунный ответ у людей. Белки вирусного капсида могут активировать различные компоненты иммунной системы человека. Доставка гена на основе AAV была перспективной, поскольку AAV является распространенным вирусом в популяции человека, большинство людей подвергались воздействию AAV, и было показано, что AAV является менее иммуногенным, чем, например, аденовирус. Соответственно, у большинства людей уже выработался иммунный ответ в отношении конкретных вариантов, воздействию которых они подвергались ранее. Данный предсуществующий адаптивный ответ может включать NAb и T-клетки, которые будут способны снижать клиническую эффективность последующих повторных инфекций, вызванных AAV, и/или приводить к уничтожению клеток, которые были трансдуцированы, что сделает пациентов с предсуществующим иммунитетом против AAV не подходящими для лечения с применением генной терапии на основе AVV. Молекулы нуклеиновой кислоты по настоящему изобретению применяются в генной терапии, не основанной на вирусах. Поскольку вирусные капсиды не являются необходимыми для доставки генов с применением молекул нуклеиновой кислоты по настоящему изобретению, иммунитет в отношении вирусных компонентов не будет развиваться при последующем повторном введении (или повторном введении доз) субъекту. В связи с этим молекулы нуклеиновой кислоты по настоящему изобретению обеспечивают возможность повторного введения доз для стратегий долгосрочной доставки гена.
[526] Кроме того, как описано в данном документе, молекулы нуклеиновой кислоты по настоящему изобретению содержат ITR парвовирусов, отличных от AAV, фланкирующие генную кассету для обеспечения стабильной экспрессии трансгена после введения. Присутствие ITR является необходимым для стабильной экспрессии трансгена, как показано на фиг. 5, где нуклеиновые кислоты без ITR были неспособны обеспечивать стабильную экспрессию трансгена (см. "dsDNA без ITR" и "мини-кольцо").
[527] Белок, представляющий собой фактор свертывания крови, по настоящему изобретению может быть получен in vivo у млекопитающего, например, у пациента-человека, с применением подхода на основе генной терапии для лечения заболевания или нарушения свертываемости крови, выбранного из группы, состоящей из коагуляционного нарушения свертываемости крови, гемартроза, мышечного кровотечения, кровотечения в полости рта, кровоизлияния, кровоизлияния в мышцы, кровоизлияния в полости рта, травмы, черепно-мозговой травмы, желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, внутригрудного кровоизлияния, перелома кости, кровотечения в центральной нервной системе, кровотечения в заглоточном пространстве, кровотечения в забрюшинном пространстве и кровотечения во влагалище подвздошно-поясничной мышцы, что было бы терапевтически благоприятным. В одном варианте осуществления заболевание или нарушение свертываемости крови представляют собой гемофилию. В другом варианте осуществления заболевание или нарушение свертываемости крови представляют собой гемофилию A.
[528] Другие состояния также подходят для лечения с применением молекул нуклеиновой кислоты, раскрытых в данном документе. В определенных вариантах осуществления способы, описанные в данном документе, применяют для лечения заболевания или состояния, которое поражает целевой орган, выбранный из мышцы, центральной нервной системы (ЦНС), глаза, печени, сердца, почки, поджелудочной железы, легких, кожи, мочевого пузыря, мочевыводящих путей или любой их комбинации. В определенных вариантах осуществления способы, описанные в данном документе, применяют для лечения заболевания или состояния, выбранного из DMD (мышечная дистрофия Дюшенна), XLMTM (X-сцепленная миотубулярная миопатия), болезни Паркинсона, SMA (спинальная мышечная атрофия), атаксии Фридрейха, GUCY2D-LCA (врожденный амавроз Лебера), XLRS (X-сцепленный ретиношизис), AMD (возрастная макулярная дегенерация), ACHM (ахроматопсия), RPF65-опосредованного IRD (таблица 9).
Таблица 9. Заболевания и нарушения, поддающиеся лечению посредством способов, раскрытых в данном документе.
(мышечная дистрофия Дюшенна)
X-сцепленный
(X-сцепленная миотубулярная миопатия)
гидроксилаза, AADC, циклогидролаза
(спинальная мышечная атрофия)
Врожденный амавроз Лебера
X-сцепленный ретиношизис
Возрастная макулярная дегенерация
HTRA
ARMS
CFB/CC2
Ахроматопсия
Метахроматическая лейкодистрофия
(Лизосомная болезнь накопления)
PSAP
Формы мукополисахаридоза
(Лизосомная болезнь накопления)
IDS (MPS II)
Фенилкетонурия
(Лизосомная болезнь накопления)
Болезнь накопления гликогена II типа
(кислая альфа-глюкозидаза)
Боковой амиотрофический склероз
Аутосомно-доминантный пигментный ретинит
(родопсин)
1. Мутация гена SOD1 обуславливала 20% случаев наследственного ALS. SOD1 дикого типа продемонстрировал антиапоптотические свойства в культурах нейронов, тогда как мутантный SOD1 согласно наблюдениям способствовал апоптозу в митохондриях спинного мозга, но не в митохондриях печени, хотя он в равной степени экспрессируется и там, и там. Понижение экспрессии мутантного SOD1 могло бы ингибировать дегенерацию двигательных нейронов при ALS. 2. HD является одной из нескольких болезней экспансии тринуклеотидных повторов, которые вызваны превышением длины повторяющегося участка гена пределов нормального диапазона. HTT содержит последовательность из трех оснований ДНК цитозин-аденин-гуанин (CAG), которые повторяются многократно (т. е. ... CAGCAGCAG ...), что известно как тринуклеотидный повтор. CAG представляет собой 3-буквенный генетический код (кодон) для аминокислоты глутамина, поэтому последовательный ряд этих оснований приводит к продуцированию цепи из глутаминовых остатков, известной как полиглутаминовый тракт (или поли-Q-тракт), и повторяющейся части гена, поли-Q-области. Обычно люди имеют менее 36 повторяющихся глутаминовых остатков в поли-Q-области, что приводит к продуцированию цитоплазматического белка хантингтина. Однако последовательность из 36 или более глутаминовых остатков приводит к продуцированию белка, который имеет другие характеристики. Эта измененная форма, называемая мутантным хантингтином (mHTT), увеличивает скорость разрушения определенных типов нейронов. Обычно то, насколько сильно прогрессирует этот процесс, связано с количеством повторов CAG, и оно обуславливает приблизительно 60% изменчивости в возрасте начала проявления симптомов. Остальная изменчивость объясняется влиянием окружающей среды и других генов, которые модифицируют механизм развития HD. 36-39 повторов приводят к форме заболевания с пониженной пенетрантностью, с гораздо более поздним началом проявления и более медленным прогрессированием симптомов. В некоторых случаях начало проявления может быть настолько поздним, что симптомы так никогда и не отмечаются. При очень большом количестве повторов HD характеризуется полной пенетрантностью и может встречаться в возрасте до 20 лет, и в этом случае ее тогда называют ювенильной HD, акинетико-ригидной HD или вариантом Вестфаля HD. Она составляет приблизительно 7% случаев у носителей HD. 3. Большинство мутаций гена RHO, ответственных за пигментный ретинит, изменяют сворачивание или транспорт белка родопсина. Несколько мутаций вызывают конститутивную активацию родопсина вместо активации в ответ на воздействие света. Исследования позволяют предположить, что измененные варианты родопсина препятствуют осуществлению жизненно важных функций клеток, вызывая саморазрушение палочек (они подвергаются апоптозу). Поскольку палочки необходимы для зрения в условиях низкой освещенности, утрата этих клеток приводит к прогрессирующей ночной слепоте у людей с пигментным ретинитом.
[529] В некоторых вариантах осуществления способы, описанные в данном документе, применяют для лечения лизосомной болезни накопления. В некоторых вариантах осуществления лизосомная болезнь накопления выбрана из MLD (метахроматическая лейкодистрофии), MPS (формы мукополисахаридоза), PKU (фенилкетонурия), болезни Помпе, представляющей собой болезнь накопления гликогена II типа, или любой их комбинации.
[530] В некоторых вариантах осуществления способы, описанные в данном документе, применяют в терапии с помощью микроРНК (miRNA). В некоторых вариантах осуществления miRNA обеспечивает лечение состояния, вызванного сверхэкспрессией гена или белка. В некоторых вариантах осуществления miRNA обеспечивает лечение состояния, вызванного накоплением белка. В некоторых вариантах осуществления miRNA обеспечивает лечение состояния, вызванного неправильной экспрессией гена или белка. В некоторых вариантах осуществления miRNA обеспечивает лечение состояния, вызванного экспрессией мутантного гена. В некоторых вариантах осуществления miRNA обеспечивает лечение состояния, вызванного экспрессией гетерологичного гена. В определенных вариантах осуществления терапия с помощью miRNA обеспечивает лечение состояния, выбранного из ALS (боковой амиотрофический склероз), болезни Хантингтона, AdRP (аутосомно-доминантный пигментный ретинит) и любой их комбинации. В определенных вариантах осуществления способы по настоящему изобретению включают направленное лечение ALS путем введения молекулы нуклеиновой кислоты, раскрытой в данном документе, где молекула нуклеиновой кислоты содержит генную кассету, кодирующую miRNA, где miRNA целенаправленно воздействует на экспрессию SOD1. В определенных вариантах осуществления miRNA предусматривает искусственную miRNA miR-SOD1, раскрытую в Dirren et al., Annals of Clinical and Translational Neurology 2(2):167-84 (февраль 2015 г.). Мутация гена SOD1 обуславливает 20% случаев наследственного ALS. SOD1 дикого типа продемонстрировал антиапоптотические свойства в культурах нейронов, тогда как мутантный SOD1 согласно наблюдениям способствовал апоптозу в митохондриях спинного мозга, но не в митохондриях печени, хотя он в равной степени экспрессируется и там, и там. Понижение экспрессии мутантного SOD1 могло бы ингибировать дегенерацию двигательных нейронов при ALS.
[531] В определенных вариантах осуществления способы по настоящему изобретению включают направленное лечение болезни Хантингтона путем введения молекулы нуклеиновой кислоты, раскрытой в данном документе, где молекула нуклеиновой кислоты содержит генную кассету, кодирующую miRNA, где miRNA целенаправленно воздействует на экспрессию HTT. В определенных вариантах осуществления miRNA включает сконструированную miRNA для miHTT, раскрытую в Evers et al., Molecular Therapy 26(9):1-15 (электронная публикация до выхода в печать в июне 2018 г.). Болезнь Хантингтона является одной из нескольких болезней экспансии тринуклеотидных повторов, которые вызваны превышением длины повторяющегося участка гена пределов нормального диапазона. HTT содержит последовательность из трех оснований ДНК цитозин-аденин-гуанин (CAG), которые повторяются многократно (т. е. ... CAGCAGCAG ...), что известно как тринуклеотидный повтор. CAG представляет собой 3-буквенный генетический код (кодон) для аминокислоты глутамина, поэтому последовательный ряд этих повторов приводит к продуцированию цепи из глутаминовых остатков, известной как полиглутаминовый тракт (или поли-Q-тракт), и повторяющейся части гена, поли-Q-области. Обычно люди имеют менее 36 повторяющихся глутаминовых остатков в поли-Q-области, что приводит к продуцированию цитоплазматического белка хантингтина. Однако последовательность из 36 или более глутаминовых остатков приводит к продуцированию белка, который имеет другие характеристики. Эта измененная форма, называемая мутантным хантингтином (mHTT), увеличивает скорость разрушения определенных типов нейронов. Обычно то, насколько сильно прогрессирует этот процесс, связано с количеством повторов CAG, и оно обуславливает приблизительно 60% изменчивости в возрасте начала проявления симптомов. Остальная изменчивость объясняется влиянием окружающей среды и других генов, которые модифицируют механизм развития болезни Хантингтона. 36-39 повторов приводят к форме заболевания с пониженной пенетрантностью, с гораздо более поздним началом проявления и более медленным прогрессированием симптомов. В некоторых случаях начало проявления может быть настолько поздним, что симптомы так никогда и не отмечаются. При очень большом количестве повторов болезнь Хантингтона характеризуется полной пенетрантностью и может встречаться в возрасте до 20 лет, и в этом случае ее тогда называют ювенильной болезнью Хантингтона, акинетико-ригидной болезнью Хантингтона или вариантом Вестфаля болезни Хантингтона. Она составляет приблизительно 7% случаев у носителей болезни Хантингтона.
[532] В определенных вариантах осуществления способы по настоящему изобретению включают направленное лечение аутосомно-доминантного пигментного ретинита (AdRP) путем введения молекулы нуклеиновой кислоты, раскрытой в данном документе, где молекула нуклеиновой кислоты содержит генную кассету, кодирующую miRNA, где miRNA целенаправленно воздействует на экспрессию RHO (родопсина). В определенных вариантах осуществления miRNA предусматривает miR-708 (см. Behrman et al., JCB 192(6):919-27 (2011). Большинство мутаций гена RHO, ответственных за пигментный ретинит, изменяют сворачивание или транспорт белка родопсина. Несколько мутаций вызывают конститутивную активацию родопсина вместо активации в ответ на воздействие света. Исследования позволяют предположить, что измененные варианты родопсина препятствуют осуществлению жизненно важных функций клеток, вызывая саморазрушение палочек (они подвергаются апоптозу). Поскольку палочки необходимы для зрения в условиях низкой освещенности, утрата этих клеток приводит к прогрессирующей ночной слепоте у людей с пигментным ретинитом.
[533] Все из различных аспектов, вариантов осуществления и возможностей выбора, описанных в данном документе, можно комбинировать во всех без исключения вариантах.
[534] Все публикации, патенты и заявки на патенты, упоминаемые в настоящем описании, включены в данный документ посредством ссылки в такой же степени, как если бы каждая отдельная публикация, патент или заявка на патент была конкретно и отдельно указана как включенная посредством ссылки.
[535] При наличии описания настоящего изобретения в общих чертах может быть достигнуто дополнительное понимание, если обратиться к представленным в данном документе примерам. Эти примеры служат лишь для иллюстративных целей и не предполагаются как ограничивающие.
ПРИМЕРЫ
Пример 1. Создание экспрессионных конструкций FVIII, несущих ITR из AAV и парвовирусов, отличных от AAV
Пример 1a. Клонирование кодон-оптимизированного гена FVIII и областей инвертированных концевых повторов (ITR) из AAV в генные кассеты
[536] Генную кассету FVIII создавали на основе генома AAV серотипа 2. Однако в данном подходе можно применять и области ITR, происходящие из любого серотипа (в том числе синтетические) (фиг. 1A).
[537] Экспрессионную плазмиду AAV2-FVIIIco6XTEN, кодирующую кодон-оптимизированную кодирующую последовательность FVIII под контролем специфического для печени промотора (TTPp) или универсального промотора (CAGp, фиг. 1A и 1B), фланкированную областями инвертированных концевых повторов (ITR) из AAV (AAV-FVIII), разрабатывали для экспрессии in vitro и in vivo, как показано на фиг. 1C. Генная кассета также содержит элементы WPRE и bGHpA для оптимальной экспрессии трансгена (фиг. 1A-1C). Кодон-оптимизированную последовательность FVIII, фланкированную ITR, клонировали в плазмидный каркас, содержащий точку начала репликации ColE1 и кассету экспрессии для бета-лактамазы, которая придает устойчивость к ампициллину (фиг. 1C). Для обеспечения возможности точного вырезания конструкции AAV-FVIII после расщепления с помощью PvuII конструировали сайты распознавания для рестрикционной эндонуклеазы PvuII, фланкирующие кассету экспрессии (фиг. 1C).
Пример 1b. Клонирование кодон-оптимизированного гена FVIII и областей инвертированных концевых повторов (ITR) из парвовирусов, отличных от AAV, в генные кассеты
[538] На основе филогенетических связей между представителями семейства вирусов Parvoviridae, к которому принадлежит AAV (фиг. 2A), выдвинули гипотезу о том, что другие отличные от AAV представители рода Dependovirus и представители рода Erythrovirus используют аналогичные клеточные механизмы для поддержания вирусного цикла жизни и обеспечения устойчивой латентной инфекции. Следовательно, области ITR, происходящие из геномов этих вирусов, можно использовать для разработки AAV-подобных (но не на основе AAV) генных кассет экспрессии. Следующие парвовирусы тестировали в отношении пригодности их областей ITR для разработки генетических конструкций для путей применения в генной терапии: штамм B парвовируса гусей (GPV) из рода Dependovirus и эритровирус, представляющий собой парвовирус B19 (фиг. 2A).
[539] Нестабильность областей ITR парвовирусов во время размножения плазмидных векторов в бактериальных клетках является препятствием для создания генетических конструкций и манипуляций с ними. Некоторые генетические конструкции, содержащие полноразмерные ITR AAV2 (145 нт.), были успешно созданы, но такие конструкции являются крайне нестабильными, и большинство плазмид на основе ITR AAV2 содержат усеченный вариант области ITR размером 130 нт. (проиллюстрирован в таблице 1). Аналогичным образом, плазмидные конструкции, несущие последовательности обоих полноразмерных ITR B19 и GPV, которые были созданы, демонстрировали высокую степень нестабильности в хозяине-бактерии (данные не показаны), что значительно ограничивает применимость этих ITR для разработки генетических векторов для путей применения в генной терапии.
[540] Ранее с помощью обратной генетики была разработана система для "спасения" рекомбинантного вируса B19, несущего усеченный вариант ITR (Manaresi, et al. Virology 508 (2017): 54-62) (таблица 2B, ITR ID: B19d135). Таким образом, ITR B19d135 использовали для создания генетически стабильной экспрессионной плазмиды FVIII B19-FVIIIco6XTEN (фиг. 1D). Чтобы дополнительно использовать этот подход для синтеза конструкции на основе ITR GPV, сравнивали последовательности полноразмерных ITR B19, GPV и AAV2 дикого типа (фиг. 3A). Исходя из гомологии первых 135 и 15 нуклеотидов последовательностей ITR B19 и AAV2 соответственно, которые не являются обязательными для функции ITR, выдвинули гипотезу, что первые 162 нуклеотида ITR GPV можно удалить, чтобы синтезировать стабильные генетические конструкции с полностью функциональными ITR (фиг. 3A, заключенные в рамку последовательности). Следовательно, аналогично конструкциям AAV2-FVIIIco6XTEN и B19-FVIIIco6XTEN, которые несут усеченные варианты их соответствующих ITR, GPVd162 (таблица 2C) использовали для создания стабильной экспрессионной плазмидной конструкции FVIII, GPV-FVIIIco6XTEN (фиг. 1E). Следует отметить, что оба полноразмерные ITR B19 и GPV намного длиннее полноразмерного ITR AAV2 (таблица 1) и не образуют различимую Т-образную шпилечную структуру ITR AAV (фиг. 2B).
[541] Плазмиды, содержащие последовательности полноразмерного ITR B19, продемонстрировали высокую степень нестабильности в клетках бактерий-хозяев, поскольку может образовываться экспрессионная конструкция FVIIIco6XTEN, содержащая только 3'-ITR. Применяя стандартные методики молекулярного клонирования, нельзя было получить положительные клоны, которые содержали оба полноразмерные 5'- и 3'-ITR B19. Чтобы создать экспрессионную конструкцию FVIIIco6XTEN, применяли B19wt-FVIIIco6XTEN, фланкированную полноразмерными ITR B19 (фиг. 1F), и специфический штамм-хозяин E. coli PMC103. PMC103 содержит делецию в гене sbcC, кодирующем экзонуклеазу, которая распознает и устраняет крестообразные структуры ДНК. Без ограничения какой-либо теорией, предположили, что применение штамма PMC103, у которого отсутствует sbcC, может позволить репликацию длинных палиндромных участков (т. е. последовательностей, которые содержат сложные вторичные структуры) и успешное клонирование B19wt-FVIIIco6XTEN, а также GPVwt-FVIIIco6XTEN. Полученная плазмида кодирует 383 пар оснований последовательности 5'- и 3'-ITR B19 дикого типа (таблица 2D), и другая плазмида кодирует 444 пар оснований последовательности 5'- и 3'-ITR GPV дикого типа (таблица 2F).
[542] Плазмиды B19-FVIIIco6XTEN (фиг. 1D; таблица 2B), GPV-FVIIIco6XTEN (фиг. 1E; таблица 2C) и B19wt-FVIIIco6XTEN (фиг. 1F, таблица 2D), содержащие кассеты экспрессии FVIII, фланкированные областями ITR парвовирусов, отличных от AAV (B19d135, GPVd162 и B19wt), создавали, как описано в примере 1a. Сайты распознавания для рестрикционной эндонуклеазы LguI использовали для фланкирования всех кассет экспрессии FVIII (фиг. 1D-1F).
Пример 1c. Получение однонитевых фрагментов ДНК, содержащих кассеты экспрессии FVIII, фланкированные ITR из AAV и парвовирусов, отличных от AAV
[543] Выдвинули гипотезу, что образование шпилечных структур в пределах областей ITR, фланкирующих кассету экспрессии FVIII, будет приводить к устойчивой трансдукции клеток-мишеней. Для исследований с целью подтверждения правильности концепции плазмиду AAV2-FVIIIco6XTEN на основе ITR AAV и плазмиды B19-FVIIIco6XTEN и GPV-FVIIIco6XTEN на основе ITR вируса, отличного от AAV, расщепляли с помощью PvuII и LguI соответственно. Однонитевой (ss) фрагмент AAV-FVIII, B19-FVIII или GPV-FVIII с образованными шпилечными структурами ITR создавали путем денатурации продуктов в виде двухнитевого фрагмента ДНК (кассета экспрессии FVIII и плазмидный каркас), полученных при расщеплении под действием PvuII или LguI, при 95°C и последующего охлаждения при 4°C для обеспечения возможности сворачивания палиндромных последовательностей ITR (фиг. 1A-1B). Полученные ssAAV-FVIII, ssB19-FVIII или ssGPV-FVIII тестировали на модели мышей с HemA (гемофилия A) в отношении способности обеспечивать устойчивую трансдукцию гепатоцитов.
Пример 1d. Применение бакуловирусной системы экспрессии для создания экспрессионных конструкций FVIII
[544] Бакуловирусную систему экспрессии, описанную в Li et al., PLoS ONE 8 (8): e69879 (2013), использовали для продуцирования конструкций AAV-FVIII, B19-FVIII и GPV-FVIII в форме молекул ДНК с замкнутыми концами (ceDNA) в клетках насекомых. Было продемонстрировано, что системная доставка кассет экспрессии на основе ceDNA обеспечивает устойчивую трансдукцию гепатоцитов и приводит к стабильной долговременной экспрессии трансгена в печени.
Пример 2. Системная инъекция генетических конструкций, содержащих кассеты экспрессии FVIII, фланкированные ITR из AAV и парвовирусов, отличных от AAV, приводит к долговременной экспрессии FVIII у мышей с HemA
Пример 2a. Оценка in vivo экспрессии FVIII, опосредованной ssAAV-FVIII
[545] Для подтверждения способности ssAAV-FVIII, несущей области ITR AAV, опосредовать устойчивую экспрессию трансгена in vivo, генную кассету экспрессии подвергали системной доставке посредством гидродинамической инъекции (HDI) мышам с гемофилией А возрастом 5-12 недель (4 животных/группа) из расчета 5 мкг, 10 мкг, 20 мкг генной кассеты экспрессии на основе ssDNA (ssAAV-FVIII) (фиг. 4A). HDI приводит к первичной доставке инъецированного материала в печень экспериментальных животных. Образцы плазмы крови собирали у экспериментальных животных через 18 часов, 3 дня, 2 недели, 3 недели, 1 месяц, 2 месяца, 3 месяца и 4 месяца после однократной гидродинамической инъекции ssAAV-FVIII. Активность FVIII в плазме крови анализировали с помощью хромогенного анализа активности FVIII. Контрольные животные, которым инъецировали 5 мкг/мышь родительской экспрессионной плазмиды, демонстрировали высокие уровни активности FVIII в плазме крови вскоре после введения. Однако уровень циркулирующего FVIII быстро снижался, и он становился невыявляемым через 15 дней после инъекции (p.i.). В отличие от этого у экспериментальных животных, которым инъецировали 5, 10 и 20 мкг/мышь ssAAV-FVIII, развивалась долговременная экспрессия трансгена со стабильными уровнями циркулирующего FVIII, составляющими приблизительно 8, 16 и 32% от нормального уровня FVIII соответственно (фиг. 4А). Наблюдали сильный дозозависимый эффект, что позволяет предположить высокую степень корреляции между инъецированной дозой и результатом лечения.
Пример 2b. Оценка in vivo экспрессии FVIII, опосредованной ssB19-FVIII и ssGPV-FVIII
[546] Для оценки in vivo экспрессии FVIII с ssB19-FVIII и ssGPV-FVIII, которые несут области ITR парвовирусов, отличных от AAV, B19d135 и GPVd162 соответственно, генную кассету экспрессии ssB19-FVIII из расчета 10 или 20 мкг/мышь и ssGPV-FVIII из расчета 10 или 50 мкг/мышь подвергали системной доставке с помощью HDI мышам с гемофилией А (HemA) возрастом 5-12 недель. Образцы крови собирали через 1, 3, 7, 14, 21, 28, 42, 56, 84, 112, 140 и 168 дней p.i., и активность FVIII в крови анализировали с помощью хромогенного анализа активности FVIII. Как наблюдали в случае конструкции AAV-FVIII, контрольные животные, которым инъецировали 5 мкг/мышь родительской экспрессионной плазмиды FVIII, демонстрировали высокие уровни активности FVIII в плазме крови через 24 часа p.i., которые быстро снижались и становились невыявляемыми через 14 дней p.i. Экспериментальные животные, которым инъецировали ssB19-FVIII, демонстрировали пиковую активность FVIII в плазме крови через 3 дня p.i., которая затем постепенно снижалась в течение периода 21 день и стабилизировалась примерно через 28 дней p.i. (фиг. 4B). С другой стороны у мышей с HemA, которым инъецировали ssGPV-FVIII, развивались стабильные уровни активности FVIII в плазме крови на примерно 112 день, которые поддерживались в течение оставшегося периода наблюдения (фиг. 4C). Следует отметить, что у животных, которым инъецировали 10 мкг/мышь либо ssAAV-FVIII (фиг. 4A), либо ssGPV-FVIII (фиг. 4C) развивались весьма сходные стабильные уровни активности FVIII в плазме крови, что позволяет предположить, что обе области ITR из AAV2 и GPV содержат генетические факторы, необходимые для эффективного обеспечения устойчивой трансдукции целевых клеток.
Пример 2c. In vivo оценка ITR и требований в отношении шпилечных структур для стабильной долговременной экспрессии FVIII в мышах с hemA
[547] Для сравнения стабильности и долговременной экспрессии кассет на основе однонитевой ДНК с альтернативными терапевтическими препаратами на основе нуклеиновых кислот, конструкцию плазмиды FVIIIco6XTEN (фиг. 1A) подвергали расщеплению с помощью PvuII или AflII для создания двухнитевой линейной ДНК с последовательностями ITR AAV или без них. Линейную двухнитевую ДНК без ITR очищали для создания конструкции 'dsDNA без ITR'. Наконец, лигирование очищенной dsDNA без ITR за счет перекрывающихся сайтов распознавания AflII привело к образованию мини-кольцевой ДНК. Данная маленькая, кольцевая, плазмидоподобная конструкция ДНК не содержит никакой бактериальной последовательности и/или последовательности ITR. Мышам с HemA инъецировали эквимолярные концентрации конструкции ДНК посредством гидродинамической инъекции и уровни активности FVIII определяли в собранных образцах плазмы крови в течение 2-4 месяцев. Все конструкции ДНК обеспечивали исходные терапевтические уровни FVIII в диапазоне 30-60% от нормы, однако только однонитевая ДНК продемонстрировала стабильную устойчивую экспрессию трансгена на уровне 32% в течение 4 месяцев после инъекции (фиг. 5). Все двухнитевые ДНК и миникольцевые ДНК достигали стабильных уровней экспрессии на уровне 6-10% от нормы в дни 14-42, однако данное плато представляет только 10% от наблюдаемой исходной активности FVIII. Поскольку временные и повышенные уровни экспрессии FVIII могут приводить к образованию нейтрализующих антител к лекарственному средству, в условиях гемофилии A для иммунологической толерантности необходима стабильная экспрессия.
Пример 2d. In vivo сравнение ITR дикого типа и производного B19
[548] Для сравнения эффекта производного ITR B19 (B19d135, фиг. 1D, таблица 2C) с полноразмерным ITR B19 (таблица 2C), создавали кассету экспрессии FVIIIco6XTEN, фланкированную ITR из 248 пар оснований (фиг. 1F). Мышам с гемофилией A осуществляли гидродинамическую инъекцию 30 мкг однонитевой FVIII-ДНК, фланкированной ITR B19d135 (фиг. 1D), GPVd165 (фиг. 1E) или B19 дикого типа (фиг. 1F). У всех когорт плазму собирали через 3, 7, 14, 21, 28 и 35 дней после инъекции, при этом дополнительные образцы отбирали в дни 42, 55 и 84 в случае конструкций B19d135 и GPVd165 и анализировали в отношении активности FVIII с помощью хромогенного анализа (фиг. 6). По сравнению с производным ITR B19 полноразмерный ITR приводил к увеличению экспрессии FVIII в приблизительно 2,5 раза. Более того, экспрессия FVIII с конструкции с ITR дикого типа была стабильной с самого начала.
Пример 2e. Оценка повторного введения одноцепочечной "голой" ДНК in vivo.
[549] Критическим ограничением методов современной генной терапии является невозможность повторного введения терапевтического препарата вследствие образования антител к лекарственному средству, направленных против вирусного капсида вектора для генной терапии. Однако системы для генной терапии, в которых отсутствуют иммуногенные белки, могли бы позволить повторное введение доз для повышения уровней у пациента до необходимого терапевтического уровня. Для оценки того, можно ли вводить повторно однонитевые кассеты, фланкированные ITR вируса, отличного от AAV, по настоящему изобретению, мышам с hemA инъецировали 30 мкг ssDNA, содержащей ITR B19d135 и GPVd165 в дни 0 и 35 (фиг. 6). У мышей, которым вводили GPVd165-FVIII, достигались стабильные уровни FVIII, составляющие примерно 5% от нормы, во время первого месяца наблюдения. После второй дозы ssDNA уровни FVIII выросли до 10% перед небольшим уменьшением, что демонстрирует повышение уровней FVIII в 2 раза. У мышей, которым вводили B19d135-FVIII, достигались стабильные уровни FVIII, составляющие 8%, в течение первой недели, которые выросли в приблизительно 3,5 раза до 30% перед уменьшением до 25%. Эти данные демонстрируют, что повторное введение однонитевой ДНК с ITR вируса, отличного от AAV, может повышать уровни стабильной экспрессии FVIII у мышей с гемофилией A.
Пример 3. Создание и оценка in vivo экспрессионных конструкций FVIII, несущих производные ITR парвовирусов, отличных от AAV, B19d135 и GPVd162
Пример 3a. Определение минимальных существенных последовательностей ITR B19 и GPV
[550] На основе сравнения последовательностей ITR депендовирусов AAV2 и GPV и эритровируса B19 (номера доступа в GenBank NC_001401.2, U25749.1 и KY940273.1 соответственно) разрабатывали минимальные последовательности ITR парвовирусов GPV и B19, которые потребуются при наличии дополнительных последовательностей (спейсеров, вставок, инверсий, добавлений и/или рекомбинаций с последовательностями ITR других парвовирусов дикого типа) или без них для устойчивой трансдукции эукариотических клеток с помощью генетических конструкций, несущих такие ITR (фиг. 3A и 3B). Выравнивание последовательностей ITR AAV2, GPV и B19 выявило консервативные области B19v1 и GPVv1 у всех трех видов вирусов (представлены в таблицах 2A-2C) в виде непрерывных последовательностей без спейсерных областей вариабельной последовательности Аналогичным образом разрабатывали варианты минимальных существенных последовательностей B19v3 и GPVv3 на основе сравнения последовательностей ITR B19 и GPR. Поскольку экспрессионные конструкции FVIII, несущие ITR GPVd162, показали лучшие результаты в экспериментах in vivo, чем генетические конструкции, несущие ITR B19d135, выдвинули гипотезу, что последовательность B19v3 содержит области минимальной последовательности ITR B19, которые являются консервативными в последовательностях B19 и GPV ITR, и последовательность GPVv3 содержит участки минимальных последовательностей ITR GPV, которые присутствуют в последовательности ITR GPV и отсутствуют в последовательности ITR B19 (таблицы 2B и 2C). Последовательности B19v2 и GPVv2 создавали путем исключения первых 135 и 162 нуклеотидов и соответствующих комплементарных 135 и 162 нуклеотидов в палиндромных областях ITR в последовательностях ITR B19 и GPV соответственно (таблицы 2B и 2C).
Пример 3b. Ориентация палиндромных областей ITR B19 и GPV и их производных в функциональных генетических конструкциях.
[551] Часть парвовирусных ITR состоит из самокомплементарной палиндромной области. Для рекомбинантных инфекционных парвовирусов В19 было ранее продемонстрировано, что "спасенные" вирусы, несущие палиндромные области в прямой и обратной ориентациях, проявляли сходные свойства роста (Manaresi et al. Virology 508 (2017): 54-62). Следовательно предполагается, что генетические экспрессионные конструкции, несущие ITR B19 и GPV и их производные, остаются функциональными независимо от того, находятся ли палиндромные области таких ITR в прямой, обратной или любой возможной комбинации 5'- и 3'-ITR по отношению к генной кассете экспрессии. Для подтверждения данной гипотезы ITR B19d135 и GPVd162, а также ITR B19 и GPV дикого типа будут включать в кассету экспрессии FVIIIco6XTEN в прямой, обратной и инвертированной ориентациях с применением идентичных, а также обратно комплементарных последовательностей для ITR из одного вида. Однонитевую ДНК из таких плазмид будут получать и тестировать на мышах с гемофилией A в отношении целевой экспрессии FVIII в печени, обусловленной промотором TTPp, как описано в примере 2a, 2b и 2d. В дополнение к изучению всех ориентаций ITR одного вида также будут создавать комбинации ITR GPV и B19 дикого типа и их производных и тестировать их в отношении экспрессии FVIII у мышей с гемофилией A. Такие кассеты экспрессии будут содержать один ITR, происходящий из B19, и один ITR, происходящий из GPV, для определения того, могут ли негомологичные последовательности ITR усиливать эписомальную конкатемеризацию и долговременную экспрессию требуемого трансгена. Мышам с гемофилией A посредством гидродинамической инъекции будут вводить 10, 20 или 50 мкг ssDNA, содержащей вышеуказанные кассеты экспрессии, и FVIII будут измерять в мышиной плазме крови, собранной с недельными интервалами после инъекции. Воздействие на экспрессию FVIII и срок действия у мышей, которым вводили данные кассеты экспрессии, будут напрямую сравнивать с экспрессией FVIII и сроком действия у мышей, которым вводили B19d135, GPVd162 и кассеты экспрессии с ITR соответствующего дикого типа (таблицы 2B, 2C, 2D, и 2F).
Пример 3c. Системная инъекция генетических конструкций, несущих производные ITR парвовирусов, отличных от AAV, B19d135 и GPVd162, у мышей с HemA
[552] Для оценки экспрессии FVIII in vivo с конструкций ssDNA, которые несут производные ITR вирусов, отличных от AAV, B19d135 и GPVd162, мышей с HemA возрастом 5-12 недель будут подвергать системной доставке 5, 10, 20 или 50 мкг/мышь каждой генной кассеты экспрессии на основе ssDNA посредством HDI. Образцы крови будут собирать через 1, 3, 7, 14, 21 и 28 дней p.i., а затем один раз в месяц в течение периода 4 месяцев. Активность FVIII в крови будут анализировать с помощью хромогенного анализа активности FVIII.
Пример 4. Получение и оценка in vivo экспрессионных конструкций на основе ceDNA, несущих производные ITR парвовирусов, отличных от AAV, B19d135 и GPVd162, в клетках насекомых
Пример 4a. Применение бакуловирусной системы экспрессии для создания экспрессионных конструкций на основе ceDNA, несущих производные ITR B19d135 и GPVd162
[553] Аналогично конструкциям AAV-FVIII, B19-FVIII и GPV-FVIII, описанным в примере 1d, бакуловирусную систему экспрессии будут применять для получения FVIII за счет экспрессии с генетических конструкций, несущих производные ITR парвовирусов, отличных от AAV, B19d135 и GPVd162, в форме ceDNA в клетках насекомых.
Пример 4b. Системная инъекция экспрессионных конструкций на основе ceDNA, несущих производные ITR парвовирусов, отличных от AAV, B19d135 и GPVd162, мышам с HemA.
[554] Для оценки vivo экспрессии FVIII in с конструкций на основе ceDNA, которые несут производные ITR парвовирусов, отличных от AAV, B19d135 и GPVd162, каждую генную кассету экспрессии на основе ceDNA из расчета 5, 10, 20 или 50 мкг/мышь будут подвергать системной доставке посредством HDI мышам с HemA возрастом 5-12 недель. Образцы крови будут собирать через 1, 3, 7, 14, 21 и 28 дней p.i., а затем один раз в месяц в течение периода 4 месяцев. Активность FVIII в крови будут анализировать с помощью хромогенного анализа активности FVIII.
Пример 5. Получение составов на основе липидных наночастиц с экспрессионными конструкциями FVIII на основе ssDNA и ceDNA
[555] После получения каждой ssDNA или ceDNA, как описано в примерах 1 и 4, каждую генетическую конструкцию будут составлять в липидные наночастицы (LNP) с применением соответствующих липидных композиций за счет микрожидкостного перемешивания (LNP-ssDNA и LNP-ceDNA). Соотношение липида к ДНК (N/P) будут корректировать для оптимизации клеточной трансдукции и экспрессии FVIII. Родительские плазмиды, кодирующие кассеты экспрессии FVIII, фланкированные ITR AAV или парвовирусов, отличных от AAV, составленные в LNP, будут применять в качестве контролей для проверки эффективности трансдукции.
Пример 6. Оценка in vitro и in vivo LNP-ssDNA и LNP-ceDNA
Пример 6a. Оценка in vitro экспрессии FVIII, опосредованной ssDNA и ceDNA, в культивируемых гепатоцитах
[556] Для целенаправленной доставки генов генетические экспрессионные конструкции FVIII на основе ssDNA или ceDNA и соответствующие родительские контрольные плазмиды составляли в LNP, как описано в примере 5. Клетки Huh7 высевали в 24-луночные планшеты для культивирования тканей из расчета 1×105 клеток/лунка и инкубировали в течение ночи. На следующий день составы на основе LNP-ssDNA добавляли к клеткам из расчета 1000, 500, 250, 125 и 62,5 нг/лунка. Культуральную среду собирали через 48 часов после трансдукции после замены среды через 24 часа после трансдукции. Активность FVIII в культуральной среде измеряли с помощью хромогенного анализа активности FVIII при сравнении со стандартом FACT плазмы крови человека. Плазмиду, несущую кассету FVIIIco6XTEN под контролем промотора CAGp и фланкированную ITR AAV, инкапсулировали в липидную наночастицу при соотношении N/P, составляющем 72, 36 и 18 (фиг. 8A). После трансдукции клеток Huh7 содержание FVIII измеряли в кондиционированных средах. Трансдукция клеток при соотношении N/P, составляющем 18, приводила к повышенным уровням FVIII относительно соотношений, составляющих 36 и 72, при этом пиковая доза, составляющая 1 мкг/мл, давала более 2 МЕ/мл. Эти данные демонстрируют применимость доставки с помощью LNP в клетки-мишени печени. Чтобы исследовать эффективность трансдукции ssDNA, находящейся под контролем специфического для печени промотора, при доставке с помощью LNP, кассету FVIIIco6XTEN под контролем промотора TTPp инкапсулировали при соотношении N/p 2 и трансдуцировали ею клетки Huh7 (фиг. 8B). В соответствии с предыдущими данными авторов настоящего изобретения (фиг. 8A) соотношение N/P, составляющее 18, привело к повышенным уровням активности FVIII по сравнению с соотношением, составляющим 36. К тому же, эти данные демонстрируют подтверждение правильности концепции доставки ssDNA FVIII с помощью в клетки печени. После 24 часов приблизительно 2×105 клеток Huh7, трансдуцированных с помощью 2 мкг/мл однонитевой FVIIIco6XTEN-AAV, продуцировали 0,33 МЕ/мл FVIII.
[557] Кроме того, в литературе было показано, что клеточные гистоны регулярно располагаются вдоль эписом rAAV, создавая хроматиноподобную структуру, сходную с нуклеосомным паттерном хромосомной ДНК в клетках. Следовательно, способность этих конструкций формировать хроматиноподобные нуклеосомные структуры, необходимые для устойчивой трансдукции клеток-мишеней, также будут оценивать с помощью Саузерн-блоттинга.
Пример 6b. Оценка долговременной экспрессии FVIII, опосредованной ssDNA и ceDNA, составленными в LNP, у мышей с HemA после внутривенного введения
[558] Мышам с HemA возрастом 5-12 недель будут вводить одно из LNP-ssDNA, LNP-ceDNA или LNP-pDNA (плазмида контроля) из расчета 5, 10, 20, 40, 100 мкг/мышь посредством IV инъекции, N=4/группа. Образцы крови будут собирать в выбранные моменты времени, начиная с 48 часов после инъекции вплоть до 6 месяцев, и активность FVIII в крови будут анализировать с помощью хромогенного анализа активности FVIII. Профиль экспрессии FVIII у мышей, обработанных с помощью LNP-ssDNA или LNP-ceDNA, будут сравнивать с таковым у мышей, обработанных с помощью LNP-pDNA, для каждой генетической конструкции, описанной в примерах 1 и 4.
Пример 6c. Оценка in vivo экспрессии FVIII, опосредованной ssDNA или ceDNA, после бустерной инъекции
[559] Подгруппе мышей, обработанных с помощью LNP-ssDNA или LNP-ceDNA в примере 6b, будут давать дополнительную бустерную IV инъекцию соответствующих LNP в той же дозе через 2 месяца после исходной инъекции. Образцы крови будут собирать в выбранные моменты времени, начиная с 48 часов после бустерной инъекции вплоть до 6 месяцев. Активность FVIII в крови будут анализировать с помощью хромогенного анализа активности FVIII. Профиль экспрессии FVIII у мышей, обработанных с помощью LNP-ssDNA или LNP-ceDNA, будут сравнивать с таковым у мышей, обработанных с помощью соответствующей LNP-pDNA.
Пример 7. Применимость генетических экспрессионных конструкций, несущих ITR, происходящие из B19 или GPV, для общего применения в генной терапии
Пример 7a. Создание репортерных генетических конструкций, несущих ITR, происходящие из B19 или GPV
[560] Чтобы продемонстрировать применимость генетических систем экспрессии на основе ITR вирусов, отличных от AAV, в качестве платформы для общего применения в путях применения в генной терапии, создавали репортерные конструкции, содержащие кассету экспрессии с зеленым флуоресцентным белком (GFP) или люциферазой (luc), фланкированную одним из ITR B19d135 или GPVd162, на основе конструкций, описанных в примере 1b. Таким образом, открытую рамку считывания (ORF) FVIII в B19-FVIIIco6XTEN (фиг. 1C) и GPV-FVIIIco6XTEN (фиг. 1D) заменяли на ORF для GFP или luc с помощью традиционных методик молекулярного клонирования.
[561] Также создавали кассеты экспрессии, фланкированные ITR B19d135 или GPVd162, содержащие трансген фенилаланингидроксилазы (PAH) мыши (фиг. 7A), которые применяли для оценки экспрессии PAH и снижения концентраций фенилаланина в крови в соответствующей мышиной модели фенилкетонурии. При применении данной модели мышам с PKU (n=3) вводили 200 мкг ssDNA, фланкированной ITR вируса, отличного от AAV, посредством гидродинамической инъекции для экспрессии в печени. Образцы крови собирали в дни 3, 7, 14, 28, 42, 56, 70 и 81 и плазму крови выделяли для определения концентрации фенилаланина (фиг. 7B-7C). Мыши, получавшие кассету экспрессии, содержащую ITR B19d135, продемонстрировали снижение уровней фенилаланина с 370 мкг/мл до 210 мкг/мл в день 3, которые стабильно поддерживались до дня 81 (фиг. 7B). Мыши, получавшие кассету с ITR GPVd162, продемонстрировали снижение уровней фенилаланина в крови с 350 мкг/мл до 310 мкг/мл в день 14, а затем они продолжили снижаться до устойчивого уровня, составляющего 250 мкг/мл в день 42 (фиг. 7C). Эти снижения концентраций фенилаланина в крови представляют 45% и 30% снижение по сравнению с концентрациями до инъекции (фиг. 7D). Чтобы подтвердить присутствие белка PAH мыши в печени, осуществляли вестерн-блоттинг анализ лизатов печени, взятых из обработанных мышей в день 81 после инъекции. Для выявления белка PAH мыши применяли антитело к метке FLAG, причем на фиг. 7E продемонстрирован выявляемый белок PAH мыши в 5 из 6 обработанных животных, при этом значительно большие уровни белка наблюдали у мышей, обработанных с помощью ssDNA, содержащей ITR B19d135. Эти данные согласуются со снижением фенилаланина в крови, наблюдаемым на фиг. 7B-7D. Взятые вместе, они демонстрируют, что доставка однонитевой ДНК может приводить к долгосрочной экспрессии функциональных ферментов печени.
[562] Последовательности различных конструкций PAH, применяемые в эксперименте, приведены в таблицах 10A и 10B.
Таблица 10A. Конструкция B19-PAH, несущая ITR B19d135 (нуклеотиды 1-4146; SEQ ID NO: 197)
Таблица 10B. Конструкция GPV-PAH, несущий ITR GPVd162 (нуклеотиды 1-4214; SEQ ID NO: 198)
Пример 7b. Получение репортерных генетических конструкций ssDNA, несущих ITR, происходящие из B19 или GPV
[563] Конструкции ssDNA репортер/PAH будут получать, как описано в примере 1c. Вкратце, плазмиды будут расщеплять с помощью LguI. Фрагменты ssDNA с образованными шпилечными структурами ITR будут создавать за счет денатурации продуктов в виде двухнитевого фрагмента ДНК (репортерная кассета экспрессии и плазмидный каркас), полученных при расщеплении под действием LguI, при 95°C и последующего охлаждения при 4°C для обеспечения возможности сворачивания палиндромных последовательностей ITR (фиг. 1A). Полученные конструкции ssDNA будут тестировать на мышах в отношении способности обеспечивать устойчивую трансдукцию в печени, мышечной ткани, фоторецепторах в глазу и центральной нервной системе (ЦНС).
Пример 7c. Оценка in vivo экспрессии репортера, опосредованной ssDNA
[564] Чтобы подтвердить способность репортерных конструкций на основе ssDNA, описанных в примере 7b, опосредовать устойчивую экспрессию трансгена in vivo, мышам возрастом 5-12 недель (4 животных на группу) будут инъецировать 5, 10 или 20 мкг/мышь репортерной ssDNA с помощью системного введения, местного введения для нацеливания на мышечную ткань и клетки ЦНС и/или субретинального введения для нацеливания на фоторецепторные клетки.
[565] Чтобы оценить экспрессию PAH c экспрессионных конструкций на основе ITR В19 и GPV, будут применять соответствующую мышиную модель заболевания. Эти генетические конструкции будут доставлять системно с помощью HDI для нацеливания на печень.
--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> BIOVERATIV THERAPEUTICS INC.
<120> МОЛЕКУЛЫ НУКЛЕИНОВОЙ КИСЛОТЫ И ПУТИ ИХ ПРИМЕНЕНИЯ ДЛЯ НЕВИРУСНОЙ ГЕННОЙ
ТЕРАПИИ
<130> 615113: SA9-465PC
<150> 62/716,826
<151> 2018-08-09
<160> 198
<170> PatentIn версия 3.5
<210> 1
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-5
<400> 1
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860
cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920
ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980
attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040
atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100
atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160
atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220
tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280
ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340
cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400
gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460
cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520
cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580
caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640
ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700
cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760
cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820
ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880
gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940
ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000
ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060
gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120
taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180
caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240
attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300
tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360
tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420
gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480
cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540
tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600
ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660
ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720
agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780
aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840
tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900
atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960
tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020
tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080
aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140
tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200
caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260
tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320
cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374
<210> 2
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-4
<400> 2
atgcagatcg agctgagcac gtgcttcttc ctgtgcctgc tgaggttctg cttcagcgcc 60
accaggaggt actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg 120
ggcgagctgc ccgtggacgc caggttcccc cccagggtgc ccaagagctt ccccttcaac 180
acgagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccatct gttcaatatc 240
gccaagccca ggcccccctg gatggggctg ctggggccca cgatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480
aaggagaatg ggcccatggc cagcgacccc ctgtgcctga cctactctta cctgagccac 540
gtggatctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggatagggac 720
gccgccagcg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggtct 780
ctgcccggcc tgatcggctg ccacaggaag agcgtgtact ggcacgtgat cggcatgggg 840
accacccccg aggtgcacag catcttcctg gagggccaca cgttcctggt gaggaatcac 900
aggcaggcca gcctggagat cagcccgatc accttcctga ccgcccagac cctgctgatg 960
gacctggggc agttcctgct gttctgccat atcagctctc accagcacga cggcatggag 1020
gcctacgtga aggtggatag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gaggttcgac 1140
gacgacaata gcccgagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcatt acatcgccgc cgaggaggag gattgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggtcttacaa gagccagtac ctgaacaacg ggccccagag gatcggcagg 1320
aagtacaaga aggtgaggtt catggcctac accgacgaga ccttcaagac cagggaggcg 1380
atccagcacg agagcgggat cctggggccc ctgctgtacg gcgaggtggg cgacacgctg 1440
ctgatcatct tcaagaacca ggccagcagg ccgtacaata tctaccccca cgggatcacc 1500
gacgtgaggc ccctgtactc taggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacgggccc 1620
acgaagagcg accccaggtg cctgaccagg tactacagct ctttcgtgaa catggagagg 1680
gacctggcca gcggcctgat cgggcccctg ctgatctgct acaaggagag cgtggatcag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttcagcgt gttcgacgag 1800
aataggtctt ggtacctgac cgagaatatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg atcccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag 2040
atggtgtacg aggataccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccataact ccgacttcag gaataggggc 2160
atgaccgccc tgctgaaggt gagctcttgc gacaagaaca ccggcgacta ctacgaggat 2220
agctacgagg atatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggtct 2280
ttcagccaga acccccccgt gctgaagagg caccagaggg agatcaccag gacgaccctg 2340
cagagcgacc aggaggagat cgactacgac gacacgatca gcgtggagat gaagaaggag 2400
gatttcgaca tctacgacga ggacgagaat cagagcccca ggtctttcca gaagaagacc 2460
aggcattact tcatcgccgc cgtggagagg ctgtgggact acggcatgag cagctctccc 2520
cacgtgctga ggaatagggc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca ggggcgagct gaacgagcac 2640
ctgggcctgc tggggcccta catcagggcc gaggtggagg ataacatcat ggtgaccttc 2700
aggaatcagg ccagcaggcc ctatagcttc tatagctctc tgatcagcta cgaggaggat 2760
cagaggcagg gcgccgagcc caggaagaac ttcgtgaagc ccaacgagac caagacctac 2820
ttctggaagg tgcagcacca catggccccc acgaaggacg agttcgactg caaggcctgg 2880
gcctacttca gcgacgtgga tctggagaag gacgtgcaca gcggcctgat cgggcccctg 2940
ctggtgtgcc acaccaacac cctgaacccc gcccacggca ggcaggtgac cgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaatatg 3060
gagaggaatt gcagggcccc ctgcaatatc cagatggagg acccgacctt caaggagaat 3120
tacaggttcc acgccatcaa cggctacatc atggacacgc tgcccggcct ggtcatggcc 3180
caggatcaga ggatcaggtg gtatctgctg agcatgggga gcaacgagaa tatccacagc 3240
atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaatctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccgggatc 3360
tggagggtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac gctgttcctg 3420
gtgtactcta acaagtgcca gacccccctg gggatggcca gcggccacat cagggacttc 3480
cagatcaccg ccagcggcca gtacggccag tgggccccca agctggccag gctgcactat 3540
tccggaagca tcaacgcctg gagcacgaag gagcccttca gctggatcaa ggtggatctg 3600
ctggccccca tgatcatcca cgggatcaag acccagggcg ccaggcagaa gttcagctct 3660
ctgtatatca gccagttcat catcatgtac tctctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac gctgatggtg ttcttcggca acgtggactc tagcgggatc 3780
aagcacaata tcttcaaccc ccccatcatc gccaggtaca tcaggctgca ccccacccat 3840
tactctatca ggtctaccct gaggatggag ctgatgggct gcgacctgaa cagctgcagc 3900
atgcccctgg ggatggagag caaggccatc agcgacgccc agatcaccgc cagctcttac 3960
ttcaccaaca tgttcgccac ctggagcccg agcaaggcca ggctgcacct gcagggcagg 4020
tctaacgcct ggaggcccca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag 4080
aagaccatga aggtgaccgg cgtgaccacg cagggcgtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat cagctctagc caggacggcc accagtggac cctgttcttc 4200
cagaacggca aggtgaaggt gttccagggc aaccaggata gcttcacccc cgtggtgaac 4260
agcctggacc cccccctgct gaccaggtat ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgcgaggccc aggatctgta ttga 4374
<210> 3
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-52
<400> 3
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340
cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400
gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520
catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640
ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180
caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240
atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540
tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900
atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260
agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374
<210> 4
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-62
<400> 4
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340
cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400
gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520
catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640
ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180
caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240
atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540
tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900
atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260
agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374
<210> 5
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-25
<400> 5
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360
ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480
aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780
ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020
gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140
gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500
gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620
accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800
aacaggagct ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860
cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920
ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980
attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040
atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100
atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160
atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220
tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280
ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340
cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400
gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460
cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520
cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580
caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640
ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700
cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760
cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820
ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880
gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940
ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000
ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060
gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120
taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180
caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240
attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300
tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360
tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420
gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480
cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540
tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600
ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660
ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720
agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780
aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840
tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900
atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960
tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020
tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080
aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140
tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200
caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260
tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320
cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374
<210> 6
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-26
<400> 6
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360
ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480
aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780
ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020
gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140
gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500
gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620
accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800
aacaggagct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340
caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400
gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460
agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520
cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580
caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640
ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700
cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760
cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820
ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940
ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000
tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060
gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120
tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180
caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240
attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300
tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360
tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420
gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480
cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540
tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600
ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660
ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720
aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780
aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840
tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900
atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960
ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020
tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080
aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140
tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200
caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260
tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320
cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374
<210> 7
<211> 1734
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-52-NT58
<400> 7
gcgacccgcc gatactacct gggagcagtg gagctctcct gggattacat gcagagcgac 60
cttggggagc tgcccgtgga tgccaggttc cctccccggg tgccaaagtc gtttccgttc 120
aacacctccg tggtgtacaa gaaaactctg ttcgtggagt tcaccgacca cctgttcaat 180
atcgccaagc ccagacctcc ctggatgggg ctgttgggac ctaccatcca agcggaggtg 240
tacgacactg tggtcatcac tctgaagaac atggcctcgc atcccgtgtc cctgcacgcc 300
gtgggagtgt cttactggaa agcgtccgag ggggccgaat acgacgacca gacctcgcag 360
agagaaaagg aagatgacaa ggtgttccca ggaggatcgc acacctacgt gtggcaagtg 420
ttgaaggaga acggcccaat ggcctccgac ccgctgtgcc tgacctactc gtacctgtcc 480
cacgtggacc tcgtgaagga cctcaactcg ggactgattg gagccctgct ggtctgcagg 540
gaaggctcac tggcgaaaga aaagactcag accttgcaca agttcattct gctgttcgct 600
gtgttcgacg aggggaagtc gtggcacagc gagactaaga actccctgat gcaagataga 660
gatgccgcct ccgcccgggc ctggcctaag atgcacaccg tgaacggtta cgtgaaccgc 720
tccctccctg gcctgattgg atgccaccgg aagtccgtgt actggcacgt gatcgggatg 780
gggaccaccc ccgaggtgca cagcatcttc ctggaaggtc acacatttct cgtgcgcaac 840
caccggcagg cctccctgga aatcagcccc attaccttcc tcactgccca gactctgctg 900
atggacctgg gacagttcct gctgttctgc catatctcct cccaccaaca tgacggaatg 960
gaggcatacg tgaaggtcga ttcctgccct gaggaacccc agctccgcat gaagaacaat 1020
gaggaagccg aggactacga cgacgacctg acggatagcg agatggatgt ggtccggttc 1080
gatgacgata acagcccttc cttcatccaa attcgctcgg tggcaaagaa gcaccccaag 1140
acctgggtgc attacattgc ggcggaagaa gaggactggg attatgcccc gcttgtcctc 1200
gctcctgacg accggagcta caagagccag tacctgaaca acggtccaca gaggatcggt 1260
agaaagtaca agaaggtccg cttcatggcc tataccgacg aaaccttcaa aactagagag 1320
gccatccaac acgaatccgg catcctgggc ccgctcttgt acggagaagt cggcgacacc 1380
cttctcatta tcttcaagaa ccaggcttcc cggccgtaca acatctatcc gcatgggatc 1440
actgacgtgc gcccactgta ctcgcggcgc ctgcccaagg gtgtcaaaca cctgaaggat 1500
tttccgatcc ttccgggaga aatcttcaag tacaagtgga ccgtgaccgt ggaagatggc 1560
ccaactaagt ctgaccctag atgcctcacc cgctactact catccttcgt caacatggag 1620
cgcgacctgg ccagcggact gatcggcccg ctgctgattt gctacaagga atcagtggac 1680
caacggggaa accagatcat gtcggataag aggaacgtca tcctcttctc cgtg 1734
<210> 8
<211> 2583
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-52-CT
<400> 8
tttgacgaaa accggtcgtg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60
gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120
ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180
atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240
aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300
ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360
aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420
tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480
cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540
accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600
aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720
agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780
gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840
aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080
aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200
gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380
gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440
atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500
atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560
gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680
agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740
ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800
gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860
ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920
cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980
agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100
agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160
tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340
accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460
gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520
tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580
tga 2583
<210> 9
<211> 1734
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-62-NT58
<400> 9
gccactcgcc ggtactacct tggagccgtg gagctttcat gggactacat gcagagcgac 60
ctgggcgaac tccccgtgga tgccagattc cccccccgcg tgccaaagtc cttccccttt 120
aacacctccg tggtgtacaa gaaaaccctc tttgtcgagt tcactgacca cctgttcaac 180
atcgccaagc cgcgcccacc ttggatgggc ctcctgggac cgaccattca agctgaagtg 240
tacgacaccg tggtgatcac cctgaagaac atggcgtccc accccgtgtc cctgcatgcg 300
gtcggagtgt cctactggaa ggcctccgaa ggagctgagt acgacgacca gactagccag 360
cgggaaaagg aggacgataa agtgttcccg ggcggctcgc atacttacgt gtggcaagtc 420
ctgaaggaaa acggacctat ggcatccgat cctctgtgcc tgacttactc ctacctttcc 480
catgtggacc tcgtgaagga cctgaacagc gggctgattg gtgcacttct cgtgtgccgc 540
gaaggttcgc tcgctaagga aaagacccag accctccata agttcatcct tttgttcgct 600
gtgttcgatg aaggaaagtc atggcattcc gaaactaaga actcgctgat gcaggaccgg 660
gatgccgcct cagcccgcgc ctggcctaaa atgcatacag tcaacggata cgtgaatcgg 720
tcactgcccg ggctcatcgg ttgtcacaga aagtccgtgt actggcacgt catcggcatg 780
ggcactacgc ctgaagtgca ctccatcttc ctggaagggc acaccttcct cgtgcgcaac 840
caccgccagg cctctctgga aatctccccg attacctttc tgaccgccca gactctgctc 900
atggacctgg ggcagttcct tctcttctgc cacatctcca gccatcagca cgacggaatg 960
gaggcctacg tgaaggtgga ctcatgcccg gaagaacctc agttgcggat gaagaacaac 1020
gaggaggccg aggactatga cgacgatttg actgactccg agatggacgt cgtgcggttc 1080
gatgacgaca acagccccag cttcatccag attcgcagcg tggccaagaa gcaccccaaa 1140
acctgggtgc actacatcgc ggccgaggaa gaagattggg actacgcccc gttggtgctg 1200
gcacccgatg accggtcgta caagtcccag tatctgaaca atggtccgca gcggattggc 1260
agaaagtaca agaaagtgcg gttcatggcg tacactgacg aaacgtttaa gacccgggag 1320
gccattcaac atgagagcgg cattctggga ccactgctgt acggagaggt cggcgatacc 1380
ctgctcatca tcttcaaaaa ccaggcctcc cggccttaca acatctaccc tcacggaatc 1440
accgacgtgc ggccactcta ctcgcggcgc ctgccgaagg gcgtcaagca cctgaaagac 1500
ttccctatcc tgccgggcga aatcttcaag tataagtgga ccgtcaccgt ggaggacggg 1560
cccaccaaga gcgatcctag gtgtctgact cggtactact ccagcttcgt gaacatggaa 1620
cgggacctgg catcgggact cattggaccg ctgctgatct gctacaaaga gtcggtggat 1680
caacgcggca accagatcat gtccgacaag cgcaacgtga tcctgttctc cgtg 1734
<210> 10
<211> 2583
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-62-CT
<400> 10
tttgatgaaa acagatcctg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60
gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120
ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180
atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240
aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300
ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360
aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420
tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480
cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540
accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600
aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720
agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780
gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840
aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080
aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200
gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380
gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440
atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500
atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560
gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680
agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740
ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800
gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860
ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920
cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980
agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100
agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160
tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340
accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460
gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520
tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580
tga 2583
<210> 11
<211> 1734
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-25-NT58
<400> 11
gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60
ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180
atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240
tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300
gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360
agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420
ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480
cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540
gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600
gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660
gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720
agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780
ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840
cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900
atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960
gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020
gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080
gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140
acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200
gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260
aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320
gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380
ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440
accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500
ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560
cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620
agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680
cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734
<210> 12
<211> 2583
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-25-CT
<400> 12
ttcgacgaga acaggagctg gtacctgact gaaaacatcc agcggttcct ccccaacccc 60
gcgggcgtgc agctggaaga tcctgagttt caggcatcaa acatcatgca ctccattaac 120
ggctacgtgt tcgattcgct gcagctgagc gtgtgtctgc acgaagtggc ctactggtac 180
atcctgtcca ttggtgccca gactgacttc ctgtccgtgt ttttctccgg ctacacgttc 240
aagcacaaga tggtgtacga ggacaccctg accctcttcc ctttttccgg cgaaactgtg 300
tttatgagca tggagaatcc cggcctgtgg atcttgggct gccacaacag cgacttccgt 360
aacagaggaa tgactgcgct gctcaaggtg tccagctgcg acaagaacac cggagactat 420
tatgaggact catacgagga catctccgcc tacctcctgt ccaagaataa cgccattgaa 480
cctcggagct tcagccagaa cccacccgtg cttaagagac atcaacggga gatcactagg 540
accaccctgc agtcagacca ggaggaaatc gactacgatg acaccatctc ggtcgagatg 600
aagaaggagg actttgacat ctacgacgaa gatgaaaacc agagcccgag gtcgttccaa 660
aagaaaaccc gccactactt tattgctgct gtcgagcggc tgtgggacta cggaatgtcg 720
tcctcgccgc acgtgctccg caaccgagcc cagagcggct cggtgccgca attcaagaag 780
gtcgtgttcc aggagttcac tgacgggagc ttcactcagc ctttgtaccg gggagaactc 840
aatgaacatc tcggcctcct cggaccttac atcagagcag aagtggaaga taacatcatg 900
gtcactttcc gtaaccaagc cagccgcccg tactcgttct actcctccct catttcttac 960
gaagaggacc agcggcaggg cgcagaaccg cgcaagaact tcgtgaagcc caacgaaacc 1020
aagacctact tctggaaagt gcagcatcat atggccccga ctaaggacga gtttgactgc 1080
aaagcctggg cctacttctc cgatgtggac ttggagaagg acgtccactc cggcctcatc 1140
ggtcccctgc tcgtgtgcca taccaatacc ctgaaccccg cacacggtcg ccaggtcacc 1200
gtgcaggagt tcgctctgtt cttcactatc ttcgacgaaa ctaagtcctg gtacttcacc 1260
gagaacatgg agaggaactg cagagccccc tgtaacatcc agatggagga cccgacgttc 1320
aaggaaaact accggttcca cgccattaac ggatacatca tggatacgct gccgggtctt 1380
gtgatggccc aggatcaacg gatcagatgg tacttattgt cgatgggcag caacgagaac 1440
atccactcta ttcacttctc cggtcatgtg ttcactgtgc ggaagaagga agagtacaag 1500
atggccctgt acaaccttta tcccggagtg ttcgaaactg tggaaatgct gccgtcgaag 1560
gccggcattt ggcgcgtgga gtgtttgatt ggagaacatc tccatgcggg gatgtcaacc 1620
ctgttcctgg tgtatagcaa caagtgccag actccgcttg ggatggcgtc aggacacatt 1680
agggatttcc agatcactgc gtccggccag tacggccaat gggcccctaa gctggcccgc 1740
ctgcattact ccggatccat taacgcctgg tcaaccaagg agccattctc ctggatcaag 1800
gtggaccttc tggcccccat gattatccac ggaattaaga cccagggggc ccggcagaag 1860
ttctcctcac tgtacatcag ccagttcata atcatgtact ccctggacgg aaagaagtgg 1920
caaacctaca gggggaacag caccggcaca ctgatggtct ttttcggaaa tgtggactcc 1980
tccgggatta agcataacat cttcaaccct ccgattatcg ctcggtacat tagacttcac 2040
cctacccact acagcattcg ctccaccctg cggatggaac tgatgggctg cgatctgaac 2100
tcgtgcagca tgccgttggg aatggagtcc aaagcaattt ccgacgcgca gatcaccgcc 2160
tcgtcctact ttaccaacat gttcgccacg tggtcaccgt ccaaggcccg gctgcacctc 2220
cagggaagat ccaacgcatg gcggccacag gtcaacaacc ctaaggagtg gctccaggtg 2280
gacttccaga aaaccatgaa ggtcaccgga gtcacaaccc agggagtgaa gtcgctgctg 2340
acttctatgt acgtcaagga gttcctgatc tccagcagcc aggacgggca ccagtggacc 2400
ctgttcttcc aaaatggaaa ggtcaaggtg tttcagggca atcaggattc attcaccccg 2460
gtggtgaact cccttgatcc acccctcctg acccgctacc ttcgcatcca cccacagtcc 2520
tgggtgcacc agatcgcgct gaggatggag gtcctgggat gcgaagccca ggacctgtac 2580
tga 2583
<210> 13
<211> 1734
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-26-NT58
<400> 13
gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60
ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180
atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240
tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300
gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360
agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420
ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480
cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540
gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600
gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660
gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720
agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780
ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840
cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900
atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960
gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020
gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080
gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140
acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200
gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260
aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320
gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380
ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440
accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500
ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560
cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620
agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680
cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734
<210> 14
<211> 2583
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-26-CT
<400> 14
ttcgacgaga acaggagctg gtacctcact gaaaacatcc agaggttcct cccaaacccc 60
gcaggagtgc aactggagga ccctgagttt caggcctcga atatcatgca ctcgattaac 120
ggttacgtgt tcgactcgct gcagctgagc gtgtgcctcc atgaagtcgc ttactggtac 180
attctgtcca tcggcgccca gactgacttc ctgagcgtgt tcttttccgg ttacaccttt 240
aagcacaaga tggtgtacga agataccctg accctgttcc ctttctccgg cgaaacggtg 300
ttcatgtcga tggagaaccc gggtctgtgg attctgggat gccacaacag cgactttcgg 360
aaccgcggaa tgactgccct gctgaaggtg tcctcatgcg acaagaacac cggagactac 420
tacgaggact cctacgagga tatctcagcc tacctcctgt ccaagaacaa cgcgatcgag 480
ccgcgcagct tcagccagaa cccgcctgtg ctgaagaggc accagcgaga aattacccgg 540
accaccctcc aatcggatca ggaggaaatc gactacgacg acaccatctc ggtggaaatg 600
aagaaggaag atttcgatat ctacgacgag gacgaaaatc agtcccctcg ctcattccaa 660
aagaaaacta gacactactt tatcgccgcg gtggaaagac tgtgggacta tggaatgtca 720
tccagccctc acgtccttcg gaaccgggcc cagagcggat cggtgcctca gttcaagaaa 780
gtggtgttcc aggagttcac cgacggcagc ttcacccagc cgctgtaccg gggagaactg 840
aacgaacacc tgggcctgct cggtccctac atccgcgcgg aagtggagga taacatcatg 900
gtgaccttcc gtaaccaagc atccagacct tactccttct attcctccct gatctcatac 960
gaggaggacc agcgccaagg cgccgagccc cgcaagaact tcgtcaagcc caacgagact 1020
aagacctact tctggaaggt ccaacaccat atggccccga ccaaggatga gtttgactgc 1080
aaggcctggg cctacttctc cgacgtggac cttgagaagg atgtccattc cggcctgatc 1140
gggccgctgc tcgtgtgtca caccaacacc ctgaacccag cgcatggacg ccaggtcacc 1200
gtccaggagt ttgctctgtt cttcaccatt tttgacgaaa ctaagtcctg gtacttcacc 1260
gagaatatgg agcgaaactg tagagcgccc tgcaatatcc agatggaaga tccgactttc 1320
aaggagaact atagattcca cgccatcaac gggtacatca tggatactct gccggggctg 1380
gtcatggccc aggatcagag gattcggtgg tacttgctgt caatgggatc gaacgaaaac 1440
attcactcca ttcacttctc cggtcacgtg ttcactgtgc gcaagaagga ggagtacaag 1500
atggcgctgt acaatctgta ccccggggtg ttcgaaactg tggagatgct gccgtccaag 1560
gccggcatct ggagagtgga gtgcctgatc ggagagcacc tccacgcggg gatgtccacc 1620
ctcttcctgg tgtactcgaa taagtgccag accccgctgg gcatggcctc gggccacatc 1680
agagacttcc agatcacagc aagcggacaa tacggccaat gggcgccgaa gctggcccgc 1740
ttgcactact ccggatcgat caacgcatgg tccaccaagg aaccgttctc gtggattaag 1800
gtggacctcc tggcccctat gattatccac ggaattaaga cccagggcgc caggcagaag 1860
ttctcctccc tgtacatctc gcaattcatc atcatgtaca gcctggacgg gaagaagtgg 1920
cagacttaca ggggaaactc caccggcacc ctgatggtct ttttcggcaa cgtggattcc 1980
tccggcatta agcacaacat cttcaaccca ccgatcatag ccagatatat taggctccac 2040
cccactcact actcaatccg ctcaactctt cggatggaac tcatggggtg cgacctgaac 2100
tcctgctcca tgccgttggg gatggaatca aaggctatta gcgacgccca gatcaccgcg 2160
agctcctact tcactaacat gttcgccacc tggagcccct ccaaggccag gctgcacttg 2220
cagggacggt caaatgcctg gcggccgcaa gtgaacaatc cgaaggaatg gcttcaagtg 2280
gatttccaaa agaccatgaa agtgaccgga gtcaccaccc agggagtgaa gtcccttctg 2340
acctcgatgt atgtgaagga gttcctgatt agcagcagcc aggacgggca ccagtggacc 2400
ctgttcttcc aaaacggaaa ggtcaaggtg ttccagggga accaggactc gttcacaccc 2460
gtggtgaact ccctggaccc cccactgctg acgcggtact tgaggattca tcctcagtcc 2520
tgggtccatc agattgcatt gcgaatggaa gtcctgggct gcgaggccca ggacctgtac 2580
tga 2583
<210> 15
<211> 2332
<212> БЕЛОК
<213> Homo sapiens
<400> 15
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1. 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg
740 745 750
Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys
755 760 765
Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn
770 775 780
Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro
785 790 795 800
His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe
805 810 815
Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser
820 825 830
Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val
835 840 845
Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly
850 855 860
Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser
865 870 875 880
Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala
885 890 895
Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His
900 905 910
Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro
915 920 925
Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp
930 935 940
Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp
945 950 955 960
Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys
965 970 975
Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys
980 985 990
Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala
995 1000 1005
Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu
1010 1015 1020
Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu
1025 1030 1035
Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp
1040 1045 1050
Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr
1055 1060 1065
Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly
1070 1075 1080
Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys
1085 1090 1095
Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His
1100 1105 1110
Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln
1115 1120 1125
Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe
1130 1135 1140
Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr
1145 1150 1155
Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn
1160 1165 1170
Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His
1175 1180 1185
Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr
1190 1195 1200
Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr
1205 1210 1215
Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg
1220 1225 1230
Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu
1235 1240 1245
Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys
1250 1255 1260
His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu
1265 1270 1275
Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys
1280 1285 1290
Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr
1295 1300 1305
Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu
1310 1315 1320
Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr
1325 1330 1335
Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr
1340 1345 1350
Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser
1355 1360 1365
Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala
1370 1375 1380
Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser
1385 1390 1395
Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser
1400 1405 1410
Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val
1415 1420 1425
Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu
1430 1435 1440
Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu
1445 1450 1455
Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys
1460 1465 1470
Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr
1475 1480 1485
Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys
1490 1495 1500
Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu
1505 1510 1515
Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile
1520 1525 1530
Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg
1535 1540 1545
Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp
1550 1555 1560
Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu
1565 1570 1575
Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys
1580 1585 1590
Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His
1595 1600 1605
Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu
1610 1615 1620
Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln
1625 1630 1635
Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
1640 1645 1650
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1655 1660 1665
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1670 1675 1680
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1685 1690 1695
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1700 1705 1710
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1715 1720 1725
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1730 1735 1740
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1745 1750 1755
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1760 1765 1770
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1775 1780 1785
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1790 1795 1800
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1805 1810 1815
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1820 1825 1830
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1835 1840 1845
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1850 1855 1860
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1865 1870 1875
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1880 1885 1890
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1895 1900 1905
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1910 1915 1920
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1925 1930 1935
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1940 1945 1950
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1955 1960 1965
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1970 1975 1980
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1985 1990 1995
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
2000 2005 2010
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
2015 2020 2025
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
2030 2035 2040
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
2045 2050 2055
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
2060 2065 2070
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
2075 2080 2085
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
2090 2095 2100
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
2105 2110 2115
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
2120 2125 2130
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
2135 2140 2145
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
2150 2155 2160
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
2165 2170 2175
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
2180 2185 2190
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
2195 2200 2205
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
2210 2215 2220
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
2225 2230 2235
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
2240 2245 2250
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
2255 2260 2265
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
2270 2275 2280
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
2285 2290 2295
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
2300 2305 2310
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
2315 2320 2325
Gln Asp Leu Tyr
2330
<210> 16
<211> 4371
<212> ДНК
<213> Искусственная последовательность
<220>
<223> BDD-FVIII (не оптимизированная; "родительская"), нуклеотидная
последовательность
<400> 16
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt 2340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c 4371
<210> 17
<211> 1438
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> BDD-FVIII (не оптимизированная; "родительская"), аминокислотная
последовательность
<400> 17
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1. 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 18
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Нуклеотидная последовательность XTEN
<400> 18
ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60
tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120
gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180
ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240
cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300
gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360
gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420
cccaccagca ctgaagaagg tgcctcgagc 450
<210> 19
<211> 4824
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-52-XTEN
<400> 19
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccccccagt gctgaagagg 2760
caccagaggg agatcaccag gaccaccctg cagtctgacc aggaggagat cgactatgat 2820
gacaccatca gcgtggagat gaagaaggag gacttcgaca tctacgacga ggacgagaac 2880
cagagcccca ggagcttcca gaagaagacc aggcactact tcattgctgc tgtggagagg 2940
ctgtgggact atggcatgtc cagcagcccc catgtgctga ggaacagggc ccagtctggc 3000
agcgtgcccc agttcaagaa agtcgtgttc caggagttca ccgacggcag cttcacccag 3060
cccctgtaca gaggggagct gaacgagcac ctgggcctgc tgggccccta catcagggcc 3120
gaggtggagg acaacatcat ggtgaccttc aggaaccagg ccagcaggcc ctacagcttc 3180
tacagcagcc tgatcagcta cgaggaggac cagaggcagg gggctgagcc caggaagaac 3240
tttgtgaagc ccaatgaaac caagacctac ttctggaagg tgcagcacca catggccccc 3300
accaaggacg agttcgactg caaggcctgg gcctacttct ctgacgtgga cctggagaag 3360
gacgtgcact ctggcctgat tggccccctg ctggtgtgcc acaccaacac cctgaaccct 3420
gcccatggca ggcaggtgac tgtgcaggag ttcgccctgt tcttcaccat cttcgatgaa 3480
accaagagct ggtacttcac tgagaacatg gagaggaact gcagggcccc ctgcaacatc 3540
cagatggagg accccacctt caaggagaac tacaggttcc atgccatcaa tggctacatc 3600
atggacaccc tgcctggcct ggtcatggcc caggaccaga ggatcaggtg gtatctgctg 3660
agcatgggca gcaacgagaa catccacagc atccacttct ctggccacgt gttcactgtg 3720
aggaagaagg aggagtacaa gatggccctg tacaacctgt accctggggt gttcgaaacc 3780
gtggagatgc tgcccagcaa ggccggcatc tggagggtgg agtgcctgat tggggagcac 3840
ctgcacgccg gcatgagcac cctgttcctg gtgtacagca acaagtgcca gacccccctg 3900
ggcatggcct ctggccacat cagggacttc cagatcactg cctctggcca gtacggccag 3960
tgggccccca agctggccag gctgcactac tccggaagca tcaatgcctg gagcaccaag 4020
gagcccttca gctggatcaa agtggacctg ctggccccca tgatcatcca cggcatcaag 4080
acccaggggg ccaggcagaa gttctccagc ctgtacatca gccagttcat catcatgtac 4140
agcctggacg gcaagaagtg gcagacctac aggggcaaca gcaccggcac cctgatggtg 4200
ttcttcggca acgtggacag cagcggcatc aagcacaaca tcttcaaccc ccccatcatc 4260
gccagataca tcaggctgca ccccacccac tacagcatca ggagcaccct gaggatggag 4320
ctgatgggct gtgacctgaa cagctgcagc atgcccctgg gcatggagag caaggccatc 4380
tctgacgccc agatcactgc ctccagctac ttcaccaaca tgtttgccac ctggagcccc 4440
agcaaggcca ggctgcacct gcagggcagg agcaatgcct ggaggcccca ggtcaacaac 4500
cccaaggagt ggctgcaggt ggacttccag aagaccatga aggtgactgg ggtgaccacc 4560
cagggggtga agagcctgct gaccagcatg tacgtgaagg agttcctgat ctccagcagc 4620
caggacggcc accagtggac cctgttcttc cagaatggca aggtgaaggt gttccagggc 4680
aaccaggaca gcttcacccc tgtggtcaac agcctggacc cccccctgct gaccagatac 4740
ctgaggatcc acccccagag ctgggtgcac cagatcgccc tgaggatgga ggtgctgggc 4800
tgtgaggccc aggacctgta ctga 4824
<210> 20
<211> 4824
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-1-XTEN
<400> 20
atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60
acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120
ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180
actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240
gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300
gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360
ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420
gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480
aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540
gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600
ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660
tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720
gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780
ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840
accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900
cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960
gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020
gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080
gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140
gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200
tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260
ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320
aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380
atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440
ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500
gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560
ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620
actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680
gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740
agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800
aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860
cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920
ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980
attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040
atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100
atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160
atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220
tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280
tttagtcaga atggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccctccagt gctgaagcgg 2760
caccagcgcg agatcacccg cactaccctg cagagtgatc aggaagagat cgactacgac 2820
gatacaattt ctgtggaaat gaagaaagag gacttcgata tctatgacga agatgagaac 2880
cagagtcctc gatcattcca gaagaaaacc aggcattact ttattgccgc agtggagcgg 2940
ctgtgggatt atggcatgtc ctctagtcct cacgtgctgc gaaatagggc ccagtcagga 3000
agcgtcccac agttcaagaa agtggtcttc caggagttta cagacgggtc ctttactcag 3060
ccactgtaca ggggcgaact gaacgagcac ctgggactgc tggggcccta tatcagagca 3120
gaagtggagg ataacattat ggtcaccttc agaaatcagg cctctcggcc ttacagtttt 3180
tattcaagcc tgatctctta cgaagaggac cagcgacagg gagctgaacc acgaaaaaac 3240
ttcgtgaagc ctaatgagac caaaacatac ttttggaagg tgcagcacca tatggcccca 3300
acaaaagacg agttcgattg caaggcatgg gcctattttt ctgacgtgga tctggagaag 3360
gacgtgcaca gtggcctgat tggcccactg ctggtgtgcc atactaacac cctgaatcca 3420
gcccacggcc ggcaggtcac tgtccaggag ttcgctctgt tctttaccat ctttgatgag 3480
acaaagagct ggtacttcac cgaaaacatg gagcgaaatt gcagggctcc atgtaacatt 3540
cagatggaag accccacatt caaggagaac taccgctttc atgctatcaa tggatacatc 3600
atggatactc tgcccgggct ggtcatggca caggaccaga gaatccggtg gtatctgctg 3660
agcatgggca gcaacgagaa tatccactca attcatttca gcgggcacgt gtttactgtc 3720
aggaagaaag aagagtacaa gatggccctg tacaacctgt atcccggcgt gttcgaaacc 3780
gtcgagatgc tgcctagcaa ggccggaatc tggagagtgg aatgcctgat tggagagcac 3840
ctgcatgctg ggatgtctac cctgtttctg gtgtacagta ataagtgtca gacacccctg 3900
ggaatggcat ccgggcatat cagggatttc cagattaccg catctggaca gtacggacag 3960
tgggcaccta agctggctag actgcactat tccggatcta tcaacgcttg gtccacaaaa 4020
gagcctttct cttggattaa ggtggacctg ctggccccaa tgatcattca tggcatcaaa 4080
actcagggag ctcggcagaa gttctcctct ctgtacatct cacagtttat catcatgtac 4140
agcctggatg ggaagaaatg gcagacatac cgcggcaata gcacaggaac tctgatggtg 4200
ttctttggca acgtggacag cagcggaatc aagcacaaca ttttcaatcc ccctatcatt 4260
gctagataca tccggctgca cccaacccat tattctattc gaagtacact gaggatggaa 4320
ctgatgggat gcgatctgaa cagttgttca atgcccctgg ggatggagtc caaggcaatc 4380
tctgacgccc agattaccgc cagctcctac ttcactaata tgtttgctac ctggagccct 4440
tccaaagcaa gactgcacct gcaaggccgc agcaacgcat ggcgaccaca ggtgaacaat 4500
cccaaggagt ggttgcaggt cgattttcag aaaactatga aggtgaccgg ggtcacaact 4560
cagggcgtga aaagtctgct gacctcaatg tacgtcaagg agttcctgat ctctagttca 4620
caggacggac atcagtggac actgttcttt cagaacggga aggtgaaagt cttccagggc 4680
aatcaggatt cctttacacc tgtggtcaac agtctagacc ctccactgct gaccagatac 4740
ctgagaatcc accctcagtc ctgggtgcac cagattgccc tgagaatgga agtgctggga 4800
tgcgaggccc aggatctgta ctga 4824
<210> 21
<211> 6
<212> ДНК
<213> Искусственная последовательность
<220>
<223> MAR/ARS
<400> 21
atattt 6
<210> 22
<211> 6
<212> ДНК
<213> Искусственная последовательность
<220>
<223> MAR/ARS
<400> 22
aaatat 6
<210> 23
<211> 5
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Дестабилизирующий элемент
<400> 23
attta 5
<210> 24
<211> 5
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Дестабилизирующий элемент
<400> 24
taaat 5
<210> 25
<211> 6
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Сайт poly-T
<400> 25
tttttt 6
<210> 26
<211> 7
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Сайт poly-A
<400> 26
aaaaaaa 7
<210> 27
<211> 6
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Сайт сплайсинга
<400> 27
ggtgat 6
<210> 28
<211> 5
<212> ДНК
<213> Искусственная последовательность
<220>
<223> TATA-бокс
<400> 28
tataa 5
<210> 29
<211> 5
<212> ДНК
<213> Искусственная последовательность
<220>
<223> TATA-бокс
<400> 29
ttata 5
<210> 30
<211> 8
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Последовательность богатых AU элементов
<400> 30
attttatt 8
<210> 31
<211> 8
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Последовательность богатых AU элементов
<400> 31
atttttaa 8
<210> 32
<211> 13
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Консенсусная последовательность Козак
<400> 32
gccgccacca tgc 13
<210> 33
<211> 32
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Пептид CTP
<400> 33
Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser
1. 5 10 15
Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu
20 25 30
<210> 34
<211> 28
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Пептид CTP
<400> 34
Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser Leu Pro Ser Pro Ser Arg
1. 5 10 15
Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu Pro Gln
20 25
<210> 35
<211> 11
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Коровая последовательность альбумин-связывающего пептида
<400> 35
Asp Ile Cys Leu Pro Arg Trp Gly Cys Leu Trp
1. 5 10
<210> 36
<211> 20
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Последовательность PAS
<400> 36
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
1. 5 10 15
Ser Ala Pro Ala
20
<210> 37
<211> 20
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Последовательность PAS
<400> 37
Ala Ala Pro Ala Ser Pro Ala Pro Ala Ala Pro Ser Ala Pro Ala Pro
1. 5 10 15
Ala Ala Pro Ser
20
<210> 38
<211> 20
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Последовательность PAS
<400> 38
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1. 5 10 15
Ser Pro Ser Ser
20
<210> 39
<211> 19
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Последовательность PAS
<400> 39
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1. 5 10 15
Ser Pro Ser
<210> 40
<211> 20
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Последовательность PAS
<400> 40
Ser Ser Pro Ser Ala Pro Ser Pro Ser Ser Pro Ala Ser Pro Ser Pro
1. 5 10 15
Ser Ser Pro Ala
20
<210> 41
<211> 24
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Последовательность PAS
<400> 41
Ala Ala Ser Pro Ala Ala Pro Ser Ala Pro Pro Ala Ala Ala Ser Pro
1. 5 10 15
Ala Ala Pro Ser Ala Pro Pro Ala
20
<210> 42
<211> 20
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Последовательность PAS
<400> 42
Ala Ser Ala Ala Ala Pro Ala Ala Ala Ser Ala Ala Ala Ser Ala Pro
1. 5 10 15
Ser Ala Ala Ala
20
<210> 43
<211> 23
<212> ДНК
<213> Искусственная последовательность
<220>
<223> мишень miR142
<400> 43
tccataaagt aggaaacact aca 23
<210> 44
<211> 2332
<212> БЕЛОК
<213> Homo sapiens
<400> 44
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1. 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg
740 745 750
Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys
755 760 765
Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn
770 775 780
Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro
785 790 795 800
His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe
805 810 815
Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser
820 825 830
Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val
835 840 845
Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly
850 855 860
Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser
865 870 875 880
Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala
885 890 895
Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His
900 905 910
Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro
915 920 925
Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp
930 935 940
Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp
945 950 955 960
Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys
965 970 975
Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys
980 985 990
Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala
995 1000 1005
Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu
1010 1015 1020
Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu
1025 1030 1035
Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp
1040 1045 1050
Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr
1055 1060 1065
Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly
1070 1075 1080
Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys
1085 1090 1095
Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His
1100 1105 1110
Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln
1115 1120 1125
Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe
1130 1135 1140
Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr
1145 1150 1155
Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn
1160 1165 1170
Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His
1175 1180 1185
Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr
1190 1195 1200
Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr
1205 1210 1215
Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg
1220 1225 1230
Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu
1235 1240 1245
Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys
1250 1255 1260
His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu
1265 1270 1275
Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys
1280 1285 1290
Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr
1295 1300 1305
Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu
1310 1315 1320
Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr
1325 1330 1335
Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr
1340 1345 1350
Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser
1355 1360 1365
Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala
1370 1375 1380
Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser
1385 1390 1395
Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser
1400 1405 1410
Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val
1415 1420 1425
Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu
1430 1435 1440
Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu
1445 1450 1455
Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys
1460 1465 1470
Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr
1475 1480 1485
Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys
1490 1495 1500
Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu
1505 1510 1515
Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile
1520 1525 1530
Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg
1535 1540 1545
Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp
1550 1555 1560
Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu
1565 1570 1575
Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys
1580 1585 1590
Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His
1595 1600 1605
Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu
1610 1615 1620
Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln
1625 1630 1635
Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
1640 1645 1650
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1655 1660 1665
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1670 1675 1680
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1685 1690 1695
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1700 1705 1710
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1715 1720 1725
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1730 1735 1740
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1745 1750 1755
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1760 1765 1770
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1775 1780 1785
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1790 1795 1800
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1805 1810 1815
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1820 1825 1830
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1835 1840 1845
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1850 1855 1860
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1865 1870 1875
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1880 1885 1890
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1895 1900 1905
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1910 1915 1920
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1925 1930 1935
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1940 1945 1950
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1955 1960 1965
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1970 1975 1980
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1985 1990 1995
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
2000 2005 2010
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
2015 2020 2025
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
2030 2035 2040
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
2045 2050 2055
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
2060 2065 2070
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
2075 2080 2085
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
2090 2095 2100
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
2105 2110 2115
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
2120 2125 2130
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
2135 2140 2145
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
2150 2155 2160
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
2165 2170 2175
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
2180 2185 2190
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
2195 2200 2205
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
2210 2215 2220
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
2225 2230 2235
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
2240 2245 2250
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
2255 2260 2265
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
2270 2275 2280
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
2285 2290 2295
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
2300 2305 2310
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
2315 2320 2325
Gln Asp Leu Tyr
2330
<210> 45
<211> 4
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Аминокислоты 233-236 из человеческого IgG1
<400> 45
Glu Leu Leu Gly
1
<210> 46
<211> 42
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN AE42-4, последовательность белка
<400> 46
Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
1. 5 10 15
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
20 25 30
Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser
35 40
<210> 47
<211> 126
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN AE42-4, последовательность ДНК
<400> 47
ggcgcgccag gttctcctgc tggctccccc acctcaacag aagaggggac aagcgaaagc 60
gctacgcctg agagtggccc tggctctgag ccagccacct ccggctctga aacccctgcc 120
tcgagc 126
<210> 48
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN AE144-2A, последовательность белка
<400> 48
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly
1. 5 10 15
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
65 70 75 80
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
130 135 140
<210> 49
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN AE144-2A, последовательность ДНК
<400> 49
ggcgcgccaa ccagtacgga gccgtccgag gggagcgcac caggaagccc ggctgggagc 60
ccgacttcta ccgaagaggg tacatctacc gaaccaagtg aaggttcagc accaggcacc 120
tcaacagaac cctctgaggg ctcggcgcct ggtacaagtg agtccgccac cccagaatcc 180
gggcctggga caagcacaga accttcggaa gggagtgccc ctggaacatc cgaatcggca 240
accccagaat cagggccagg atctgagccc gcgacttcgg gctccgagac gcctgggaca 300
tccaccgagc cctccgaagg atcagcccca ggcaccagca cggagccctc tgagggaagc 360
gcacctggta ccagcgaaag cgcaactccc gaatcaggtc ccggtacgag cgagtcggcg 420
accccggaga gcgggccagg tgcctcgagc 450
<210> 50
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN AE144-3B, последовательность белка
<400> 50
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1. 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
20 25 30
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
65 70 75 80
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 51
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN AE144-3B, последовательность ДНК
<400> 51
ggcgcgccaa gtcccgctgg aagcccaact agcaccgaag aggggacctc agagtccgcc 60
acccccgagt ccggccctgg ctctgagcct gccactagcg gctccgagac tcctggcaca 120
tccgaaagcg ctacacccga gagtggaccc ggcacctcta ccgagcccag tgagggctcc 180
gcccctggaa caagcaccga gcccagcgaa ggcagcgccc cagggacctc cacagagccc 240
agtgaaggca gtgctcctgg caccagcacc gaaccaagcg agggctctgc acccgggacc 300
tccaccgagc caagcgaagg ctctgcccct ggcacttcca ccgagcccag cgaaggcagc 360
gcccctggga gccccgctgg ctctcccacc agcactgagg agggcacatc taccgaacca 420
agtgaaggct ctgcaccagg tgcctcgagc 450
<210> 52
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN AE144-4A, последовательность белка
<400> 52
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1. 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
65 70 75 80
Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
85 90 95
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly
100 105 110
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 53
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN AE144-4A, последовательность ДНК
<400> 53
ggcgcgccaa cgtccgaaag tgctacccct gagtcaggcc ctggtagtga gcctgccaca 60
agcggaagcg aaactccggg gacctcagag tctgccactc ccgaatcggg gccaggctct 120
gaaccggcca cttcagggag cgaaacacca ggaacatcgg agagcgctac cccggagagc 180
gggccaggaa ctagtactga gcctagcgag ggaagtgcac ctggtacaag cgagtccgcc 240
acacccgagt ctggccctgg ctctccagcg ggctcaccca cgagcactga agagggctct 300
cccgctggca gcccaacgtc gacagaagaa ggatcaccag caggctcccc cacatcaaca 360
gaggagggta catcagaatc tgctactccc gagagtggac ccggtacctc cactgagccc 420
agcgagggga gtgcaccagg tgcctcgagc 450
<210> 54
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN AE144-5A, последовательность белка
<400> 54
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1. 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
65 70 75 80
Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
85 90 95
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
100 105 110
Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125
Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
130 135 140
<210> 55
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN AE144-5A, последовательность ДНК
<400> 55
ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60
tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120
gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180
ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240
cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300
gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360
gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420
cccaccagca ctgaagaagg tgcctcgagc 450
<210> 56
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN AE144-6B, последовательность белка
<400> 56
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser
1. 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala
50 55 60
Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
65 70 75 80
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala
100 105 110
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 57
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN AE144-6B, последовательность ДНК
<400> 57
ggcgcgccaa catctaccga gccttccgaa ggctctgccc ctgggacctc agaatctgca 60
acccctgaaa gcggccctgg aacctccgaa agtgccactc ccgagagcgg cccagggaca 120
agcgagtcag caacccctga gtctggaccc ggcagcgagc ctgcaacctc tggctcagag 180
actcccggct cagaacccgc tacctcaggc tccgagacac ccggctctcc tgctgggagt 240
cccacttcca ccgaggaagg aacatccact gagcctagtg agggctctgc ccctggaacc 300
agcacagagc caagtgaggg cagtgcacca ggatccgagc cagcaaccag cgggtccgag 360
actcccggga cctctgagtc tgccacccca gagagcggac ccggcacttc aaccgagccc 420
tccgaaggat cagcaccagg tgcctcgagc 450
<210> 58
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN AG144-1, последовательность белка
<400> 58
Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser
1. 5 10 15
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr
20 25 30
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
35 40 45
Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser
50 55 60
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr
65 70 75 80
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
85 90 95
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser
100 105 110
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser
115 120 125
Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser
130 135 140
<210> 59
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN AG144-1, последовательность ДНК
<400> 59
ggcgcgccac ccgggtcgtc cccgtcggcg tccaccggaa cagggccagg gtcatccccg 60
tcagcgtcga ctgggacggg acccgggaca cccggttcgg ggactgcatc ctcctcgcct 120
ggttcgtcca ccccgtcagg agccacgggt tcgccgggaa gcagcccaag cgcatccact 180
ggtacagggc ctggggcttc accgggtact tcatccacgg ggtcaccggg aacgcccgga 240
tcggggacgg cttcctcatc accaggatcg tcaacaccct cgggcgcaac gggcagcccc 300
ggaacccctg gttcgggtac ggcgtcgtcg agccccggtg cgagcccggg aacaagctcg 360
acaggatcgc ctggggcgtc acccggcacg tcgagcacag gcagccccgg aacccctgga 420
tcgggaaccg cgtcgtcaag cgcctcgagc 450
<210> 60
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN AG144-A, последовательность белка
<400> 60
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
1. 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly
100 105 110
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 61
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN AG144-A, последовательность ДНК
<400> 61
ggcgcgccag gtgcctcgcc gggaacatca tcaactggtt cacccgggtc atccccctcg 60
gcctcaaccg ggacgggtcc cggctcatcc cccagcgcca gcactggaac aggtcctggc 120
actcctggtt ccggtacggc atcgtcatcc ccgggaagct caacaccgtc cggagcgaca 180
ggatcacctg gctcgtcacc ttcggcgtca actggaacgg ggccaggggc ctcacccgga 240
acgtcctcga ctgggtcgcc tggtacgccg ggatcaggaa cggcctcatc ctcgcctggg 300
tcctcaacgc cctcgggtgc gactggttcg ccgggaactc ctggctcggg gacggcctcg 360
tcgtcgcctg gggcatcacc ggggacgagc tccacggggt cccctggagc gtcaccgggg 420
acctcctcga caggtagccc ggcctcgagc 450
<210> 62
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN AG144-B, последовательность белка
<400> 62
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
1. 5 10 15
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
65 70 75 80
Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro
100 105 110
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 63
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN AG144-B, последовательность ДНК
<400> 63
ggcgcgccag gtacaccggg cagcggcacg gcttcgtcgt cacccggctc gtccacaccg 60
tcgggagcta cgggaagccc aggagcgtca ccgggaacgt cgtcaacggg gtcaccgggt 120
acgccaggta gcggcacggc cagcagctcg ccaggttcat cgaccccgtc gggagcgact 180
gggtcgcccg gatcaagccc gtcagcttcc actggaacag gacccgggtc gtcgccgtca 240
gcctcaacgg ggacaggacc tggttcatcg acgccgtcag gggcgacagg ctcgcccgga 300
tcgtcaacac cctcgggggc aacggggagc cctggtgcgt cgcctggaac ctcatccacc 360
ggaagcccgg gggcctcgcc gggtacgagc tccacgggat cgcccggagc gtcccccgga 420
acttcaagca cagggagccc tgcctcgagc 450
<210> 64
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN AG144-C, последовательность белка
<400> 64
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro
1. 5 10 15
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
35 40 45
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly
50 55 60
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
85 90 95
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr
100 105 110
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 65
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN AG144-C, последовательность ДНК
<400> 65
ggcgcgccag gtacacccgg atcgggtaca gcgtcatcga gccccggtgc gtcacctggt 60
acgtcgagca cggggtcgcc aggggcgtcc cctgggacgt cctcaacagg ctcgcccggt 120
gcgtcacccg gcacgtcgtc cacgggttca cctggtagct ccccttccgc gtccactggc 180
accgggcctg gaactccggg gagcggcaca gcgagctcgt cgccgggagc atcgcctggg 240
acatcgagca ccgggtcgcc aggagcatcg cccggaacat ccagcacagg aagccccggc 300
gcgtcgcccg ggacatcaag cacaggttcc ccgggatcga gcacgccgtc cggagccact 360
ggatcaccag ggagctcgac accttccggc gcaacgggat cgcccggagc cagcccgggt 420
acgtcaagca ctggctcccc tgcctcgagc 450
<210> 66
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN AG144-F, последовательность белка
<400> 66
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro
1. 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
85 90 95
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
100 105 110
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 67
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN AG144-F, последовательность ДНК
<400> 67
ggcgcgccag gctccagccc ctccgcgagc acgggaaccg gaccaggttc gtcaccctca 60
gcatcaacgg ggacgggacc gggggcgtca ccaggaacgt cctccaccgg ctcgccgggt 120
gcatcacccg gaacgtcatc gaccggatcg ccagggagct cgacgccatc aggcgcaaca 180
ggatcacctg gctcaagccc tagcgcgtca accggcacgg gtccgggtgc ctcccctggc 240
acgtccagca ccggatcacc cggatcgagc ccatccgcct caaccggaac cggacccggt 300
acaccagggt cgggaacagc ctcctcgtca ccaggctcct caaccccctc gggagccacg 360
ggttcgcccg gttcgtcaac gccttccgga gcaactggta gccccggagc atcgccagga 420
acttcgagca cggggtcgcc cgcctcgagc 450
<210> 68
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-1 последовательность ДНК
<400> 68
atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60
acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120
ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180
actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240
gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300
gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360
ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420
gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480
aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540
gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600
ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660
tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720
gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780
ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840
accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900
cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960
gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020
gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080
gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140
gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200
tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260
ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320
aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380
atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440
ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500
gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560
ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620
actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680
gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740
agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800
aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860
cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920
ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980
attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040
atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100
atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160
atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220
tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280
tttagtcaga atcctccagt gctgaagagg caccagaggg agatcacccg cactaccctg 2340
cagagtgatc aggaagagat cgactacgac gatacaattt ctgtggaaat gaagaaagag 2400
gacttcgata tctatgacga agatgagaac cagagtcctc gatcattcca gaagaaaacc 2460
aggcattact ttattgccgc agtggagcgg ctgtgggatt atggcatgtc ctctagtcct 2520
cacgtgctgc gaaatagggc ccagtcagga agcgtcccac agttcaagaa agtggtcttc 2580
caggagttta cagacgggtc ctttactcag ccactgtaca ggggcgaact gaacgagcac 2640
ctgggactgc tggggcccta tatcagagca gaagtggagg ataacattat ggtcaccttc 2700
agaaatcagg cctctcggcc ttacagtttt tattcaagcc tgatctctta cgaagaggac 2760
cagcgacagg gagctgaacc acgaaaaaac ttcgtgaagc ctaatgagac caaaacatac 2820
ttttggaagg tgcagcacca tatggcccca acaaaagacg agttcgattg caaggcatgg 2880
gcctattttt ctgacgtgga tctggagaag gacgtgcaca gtggcctgat tggcccactg 2940
ctggtgtgcc atactaacac cctgaatcca gcccacggcc ggcaggtcac tgtccaggag 3000
ttcgctctgt tctttaccat ctttgatgag acaaagagct ggtacttcac cgaaaacatg 3060
gagcgaaatt gcagggctcc atgtaacatt cagatggaag accccacatt caaggagaac 3120
taccgctttc atgctatcaa tggatacatc atggatactc tgcccgggct ggtcatggca 3180
caggaccaga gaatccggtg gtatctgctg agcatgggca gcaacgagaa tatccactca 3240
attcatttca gcgggcacgt gtttactgtc aggaagaaag aagagtacaa gatggccctg 3300
tacaacctgt atcccggcgt gttcgaaacc gtcgagatgc tgcctagcaa ggccggaatc 3360
tggagagtgg aatgcctgat tggagagcac ctgcatgctg ggatgtctac cctgtttctg 3420
gtgtacagta ataagtgtca gacacccctg ggaatggcat ccgggcatat cagggatttc 3480
cagattaccg catctggaca gtacggacag tgggcaccta agctggctag actgcactat 3540
tccggatcta tcaacgcttg gtccacaaaa gagcctttct cttggattaa ggtggacctg 3600
ctggccccaa tgatcattca tggcatcaaa actcagggag ctcggcagaa gttctcctct 3660
ctgtacatct cacagtttat catcatgtac agcctggatg ggaagaaatg gcagacatac 3720
cgcggcaata gcacaggaac tctgatggtg ttctttggca acgtggacag cagcggaatc 3780
aagcacaaca ttttcaatcc ccctatcatt gctagataca tccggctgca cccaacccat 3840
tattctattc gaagtacact gaggatggaa ctgatgggat gcgatctgaa cagttgttca 3900
atgcccctgg ggatggagtc caaggcaatc tctgacgccc agattaccgc cagctcctac 3960
ttcactaata tgtttgctac ctggagccct tccaaagcaa gactgcacct gcaaggccgc 4020
agcaacgcat ggcgaccaca ggtgaacaat cccaaggagt ggttgcaggt cgattttcag 4080
aaaactatga aggtgaccgg ggtcacaact cagggcgtga aaagtctgct gacctcaatg 4140
tacgtcaagg agttcctgat ctctagttca caggacggac atcagtggac actgttcttt 4200
cagaacggga aggtgaaagt cttccagggc aatcaggatt cctttacacc tgtggtcaac 4260
agtctagacc ctccactgct gaccagatac ctgagaatcc accctcagtc ctgggtgcac 4320
cagattgccc tgagaatgga agtgctggga tgcgaggccc aggatctgta ctga 4374
<210> 69
<211> 577
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Промотор ET, последовательность ДНК
<400> 69
ctcgaggtca attcacgcga gttaataatt accagcgcgg gccaaataaa taatccgcga 60
ggggcaggtg acgtttgccc agcgcgcgct ggtaattatt aacctcgcga atattgattc 120
gaggccgcga ttgccgcaat cgcgaggggc aggtgacctt tgcccagcgc gcgttcgccc 180
cgccccggac ggtatcgata agcttaggag cttgggctgc aggtcgaggg cactgggagg 240
atgttgagta agatggaaaa ctactgatga cccttgcaga gacagagtat taggacatgt 300
ttgaacaggg gccgggcgat cagcaggtag ctctagagga tccccgtctg tctgcacatt 360
tcgtagagcg agtgttccga tactctaatc tccctaggca aggttcatat ttgtgtaggt 420
tacttattct ccttttgttg actaagtcaa taatcagaat cagcaggttt ggagtcagct 480
tggcagggat cagcagcctg ggttggaagg agggggtata aaagcccctt caccaggaga 540
agccgtcaca cagatccaca agctcctgcc accatgg 577
<210> 70
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-5
<400> 70
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860
cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920
ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980
attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040
atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100
atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160
atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220
tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280
ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340
cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400
gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460
cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520
cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580
caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640
ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700
cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760
cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820
ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880
gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940
ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000
ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060
gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120
taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180
caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240
attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300
tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360
tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420
gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480
cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540
tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600
ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660
ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720
agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780
aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840
tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900
atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960
tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020
tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080
aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140
tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200
caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260
tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320
cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374
<210> 71
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-6
<400> 71
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340
caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400
gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460
agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520
cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580
caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640
ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700
cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760
cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820
ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940
ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000
tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060
gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120
tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180
caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240
attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300
tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360
tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420
gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480
cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540
tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600
ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660
ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720
aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780
aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840
tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900
atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960
ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020
tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080
aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140
tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200
caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260
tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320
cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374
<210> 72
<211> 4824
<212> ДНК
<213> Искусственная последовательность
<220>
<223> coFVIII-6-XTEN
<400> 72
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gcccgcctgt gctgaagagg 2760
caccagcgag aaattacccg gaccaccctc caatcggatc aggaggaaat cgactacgac 2820
gacaccatct cggtggaaat gaagaaggaa gatttcgata tctacgacga ggacgaaaat 2880
cagtcccctc gctcattcca aaagaaaact agacactact ttatcgccgc ggtggaaaga 2940
ctgtgggact atggaatgtc atccagccct cacgtccttc ggaaccgggc ccagagcgga 3000
tcggtgcctc agttcaagaa agtggtgttc caggagttca ccgacggcag cttcacccag 3060
ccgctgtacc ggggagaact gaacgaacac ctgggcctgc tcggtcccta catccgcgcg 3120
gaagtggagg ataacatcat ggtgaccttc cgtaaccaag catccagacc ttactccttc 3180
tattcctccc tgatctcata cgaggaggac cagcgccaag gcgccgagcc ccgcaagaac 3240
ttcgtcaagc ccaacgagac taagacctac ttctggaagg tccaacacca tatggccccg 3300
accaaggatg agtttgactg caaggcctgg gcctacttct ccgacgtgga ccttgagaag 3360
gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc acaccaacac cctgaaccca 3420
gcgcatggac gccaggtcac cgtccaggag tttgctctgt tcttcaccat ttttgacgaa 3480
actaagtcct ggtacttcac cgagaatatg gagcgaaact gtagagcgcc ctgcaatatc 3540
cagatggaag atccgacttt caaggagaac tatagattcc acgccatcaa cgggtacatc 3600
atggatactc tgccggggct ggtcatggcc caggatcaga ggattcggtg gtacttgctg 3660
tcaatgggat cgaacgaaaa cattcactcc attcacttct ccggtcacgt gttcactgtg 3720
cgcaagaagg aggagtacaa gatggcgctg tacaatctgt accccggggt gttcgaaact 3780
gtggagatgc tgccgtccaa ggccggcatc tggagagtgg agtgcctgat cggagagcac 3840
ctccacgcgg ggatgtccac cctcttcctg gtgtactcga ataagtgcca gaccccgctg 3900
ggcatggcct cgggccacat cagagacttc cagatcacag caagcggaca atacggccaa 3960
tgggcgccga agctggcccg cttgcactac tccggatcga tcaacgcatg gtccaccaag 4020
gaaccgttct cgtggattaa ggtggacctc ctggccccta tgattatcca cggaattaag 4080
acccagggcg ccaggcagaa gttctcctcc ctgtacatct cgcaattcat catcatgtac 4140
agcctggacg ggaagaagtg gcagacttac aggggaaact ccaccggcac cctgatggtc 4200
tttttcggca acgtggattc ctccggcatt aagcacaaca tcttcaaccc accgatcata 4260
gccagatata ttaggctcca ccccactcac tactcaatcc gctcaactct tcggatggaa 4320
ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg ggatggaatc aaaggctatt 4380
agcgacgccc agatcaccgc gagctcctac ttcactaaca tgttcgccac ctggagcccc 4440
tccaaggcca ggctgcactt gcagggacgg tcaaatgcct ggcggccgca agtgaacaat 4500
ccgaaggaat ggcttcaagt ggatttccaa aagaccatga aagtgaccgg agtcaccacc 4560
cagggagtga agtcccttct gacctcgatg tatgtgaagg agttcctgat tagcagcagc 4620
caggacgggc accagtggac cctgttcttc caaaacggaa aggtcaaggt gttccagggg 4680
aaccaggact cgttcacacc cgtggtgaac tccctggacc ccccactgct gacgcggtac 4740
ttgaggattc atcctcagtc ctgggtccat cagattgcat tgcgaatgga agtcctgggc 4800
tgcgaggccc aggacctgta ctga 4824
<210> 73
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AD
<400> 73
Gly Glu Ser Pro Gly Gly Ser Ser Gly Ser Glu Ser
1. 5 10
<210> 74
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AD
<400> 74
Gly Ser Glu Gly Ser Ser Gly Pro Gly Glu Ser Ser
1. 5 10
<210> 75
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AD
<400> 75
Gly Ser Ser Glu Ser Gly Ser Ser Glu Gly Gly Pro
1. 5 10
<210> 76
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AD
<400> 76
Gly Ser Gly Gly Glu Pro Ser Glu Ser Gly Ser Ser
1. 5 10
<210> 77
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AE, AM
<400> 77
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
1. 5 10
<210> 78
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AE, AM, AQ
<400> 78
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
1. 5 10
<210> 79
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AE, AM, AQ
<400> 79
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
1. 5 10
<210> 80
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AE, AM, AQ
<400> 80
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
1. 5 10
<210> 81
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AF, AM
<400> 81
Gly Ser Thr Ser Glu Ser Pro Ser Gly Thr Ala Pro
1. 5 10
<210> 82
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AF, AM
<400> 82
Gly Thr Ser Thr Pro Glu Ser Gly Ser Ala Ser Pro
1. 5 10
<210> 83
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AF, AM
<400> 83
Gly Thr Ser Pro Ser Gly Glu Ser Ser Thr Ala Pro
1. 5 10
<210> 84
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AF, AM
<400> 84
Gly Ser Thr Ser Ser Thr Ala Glu Ser Pro Gly Pro
1. 5 10
<210> 85
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AG, AM
<400> 85
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
1. 5 10
<210> 86
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AG, AM
<400> 86
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
1. 5 10
<210> 87
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AG, AM
<400> 87
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
1. 5 10
<210> 88
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AG, AM
<400> 88
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
1. 5 10
<210> 89
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AQ
<400> 89
Gly Glu Pro Ala Gly Ser Pro Thr Ser Thr Ser Glu
1. 5 10
<210> 90
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AQ
<400> 90
Gly Thr Gly Glu Pro Ser Ser Thr Pro Ala Ser Glu
1. 5 10
<210> 91
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AQ
<400> 91
Gly Ser Gly Pro Ser Thr Glu Ser Ala Pro Thr Glu
1. 5 10
<210> 92
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AQ
<400> 92
Gly Ser Glu Thr Pro Ser Gly Pro Ser Glu Thr Ala
1. 5 10
<210> 93
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AQ
<400> 93
Gly Pro Ser Glu Thr Ser Thr Ser Glu Pro Gly Ala
1. 5 10
<210> 94
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив AQ
<400> 94
Gly Ser Pro Ser Glu Pro Thr Glu Gly Thr Ser Ala
1. 5 10
<210> 95
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив BD
<400> 95
Gly Ser Gly Ala Ser Glu Pro Thr Ser Thr Glu Pro
1. 5 10
<210> 96
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив BD
<400> 96
Gly Ser Glu Pro Ala Thr Ser Gly Thr Glu Pro Ser
1. 5 10
<210> 97
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив BD
<400> 97
Gly Thr Ser Glu Pro Ser Thr Ser Glu Pro Gly Ala
1. 5 10
<210> 98
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив BD
<400> 98
Gly Thr Ser Thr Glu Pro Ser Glu Pro Gly Ser Ala
1. 5 10
<210> 99
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив BD
<400> 99
Gly Ser Thr Ala Gly Ser Glu Thr Ser Thr Glu Ala
1. 5 10
<210> 100
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив BD
<400> 100
Gly Ser Glu Thr Ala Thr Ser Gly Ser Glu Thr Ala
1. 5 10
<210> 101
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив BD
<400> 101
Gly Thr Ser Glu Ser Ala Thr Ser Glu Ser Gly Ala
1. 5 10
<210> 102
<211> 12
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мотив BD
<400> 102
Gly Thr Ser Thr Glu Ala Ser Glu Gly Ser Ala Ser
1. 5 10
<210> 103
<211> 1607
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Последовательность белка coFVIII-6-XTEN
<400> 103
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1. 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Gly Ala Pro Thr
755 760 765
Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr
770 775 780
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
785 790 795 800
Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr
805 810 815
Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro
820 825 830
Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr
835 840 845
Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser
850 855 860
Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
865 870 875 880
Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr
885 890 895
Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ala
900 905 910
Ser Ser Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
915 920 925
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser
930 935 940
Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn
945 950 955 960
Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala
965 970 975
Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val
980 985 990
Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val
995 1000 1005
Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr
1010 1015 1020
Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile
1025 1030 1035
Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln
1040 1045 1050
Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu
1055 1060 1065
Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys
1070 1075 1080
Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met
1085 1090 1095
Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
1100 1105 1110
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly
1115 1120 1125
Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly
1130 1135 1140
Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
1145 1150 1155
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
1160 1165 1170
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys
1175 1180 1185
Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr
1190 1195 1200
Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr
1205 1210 1215
Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe
1220 1225 1230
Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met
1235 1240 1245
Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met
1250 1255 1260
Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly
1265 1270 1275
Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser
1280 1285 1290
Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg
1295 1300 1305
Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro
1310 1315 1320
Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser
1325 1330 1335
Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1340 1345 1350
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe
1355 1360 1365
Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp
1370 1375 1380
Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1385 1390 1395
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn
1400 1405 1410
Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro
1415 1420 1425
Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly
1430 1435 1440
Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys
1445 1450 1455
Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn
1460 1465 1470
Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln
1475 1480 1485
Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu
1490 1495 1500
Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val
1505 1510 1515
Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys
1520 1525 1530
Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu
1535 1540 1545
Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp
1550 1555 1560
Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr
1565 1570 1575
Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1580 1585 1590
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1595 1600 1605
<210> 104
<211> 16
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Rep-связывающий сайт (RBS) для AAV2
<400> 104
gcgcgctcgc tcgctc 16
<210> 105
<211> 6
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Сайт концевого разрешения (TRS) для AAV2
<400> 105
agttgg 6
<210> 106
<211> 2328
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Зрелый полноразмерный FVIII
<400> 106
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1. 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Lys Arg Arg Leu Pro Lys Gly Val Lys His Leu
485 490 495
Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys Trp Thr
500 505 510
Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys Leu Thr
515 520 525
Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala Ser Gly
530 535 540
Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp Gln Arg
545 550 555 560
Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe Ser Val
565 570 575
Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln Arg Phe
580 585 590
Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe Gln Ala
595 600 605
Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser Leu Gln
610 615 620
Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu Ser Ile
625 630 635 640
Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr Thr Phe
645 650 655
Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro Phe Ser
660 665 670
Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp Ile Leu
675 680 685
Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala Leu Leu
690 695 700
Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser
705 710 715 720
Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala Ile Glu
725 730 735
Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg Gln Lys
740 745 750
Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys Thr Asp
755 760 765
Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn Val Ser
770 775 780
Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro His Gly
785 790 795 800
Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe Ser Asp
805 810 815
Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser Glu Met
820 825 830
Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val Phe Thr
835 840 845
Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly Thr Thr
850 855 860
Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser Thr Ser
865 870 875 880
Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala Gly Thr
885 890 895
Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His Tyr Asp
900 905 910
Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro Leu Thr
915 920 925
Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp Ser Lys
930 935 940
Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp Gly Lys
945 950 955 960
Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys Arg Ala
965 970 975
His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys Val Ser
980 985 990
Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala Thr Asn
995 1000 1005
Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu Asn Ser
1010 1015 1020
Pro Ser Val Trp Gln Asn Ile Ser Asp Thr Glu Phe Lys Lys Val
1025 1030 1035
Thr Pro Leu Ile His Asp Arg Met Leu Met Asp Lys Asn Ala Thr
1040 1045 1050
Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr Thr Ser Ser Lys
1055 1060 1065
Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly Pro Ile Pro Pro
1070 1075 1080
Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys Met Leu Phe Leu
1085 1090 1095
Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His Gly Lys Asn Ser
1100 1105 1110
Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln Leu Val Ser Leu
1115 1120 1125
Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe Leu Ser Glu Lys
1130 1135 1140
Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr Lys Asp Val Gly
1145 1150 1155
Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn Leu Phe Leu Thr
1160 1165 1170
Asn Leu Asp Asn Leu His Glu Asn Asn Thr His Asn Gln Glu Lys
1175 1180 1185
Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr Leu Ile Gln Glu
1190 1195 1200
Asn Val Val Leu Pro Gln Ile His Thr Val Thr Gly Thr Lys Asn
1205 1210 1215
Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg Gln Asn Val Glu
1220 1225 1230
Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu Gln Asp Phe Arg
1235 1240 1245
Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys His Thr Ala His
1250 1255 1260
Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu Gly Leu Gly Asn
1265 1270 1275
Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys Thr Thr Arg Ile
1280 1285 1290
Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr Gln Arg Ser Lys
1295 1300 1305
Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu Glu Thr Glu Leu
1310 1315 1320
Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr Gln Trp Ser Lys
1325 1330 1335
Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr Gln Ile Asp Tyr
1340 1345 1350
Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser Pro Leu Ser Asp
1355 1360 1365
Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala Asn Arg Ser Pro
1370 1375 1380
Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser Ile Arg Pro Ile
1385 1390 1395
Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser Ser His Leu Pro
1400 1405 1410
Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val Gln Glu Ser Ser
1415 1420 1425
His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu Ser Leu Ala Ile
1430 1435 1440
Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu Val Gly Ser Leu
1445 1450 1455
Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys Lys Val Glu Asn
1460 1465 1470
Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr Ser Gly Lys Val
1475 1480 1485
Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys Asp Leu Phe Pro
1490 1495 1500
Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu Asp Leu Val Glu
1505 1510 1515
Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile Lys Trp Asn Glu
1520 1525 1530
Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg Val Ala Thr Glu
1535 1540 1545
Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp Pro Leu Ala Trp
1550 1555 1560
Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu Glu Trp Lys Ser
1565 1570 1575
Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys Lys Lys Asp Thr
1580 1585 1590
Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His Ala Ile Ala Ala
1595 1600 1605
Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu Val Thr Trp Ala
1610 1615 1620
Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln Asn Pro Pro Val
1625 1630 1635
Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser
1640 1645 1650
Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met
1655 1660 1665
Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser
1670 1675 1680
Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala
1685 1690 1695
Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val
1700 1705 1710
Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys
1715 1720 1725
Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu
1730 1735 1740
Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr
1745 1750 1755
Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn
1760 1765 1770
Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr
1775 1780 1785
Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val
1790 1795 1800
Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
1805 1810 1815
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr
1820 1825 1830
Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile
1835 1840 1845
Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His
1850 1855 1860
Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
1865 1870 1875
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg
1880 1885 1890
Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe
1895 1900 1905
Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp
1910 1915 1920
Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp
1925 1930 1935
Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His
1940 1945 1950
Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys
1955 1960 1965
Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu
1970 1975 1980
Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile
1985 1990 1995
Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr
2000 2005 2010
Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile
2015 2020 2025
Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala
2030 2035 2040
Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp
2045 2050 2055
Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala
2060 2065 2070
Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys
2075 2080 2085
Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu
2090 2095 2100
Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr
2105 2110 2115
Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His
2120 2125 2130
Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His
2135 2140 2145
Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met
2150 2155 2160
Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser
2165 2170 2175
Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr
2180 2185 2190
Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu
2195 2200 2205
Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys
2210 2215 2220
Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly
2225 2230 2235
Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val
2240 2245 2250
Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr
2255 2260 2265
Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln
2270 2275 2280
Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu
2285 2290 2295
Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile
2300 2305 2310
Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
2315 2320 2325
<210> 107
<211> 7053
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Зрелый полноразмерный FVIII
<400> 107
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt 2340
ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa 2400
atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat 2460
gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca 2520
cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc 2580
catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag 2640
aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca 2700
tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca 2760
agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta 2820
tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa 2880
aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga 2940
aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct 3000
gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac 3060
aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta 3120
attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa 3180
gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta 3240
aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa 3300
gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc 3360
ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg 3420
caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag 3480
aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta 3540
ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat 3600
ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag 3660
gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag 3720
aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac 3780
ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca 3840
aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga 3900
aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca 3960
agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca 4020
ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc 4080
aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag 4140
aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct 4200
caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct 4260
atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat 4320
agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat 4380
aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc 4440
ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg 4500
aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat 4560
cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg 4620
gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct 4680
ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta 4740
ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa 4800
tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg 4860
aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa 4920
atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca 4980
gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa 5040
attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat 5100
gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct 5160
gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg 5220
gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc 5280
tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca 5340
tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt 5400
ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa 5460
cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat 5520
catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt 5580
gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac 5640
acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc 5700
atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct 5760
ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc 5820
aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga 5880
tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat 5940
gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt 6000
gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt 6060
attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt 6120
cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga 6180
caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc 6240
tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt 6300
cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt 6360
atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga 6420
accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac 6480
cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact 6540
cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag 6600
agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc 6660
acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct 6720
caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca 6780
ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc 6840
atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag 6900
gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta 6960
ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg 7020
gaggttctgg gctgcgaggc acaggacctc tac 7053
<210> 108
<400> 108
000
<210> 109
<211> 1718
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> BIVV001 BDD-FVIII(XTEN) последовательность (без Fc)
<400> 109
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1. 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Lys Arg Arg Leu Pro Lys Gly Val Lys His Leu
485 490 495
Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys Trp Thr
500 505 510
Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys Leu Thr
515 520 525
Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala Ser Gly
530 535 540
Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp Gln Arg
545 550 555 560
Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe Ser Val
565 570 575
Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln Arg Phe
580 585 590
Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe Gln Ala
595 600 605
Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser Leu Gln
610 615 620
Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu Ser Ile
625 630 635 640
Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr Thr Phe
645 650 655
Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro Phe Ser
660 665 670
Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp Ile Leu
675 680 685
Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala Leu Leu
690 695 700
Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser
705 710 715 720
Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala Ile Glu
725 730 735
Pro Arg Ser Phe Ser Gln Asn Gly Thr Ser Glu Ser Ala Thr Pro Glu
740 745 750
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
755 760 765
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
770 775 780
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
785 790 795 800
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
805 810 815
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
820 825 830
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
835 840 845
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
850 855 860
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly
865 870 875 880
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly
885 890 895
Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
900 905 910
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser
915 920 925
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
930 935 940
Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
945 950 955 960
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu
965 970 975
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
980 985 990
Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
995 1000 1005
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
1010 1015 1020
Glu Pro Ser Glu Gly Ser Ala Pro Ala Ser Ser Glu Ile Thr Arg
1025 1030 1035
Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr
1040 1045 1050
Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu
1055 1060 1065
Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His
1070 1075 1080
Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser
1085 1090 1095
Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val
1100 1105 1110
Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
1115 1120 1125
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly
1130 1135 1140
Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met
1145 1150 1155
Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser
1160 1165 1170
Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
1175 1180 1185
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp
1190 1195 1200
Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys
1205 1210 1215
Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val
1220 1225 1230
His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr
1235 1240 1245
Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala
1250 1255 1260
Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr
1265 1270 1275
Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met
1280 1285 1290
Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn
1295 1300 1305
Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp
1310 1315 1320
Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn
1325 1330 1335
Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys
1340 1345 1350
Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val
1355 1360 1365
Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg
1370 1375 1380
Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr
1385 1390 1395
Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met
1400 1405 1410
Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln
1415 1420 1425
Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly
1430 1435 1440
Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys
1445 1450 1455
Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln
1460 1465 1470
Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile
1475 1480 1485
Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly
1490 1495 1500
Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser
1505 1510 1515
Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg
1520 1525 1530
Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu
1535 1540 1545
Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro
1550 1555 1560
Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala
1565 1570 1575
Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys
1580 1585 1590
Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln
1595 1600 1605
Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr
1610 1615 1620
Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu
1625 1630 1635
Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp
1640 1645 1650
Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val
1655 1660 1665
Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu
1670 1675 1680
Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser
1685 1690 1695
Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu
1700 1705 1710
Ala Gln Asp Leu Tyr
1715
<210> 110
<211> 6526
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Конструкция NB15.1v32 (AAV-FVIIIco6XTEN-ssDNA)
<400> 110
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata 180
cgcgctctct taaggtagcc ccgggacgcg tcaattgaga tctggatccg gtaccgaatt 240
cgcggccgcc tcgacgacta gcgtttaatt aaacgcgtgt ctgtctgcac atttcgtaga 300
gcgagtgttc cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat 360
tctccttttg ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg 420
gatcagcagc ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc 480
acacagatcc acaagctcct gaggtaagtg ccgtgtgtgg ttcccgcggg cctggcctct 540
ttacgggtta tggcccttgc gtgccttgaa ttactgacac tgacatccac tttttctttt 600
tctccacagc tagcgccacc atgcagattg agctgtccac ttgtttcttc ctgtgcctcc 660
tgcgcttctg tttctccgcc actcgccggt actaccttgg agccgtggag ctttcatggg 720
actacatgca gagcgacctg ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc 780
caaagtcctt cccctttaac acctccgtgg tgtacaagaa aaccctcttt gtcgagttca 840
ctgaccacct gttcaacatc gccaagccgc gcccaccttg gatgggcctc ctgggaccga 900
ccattcaagc tgaagtgtac gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc 960
ccgtgtccct gcatgcggtc ggagtgtcct actggaaggc ctccgaagga gctgagtacg 1020
acgaccagac tagccagcgg gaaaaggagg acgataaagt gttcccgggc ggctcgcata 1080
cttacgtgtg gcaagtcctg aaggaaaacg gacctatggc atccgatcct ctgtgcctga 1140
cttactccta cctttcccat gtggacctcg tgaaggacct gaacagcggg ctgattggtg 1200
cacttctcgt gtgccgcgaa ggttcgctcg ctaaggaaaa gacccagacc ctccataagt 1260
tcatcctttt gttcgctgtg ttcgatgaag gaaagtcatg gcattccgaa actaagaact 1320
cgctgatgca ggaccgggat gccgcctcag cccgcgcctg gcctaaaatg catacagtca 1380
acggatacgt gaatcggtca ctgcccgggc tcatcggttg tcacagaaag tccgtgtact 1440
ggcacgtcat cggcatgggc actacgcctg aagtgcactc catcttcctg gaagggcaca 1500
ccttcctcgt gcgcaaccac cgccaggcct ctctggaaat ctccccgatt acctttctga 1560
ccgcccagac tctgctcatg gacctggggc agttccttct cttctgccac atctccagcc 1620
atcagcacga cggaatggag gcctacgtga aggtggactc atgcccggaa gaacctcagt 1680
tgcggatgaa gaacaacgag gaggccgagg actatgacga cgatttgact gactccgaga 1740
tggacgtcgt gcggttcgat gacgacaaca gccccagctt catccagatt cgcagcgtgg 1800
ccaagaagca ccccaaaacc tgggtgcact acatcgcggc cgaggaagaa gattgggact 1860
acgccccgtt ggtgctggca cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg 1920
gtccgcagcg gattggcaga aagtacaaga aagtgcggtt catggcgtac actgacgaaa 1980
cgtttaagac ccgggaggcc attcaacatg agagcggcat tctgggacca ctgctgtacg 2040
gagaggtcgg cgataccctg ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca 2100
tctaccctca cggaatcacc gacgtgcggc cactctactc gcggcgcctg ccgaagggcg 2160
tcaagcacct gaaagacttc cctatcctgc cgggcgaaat cttcaagtat aagtggaccg 2220
tcaccgtgga ggacgggccc accaagagcg atcctaggtg tctgactcgg tactactcca 2280
gcttcgtgaa catggaacgg gacctggcat cgggactcat tggaccgctg ctgatctgct 2340
acaaagagtc ggtggatcaa cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc 2400
tgttctccgt gtttgatgaa aacagatcct ggtacctcac tgaaaacatc cagaggttcc 2460
tcccaaaccc cgcaggagtg caactggagg accctgagtt tcaggcctcg aatatcatgc 2520
actcgattaa cggttacgtg ttcgactcgc tgcaactgag cgtgtgcctc catgaagtcg 2580
cttactggta cattctgtcc atcggcgccc agactgactt cctgagcgtg ttcttttccg 2640
gttacacctt taagcacaag atggtgtacg aagataccct gaccctgttc cctttctccg 2700
gcgaaacggt gttcatgtcg atggagaacc cgggtctgtg gattctggga tgccacaaca 2760
gcgactttcg gaaccgcgga atgactgccc tgctgaaggt gtcctcatgc gacaagaaca 2820
ccggagacta ctacgaggac tcctacgagg atatctcagc ctacctcctg tccaagaaca 2880
acgcgatcga gccgcgcagc ttcagccaga acggcgcgcc aacatcagag agcgccaccc 2940
ctgaaagtgg tcccgggagc gagccagcca catctgggtc ggaaacgcca ggcacaagtg 3000
agtctgcaac tcccgagtcc ggacctggct ccgagcctgc cactagcggc tccgagactc 3060
cgggaacttc cgagagcgct acaccagaaa gcggacccgg aaccagtacc gaacctagcg 3120
agggctctgc tccgggcagc ccagccggct ctcctacatc cacggaggag ggcacttccg 3180
aatccgccac cccggagtca gggccaggat ctgaacccgc tacctcaggc agtgagacgc 3240
caggaacgag cgagtccgct acaccggaga gtgggccagg gagccctgct ggatctccta 3300
cgtccactga ggaagggtca ccagcgggct cgcccaccag cactgaagaa ggtgcctcga 3360
gcccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc caatcggatc 3420
aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa gatttcgata 3480
tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact agacactact 3540
ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct cacgtccttc 3600
ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc caggagttca 3660
ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac ctgggcctgc 3720
tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc cgtaaccaag 3780
catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac cagcgccaag 3840
gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac ttctggaagg 3900
tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg gcctacttct 3960
ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc 4020
acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag tttgctctgt 4080
tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg gagcgaaact 4140
gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac tatagattcc 4200
acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc caggatcaga 4260
ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc attcacttct 4320
ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg tacaatctgt 4380
accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc tggagagtgg 4440
agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg gtgtactcga 4500
ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc cagatcacag 4560
caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac tccggatcga 4620
tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc ctggccccta 4680
tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc ctgtacatct 4740
cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac aggggaaact 4800
ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt aagcacaaca 4860
tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac tactcaatcc 4920
gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg 4980
ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac ttcactaaca 5040
tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg tcaaatgcct 5100
ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa aagaccatga 5160
aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg tatgtgaagg 5220
agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc caaaacggaa 5280
aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac tccctggacc 5340
ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat cagattgcat 5400
tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctgaatcagc ctgagctcgc 5460
tgatcataat caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta 5520
tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc 5580
ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga 5640
ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac 5700
ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc 5760
cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc 5820
tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg 5880
gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc 5940
ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc 6000
gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgctgat 6060
cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 6120
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 6180
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 6240
gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggcttctg 6300
aggcggaaag aacgggctcg agaagcttct agatatcctc tcttaaggta gcatcgagat 6360
ttaaattagg gataacaggg taatggcgcg ggccgcagga acccctagtg atggagttgg 6420
ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 6480
gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcag 6526
<210> 111
<211> 130
<212> ДНК
<213> Искусственная последовательность
<220>
<223> 5'-ITR (инвертированный концевой повтор AAV2 на 5'-конце)
<400> 111
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 112
<211> 142
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Каркасная последовательность плазмиды (PBS)-1
<400> 112
gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata cgcgctctct 60
taaggtagcc ccgggacgcg tcaattgaga tctggatccg gtaccgaatt cgcggccgcc 120
tcgacgacta gcgtttaatt aa 142
<210> 113
<211> 229
<212> ДНК
<213> Искусственная последовательность
<220>
<223> TTPp (специфический для печени промотор)
<400> 113
acgcgtgtct gtctgcacat ttcgtagagc gagtgttccg atactctaat ctccctaggc 60
aaggttcata tttgtgtagg ttacttattc tccttttgtt gactaagtca ataatcagaa 120
tcagcaggtt tggagtcagc ttggcaggga tcagcagcct gggttggaag gagggggtat 180
aaaagcccct tcaccaggag aagccgtcac acagatccac aagctcctg 229
<210> 114
<211> 2
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Каркасная последовательность плазмиды (PBS)-2
<400> 114
ag 2
<210> 115
<211> 106
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический интрон
<400> 115
gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg 60
ccttgaatta ctgacactga catccacttt ttctttttct ccacag 106
<210> 116
<211> 11
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Каркасная последовательность плазмиды (PBS)-3
<400> 116
ctagcgccac c 11
<210> 117
<211> 4824
<212> ДНК
<213> Искусственная последовательность
<220>
<223> FVIIIco6XTEN (открытая рамка считывания для кодон-оптимизированного
варианта 6 FVIII, содержащего XTEN144)
<400> 117
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcaactgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gcccgcctgt gctgaagagg 2760
caccagcgag aaattacccg gaccaccctc caatcggatc aggaggaaat cgactacgac 2820
gacaccatct cggtggaaat gaagaaggaa gatttcgata tctacgacga ggacgaaaat 2880
cagtcccctc gctcattcca aaagaaaact agacactact ttatcgccgc ggtggaaaga 2940
ctgtgggact atggaatgtc atccagccct cacgtccttc ggaaccgggc ccagagcgga 3000
tcggtgcctc agttcaagaa agtggtgttc caggagttca ccgacggcag cttcacccag 3060
ccgctgtacc ggggagaact gaacgaacac ctgggcctgc tcggtcccta catccgcgcg 3120
gaagtggagg ataacatcat ggtgaccttc cgtaaccaag catccagacc ttactccttc 3180
tattcctccc tgatctcata cgaggaggac cagcgccaag gcgccgagcc ccgcaagaac 3240
ttcgtcaagc ccaacgagac taagacctac ttctggaagg tccaacacca tatggccccg 3300
accaaggatg agtttgactg caaggcctgg gcctacttct ccgacgtgga ccttgagaag 3360
gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc acaccaacac cctgaaccca 3420
gcgcatggac gccaggtcac cgtccaggag tttgctctgt tcttcaccat ttttgacgaa 3480
actaagtcct ggtacttcac cgagaatatg gagcgaaact gtagagcgcc ctgcaatatc 3540
cagatggaag atccgacttt caaggagaac tatagattcc acgccatcaa cgggtacatc 3600
atggatactc tgccggggct ggtcatggcc caggatcaga ggattcggtg gtacttgctg 3660
tcaatgggat cgaacgaaaa cattcactcc attcacttct ccggtcacgt gttcactgtg 3720
cgcaagaagg aggagtacaa gatggcgctg tacaatctgt accccggggt gttcgaaact 3780
gtggagatgc tgccgtccaa ggccggcatc tggagagtgg agtgcctgat cggagagcac 3840
ctccacgcgg ggatgtccac cctcttcctg gtgtactcga ataagtgcca gaccccgctg 3900
ggcatggcct cgggccacat cagagacttc cagatcacag caagcggaca atacggccaa 3960
tgggcgccga agctggcccg cttgcactac tccggatcga tcaacgcatg gtccaccaag 4020
gaaccgttct cgtggattaa ggtggacctc ctggccccta tgattatcca cggaattaag 4080
acccagggcg ccaggcagaa gttctcctcc ctgtacatct cgcaattcat catcatgtac 4140
agcctggacg ggaagaagtg gcagacttac aggggaaact ccaccggcac cctgatggtc 4200
tttttcggca acgtggattc ctccggcatt aagcacaaca tcttcaaccc accgatcata 4260
gccagatata ttaggctcca ccccactcac tactcaatcc gctcaactct tcggatggaa 4320
ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg ggatggaatc aaaggctatt 4380
agcgacgccc agatcaccgc gagctcctac ttcactaaca tgttcgccac ctggagcccc 4440
tccaaggcca ggctgcactt gcagggacgg tcaaatgcct ggcggccgca agtgaacaat 4500
ccgaaggaat ggcttcaagt ggatttccaa aagaccatga aagtgaccgg agtcaccacc 4560
cagggagtga agtcccttct gacctcgatg tatgtgaagg agttcctgat tagcagcagc 4620
caggacgggc accagtggac cctgttcttc caaaacggaa aggtcaaggt gttccagggg 4680
aaccaggact cgttcacacc cgtggtgaac tccctggacc ccccactgct gacgcggtac 4740
ttgaggattc atcctcagtc ctgggtccat cagattgcat tgcgaatgga agtcctgggc 4800
tgcgaggccc aggacctgta ctga 4824
<210> 118
<211> 450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> XTEN144
<400> 118
ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60
tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120
gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180
ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240
cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300
gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360
gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420
cccaccagca ctgaagaagg tgcctcgagc 450
<210> 119
<211> 19
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Каркасная последовательность плазмиды (PBS)-4
<400> 119
atcagcctga gctcgctga 19
<210> 120
<211> 595
<212> ДНК
<213> Искусственная последовательность
<220>
<223> WPRE (мутантный посттранскрипционный регуляторный элемент
вируса гепатита сурков)
<400> 120
tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt 60
tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc 120
ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga 180
gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc 240
cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct 300
ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg 360
gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct 420
gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc 480
cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg 540
tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgctg 595
<210> 121
<211> 8
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Каркасная последовательность плазмиды (PBS)-5
<400> 121
atcagcct 8
<210> 122
<211> 211
<212> ДНК
<213> Искусственная последовательность
<220>
<223> bGHpA (сигнал полиаденилирования бычьего гормона роста)
<400> 122
cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 60
ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 120
gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 180
attgggaaga caatagcagg catgctgggg a 211
<210> 123
<211> 119
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Каркасная последовательность плазмиды (PBS)-6
<400> 123
tgcggtgggc tctatggctt ctgaggcgga aagaacgggc tcgagaagct tctagatatc 60
ctctcttaag gtagcatcga gatttaaatt agggataaca gggtaatggc gcgggccgc 119
<210> 124
<211> 130
<212> ДНК
<213> Искусственная последовательность
<220>
<223> 3'-ITR (инвертированный концевой повтор AAV2 на 3'-конце)
<400> 124
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag 130
<210> 125
<211> 415
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Зрелый полипептид FIX
<400> 125
Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg
1. 5 10 15
Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe
20 25 30
Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly
35 40 45
Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp
50 55 60
Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys
65 70 75 80
Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu
85 90 95
Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr
100 105 110
Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val
115 120 125
Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr
130 135 140
Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu
145 150 155 160
Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn
165 170 175
Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe
180 185 190
Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly
195 200 205
Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu
210 215 220
Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu
225 230 235 240
Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His
245 250 255
His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu
260 265 270
Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile
275 280 285
Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser
290 295 300
Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala
305 310 315 320
Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys
325 330 335
Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly
340 345 350
Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
355 360 365
His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser
370 375 380
Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys
385 390 395 400
Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr
405 410 415
<210> 126
<211> 415
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Зрелый полипептид Padua(R338L)FIX
<400> 126
Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg
1. 5 10 15
Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe
20 25 30
Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly
35 40 45
Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp
50 55 60
Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys
65 70 75 80
Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu
85 90 95
Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr
100 105 110
Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val
115 120 125
Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr
130 135 140
Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu
145 150 155 160
Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn
165 170 175
Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe
180 185 190
Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly
195 200 205
Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu
210 215 220
Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu
225 230 235 240
Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His
245 250 255
His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu
260 265 270
Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile
275 280 285
Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser
290 295 300
Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala
305 310 315 320
Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys
325 330 335
Leu Leu Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly
340 345 350
Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
355 360 365
His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser
370 375 380
Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys
385 390 395 400
Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr
405 410 415
<210> 127
<211> 46
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> FIX сигнальный полипептид и пропептид
<400> 127
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1. 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg
35 40 45
<210> 128
<211> 8442
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Человеческий VWF
<400> 128
atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60
ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120
gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180
ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240
agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300
accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360
gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420
gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480
ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540
acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600
gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660
ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720
gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780
ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840
gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900
tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960
tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020
ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080
acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140
aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200
aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260
cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320
acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380
ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440
cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500
gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560
tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620
ctggcrgagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680
gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740
gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800
ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860
tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920
gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980
tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040
gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100
tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160
atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220
agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280
agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340
ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400
agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460
tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520
acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580
catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640
ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700
aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760
tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820
gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880
tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940
tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000
ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060
tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120
tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180
agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240
ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgcctgcttc 3300
tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360
aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420
gagtgtgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480
gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540
aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600
gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660
cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720
ggaggcctgg tggtgcctcc cacagatgcc ccggtgagcc ccaccactct gtatgtggag 3780
gacatctcgg aaccgccgtt gcacgatttc tactgcagca ggctactgga cctggtcttc 3840
ctgctggatg gctcctccag gctgtccgag gctgagtttg aagtgctgaa ggcctttgtg 3900
gtggacatga tggagcggct gcgcatctcc cagaagtggg tccgcgtggc cgtggtggag 3960
taccacgacg gctcccacgc ctacatcggg ctcaaggacc ggaagcgacc gtcagagctg 4020
cggcgcattg ccagccaggt gaagtatgcg ggcagccagg tggcctccac cagcgaggtc 4080
ttgaaataca cactgttcca aatcttcagc aagatcgacc gccctgaagc ctcccgcatc 4140
gccctgctcc tgatggccag ccaggagccc caacggatgt cccggaactt tgtccgctac 4200
gtccagggcc tgaagaagaa gaaggtcatt gtgatcccgg tgggcattgg gccccatgcc 4260
aacctcaagc agatccgcct catcgagaag caggcccctg agaacaaggc cttcgtgctg 4320
agcagtgtgg atgagctgga gcagcaaagg gacgagatcg ttagctacct ctgtgacctt 4380
gcccctgaag cccctcctcc tactctgccc cccgacatgg cacaagtcac tgtgggcccg 4440
gggctcttgg gggtttcgac cctggggccc aagaggaact ccatggttct ggatgtggcg 4500
ttcgtcctgg aaggatcgga caaaattggt gaagccgact tcaacaggag caaggagttc 4560
atggaggagg tgattcagcg gatggatgtg ggccaggaca gcatccacgt cacggtgctg 4620
cagtactcct acatggtgac cgtggagtac cccttcagcg aggcacagtc caaaggggac 4680
atcctgcagc gggtgcgaga gatccgctac cagggcggca acaggaccaa cactgggctg 4740
gccctgcggt acctctctga ccacagcttc ttggtcagcc agggtgaccg ggagcaggcg 4800
cccaacctgg tctacatggt caccggaaat cctgcctctg atgagatcaa gaggctgcct 4860
ggagacatcc aggtggtgcc cattggagtg ggccctaatg ccaacgtgca ggagctggag 4920
aggattggct ggcccaatgc ccctatcctc atccaggact ttgagacgct cccccgagag 4980
gctcctgacc tggtgctgca gaggtgctgc tccggagagg ggctgcagat ccccaccctc 5040
tcccctgcac ctgactgcag ccagcccctg gacgtgatcc ttctcctgga tggctcctcc 5100
agtttcccag cttcttattt tgatgaaatg aagagtttcg ccaaggcttt catttcaaaa 5160
gccaatatag ggcctcgtct cactcaggtg tcagtgctgc agtatggaag catcaccacc 5220
attgacgtgc catggaacgt ggtcccggag aaagcccatt tgctgagcct tgtggacgtc 5280
atgcagcggg agggaggccc cagccaaatc ggggatgcct tgggctttgc tgtgcgatac 5340
ttgacttcag aaatgcatgg tgccaggccg ggagcctcaa aggcggtggt catcctggtc 5400
acggacgtct ctgtggattc agtggatgca gcagctgatg ccgccaggtc caacagagtg 5460
acagtgttcc ctattggaat tggagatcgc tacgatgcag cccagctacg gatcttggca 5520
ggcccagcag gcgactccaa cgtggtgaag ctccagcgaa tcgaagacct ccctaccatg 5580
gtcaccttgg gcaattcctt cctccacaaa ctgtgctctg gatttgttag gatttgcatg 5640
gatgaggatg ggaatgagaa gaggcccggg gacgtctgga ccttgccaga ccagtgccac 5700
accgtgactt gccagccaga tggccagacc ttgctgaaga gtcatcgggt caactgtgac 5760
cgggggctga ggccttcgtg ccctaacagc cagtcccctg ttaaagtgga agagacctgt 5820
ggctgccgct ggacctgccc ctgygtgtgc acaggcagct ccactcggca catcgtgacc 5880
tttgatgggc agaatttcaa gctgactggc agctgttctt atgtcctatt tcaaaacaag 5940
gagcaggacc tggaggtgat tctccataat ggtgcctgca gccctggagc aaggcagggc 6000
tgcatgaaat ccatcgaggt gaagcacagt gccctctccg tcgagstgca cagtgacatg 6060
gaggtgacgg tgaatgggag actggtctct gttccttacg tgggtgggaa catggaagtc 6120
aacgtttatg gtgccatcat gcatgaggtc agattcaatc accttggtca catcttcaca 6180
ttcactccac aaaacaatga gttccaactg cagctcagcc ccaagacttt tgcttcaaag 6240
acgtatggtc tgtgtgggat ctgtgatgag aacggagcca atgacttcat gctgagggat 6300
ggcacagtca ccacagactg gaaaacactt gttcaggaat ggactgtgca gcggccaggg 6360
cagacgtgcc agcccatcct ggaggagcag tgtcttgtcc ccgacagctc ccactgccag 6420
gtcctcctct taccactgtt tgctgaatgc cacaaggtcc tggctccagc cacattctat 6480
gccatctgcc agcaggacag ttgccaccag gagcaagtgt gtgaggtgat cgcctcttat 6540
gcccacctct gtcggaccaa cggggtctgc gttgactgga ggacacctga tttctgtgct 6600
atgtcatgcc caccatctct ggtctacaac cactgtgagc atggctgtcc ccggcactgt 6660
gatggcaacg tgagctcctg tggggaccat ccctccgaag gctgtttctg ccctccagat 6720
aaagtcatgt tggaaggcag ctgtgtccct gaagaggcct gcactcagtg cattggtgag 6780
gatggagtcc agcaccagtt cctggaagcc tgggtcccgg accaccagcc ctgtcagatc 6840
tgcacatgcc tcagcgggcg gaaggtcaac tgcacaacgc agccctgccc cacggccaaa 6900
gctcccacgt gtggcctgtg tgaagtagcc cgcctccgcc agaatgcaga ccagtgctgc 6960
cccgagtatg agtgtgtgtg tgacccagtg agctgtgacc tgcccccagt gcctcactgt 7020
gaacgtggcc tccagcccac actgaccaac cctggcgagt gcagacccaa cttcacctgc 7080
gcctgcagga aggaggagtg caaaagagtg tccccaccct cctgcccccc gcaccgtttg 7140
cccacccttc ggaagaccca gtgctgtgat gagtatgagt gtgcctgcaa ctgtgtcaac 7200
tccacagtga gctgtcccct tgggtacttg gcctcaaccg ccaccaatga ctgtggctgt 7260
accacaacca cctgccttcc cgacaaggtg tgtgtccacc gaagcaccat ctaccctgtg 7320
ggccagttct gggaggaggg ctgcgatgtg tgcacctgca ccgacatgga ggatgccgtg 7380
atgggcctcc gcgtggccca gtgctcccag aagccctgtg aggacagctg tcggtcgggc 7440
ttcacttacg ttctgcatga aggcgagtgc tgtggaaggt gcctgccatc tgcctgtgag 7500
gtggtgactg gctcaccgcg gggggactcc cagtcttcct ggaagagtgt cggctcccag 7560
tgggcctccc cggagaaccc ctgcctcatc aatgagtgtg tccgagtgaa ggaggaggtc 7620
tttatacaac aaaggaacgt ctcctgcccc cagctggagg tccctgtctg cccctcgggc 7680
tttcagctga gctgtaagac ctcagcgtgc tgcccaagct gtcgctgtga gcgcatggag 7740
gcctgcatgc tcaatggcac tgtcattggg cccgggaaga ctgtgatgat cgatgtgtgc 7800
acgacctgcc gctgcatggt gcaggtgggg gtcatctctg gattcaagct ggagtgcagg 7860
aagaccacct gcaacccctg ccccctgggt tacaaggaag aaaataacac aggtgaatgt 7920
tgtgggagat gtttgcctac ggcttgcacc attcagctaa gaggaggaca gatcatgaca 7980
ctgaagcgtg atgagacgct ccaggatggc tgtgatactc acttctgcaa ggtcaatgag 8040
agaggagagt acttctggga gaagagggtc acaggctgcc caccctttga tgaacacaag 8100
tgtcttgctg agggaggtaa aattatgaaa attccaggca cctgctgtga cacatgtgag 8160
gagcctgagt gcaacgacat cactgccagg ctgcagtatg tcaaggtggg aagctgtaag 8220
tctgaagtag aggtggatat ccactactgc cagggcaaat gtgccagcaa agccatgtac 8280
tccattgaca tcaacgatgt gcaggaccag tgctcctgct gctctccgac acggacggag 8340
cccatgcagg tggccctgca ctgcaccaat ggctctgttg tgtaccatga ggttctcaat 8400
gccatggagt gcaaatgctc ccccaggaag tgcagcaagt ga 8442
<210> 129
<211> 2809
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Человеческий VWF
<220>
<221> другой_признак
<222> (540)..(540)
<223> Xaa может представлять собой любую втречающуюся в природе аминокислоту
<220>
<221> другой_признак
<222> (1944)..(1944)
<223> Xaa может представлять собой любую втречающуюся в природе аминокислоту
<220>
<221> другой_признак
<222> (2012)..(2012)
<223> Xaa может представлять собой любую втречающуюся в природе аминокислоту
<400> 129
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1. 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Cys Glu Lys Thr Leu Cys Glu Cys Ala
245 250 255
Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala Arg Thr
260 265 270
Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His Ser Ala
275 280 285
Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys Val Ser
290 295 300
Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met Cys Gln
305 310 315 320
Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu Leu Asp
325 330 335
Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His Ser Gly
340 345 350
Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn Thr Cys
355 360 365
Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys Pro Gly
370 375 380
Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp Asn Arg
385 390 395 400
Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg Asp Cys
405 410 415
Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys Ala Asp
420 425 430
Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu Pro Gly
435 440 445
Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val Ala Met
450 455 460
Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu Arg Ile
465 470 475 480
Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu Asp Leu
485 490 495
Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu Ser Pro
500 505 510
Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn Gly Asn
515 520 525
Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Xaa Glu Pro Arg Val
530 535 540
Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln Asp Leu
545 550 555 560
Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met Thr Arg
565 570 575
Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe Glu Ala
580 585 590
Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys Arg Tyr
595 600 605
Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly Ala Ser
610 615 620
Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val Ala Trp Arg Glu
625 630 635 640
Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln Val Tyr Leu Gln
645 650 655
Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu Ser Tyr Pro Asp
660 665 670
Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe Cys Pro Pro Gly
675 680 685
Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys Ala Gln Cys Pro
690 695 700
Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp Ile Phe Ser Asp
705 710 715 720
His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met His Cys Thr Met
725 730 735
Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val Leu Ser Ser Pro
740 745 750
Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg Pro Pro Met Val
755 760 765
Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu Gly Leu Glu Cys
770 775 780
Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met Ser Met Gly Cys
785 790 795 800
Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg His Glu Asn Arg
805 810 815
Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln Gly Lys Glu Tyr
820 825 830
Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr Cys Val Cys Arg
835 840 845
Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser
850 855 860
Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu
865 870 875 880
Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser
885 890 895
Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His
900 905 910
Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly Gly
915 920 925
Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro Met Lys
930 935 940
Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr Ile Ile Leu
945 950 955 960
Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg His Leu Ser Ile
965 970 975
Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val Cys Gly Leu Cys
980 985 990
Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr Ser Ser Asn Leu
995 1000 1005
Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser Trp Lys Val
1010 1015 1020
Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp Ser Ser
1025 1030 1035
Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln Thr Met Val Asp
1040 1045 1050
Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn
1055 1060 1065
Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp
1070 1075 1080
Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys Phe Cys Asp
1085 1090 1095
Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly Lys Val
1100 1105 1110
Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu Glu
1115 1120 1125
Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn
1130 1135 1140
Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro
1145 1150 1155
Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys
1160 1165 1170
Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp
1175 1180 1185
Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala
1190 1195 1200
Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys
1205 1210 1215
Gln Ile Cys His Cys Asp Val Val Asn Leu Thr Cys Glu Ala Cys
1220 1225 1230
Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val
1235 1240 1245
Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu
1250 1255 1260
His Asp Phe Tyr Cys Ser Arg Leu Leu Asp Leu Val Phe Leu Leu
1265 1270 1275
Asp Gly Ser Ser Arg Leu Ser Glu Ala Glu Phe Glu Val Leu Lys
1280 1285 1290
Ala Phe Val Val Asp Met Met Glu Arg Leu Arg Ile Ser Gln Lys
1295 1300 1305
Trp Val Arg Val Ala Val Val Glu Tyr His Asp Gly Ser His Ala
1310 1315 1320
Tyr Ile Gly Leu Lys Asp Arg Lys Arg Pro Ser Glu Leu Arg Arg
1325 1330 1335
Ile Ala Ser Gln Val Lys Tyr Ala Gly Ser Gln Val Ala Ser Thr
1340 1345 1350
Ser Glu Val Leu Lys Tyr Thr Leu Phe Gln Ile Phe Ser Lys Ile
1355 1360 1365
Asp Arg Pro Glu Ala Ser Arg Ile Ala Leu Leu Leu Met Ala Ser
1370 1375 1380
Gln Glu Pro Gln Arg Met Ser Arg Asn Phe Val Arg Tyr Val Gln
1385 1390 1395
Gly Leu Lys Lys Lys Lys Val Ile Val Ile Pro Val Gly Ile Gly
1400 1405 1410
Pro His Ala Asn Leu Lys Gln Ile Arg Leu Ile Glu Lys Gln Ala
1415 1420 1425
Pro Glu Asn Lys Ala Phe Val Leu Ser Ser Val Asp Glu Leu Glu
1430 1435 1440
Gln Gln Arg Asp Glu Ile Val Ser Tyr Leu Cys Asp Leu Ala Pro
1445 1450 1455
Glu Ala Pro Pro Pro Thr Leu Pro Pro Asp Met Ala Gln Val Thr
1460 1465 1470
Val Gly Pro Gly Leu Leu Gly Val Ser Thr Leu Gly Pro Lys Arg
1475 1480 1485
Asn Ser Met Val Leu Asp Val Ala Phe Val Leu Glu Gly Ser Asp
1490 1495 1500
Lys Ile Gly Glu Ala Asp Phe Asn Arg Ser Lys Glu Phe Met Glu
1505 1510 1515
Glu Val Ile Gln Arg Met Asp Val Gly Gln Asp Ser Ile His Val
1520 1525 1530
Thr Val Leu Gln Tyr Ser Tyr Met Val Thr Val Glu Tyr Pro Phe
1535 1540 1545
Ser Glu Ala Gln Ser Lys Gly Asp Ile Leu Gln Arg Val Arg Glu
1550 1555 1560
Ile Arg Tyr Gln Gly Gly Asn Arg Thr Asn Thr Gly Leu Ala Leu
1565 1570 1575
Arg Tyr Leu Ser Asp His Ser Phe Leu Val Ser Gln Gly Asp Arg
1580 1585 1590
Glu Gln Ala Pro Asn Leu Val Tyr Met Val Thr Gly Asn Pro Ala
1595 1600 1605
Ser Asp Glu Ile Lys Arg Leu Pro Gly Asp Ile Gln Val Val Pro
1610 1615 1620
Ile Gly Val Gly Pro Asn Ala Asn Val Gln Glu Leu Glu Arg Ile
1625 1630 1635
Gly Trp Pro Asn Ala Pro Ile Leu Ile Gln Asp Phe Glu Thr Leu
1640 1645 1650
Pro Arg Glu Ala Pro Asp Leu Val Leu Gln Arg Cys Cys Ser Gly
1655 1660 1665
Glu Gly Leu Gln Ile Pro Thr Leu Ser Pro Ala Pro Asp Cys Ser
1670 1675 1680
Gln Pro Leu Asp Val Ile Leu Leu Leu Asp Gly Ser Ser Ser Phe
1685 1690 1695
Pro Ala Ser Tyr Phe Asp Glu Met Lys Ser Phe Ala Lys Ala Phe
1700 1705 1710
Ile Ser Lys Ala Asn Ile Gly Pro Arg Leu Thr Gln Val Ser Val
1715 1720 1725
Leu Gln Tyr Gly Ser Ile Thr Thr Ile Asp Val Pro Trp Asn Val
1730 1735 1740
Val Pro Glu Lys Ala His Leu Leu Ser Leu Val Asp Val Met Gln
1745 1750 1755
Arg Glu Gly Gly Pro Ser Gln Ile Gly Asp Ala Leu Gly Phe Ala
1760 1765 1770
Val Arg Tyr Leu Thr Ser Glu Met His Gly Ala Arg Pro Gly Ala
1775 1780 1785
Ser Lys Ala Val Val Ile Leu Val Thr Asp Val Ser Val Asp Ser
1790 1795 1800
Val Asp Ala Ala Ala Asp Ala Ala Arg Ser Asn Arg Val Thr Val
1805 1810 1815
Phe Pro Ile Gly Ile Gly Asp Arg Tyr Asp Ala Ala Gln Leu Arg
1820 1825 1830
Ile Leu Ala Gly Pro Ala Gly Asp Ser Asn Val Val Lys Leu Gln
1835 1840 1845
Arg Ile Glu Asp Leu Pro Thr Met Val Thr Leu Gly Asn Ser Phe
1850 1855 1860
Leu His Lys Leu Cys Ser Gly Phe Val Arg Ile Cys Met Asp Glu
1865 1870 1875
Asp Gly Asn Glu Lys Arg Pro Gly Asp Val Trp Thr Leu Pro Asp
1880 1885 1890
Gln Cys His Thr Val Thr Cys Gln Pro Asp Gly Gln Thr Leu Leu
1895 1900 1905
Lys Ser His Arg Val Asn Cys Asp Arg Gly Leu Arg Pro Ser Cys
1910 1915 1920
Pro Asn Ser Gln Ser Pro Val Lys Val Glu Glu Thr Cys Gly Cys
1925 1930 1935
Arg Trp Thr Cys Pro Xaa Val Cys Thr Gly Ser Ser Thr Arg His
1940 1945 1950
Ile Val Thr Phe Asp Gly Gln Asn Phe Lys Leu Thr Gly Ser Cys
1955 1960 1965
Ser Tyr Val Leu Phe Gln Asn Lys Glu Gln Asp Leu Glu Val Ile
1970 1975 1980
Leu His Asn Gly Ala Cys Ser Pro Gly Ala Arg Gln Gly Cys Met
1985 1990 1995
Lys Ser Ile Glu Val Lys His Ser Ala Leu Ser Val Glu Xaa His
2000 2005 2010
Ser Asp Met Glu Val Thr Val Asn Gly Arg Leu Val Ser Val Pro
2015 2020 2025
Tyr Val Gly Gly Asn Met Glu Val Asn Val Tyr Gly Ala Ile Met
2030 2035 2040
His Glu Val Arg Phe Asn His Leu Gly His Ile Phe Thr Phe Thr
2045 2050 2055
Pro Gln Asn Asn Glu Phe Gln Leu Gln Leu Ser Pro Lys Thr Phe
2060 2065 2070
Ala Ser Lys Thr Tyr Gly Leu Cys Gly Ile Cys Asp Glu Asn Gly
2075 2080 2085
Ala Asn Asp Phe Met Leu Arg Asp Gly Thr Val Thr Thr Asp Trp
2090 2095 2100
Lys Thr Leu Val Gln Glu Trp Thr Val Gln Arg Pro Gly Gln Thr
2105 2110 2115
Cys Gln Pro Ile Leu Glu Glu Gln Cys Leu Val Pro Asp Ser Ser
2120 2125 2130
His Cys Gln Val Leu Leu Leu Pro Leu Phe Ala Glu Cys His Lys
2135 2140 2145
Val Leu Ala Pro Ala Thr Phe Tyr Ala Ile Cys Gln Gln Asp Ser
2150 2155 2160
Cys His Gln Glu Gln Val Cys Glu Val Ile Ala Ser Tyr Ala His
2165 2170 2175
Leu Cys Arg Thr Asn Gly Val Cys Val Asp Trp Arg Thr Pro Asp
2180 2185 2190
Phe Cys Ala Met Ser Cys Pro Pro Ser Leu Val Tyr Asn His Cys
2195 2200 2205
Glu His Gly Cys Pro Arg His Cys Asp Gly Asn Val Ser Ser Cys
2210 2215 2220
Gly Asp His Pro Ser Glu Gly Cys Phe Cys Pro Pro Asp Lys Val
2225 2230 2235
Met Leu Glu Gly Ser Cys Val Pro Glu Glu Ala Cys Thr Gln Cys
2240 2245 2250
Ile Gly Glu Asp Gly Val Gln His Gln Phe Leu Glu Ala Trp Val
2255 2260 2265
Pro Asp His Gln Pro Cys Gln Ile Cys Thr Cys Leu Ser Gly Arg
2270 2275 2280
Lys Val Asn Cys Thr Thr Gln Pro Cys Pro Thr Ala Lys Ala Pro
2285 2290 2295
Thr Cys Gly Leu Cys Glu Val Ala Arg Leu Arg Gln Asn Ala Asp
2300 2305 2310
Gln Cys Cys Pro Glu Tyr Glu Cys Val Cys Asp Pro Val Ser Cys
2315 2320 2325
Asp Leu Pro Pro Val Pro His Cys Glu Arg Gly Leu Gln Pro Thr
2330 2335 2340
Leu Thr Asn Pro Gly Glu Cys Arg Pro Asn Phe Thr Cys Ala Cys
2345 2350 2355
Arg Lys Glu Glu Cys Lys Arg Val Ser Pro Pro Ser Cys Pro Pro
2360 2365 2370
His Arg Leu Pro Thr Leu Arg Lys Thr Gln Cys Cys Asp Glu Tyr
2375 2380 2385
Glu Cys Ala Cys Asn Cys Val Asn Ser Thr Val Ser Cys Pro Leu
2390 2395 2400
Gly Tyr Leu Ala Ser Thr Ala Thr Asn Asp Cys Gly Cys Thr Thr
2405 2410 2415
Thr Thr Cys Leu Pro Asp Lys Val Cys Val His Arg Ser Thr Ile
2420 2425 2430
Tyr Pro Val Gly Gln Phe Trp Glu Glu Gly Cys Asp Val Cys Thr
2435 2440 2445
Cys Thr Asp Met Glu Asp Ala Val Met Gly Leu Arg Val Ala Gln
2450 2455 2460
Cys Ser Gln Lys Pro Cys Glu Asp Ser Cys Arg Ser Gly Phe Thr
2465 2470 2475
Tyr Val Leu His Glu Gly Glu Cys Cys Gly Arg Cys Leu Pro Ser
2480 2485 2490
Ala Cys Glu Val Val Thr Gly Ser Pro Arg Gly Asp Ser Gln Ser
2495 2500 2505
Ser Trp Lys Ser Val Gly Ser Gln Trp Ala Ser Pro Glu Asn Pro
2510 2515 2520
Cys Leu Ile Asn Glu Cys Val Arg Val Lys Glu Glu Val Phe Ile
2525 2530 2535
Gln Gln Arg Asn Val Ser Cys Pro Gln Leu Glu Val Pro Val Cys
2540 2545 2550
Pro Ser Gly Phe Gln Leu Ser Cys Lys Thr Ser Ala Cys Cys Pro
2555 2560 2565
Ser Cys Arg Cys Glu Arg Met Glu Ala Cys Met Leu Asn Gly Thr
2570 2575 2580
Val Ile Gly Pro Gly Lys Thr Val Met Ile Asp Val Cys Thr Thr
2585 2590 2595
Cys Arg Cys Met Val Gln Val Gly Val Ile Ser Gly Phe Lys Leu
2600 2605 2610
Glu Cys Arg Lys Thr Thr Cys Asn Pro Cys Pro Leu Gly Tyr Lys
2615 2620 2625
Glu Glu Asn Asn Thr Gly Glu Cys Cys Gly Arg Cys Leu Pro Thr
2630 2635 2640
Ala Cys Thr Ile Gln Leu Arg Gly Gly Gln Ile Met Thr Leu Lys
2645 2650 2655
Arg Asp Glu Thr Leu Gln Asp Gly Cys Asp Thr His Phe Cys Lys
2660 2665 2670
Val Asn Glu Arg Gly Glu Tyr Phe Trp Glu Lys Arg Val Thr Gly
2675 2680 2685
Cys Pro Pro Phe Asp Glu His Lys Cys Leu Ala Glu Gly Gly Lys
2690 2695 2700
Ile Met Lys Ile Pro Gly Thr Cys Cys Asp Thr Cys Glu Glu Pro
2705 2710 2715
Glu Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr Val Lys Val Gly
2720 2725 2730
Ser Cys Lys Ser Glu Val Glu Val Asp Ile His Tyr Cys Gln Gly
2735 2740 2745
Lys Cys Ala Ser Lys Ala Met Tyr Ser Ile Asp Ile Asn Asp Val
2750 2755 2760
Gln Asp Gln Cys Ser Cys Cys Ser Pro Thr Arg Thr Glu Pro Met
2765 2770 2775
Gln Val Ala Leu His Cys Thr Asn Gly Ser Val Val Tyr His Glu
2780 2785 2790
Val Leu Asn Ala Met Glu Cys Lys Cys Ser Pro Arg Lys Cys Ser
2795 2800 2805
Lys
<210> 130
<211> 36
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE36
<400> 130
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
1. 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
20 25 30
Ser Glu Thr Pro
35
<210> 131
<211> 42
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE42
<400> 131
Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
1. 5 10 15
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
20 25 30
Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser
35 40
<210> 132
<211> 78
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE72
<400> 132
Gly Ala Pro Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser
1. 5 10 15
Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
20 25 30
Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu
35 40 45
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr
50 55 60
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser
65 70 75
<210> 133
<211> 78
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE78
<400> 133
Gly Ala Pro Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser
1. 5 10 15
Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
20 25 30
Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu
35 40 45
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr
50 55 60
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser
65 70 75
<210> 134
<211> 143
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE144
<400> 134
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
1. 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
20 25 30
Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
35 40 45
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro
50 55 60
Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly
65 70 75 80
Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
85 90 95
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu
100 105 110
Ser Ala Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
115 120 125
Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
130 135 140
<210> 135
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE144_6B
<400> 135
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser
1. 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala
50 55 60
Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
65 70 75 80
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala
100 105 110
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 136
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AG144
<400> 136
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
1. 5 10 15
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
35 40 45
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro
50 55 60
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
65 70 75 80
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
85 90 95
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
100 105 110
Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala
115 120 125
Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
130 135 140
<210> 137
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AG144_A
<400> 137
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
1. 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly
100 105 110
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 138
<211> 288
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE288
<400> 138
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
1. 5 10 15
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
20 25 30
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
35 40 45
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
65 70 75 80
Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
85 90 95
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
100 105 110
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr
115 120 125
Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
130 135 140
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu
145 150 155 160
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro
165 170 175
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
180 185 190
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro
195 200 205
Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr
210 215 220
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
225 230 235 240
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro
245 250 255
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
260 265 270
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
275 280 285
<210> 139
<211> 288
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE288_2
<400> 139
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
1. 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
20 25 30
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
35 40 45
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
65 70 75 80
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
85 90 95
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
100 105 110
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
115 120 125
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
130 135 140
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
145 150 155 160
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
165 170 175
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
180 185 190
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
195 200 205
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
210 215 220
Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
225 230 235 240
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala
245 250 255
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
260 265 270
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
275 280 285
<210> 140
<211> 288
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AG288
<400> 140
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser
1. 5 10 15
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr
20 25 30
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
35 40 45
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser
50 55 60
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr
65 70 75 80
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
85 90 95
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
100 105 110
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser
115 120 125
Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
130 135 140
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser
145 150 155 160
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser
165 170 175
Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly
180 185 190
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser
195 200 205
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly
210 215 220
Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly
225 230 235 240
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser
245 250 255
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr
260 265 270
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
275 280 285
<210> 141
<211> 576
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE576
<400> 141
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
1. 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu
20 25 30
Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
35 40 45
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
65 70 75 80
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
85 90 95
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala
100 105 110
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
115 120 125
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
130 135 140
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala
145 150 155 160
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu
165 170 175
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
180 185 190
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
195 200 205
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
210 215 220
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
225 230 235 240
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
245 250 255
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
260 265 270
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
275 280 285
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
290 295 300
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
305 310 315 320
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
325 330 335
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
340 345 350
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
355 360 365
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
370 375 380
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
385 390 395 400
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
405 410 415
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
420 425 430
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
435 440 445
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
450 455 460
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
465 470 475 480
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
485 490 495
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
500 505 510
Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
515 520 525
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala
530 535 540
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
545 550 555 560
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
565 570 575
<210> 142
<211> 576
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AG576
<400> 142
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser
1. 5 10 15
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser
20 25 30
Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly
35 40 45
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
50 55 60
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser
65 70 75 80
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
85 90 95
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro
100 105 110
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser
115 120 125
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
130 135 140
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser
145 150 155 160
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr
165 170 175
Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
180 185 190
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser
195 200 205
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly
210 215 220
Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
225 230 235 240
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro
245 250 255
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly
260 265 270
Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
275 280 285
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
290 295 300
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser
305 310 315 320
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
325 330 335
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser
340 345 350
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser
355 360 365
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
370 375 380
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro
385 390 395 400
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly
405 410 415
Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser
420 425 430
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro
435 440 445
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly
450 455 460
Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
465 470 475 480
Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser
485 490 495
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser
500 505 510
Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser
515 520 525
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
530 535 540
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser
545 550 555 560
Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
565 570 575
<210> 143
<211> 864
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE864
<400> 143
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
1. 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu
20 25 30
Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
35 40 45
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
65 70 75 80
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
85 90 95
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala
100 105 110
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
115 120 125
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
130 135 140
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala
145 150 155 160
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu
165 170 175
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
180 185 190
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
195 200 205
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
210 215 220
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
225 230 235 240
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
245 250 255
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
260 265 270
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
275 280 285
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
290 295 300
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
305 310 315 320
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
325 330 335
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
340 345 350
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
355 360 365
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
370 375 380
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
385 390 395 400
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
405 410 415
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
420 425 430
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
435 440 445
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
450 455 460
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
465 470 475 480
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
485 490 495
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
500 505 510
Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
515 520 525
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala
530 535 540
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
545 550 555 560
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
565 570 575
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
580 585 590
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
595 600 605
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
610 615 620
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
625 630 635 640
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
645 650 655
Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
660 665 670
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
675 680 685
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr
690 695 700
Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
705 710 715 720
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu
725 730 735
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro
740 745 750
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
755 760 765
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro
770 775 780
Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr
785 790 795 800
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
805 810 815
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro
820 825 830
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
835 840 845
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
850 855 860
<210> 144
<211> 864
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AG864
<400> 144
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
1. 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly
100 105 110
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
145 150 155 160
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
165 170 175
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
180 185 190
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
195 200 205
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
210 215 220
Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
225 230 235 240
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro
245 250 255
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
260 265 270
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
275 280 285
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro
290 295 300
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
305 310 315 320
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
325 330 335
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly
340 345 350
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
355 360 365
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
370 375 380
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr
385 390 395 400
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
405 410 415
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
420 425 430
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
435 440 445
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
450 455 460
Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
465 470 475 480
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro
485 490 495
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
500 505 510
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
515 520 525
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro
530 535 540
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
545 550 555 560
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
565 570 575
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
580 585 590
Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala
595 600 605
Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
610 615 620
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
625 630 635 640
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
645 650 655
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
660 665 670
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro
675 680 685
Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala
690 695 700
Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
705 710 715 720
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro
725 730 735
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
740 745 750
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
755 760 765
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
770 775 780
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
785 790 795 800
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
805 810 815
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
820 825 830
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
835 840 845
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
850 855 860
<210> 145
<211> 72
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN_AE72_2A_1
<400> 145
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly
1. 5 10 15
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 146
<211> 72
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN_AE72_2A_2
<400> 146
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1. 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser
50 55 60
Ala Thr Pro Glu Ser Gly Pro Gly
65 70
<210> 147
<211> 72
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN_AE72_3B_1
<400> 147
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1. 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
20 25 30
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 148
<211> 72
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN_AE72_3B_2
<400> 148
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
1. 5 10 15
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
35 40 45
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 149
<211> 72
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN_AE72_4A_2
<400> 149
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly
1. 5 10 15
Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser
20 25 30
Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 150
<211> 72
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN_AE72_5A_2
<400> 150
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1. 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
20 25 30
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly
50 55 60
Ser Pro Thr Ser Thr Glu Glu Gly
65 70
<210> 151
<211> 72
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN_AE72_6B_1
<400> 151
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser
1. 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala
50 55 60
Thr Ser Gly Ser Glu Thr Pro Gly
65 70
<210> 152
<211> 72
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN_AE72_6B_2
<400> 152
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu
1. 5 10 15
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 153
<211> 72
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN_AE72_1A_1
<400> 153
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1. 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
35 40 45
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 154
<211> 72
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN_AE72_1A_2
<400> 154
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1. 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
20 25 30
Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 155
<211> 144
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> XTEN_AE144_1A
<400> 155
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1. 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
35 40 45
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
65 70 75 80
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
85 90 95
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly
100 105 110
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 156
<211> 150
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE150
<400> 156
Gly Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
1. 5 10 15
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
20 25 30
Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
35 40 45
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
50 55 60
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala
65 70 75 80
Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
85 90 95
Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
100 105 110
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
115 120 125
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
130 135 140
Ser Ala Pro Ala Ser Ser
145 150
<210> 157
<211> 150
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> G150
<400> 157
Gly Ala Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly
1. 5 10 15
Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser
20 25 30
Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly
35 40 45
Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly
50 55 60
Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro
65 70 75 80
Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly
85 90 95
Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly
100 105 110
Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser
115 120 125
Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr
130 135 140
Gly Ser Pro Ala Ser Ser
145 150
<210> 158
<211> 294
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AE294
<400> 158
Gly Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
1. 5 10 15
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
20 25 30
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
35 40 45
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
50 55 60
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly
65 70 75 80
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu
85 90 95
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
100 105 110
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly
115 120 125
Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser
130 135 140
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
145 150 155 160
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser
165 170 175
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
180 185 190
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
195 200 205
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly
210 215 220
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly
225 230 235 240
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
245 250 255
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
260 265 270
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
275 280 285
Ser Ala Pro Ala Ser Ser
290
<210> 159
<211> 294
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> AG294
<400> 159
Gly Ala Pro Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
1. 5 10 15
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly
20 25 30
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
35 40 45
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
50 55 60
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly
65 70 75 80
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
85 90 95
Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
100 105 110
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro
115 120 125
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
130 135 140
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
145 150 155 160
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
165 170 175
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
180 185 190
Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
195 200 205
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr
210 215 220
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr
225 230 235 240
Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
245 250 255
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly
260 265 270
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
275 280 285
Thr Gly Ser Ala Ser Ser
290
<210> 160
<211> 1016
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> FIX-линкер-альбумин
<400> 160
Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg
1. 5 10 15
Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe
20 25 30
Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly
35 40 45
Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp
50 55 60
Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys
65 70 75 80
Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu
85 90 95
Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr
100 105 110
Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val
115 120 125
Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr
130 135 140
Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu
145 150 155 160
Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn
165 170 175
Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe
180 185 190
Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly
195 200 205
Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu
210 215 220
Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu
225 230 235 240
Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His
245 250 255
His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu
260 265 270
Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile
275 280 285
Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser
290 295 300
Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala
305 310 315 320
Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys
325 330 335
Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly
340 345 350
Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
355 360 365
His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser
370 375 380
Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys
385 390 395 400
Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Pro
405 410 415
Val Ser Gln Thr Ser Lys Leu Thr Arg Ala Glu Thr Val Phe Pro Asp
420 425 430
Val Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly
435 440 445
Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu
450 455 460
Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr
465 470 475 480
Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp
485 490 495
Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr
500 505 510
Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu
515 520 525
Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn
530 535 540
Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe
545 550 555 560
His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala
565 570 575
Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys
580 585 590
Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala
595 600 605
Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala
610 615 620
Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly
625 630 635 640
Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe
645 650 655
Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr
660 665 670
Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp
675 680 685
Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile
690 695 700
Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser
705 710 715 720
His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro
725 730 735
Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr
740 745 750
Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala
755 760 765
Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys
770 775 780
Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Phe Cys
785 790 795 800
Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gln
805 810 815
Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Tyr
820 825 830
Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Gln
835 840 845
Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Val
850 855 860
Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala
865 870 875 880
Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Glu
885 890 895
Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu
900 905 910
Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Tyr
915 920 925
Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Ile
930 935 940
Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala Leu
945 950 955 960
Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Lys
965 970 975
Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala
980 985 990
Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala
995 1000 1005
Ala Ser Gln Ala Ala Leu Gly Leu
1010 1015
<210> 161
<211> 424
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> FIX
<400> 161
Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg
1. 5 10 15
Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe
20 25 30
Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly
35 40 45
Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp
50 55 60
Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys
65 70 75 80
Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu
85 90 95
Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr
100 105 110
Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val
115 120 125
Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr
130 135 140
Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu
145 150 155 160
Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn
165 170 175
Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe
180 185 190
Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly
195 200 205
Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu
210 215 220
Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu
225 230 235 240
Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His
245 250 255
His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu
260 265 270
Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile
275 280 285
Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser
290 295 300
Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala
305 310 315 320
Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys
325 330 335
Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly
340 345 350
Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
355 360 365
His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser
370 375 380
Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys
385 390 395 400
Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Pro
405 410 415
Val Ser Gln Thr Ser Lys Leu Thr
420
<210> 162
<211> 9
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Линкер
<400> 162
Arg Ala Glu Thr Val Phe Pro Asp Val
1. 5
<210> 163
<211> 585
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Альбумин
<400> 163
Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu
1. 5 10 15
Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln
20 25 30
Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu
35 40 45
Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys
50 55 60
Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu
65 70 75 80
Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro
85 90 95
Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu
100 105 110
Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His
115 120 125
Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg
130 135 140
Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg
145 150 155 160
Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala
165 170 175
Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser
180 185 190
Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu
195 200 205
Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro
210 215 220
Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys
225 230 235 240
Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp
245 250 255
Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser
260 265 270
Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His
275 280 285
Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser
290 295 300
Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala
305 310 315 320
Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg
325 330 335
Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr
340 345 350
Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu
355 360 365
Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro
370 375 380
Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu
385 390 395 400
Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro
405 410 415
Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys
420 425 430
Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys
435 440 445
Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His
450 455 460
Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser
465 470 475 480
Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr
485 490 495
Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp
500 505 510
Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala
515 520 525
Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu
530 535 540
Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys
545 550 555 560
Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val
565 570 575
Ala Ala Ser Gln Ala Ala Leu Gly Leu
580 585
<210> 164
<211> 763
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> FIX(XTEN)-Fc
<400> 164
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1. 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Gly Pro Ser Pro Gly Ser Pro Thr Ser Thr Glu Glu
210 215 220
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
225 230 235 240
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
245 250 255
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
260 265 270
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser
275 280 285
Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe Thr Arg Val Val
290 295 300
Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp Gln Val Val Leu
305 310 315 320
Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile Val Asn Glu Lys
325 330 335
Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly Val Lys Ile Thr
340 345 350
Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu His Thr Glu Gln
355 360 365
Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn Tyr Asn Ala Ala
370 375 380
Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu Leu Asp Glu Pro
385 390 395 400
Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile Ala Asp Lys Glu
405 410 415
Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr Val Ser Gly Trp
420 425 430
Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val Leu Gln Tyr Leu
435 440 445
Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Leu Ser Thr Lys Phe
450 455 460
Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His Glu Gly Gly Arg
465 470 475 480
Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val Thr Glu Val Glu
485 490 495
Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly Glu Glu Cys Ala
500 505 510
Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser Arg Tyr Val Asn
515 520 525
Trp Ile Lys Glu Lys Thr Lys Leu Thr Asp Lys Thr His Thr Cys Pro
530 535 540
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
545 550 555 560
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
565 570 575
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
580 585 590
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
595 600 605
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
610 615 620
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
625 630 635 640
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
645 650 655
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
660 665 670
Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
675 680 685
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
690 695 700
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
705 710 715 720
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
725 730 735
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
740 745 750
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
755 760
<210> 165
<211> 712
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> FIX-FXIa-AE288
<400> 165
Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg
1. 5 10 15
Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe
20 25 30
Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly
35 40 45
Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp
50 55 60
Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys
65 70 75 80
Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu
85 90 95
Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr
100 105 110
Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val
115 120 125
Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr
130 135 140
Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu
145 150 155 160
Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn
165 170 175
Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe
180 185 190
Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly
195 200 205
Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu
210 215 220
Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu
225 230 235 240
Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His
245 250 255
His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu
260 265 270
Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile
275 280 285
Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser
290 295 300
Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala
305 310 315 320
Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys
325 330 335
Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly
340 345 350
Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
355 360 365
His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser
370 375 380
Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys
385 390 395 400
Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Gly
405 410 415
Lys Leu Thr Arg Ala Glu Thr Gly Gly Thr Ser Glu Ser Ala Thr Pro
420 425 430
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
435 440 445
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
450 455 460
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
465 470 475 480
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
485 490 495
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
500 505 510
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
515 520 525
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
530 535 540
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala
545 550 555 560
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu
565 570 575
Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
580 585 590
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu
595 600 605
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
610 615 620
Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
625 630 635 640
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr
645 650 655
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
660 665 670
Gly Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
675 680 685
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
690 695 700
Glu Pro Ser Glu Gly Ser Ala Pro
705 710
<210> 166
<211> 944
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> FIX-Fc-Fc
<400> 166
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1. 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Asp Lys Thr
450 455 460
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
465 470 475 480
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
485 490 495
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
500 505 510
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
515 520 525
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
530 535 540
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
545 550 555 560
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
565 570 575
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
580 585 590
Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
595 600 605
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
610 615 620
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
625 630 635 640
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
645 650 655
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
660 665 670
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
675 680 685
Arg Arg Arg Arg Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
690 695 700
Gly Gly Gly Ser Gly Gly Gly Gly Ser Arg Arg Arg Arg Asp Lys Thr
705 710 715 720
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
725 730 735
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
740 745 750
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
755 760 765
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
770 775 780
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
785 790 795 800
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
805 810 815
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
820 825 830
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
835 840 845
Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
850 855 860
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
865 870 875 880
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
885 890 895
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
900 905 910
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
915 920 925
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
930 935 940
<210> 167
<211> 383
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус B19 KY940273.1
<400> 167
ccaaatcaga tgccgccggt cgccgccggt aggcgggact tccggtacaa gatggcggac 60
aattacgtca tttcctgtga cgtcatttcc tgtgacgtca cttccggtgg gcgggacttc 120
cggaattagg gttggctctg ggccagcttg cttggggttg ccttgacact aagacaagcg 180
gcgcgccgct tgatcttagt ggcacgtcaa ccccaagcgc tggcccagag ccaaccctaa 240
ttccggaagt cccgcccacc ggaagtgacg tcacaggaaa tgacgtcaca ggaaatgacg 300
taattgtccg ccatcttgta ccggaagtcc cgcctaccgg cggcgaccgg cggcatctga 360
tttggtgtct tcttttaaat ttt 383
<210> 168
<211> 248
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус B19 d135
<400> 168
ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60
ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120
ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180
ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240
taaatttt 248
<210> 169
<211> 129
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус v1 AAV2
<400> 169
cggcgcgccg cttgatctta gtggcacgtc aaccagcgct ggcccagagc caaccctaat 60
tccggaagtc ctcagtccgc catcttgccc gcctaccggc ggcgaccggc ggcatcattt 120
ggtgttctt 129
<210> 170
<211> 113
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус V2
<400> 170
ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60
ttagtggcac gtcaacccca agcgctggcc cagagtgtct tcttttaaat ttt 113
<210> 171
<211> 340
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус V3
<400> 171
caaatcagat gccgccggtc gccgccggta ggcgggactt ccggtacaag atggcggaca 60
attacgtcat ttcctgtgac gtatttcctg tgacgtactt ccggtggcgg gacttccgga 120
attttggctc tgggccagct tgcttggggt tgccttgacc aagcgcgcgc cgcttgatca 180
ccccaagcgc tggcccagag ccacctaacc ggaagtcccc ccaccggaag tgacgtcaca 240
ggaaagacgt cacaggaagt aattgtccgc catcttgtac cggaagtccc gcaccggcgg 300
cgaccggcgg catctgattt ggtgtcttct tttaaatttt 340
<210> 172
<211> 444
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус U25749.1
<400> 172
ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag tgacgcaagt 60
tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca cgtgcttcct 120
gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg tgtttccggc 180
tgttaggttg accacgcgca tgccgcgcgg tcagcccaat agttaagccg gaaacacgtc 240
accggaagtc acatgaccgg aagtcacgtg accggaaaca cgtgacagga agcacgtgac 300
cggaactacg tcaccggatg tgcgtcaccg gaagcatgtg accggaactt gcgtcacttc 360
cccctcccct gattggctgg ttcgaacgaa cgaaccctcc aatgagactc aaggacaaga 420
ggatattttg cgcgccagga agtg 444
<210> 173
<211> 282
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус GPV AAV2 V1
<400> 173
cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60
ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120
tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180
cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240
tgagactcaa ggacaagagg atattttgcg cgccaggaag tg 282
<210> 174
<211> 145
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус GPV AAV2 V1
<400> 174
ttgaccacgc gcatgccgcg cggtcagccc aatagttaag ccgggtgacc acacgtgaca 60
ggaagcacgg gatgtgcgtc accggaagca gtgaccgggc tggttcgaac gaacgaaccc 120
tccaactcaa ggacaagagg atatt 145
<210> 175
<211> 120
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус GPV V2
<400> 175
cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60
ttaagccgga aacacgtcac cgactcaagg acaagaggat attttgcgcg ccaggaagtg 120
<210> 176
<211> 102
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус GPV V3
<400> 176
gggaacaatc aggggaagtg accggtgacg tcatgtaact tgcgtcactt cccgttcgaa 60
cgaacgaacg agactcaagg acaagaggcg cgccaggaag tg 102
<210> 177
<211> 145
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус AAV2 NC_001401.2
<400> 177
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 178
<211> 130
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Парвовирус Gtx
<400> 178
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 179
<211> 6762
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Конструкция B19-FVIII
<400> 179
ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60
ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120
ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180
ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240
taaattttgc ggcaattcag tcgataacta taacggtcct aaggtagcga tttaaatacg 300
cgctctctta aggtagcccc gggacgcgtc aattgagatc tggatccggt accgaattcg 360
cggccgcctc gacgactagc gtttaattaa acgcgtgtct gtctgcacat ttcgtagagc 420
gagtgttccg atactctaat ctccctaggc aaggttcata tttgtgtagg ttacttattc 480
tccttttgtt gactaagtca ataatcagaa tcagcaggtt tggagtcagc ttggcaggga 540
tcagcagcct gggttggaag gagggggtat aaaagcccct tcaccaggag aagccgtcac 600
acagatccac aagctcctga ggtaagtgcc gtgtgtggtt cccgcgggcc tggcctcttt 660
acgggttatg gcccttgcgt gccttgaatt actgacactg acatccactt tttctttttc 720
tccacagcta gcgccaccat gcagattgag ctgtccactt gtttcttcct gtgcctcctg 780
cgcttctgtt tctccgccac tcgccggtac taccttggag ccgtggagct ttcatgggac 840
tacatgcaga gcgacctggg cgaactcccc gtggatgcca gattcccccc ccgcgtgcca 900
aagtccttcc cctttaacac ctccgtggtg tacaagaaaa ccctctttgt cgagttcact 960
gaccacctgt tcaacatcgc caagccgcgc ccaccttgga tgggcctcct gggaccgacc 1020
attcaagctg aagtgtacga caccgtggtg atcaccctga agaacatggc gtcccacccc 1080
gtgtccctgc atgcggtcgg agtgtcctac tggaaggcct ccgaaggagc tgagtacgac 1140
gaccagacta gccagcggga aaaggaggac gataaagtgt tcccgggcgg ctcgcatact 1200
tacgtgtggc aagtcctgaa ggaaaacgga cctatggcat ccgatcctct gtgcctgact 1260
tactcctacc tttcccatgt ggacctcgtg aaggacctga acagcgggct gattggtgca 1320
cttctcgtgt gccgcgaagg ttcgctcgct aaggaaaaga cccagaccct ccataagttc 1380
atccttttgt tcgctgtgtt cgatgaagga aagtcatggc attccgaaac taagaactcg 1440
ctgatgcagg accgggatgc cgcctcagcc cgcgcctggc ctaaaatgca tacagtcaac 1500
ggatacgtga atcggtcact gcccgggctc atcggttgtc acagaaagtc cgtgtactgg 1560
cacgtcatcg gcatgggcac tacgcctgaa gtgcactcca tcttcctgga agggcacacc 1620
ttcctcgtgc gcaaccaccg ccaggcctct ctggaaatct ccccgattac ctttctgacc 1680
gcccagactc tgctcatgga cctggggcag ttccttctct tctgccacat ctccagccat 1740
cagcacgacg gaatggaggc ctacgtgaag gtggactcat gcccggaaga acctcagttg 1800
cggatgaaga acaacgagga ggccgaggac tatgacgacg atttgactga ctccgagatg 1860
gacgtcgtgc ggttcgatga cgacaacagc cccagcttca tccagattcg cagcgtggcc 1920
aagaagcacc ccaaaacctg ggtgcactac atcgcggccg aggaagaaga ttgggactac 1980
gccccgttgg tgctggcacc cgatgaccgg tcgtacaagt cccagtatct gaacaatggt 2040
ccgcagcgga ttggcagaaa gtacaagaaa gtgcggttca tggcgtacac tgacgaaacg 2100
tttaagaccc gggaggccat tcaacatgag agcggcattc tgggaccact gctgtacgga 2160
gaggtcggcg ataccctgct catcatcttc aaaaaccagg cctcccggcc ttacaacatc 2220
taccctcacg gaatcaccga cgtgcggcca ctctactcgc ggcgcctgcc gaagggcgtc 2280
aagcacctga aagacttccc tatcctgccg ggcgaaatct tcaagtataa gtggaccgtc 2340
accgtggagg acgggcccac caagagcgat cctaggtgtc tgactcggta ctactccagc 2400
ttcgtgaaca tggaacggga cctggcatcg ggactcattg gaccgctgct gatctgctac 2460
aaagagtcgg tggatcaacg cggcaaccag atcatgtccg acaagcgcaa cgtgatcctg 2520
ttctccgtgt ttgatgaaaa cagatcctgg tacctcactg aaaacatcca gaggttcctc 2580
ccaaaccccg caggagtgca actggaggac cctgagtttc aggcctcgaa tatcatgcac 2640
tcgattaacg gttacgtgtt cgactcgctg caactgagcg tgtgcctcca tgaagtcgct 2700
tactggtaca ttctgtccat cggcgcccag actgacttcc tgagcgtgtt cttttccggt 2760
tacaccttta agcacaagat ggtgtacgaa gataccctga ccctgttccc tttctccggc 2820
gaaacggtgt tcatgtcgat ggagaacccg ggtctgtgga ttctgggatg ccacaacagc 2880
gactttcgga accgcggaat gactgccctg ctgaaggtgt cctcatgcga caagaacacc 2940
ggagactact acgaggactc ctacgaggat atctcagcct acctcctgtc caagaacaac 3000
gcgatcgagc cgcgcagctt cagccagaac ggcgcgccaa catcagagag cgccacccct 3060
gaaagtggtc ccgggagcga gccagccaca tctgggtcgg aaacgccagg cacaagtgag 3120
tctgcaactc ccgagtccgg acctggctcc gagcctgcca ctagcggctc cgagactccg 3180
ggaacttccg agagcgctac accagaaagc ggacccggaa ccagtaccga acctagcgag 3240
ggctctgctc cgggcagccc agccggctct cctacatcca cggaggaggg cacttccgaa 3300
tccgccaccc cggagtcagg gccaggatct gaacccgcta cctcaggcag tgagacgcca 3360
ggaacgagcg agtccgctac accggagagt gggccaggga gccctgctgg atctcctacg 3420
tccactgagg aagggtcacc agcgggctcg cccaccagca ctgaagaagg tgcctcgagc 3480
ccgcctgtgc tgaagaggca ccagcgagaa attacccgga ccaccctcca atcggatcag 3540
gaggaaatcg actacgacga caccatctcg gtggaaatga agaaggaaga tttcgatatc 3600
tacgacgagg acgaaaatca gtcccctcgc tcattccaaa agaaaactag acactacttt 3660
atcgccgcgg tggaaagact gtgggactat ggaatgtcat ccagccctca cgtccttcgg 3720
aaccgggccc agagcggatc ggtgcctcag ttcaagaaag tggtgttcca ggagttcacc 3780
gacggcagct tcacccagcc gctgtaccgg ggagaactga acgaacacct gggcctgctc 3840
ggtccctaca tccgcgcgga agtggaggat aacatcatgg tgaccttccg taaccaagca 3900
tccagacctt actccttcta ttcctccctg atctcatacg aggaggacca gcgccaaggc 3960
gccgagcccc gcaagaactt cgtcaagccc aacgagacta agacctactt ctggaaggtc 4020
caacaccata tggccccgac caaggatgag tttgactgca aggcctgggc ctacttctcc 4080
gacgtggacc ttgagaagga tgtccattcc ggcctgatcg ggccgctgct cgtgtgtcac 4140
accaacaccc tgaacccagc gcatggacgc caggtcaccg tccaggagtt tgctctgttc 4200
ttcaccattt ttgacgaaac taagtcctgg tacttcaccg agaatatgga gcgaaactgt 4260
agagcgccct gcaatatcca gatggaagat ccgactttca aggagaacta tagattccac 4320
gccatcaacg ggtacatcat ggatactctg ccggggctgg tcatggccca ggatcagagg 4380
attcggtggt acttgctgtc aatgggatcg aacgaaaaca ttcactccat tcacttctcc 4440
ggtcacgtgt tcactgtgcg caagaaggag gagtacaaga tggcgctgta caatctgtac 4500
cccggggtgt tcgaaactgt ggagatgctg ccgtccaagg ccggcatctg gagagtggag 4560
tgcctgatcg gagagcacct ccacgcgggg atgtccaccc tcttcctggt gtactcgaat 4620
aagtgccaga ccccgctggg catggcctcg ggccacatca gagacttcca gatcacagca 4680
agcggacaat acggccaatg ggcgccgaag ctggcccgct tgcactactc cggatcgatc 4740
aacgcatggt ccaccaagga accgttctcg tggattaagg tggacctcct ggcccctatg 4800
attatccacg gaattaagac ccagggcgcc aggcagaagt tctcctccct gtacatctcg 4860
caattcatca tcatgtacag cctggacggg aagaagtggc agacttacag gggaaactcc 4920
accggcaccc tgatggtctt tttcggcaac gtggattcct ccggcattaa gcacaacatc 4980
ttcaacccac cgatcatagc cagatatatt aggctccacc ccactcacta ctcaatccgc 5040
tcaactcttc ggatggaact catggggtgc gacctgaact cctgctccat gccgttgggg 5100
atggaatcaa aggctattag cgacgcccag atcaccgcga gctcctactt cactaacatg 5160
ttcgccacct ggagcccctc caaggccagg ctgcacttgc agggacggtc aaatgcctgg 5220
cggccgcaag tgaacaatcc gaaggaatgg cttcaagtgg atttccaaaa gaccatgaaa 5280
gtgaccggag tcaccaccca gggagtgaag tcccttctga cctcgatgta tgtgaaggag 5340
ttcctgatta gcagcagcca ggacgggcac cagtggaccc tgttcttcca aaacggaaag 5400
gtcaaggtgt tccaggggaa ccaggactcg ttcacacccg tggtgaactc cctggacccc 5460
ccactgctga cgcggtactt gaggattcat cctcagtcct gggtccatca gattgcattg 5520
cgaatggaag tcctgggctg cgaggcccag gacctgtact gaatcagcct gagctcgctg 5580
atcataatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 5640
ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 5700
cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 5760
agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 5820
ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 5880
tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 5940
ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 6000
tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 6060
ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 6120
gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgctgatca 6180
gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 6240
ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 6300
cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 6360
gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag 6420
gcggaaagaa cgggctcgag aagcttctag atatcctctc ttaaggtagc atcgagattt 6480
aaattaggga taacagggta atggcgcggg ccgcaaaatt taaaagaaga caccaaatca 6540
gatgccgccg gtcgccgccg gtaggcggga cttccggtac aagatggcgg acaattacgt 6600
catttcctgt gacgtcattt cctgtgacgt cacttccggt gggcgggact tccggaatta 6660
gggttggctc tgggccagcg cttggggttg acgtgccact aagatcaagc ggcgcgccgc 6720
ttgtcttagt gtcaaggcaa ccccaagcaa gctggcccag ag 6762
<210> 180
<211> 248
<212> ДНК
<213> Искусственная последовательность
<220>
<223> 5'-ITR
<400> 180
ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60
ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120
ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180
ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240
taaatttt 248
<210> 181
<211> 248
<212> ДНК
<213> Искусственная последовательность
<220>
<223> 3'-ITR
<400> 181
aaaatttaaa agaagacacc aaatcagatg ccgccggtcg ccgccggtag gcgggacttc 60
cggtacaaga tggcggacaa ttacgtcatt tcctgtgacg tcatttcctg tgacgtcact 120
tccggtgggc gggacttccg gaattagggt tggctctggg ccagcgcttg gggttgacgt 180
gccactaaga tcaagcggcg cgccgcttgt cttagtgtca aggcaacccc aagcaagctg 240
gcccagag 248
<210> 182
<211> 6830
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая полинуклеотидная последовательность
<400> 182
cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60
ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120
tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180
cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240
tgagactcaa ggacaagagg atattttgcg cgccaggaag tggcggcaat tcagtcgata 300
actataacgg tcctaaggta gcgatttaaa tacgcgctct cttaaggtag ccccgggacg 360
cgtcaattga gatctggatc cggtaccgaa ttcgcggccg cctcgacgac tagcgtttaa 420
ttaaacgcgt gtctgtctgc acatttcgta gagcgagtgt tccgatactc taatctccct 480
aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa gtcaataatc 540
agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg gaaggagggg 600
gtataaaagc cccttcacca ggagaagccg tcacacagat ccacaagctc ctgaggtaag 660
tgccgtgtgt ggttcccgcg ggcctggcct ctttacgggt tatggccctt gcgtgccttg 720
aattactgac actgacatcc actttttctt tttctccaca gctagcgcca ccatgcagat 780
tgagctgtcc acttgtttct tcctgtgcct cctgcgcttc tgtttctccg ccactcgccg 840
gtactacctt ggagccgtgg agctttcatg ggactacatg cagagcgacc tgggcgaact 900
ccccgtggat gccagattcc ccccccgcgt gccaaagtcc ttccccttta acacctccgt 960
ggtgtacaag aaaaccctct ttgtcgagtt cactgaccac ctgttcaaca tcgccaagcc 1020
gcgcccacct tggatgggcc tcctgggacc gaccattcaa gctgaagtgt acgacaccgt 1080
ggtgatcacc ctgaagaaca tggcgtccca ccccgtgtcc ctgcatgcgg tcggagtgtc 1140
ctactggaag gcctccgaag gagctgagta cgacgaccag actagccagc gggaaaagga 1200
ggacgataaa gtgttcccgg gcggctcgca tacttacgtg tggcaagtcc tgaaggaaaa 1260
cggacctatg gcatccgatc ctctgtgcct gacttactcc tacctttccc atgtggacct 1320
cgtgaaggac ctgaacagcg ggctgattgg tgcacttctc gtgtgccgcg aaggttcgct 1380
cgctaaggaa aagacccaga ccctccataa gttcatcctt ttgttcgctg tgttcgatga 1440
aggaaagtca tggcattccg aaactaagaa ctcgctgatg caggaccggg atgccgcctc 1500
agcccgcgcc tggcctaaaa tgcatacagt caacggatac gtgaatcggt cactgcccgg 1560
gctcatcggt tgtcacagaa agtccgtgta ctggcacgtc atcggcatgg gcactacgcc 1620
tgaagtgcac tccatcttcc tggaagggca caccttcctc gtgcgcaacc accgccaggc 1680
ctctctggaa atctccccga ttacctttct gaccgcccag actctgctca tggacctggg 1740
gcagttcctt ctcttctgcc acatctccag ccatcagcac gacggaatgg aggcctacgt 1800
gaaggtggac tcatgcccgg aagaacctca gttgcggatg aagaacaacg aggaggccga 1860
ggactatgac gacgatttga ctgactccga gatggacgtc gtgcggttcg atgacgacaa 1920
cagccccagc ttcatccaga ttcgcagcgt ggccaagaag caccccaaaa cctgggtgca 1980
ctacatcgcg gccgaggaag aagattggga ctacgccccg ttggtgctgg cacccgatga 2040
ccggtcgtac aagtcccagt atctgaacaa tggtccgcag cggattggca gaaagtacaa 2100
gaaagtgcgg ttcatggcgt acactgacga aacgtttaag acccgggagg ccattcaaca 2160
tgagagcggc attctgggac cactgctgta cggagaggtc ggcgataccc tgctcatcat 2220
cttcaaaaac caggcctccc ggccttacaa catctaccct cacggaatca ccgacgtgcg 2280
gccactctac tcgcggcgcc tgccgaaggg cgtcaagcac ctgaaagact tccctatcct 2340
gccgggcgaa atcttcaagt ataagtggac cgtcaccgtg gaggacgggc ccaccaagag 2400
cgatcctagg tgtctgactc ggtactactc cagcttcgtg aacatggaac gggacctggc 2460
atcgggactc attggaccgc tgctgatctg ctacaaagag tcggtggatc aacgcggcaa 2520
ccagatcatg tccgacaagc gcaacgtgat cctgttctcc gtgtttgatg aaaacagatc 2580
ctggtacctc actgaaaaca tccagaggtt cctcccaaac cccgcaggag tgcaactgga 2640
ggaccctgag tttcaggcct cgaatatcat gcactcgatt aacggttacg tgttcgactc 2700
gctgcaactg agcgtgtgcc tccatgaagt cgcttactgg tacattctgt ccatcggcgc 2760
ccagactgac ttcctgagcg tgttcttttc cggttacacc tttaagcaca agatggtgta 2820
cgaagatacc ctgaccctgt tccctttctc cggcgaaacg gtgttcatgt cgatggagaa 2880
cccgggtctg tggattctgg gatgccacaa cagcgacttt cggaaccgcg gaatgactgc 2940
cctgctgaag gtgtcctcat gcgacaagaa caccggagac tactacgagg actcctacga 3000
ggatatctca gcctacctcc tgtccaagaa caacgcgatc gagccgcgca gcttcagcca 3060
gaacggcgcg ccaacatcag agagcgccac ccctgaaagt ggtcccggga gcgagccagc 3120
cacatctggg tcggaaacgc caggcacaag tgagtctgca actcccgagt ccggacctgg 3180
ctccgagcct gccactagcg gctccgagac tccgggaact tccgagagcg ctacaccaga 3240
aagcggaccc ggaaccagta ccgaacctag cgagggctct gctccgggca gcccagccgg 3300
ctctcctaca tccacggagg agggcacttc cgaatccgcc accccggagt cagggccagg 3360
atctgaaccc gctacctcag gcagtgagac gccaggaacg agcgagtccg ctacaccgga 3420
gagtgggcca gggagccctg ctggatctcc tacgtccact gaggaagggt caccagcggg 3480
ctcgcccacc agcactgaag aaggtgcctc gagcccgcct gtgctgaaga ggcaccagcg 3540
agaaattacc cggaccaccc tccaatcgga tcaggaggaa atcgactacg acgacaccat 3600
ctcggtggaa atgaagaagg aagatttcga tatctacgac gaggacgaaa atcagtcccc 3660
tcgctcattc caaaagaaaa ctagacacta ctttatcgcc gcggtggaaa gactgtggga 3720
ctatggaatg tcatccagcc ctcacgtcct tcggaaccgg gcccagagcg gatcggtgcc 3780
tcagttcaag aaagtggtgt tccaggagtt caccgacggc agcttcaccc agccgctgta 3840
ccggggagaa ctgaacgaac acctgggcct gctcggtccc tacatccgcg cggaagtgga 3900
ggataacatc atggtgacct tccgtaacca agcatccaga ccttactcct tctattcctc 3960
cctgatctca tacgaggagg accagcgcca aggcgccgag ccccgcaaga acttcgtcaa 4020
gcccaacgag actaagacct acttctggaa ggtccaacac catatggccc cgaccaagga 4080
tgagtttgac tgcaaggcct gggcctactt ctccgacgtg gaccttgaga aggatgtcca 4140
ttccggcctg atcgggccgc tgctcgtgtg tcacaccaac accctgaacc cagcgcatgg 4200
acgccaggtc accgtccagg agtttgctct gttcttcacc atttttgacg aaactaagtc 4260
ctggtacttc accgagaata tggagcgaaa ctgtagagcg ccctgcaata tccagatgga 4320
agatccgact ttcaaggaga actatagatt ccacgccatc aacgggtaca tcatggatac 4380
tctgccgggg ctggtcatgg cccaggatca gaggattcgg tggtacttgc tgtcaatggg 4440
atcgaacgaa aacattcact ccattcactt ctccggtcac gtgttcactg tgcgcaagaa 4500
ggaggagtac aagatggcgc tgtacaatct gtaccccggg gtgttcgaaa ctgtggagat 4560
gctgccgtcc aaggccggca tctggagagt ggagtgcctg atcggagagc acctccacgc 4620
ggggatgtcc accctcttcc tggtgtactc gaataagtgc cagaccccgc tgggcatggc 4680
ctcgggccac atcagagact tccagatcac agcaagcgga caatacggcc aatgggcgcc 4740
gaagctggcc cgcttgcact actccggatc gatcaacgca tggtccacca aggaaccgtt 4800
ctcgtggatt aaggtggacc tcctggcccc tatgattatc cacggaatta agacccaggg 4860
cgccaggcag aagttctcct ccctgtacat ctcgcaattc atcatcatgt acagcctgga 4920
cgggaagaag tggcagactt acaggggaaa ctccaccggc accctgatgg tctttttcgg 4980
caacgtggat tcctccggca ttaagcacaa catcttcaac ccaccgatca tagccagata 5040
tattaggctc caccccactc actactcaat ccgctcaact cttcggatgg aactcatggg 5100
gtgcgacctg aactcctgct ccatgccgtt ggggatggaa tcaaaggcta ttagcgacgc 5160
ccagatcacc gcgagctcct acttcactaa catgttcgcc acctggagcc cctccaaggc 5220
caggctgcac ttgcagggac ggtcaaatgc ctggcggccg caagtgaaca atccgaagga 5280
atggcttcaa gtggatttcc aaaagaccat gaaagtgacc ggagtcacca cccagggagt 5340
gaagtccctt ctgacctcga tgtatgtgaa ggagttcctg attagcagca gccaggacgg 5400
gcaccagtgg accctgttct tccaaaacgg aaaggtcaag gtgttccagg ggaaccagga 5460
ctcgttcaca cccgtggtga actccctgga ccccccactg ctgacgcggt acttgaggat 5520
tcatcctcag tcctgggtcc atcagattgc attgcgaatg gaagtcctgg gctgcgaggc 5580
ccaggacctg tactgaatca gcctgagctc gctgatcata atcaacctct ggattacaaa 5640
atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac 5700
gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc 5760
ttgtataaat cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt 5820
ggcgtggtgt gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc 5880
tgtcagctcc tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc 5940
gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg 6000
gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc cacctggatt 6060
ctgcgcggga cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc 6120
cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt 6180
cggatctccc tttgggccgc ctccccgctg atcagcctcg actgtgcctt ctagttgcca 6240
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 6300
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 6360
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 6420
tgctggggat gcggtgggct ctatggcttc tgaggcggaa agaacgggct cgagaagctt 6480
ctagatatcc tctcttaagg tagcatcgag atttaaatta gggataacag ggtaatggcg 6540
cgggccgcca cttcctggcg cgcaaaatat cctcttgtcc ttgagtctca ttggagggtt 6600
cgttcgttcg aaccagccaa tcaggggagg gggaagtgac gcaagttccg gtcacatgct 6660
tccggtgacg cacatccggt gacgtagttc cggtcacgtg cttcctgtca cgtgtttccg 6720
gtcacgtgac ttccggtcat gtgacttccg gtgacgtgtt tccggcttaa ctattgggct 6780
gaccgcgcgg catgcgcgtg gtcaacctaa cagccggaaa cacgtcaccg 6830
<210> 183
<211> 282
<212> ДНК
<213> Искусственная последовательность
<220>
<223> 5'-ITR
<400> 183
cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60
ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120
tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180
cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240
tgagactcaa ggacaagagg atattttgcg cgccaggaag tg 282
<210> 184
<211> 282
<212> ДНК
<213> Искусственная последовательность
<220>
<223> 3'-ITR
<400> 184
cacttcctgg cgcgcaaaat atcctcttgt ccttgagtct cattggaggg ttcgttcgtt 60
cgaaccagcc aatcagggga gggggaagtg acgcaagttc cggtcacatg cttccggtga 120
cgcacatccg gtgacgtagt tccggtcacg tgcttcctgt cacgtgtttc cggtcacgtg 180
acttccggtc atgtgacttc cggtgacgtg tttccggctt aactattggg ctgaccgcgc 240
ggcatgcgcg tggtcaacct aacagccgga aacacgtcac cg 282
<210> 185
<211> 383
<212> ДНК
<213> Искусственная последовательность
<220>
<223> 5'-ITR
<400> 185
ccaaatcaga tgccgccggt cgccgccggt aggcgggact tccggtacaa gatggcggac 60
aattacgtca tttcctgtga cgtcatttcc tgtgacgtca cttccggtgg gcgggacttc 120
cggaattagg gttggctctg ggccagcttg cttggggttg ccttgacact aagacaagcg 180
gcgcgccgct tgatcttagt ggcacgtcaa ccccaagcgc tggcccagag ccaaccctaa 240
ttccggaagt cccgcccacc ggaagtgacg tcacaggaaa tgacgtcaca ggaaatgacg 300
taattgtccg ccatcttgta ccggaagtcc cgcctaccgg cggcgaccgg cggcatctga 360
tttggtgtct tcttttaaat ttt 383
<210> 186
<211> 383
<212> ДНК
<213> Искусственная последовательность
<220>
<223> 3'-ITR
<400> 186
aaaatttaaa agaagacacc aaatcagatg ccgccggtcg ccgccggtag gcgggacttc 60
cggtacaaga tggcggacaa ttacgtcatt tcctgtgacg tcatttcctg tgacgtcact 120
tccggtgggc gggacttccg gaattagggt tggctctggg ccagcgcttg gggttgacgt 180
gccactaaga tcaagcggcg cgccgcttgt cttagtgtca aggcaacccc aagcaagctg 240
gcccagagcc aaccctaatt ccggaagtcc cgcccaccgg aagtgacgtc acaggaaatg 300
acgtcacagg aaatgacgta attgtccgcc atcttgtacc ggaagtcccg cctaccggcg 360
gcgaccggcg gcatctgatt tgg 383
<210> 187
<211> 444
<212> ДНК
<213> Искусственная последовательность
<220>
<223> 5'-ITR
<400> 187
ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag tgacgcaagt 60
tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca cgtgcttcct 120
gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg tgtttccggc 180
tgttaggttg accacgcgca tgccgcgcgg tcagcccaat agttaagccg gaaacacgtc 240
accggaagtc acatgaccgg aagtcacgtg accggaaaca cgtgacagga agcacgtgac 300
cggaactacg tcaccggatg tgcgtcaccg gaagcatgtg accggaactt gcgtcacttc 360
cccctcccct gattggctgg ttcgaacgaa cgaaccctcc aatgagactc aaggacaaga 420
ggatattttg cgcgccagga agtg 444
<210> 188
<211> 444
<212> ДНК
<213> Искусственная последовательность
<220>
<223> 3'-ITR
<400> 188
cacttcctgg cgcgcaaaat atcctcttgt ccttgagtct cattggaggg ttcgttcgtt 60
cgaaccagcc aatcagggga gggggaagtg acgcaagttc cggtcacatg cttccggtga 120
cgcacatccg gtgacgtagt tccggtcacg tgcttcctgt cacgtgtttc cggtcacgtg 180
acttccggtc atgtgacttc cggtgacgtg tttccggctt aactattggg ctgaccgcgc 240
ggcatgcgcg tggtcaacct aacagccgga aacacgtcac cggaagtcac atgaccggaa 300
gtcacgtgac cggaaacacg tgacaggaag cacgtgaccg gaactacgtc accggatgtg 360
cgtcaccgga agcatgtgac cggaacttgc gtcacttccc cctcccctga ttggctggtt 420
cgaacgaacg aaccctccaa tgag 444
<210> 189
<211> 7032
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая полинуклеотидная последовательность
<400> 189
ccaaatcaga tgccgccggt cgccgccggt aggcgggact tccggtacaa gatggcggac 60
aattacgtca tttcctgtga cgtcatttcc tgtgacgtca cttccggtgg gcgggacttc 120
cggaattagg gttggctctg ggccagcttg cttggggttg ccttgacact aagacaagcg 180
gcgcgccgct tgatcttagt ggcacgtcaa ccccaagcgc tggcccagag ccaaccctaa 240
ttccggaagt cccgcccacc ggaagtgacg tcacaggaaa tgacgtcaca ggaaatgacg 300
taattgtccg ccatcttgta ccggaagtcc cgcctaccgg cggcgaccgg cggcatctga 360
tttggtgtct tcttttaaat tttgcggcaa ttcagtcgat aactataacg gtcctaaggt 420
agcgatttaa atacgcgctc tcttaaggta gccccgggac gcgtcaattg agatctggat 480
ccggtaccga attcgcggcc gcctcgacga ctagcgttta attaaacgcg tgtctgtctg 540
cacatttcgt agagcgagtg ttccgatact ctaatctccc taggcaaggt tcatatttgt 600
gtaggttact tattctcctt ttgttgacta agtcaataat cagaatcagc aggtttggag 660
tcagcttggc agggatcagc agcctgggtt ggaaggaggg ggtataaaag ccccttcacc 720
aggagaagcc gtcacacaga tccacaagct cctgaggtaa gtgccgtgtg tggttcccgc 780
gggcctggcc tctttacggg ttatggccct tgcgtgcctt gaattactga cactgacatc 840
cactttttct ttttctccac agctagcgcc accatgcaga ttgagctgtc cacttgtttc 900
ttcctgtgcc tcctgcgctt ctgtttctcc gccactcgcc ggtactacct tggagccgtg 960
gagctttcat gggactacat gcagagcgac ctgggcgaac tccccgtgga tgccagattc 1020
cccccccgcg tgccaaagtc cttccccttt aacacctccg tggtgtacaa gaaaaccctc 1080
tttgtcgagt tcactgacca cctgttcaac atcgccaagc cgcgcccacc ttggatgggc 1140
ctcctgggac cgaccattca agctgaagtg tacgacaccg tggtgatcac cctgaagaac 1200
atggcgtccc accccgtgtc cctgcatgcg gtcggagtgt cctactggaa ggcctccgaa 1260
ggagctgagt acgacgacca gactagccag cgggaaaagg aggacgataa agtgttcccg 1320
ggcggctcgc atacttacgt gtggcaagtc ctgaaggaaa acggacctat ggcatccgat 1380
cctctgtgcc tgacttactc ctacctttcc catgtggacc tcgtgaagga cctgaacagc 1440
gggctgattg gtgcacttct cgtgtgccgc gaaggttcgc tcgctaagga aaagacccag 1500
accctccata agttcatcct tttgttcgct gtgttcgatg aaggaaagtc atggcattcc 1560
gaaactaaga actcgctgat gcaggaccgg gatgccgcct cagcccgcgc ctggcctaaa 1620
atgcatacag tcaacggata cgtgaatcgg tcactgcccg ggctcatcgg ttgtcacaga 1680
aagtccgtgt actggcacgt catcggcatg ggcactacgc ctgaagtgca ctccatcttc 1740
ctggaagggc acaccttcct cgtgcgcaac caccgccagg cctctctgga aatctccccg 1800
attacctttc tgaccgccca gactctgctc atggacctgg ggcagttcct tctcttctgc 1860
cacatctcca gccatcagca cgacggaatg gaggcctacg tgaaggtgga ctcatgcccg 1920
gaagaacctc agttgcggat gaagaacaac gaggaggccg aggactatga cgacgatttg 1980
actgactccg agatggacgt cgtgcggttc gatgacgaca acagccccag cttcatccag 2040
attcgcagcg tggccaagaa gcaccccaaa acctgggtgc actacatcgc ggccgaggaa 2100
gaagattggg actacgcccc gttggtgctg gcacccgatg accggtcgta caagtcccag 2160
tatctgaaca atggtccgca gcggattggc agaaagtaca agaaagtgcg gttcatggcg 2220
tacactgacg aaacgtttaa gacccgggag gccattcaac atgagagcgg cattctggga 2280
ccactgctgt acggagaggt cggcgatacc ctgctcatca tcttcaaaaa ccaggcctcc 2340
cggccttaca acatctaccc tcacggaatc accgacgtgc ggccactcta ctcgcggcgc 2400
ctgccgaagg gcgtcaagca cctgaaagac ttccctatcc tgccgggcga aatcttcaag 2460
tataagtgga ccgtcaccgt ggaggacggg cccaccaaga gcgatcctag gtgtctgact 2520
cggtactact ccagcttcgt gaacatggaa cgggacctgg catcgggact cattggaccg 2580
ctgctgatct gctacaaaga gtcggtggat caacgcggca accagatcat gtccgacaag 2640
cgcaacgtga tcctgttctc cgtgtttgat gaaaacagat cctggtacct cactgaaaac 2700
atccagaggt tcctcccaaa ccccgcagga gtgcaactgg aggaccctga gtttcaggcc 2760
tcgaatatca tgcactcgat taacggttac gtgttcgact cgctgcaact gagcgtgtgc 2820
ctccatgaag tcgcttactg gtacattctg tccatcggcg cccagactga cttcctgagc 2880
gtgttctttt ccggttacac ctttaagcac aagatggtgt acgaagatac cctgaccctg 2940
ttccctttct ccggcgaaac ggtgttcatg tcgatggaga acccgggtct gtggattctg 3000
ggatgccaca acagcgactt tcggaaccgc ggaatgactg ccctgctgaa ggtgtcctca 3060
tgcgacaaga acaccggaga ctactacgag gactcctacg aggatatctc agcctacctc 3120
ctgtccaaga acaacgcgat cgagccgcgc agcttcagcc agaacggcgc gccaacatca 3180
gagagcgcca cccctgaaag tggtcccggg agcgagccag ccacatctgg gtcggaaacg 3240
ccaggcacaa gtgagtctgc aactcccgag tccggacctg gctccgagcc tgccactagc 3300
ggctccgaga ctccgggaac ttccgagagc gctacaccag aaagcggacc cggaaccagt 3360
accgaaccta gcgagggctc tgctccgggc agcccagccg gctctcctac atccacggag 3420
gagggcactt ccgaatccgc caccccggag tcagggccag gatctgaacc cgctacctca 3480
ggcagtgaga cgccaggaac gagcgagtcc gctacaccgg agagtgggcc agggagccct 3540
gctggatctc ctacgtccac tgaggaaggg tcaccagcgg gctcgcccac cagcactgaa 3600
gaaggtgcct cgagcccgcc tgtgctgaag aggcaccagc gagaaattac ccggaccacc 3660
ctccaatcgg atcaggagga aatcgactac gacgacacca tctcggtgga aatgaagaag 3720
gaagatttcg atatctacga cgaggacgaa aatcagtccc ctcgctcatt ccaaaagaaa 3780
actagacact actttatcgc cgcggtggaa agactgtggg actatggaat gtcatccagc 3840
cctcacgtcc ttcggaaccg ggcccagagc ggatcggtgc ctcagttcaa gaaagtggtg 3900
ttccaggagt tcaccgacgg cagcttcacc cagccgctgt accggggaga actgaacgaa 3960
cacctgggcc tgctcggtcc ctacatccgc gcggaagtgg aggataacat catggtgacc 4020
ttccgtaacc aagcatccag accttactcc ttctattcct ccctgatctc atacgaggag 4080
gaccagcgcc aaggcgccga gccccgcaag aacttcgtca agcccaacga gactaagacc 4140
tacttctgga aggtccaaca ccatatggcc ccgaccaagg atgagtttga ctgcaaggcc 4200
tgggcctact tctccgacgt ggaccttgag aaggatgtcc attccggcct gatcgggccg 4260
ctgctcgtgt gtcacaccaa caccctgaac ccagcgcatg gacgccaggt caccgtccag 4320
gagtttgctc tgttcttcac catttttgac gaaactaagt cctggtactt caccgagaat 4380
atggagcgaa actgtagagc gccctgcaat atccagatgg aagatccgac tttcaaggag 4440
aactatagat tccacgccat caacgggtac atcatggata ctctgccggg gctggtcatg 4500
gcccaggatc agaggattcg gtggtacttg ctgtcaatgg gatcgaacga aaacattcac 4560
tccattcact tctccggtca cgtgttcact gtgcgcaaga aggaggagta caagatggcg 4620
ctgtacaatc tgtaccccgg ggtgttcgaa actgtggaga tgctgccgtc caaggccggc 4680
atctggagag tggagtgcct gatcggagag cacctccacg cggggatgtc caccctcttc 4740
ctggtgtact cgaataagtg ccagaccccg ctgggcatgg cctcgggcca catcagagac 4800
ttccagatca cagcaagcgg acaatacggc caatgggcgc cgaagctggc ccgcttgcac 4860
tactccggat cgatcaacgc atggtccacc aaggaaccgt tctcgtggat taaggtggac 4920
ctcctggccc ctatgattat ccacggaatt aagacccagg gcgccaggca gaagttctcc 4980
tccctgtaca tctcgcaatt catcatcatg tacagcctgg acgggaagaa gtggcagact 5040
tacaggggaa actccaccgg caccctgatg gtctttttcg gcaacgtgga ttcctccggc 5100
attaagcaca acatcttcaa cccaccgatc atagccagat atattaggct ccaccccact 5160
cactactcaa tccgctcaac tcttcggatg gaactcatgg ggtgcgacct gaactcctgc 5220
tccatgccgt tggggatgga atcaaaggct attagcgacg cccagatcac cgcgagctcc 5280
tacttcacta acatgttcgc cacctggagc ccctccaagg ccaggctgca cttgcaggga 5340
cggtcaaatg cctggcggcc gcaagtgaac aatccgaagg aatggcttca agtggatttc 5400
caaaagacca tgaaagtgac cggagtcacc acccagggag tgaagtccct tctgacctcg 5460
atgtatgtga aggagttcct gattagcagc agccaggacg ggcaccagtg gaccctgttc 5520
ttccaaaacg gaaaggtcaa ggtgttccag gggaaccagg actcgttcac acccgtggtg 5580
aactccctgg accccccact gctgacgcgg tacttgagga ttcatcctca gtcctgggtc 5640
catcagattg cattgcgaat ggaagtcctg ggctgcgagg cccaggacct gtactgaatc 5700
agcctgagct cgctgatcat aatcaacctc tggattacaa aatttgtgaa agattgactg 5760
gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt 5820
atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc 5880
tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt 5940
ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga 6000
ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct 6060
gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat 6120
cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct 6180
gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc 6240
tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg 6300
cctccccgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 6360
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 6420
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 6480
caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc 6540
tctatggctt ctgaggcgga aagaacgggc tcgagaagct tctagatatc ctctcttaag 6600
gtagcatcga gatttaaatt agggataaca gggtaatggc gcgggccgca aaatttaaaa 6660
gaagacacca aatcagatgc cgccggtcgc cgccggtagg cgggacttcc ggtacaagat 6720
ggcggacaat tacgtcattt cctgtgacgt catttcctgt gacgtcactt ccggtgggcg 6780
ggacttccgg aattagggtt ggctctgggc cagcgcttgg ggttgacgtg ccactaagat 6840
caagcggcgc gccgcttgtc ttagtgtcaa ggcaacccca agcaagctgg cccagagcca 6900
accctaattc cggaagtccc gcccaccgga agtgacgtca caggaaatga cgtcacagga 6960
aatgacgtaa ttgtccgcca tcttgtaccg gaagtcccgc ctaccggcgg cgaccggcgg 7020
catctgattt gg 7032
<210> 190
<211> 6824
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая полинуклеотидная последовательность
<400> 190
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata 180
cgcgctctct taaggtagcc ccgggacgcg tcaattgaga tctggatccg gtaccgaatt 240
cgcggccgcc tcgacgacta gcgtttaatt aaatcgaggt gagccccacg ttctgcttca 300
ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt ttttaattat 360
tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg gcggggcggg 420
gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc 480
tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg 540
cgcggcgggc gggagtcgct gcgcgctgcc ttcgccccgt gccccgctcc gccgccgcct 600
cgcgccgccc gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg 660
gcccttctcc ttcgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt 720
ggctgcgtga aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg 780
ggctgtccgc ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc 840
tggcgtgtga ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc 900
ctacaggcta gcgccaccat gcagattgag ctgtccactt gtttcttcct gtgcctcctg 960
cgcttctgtt tctccgccac tcgccggtac taccttggag ccgtggagct ttcatgggac 1020
tacatgcaga gcgacctggg cgaactcccc gtggatgcca gattcccccc ccgcgtgcca 1080
aagtccttcc cctttaacac ctccgtggtg tacaagaaaa ccctctttgt cgagttcact 1140
gaccacctgt tcaacatcgc caagccgcgc ccaccttgga tgggcctcct gggaccgacc 1200
attcaagctg aagtgtacga caccgtggtg atcaccctga agaacatggc gtcccacccc 1260
gtgtccctgc atgcggtcgg agtgtcctac tggaaggcct ccgaaggagc tgagtacgac 1320
gaccagacta gccagcggga aaaggaggac gataaagtgt tcccgggcgg ctcgcatact 1380
tacgtgtggc aagtcctgaa ggaaaacgga cctatggcat ccgatcctct gtgcctgact 1440
tactcctacc tttcccatgt ggacctcgtg aaggacctga acagcgggct gattggtgca 1500
cttctcgtgt gccgcgaagg ttcgctcgct aaggaaaaga cccagaccct ccataagttc 1560
atccttttgt tcgctgtgtt cgatgaagga aagtcatggc attccgaaac taagaactcg 1620
ctgatgcagg accgggatgc cgcctcagcc cgcgcctggc ctaaaatgca tacagtcaac 1680
ggatacgtga atcggtcact gcccgggctc atcggttgtc acagaaagtc cgtgtactgg 1740
cacgtcatcg gcatgggcac tacgcctgaa gtgcactcca tcttcctgga agggcacacc 1800
ttcctcgtgc gcaaccaccg ccaggcctct ctggaaatct ccccgattac ctttctgacc 1860
gcccagactc tgctcatgga cctggggcag ttccttctct tctgccacat ctccagccat 1920
cagcacgacg gaatggaggc ctacgtgaag gtggactcat gcccggaaga acctcagttg 1980
cggatgaaga acaacgagga ggccgaggac tatgacgacg atttgactga ctccgagatg 2040
gacgtcgtgc ggttcgatga cgacaacagc cccagcttca tccagattcg cagcgtggcc 2100
aagaagcacc ccaaaacctg ggtgcactac atcgcggccg aggaagaaga ttgggactac 2160
gccccgttgg tgctggcacc cgatgaccgg tcgtacaagt cccagtatct gaacaatggt 2220
ccgcagcgga ttggcagaaa gtacaagaaa gtgcggttca tggcgtacac tgacgaaacg 2280
tttaagaccc gggaggccat tcaacatgag agcggcattc tgggaccact gctgtacgga 2340
gaggtcggcg ataccctgct catcatcttc aaaaaccagg cctcccggcc ttacaacatc 2400
taccctcacg gaatcaccga cgtgcggcca ctctactcgc ggcgcctgcc gaagggcgtc 2460
aagcacctga aagacttccc tatcctgccg ggcgaaatct tcaagtataa gtggaccgtc 2520
accgtggagg acgggcccac caagagcgat cctaggtgtc tgactcggta ctactccagc 2580
ttcgtgaaca tggaacggga cctggcatcg ggactcattg gaccgctgct gatctgctac 2640
aaagagtcgg tggatcaacg cggcaaccag atcatgtccg acaagcgcaa cgtgatcctg 2700
ttctccgtgt ttgatgaaaa cagatcctgg tacctcactg aaaacatcca gaggttcctc 2760
ccaaaccccg caggagtgca actggaggac cctgagtttc aggcctcgaa tatcatgcac 2820
tcgattaacg gttacgtgtt cgactcgctg caactgagcg tgtgcctcca tgaagtcgct 2880
tactggtaca ttctgtccat cggcgcccag actgacttcc tgagcgtgtt cttttccggt 2940
tacaccttta agcacaagat ggtgtacgaa gataccctga ccctgttccc tttctccggc 3000
gaaacggtgt tcatgtcgat ggagaacccg ggtctgtgga ttctgggatg ccacaacagc 3060
gactttcgga accgcggaat gactgccctg ctgaaggtgt cctcatgcga caagaacacc 3120
ggagactact acgaggactc ctacgaggat atctcagcct acctcctgtc caagaacaac 3180
gcgatcgagc cgcgcagctt cagccagaac ggcgcgccaa catcagagag cgccacccct 3240
gaaagtggtc ccgggagcga gccagccaca tctgggtcgg aaacgccagg cacaagtgag 3300
tctgcaactc ccgagtccgg acctggctcc gagcctgcca ctagcggctc cgagactccg 3360
ggaacttccg agagcgctac accagaaagc ggacccggaa ccagtaccga acctagcgag 3420
ggctctgctc cgggcagccc agccggctct cctacatcca cggaggaggg cacttccgaa 3480
tccgccaccc cggagtcagg gccaggatct gaacccgcta cctcaggcag tgagacgcca 3540
ggaacgagcg agtccgctac accggagagt gggccaggga gccctgctgg atctcctacg 3600
tccactgagg aagggtcacc agcgggctcg cccaccagca ctgaagaagg tgcctcgagc 3660
ccgcctgtgc tgaagaggca ccagcgagaa attacccgga ccaccctcca atcggatcag 3720
gaggaaatcg actacgacga caccatctcg gtggaaatga agaaggaaga tttcgatatc 3780
tacgacgagg acgaaaatca gtcccctcgc tcattccaaa agaaaactag acactacttt 3840
atcgccgcgg tggaaagact gtgggactat ggaatgtcat ccagccctca cgtccttcgg 3900
aaccgggccc agagcggatc ggtgcctcag ttcaagaaag tggtgttcca ggagttcacc 3960
gacggcagct tcacccagcc gctgtaccgg ggagaactga acgaacacct gggcctgctc 4020
ggtccctaca tccgcgcgga agtggaggat aacatcatgg tgaccttccg taaccaagca 4080
tccagacctt actccttcta ttcctccctg atctcatacg aggaggacca gcgccaaggc 4140
gccgagcccc gcaagaactt cgtcaagccc aacgagacta agacctactt ctggaaggtc 4200
caacaccata tggccccgac caaggatgag tttgactgca aggcctgggc ctacttctcc 4260
gacgtggacc ttgagaagga tgtccattcc ggcctgatcg ggccgctgct cgtgtgtcac 4320
accaacaccc tgaacccagc gcatggacgc caggtcaccg tccaggagtt tgctctgttc 4380
ttcaccattt ttgacgaaac taagtcctgg tacttcaccg agaatatgga gcgaaactgt 4440
agagcgccct gcaatatcca gatggaagat ccgactttca aggagaacta tagattccac 4500
gccatcaacg ggtacatcat ggatactctg ccggggctgg tcatggccca ggatcagagg 4560
attcggtggt acttgctgtc aatgggatcg aacgaaaaca ttcactccat tcacttctcc 4620
ggtcacgtgt tcactgtgcg caagaaggag gagtacaaga tggcgctgta caatctgtac 4680
cccggggtgt tcgaaactgt ggagatgctg ccgtccaagg ccggcatctg gagagtggag 4740
tgcctgatcg gagagcacct ccacgcgggg atgtccaccc tcttcctggt gtactcgaat 4800
aagtgccaga ccccgctggg catggcctcg ggccacatca gagacttcca gatcacagca 4860
agcggacaat acggccaatg ggcgccgaag ctggcccgct tgcactactc cggatcgatc 4920
aacgcatggt ccaccaagga accgttctcg tggattaagg tggacctcct ggcccctatg 4980
attatccacg gaattaagac ccagggcgcc aggcagaagt tctcctccct gtacatctcg 5040
caattcatca tcatgtacag cctggacggg aagaagtggc agacttacag gggaaactcc 5100
accggcaccc tgatggtctt tttcggcaac gtggattcct ccggcattaa gcacaacatc 5160
ttcaacccac cgatcatagc cagatatatt aggctccacc ccactcacta ctcaatccgc 5220
tcaactcttc ggatggaact catggggtgc gacctgaact cctgctccat gccgttgggg 5280
atggaatcaa aggctattag cgacgcccag atcaccgcga gctcctactt cactaacatg 5340
ttcgccacct ggagcccctc caaggccagg ctgcacttgc agggacggtc aaatgcctgg 5400
cggccgcaag tgaacaatcc gaaggaatgg cttcaagtgg atttccaaaa gaccatgaaa 5460
gtgaccggag tcaccaccca gggagtgaag tcccttctga cctcgatgta tgtgaaggag 5520
ttcctgatta gcagcagcca ggacgggcac cagtggaccc tgttcttcca aaacggaaag 5580
gtcaaggtgt tccaggggaa ccaggactcg ttcacacccg tggtgaactc cctggacccc 5640
ccactgctga cgcggtactt gaggattcat cctcagtcct gggtccatca gattgcattg 5700
cgaatggaag tcctgggctg cgaggcccag gacctgtact gaatcagcct gagctcgctg 5760
atcataatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 5820
ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 5880
cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 5940
agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 6000
ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 6060
tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 6120
ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 6180
tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 6240
ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 6300
gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgctgatca 6360
gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 6420
ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 6480
cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 6540
gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag 6600
gcggaaagaa cgggctcgag aagcttctag atatcctctc ttaaggtagc atcgagattt 6660
aaattaggga taacagggta atggcgcggg ccgcaggaac ccctagtgat ggagttggcc 6720
actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 6780
ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcag 6824
<210> 191
<211> 278
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая полинуклеотидная последовательность
<400> 191
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcg 278
<210> 192
<211> 262
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая полинуклеотидная последовательность
<400> 192
gtgagcgggc gggacggccc ttctccttcg ggctgtaatt agcgcttggt ttaatgacgg 60
cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc 120
ggggggagcg gctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag 180
ggcggggttc ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgttca 240
tgccttcttc tttttcctac ag 262
<210> 193
<211> 130
<212> ДНК
<213> Искусственная последовательность
<220>
<223> 3'-ITR
<400> 193
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag 130
<210> 194
<211> 7154
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая полинуклеотидная последовательность
<400> 194
ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag tgacgcaagt 60
tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca cgtgcttcct 120
gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg tgtttccggc 180
tgttaggttg accacgcgca tgccgcgcgg tcagcccaat agttaagccg gaaacacgtc 240
accggaagtc acatgaccgg aagtcacgtg accggaaaca cgtgacagga agcacgtgac 300
cggaactacg tcaccggatg tgcgtcaccg gaagcatgtg accggaactt gcgtcacttc 360
cccctcccct gattggctgg ttcgaacgaa cgaaccctcc aatgagactc aaggacaaga 420
ggatattttg cgcgccagga agtggcggca attcagtcga taactataac ggtcctaagg 480
tagcgattta aatacgcgct ctcttaaggt agccccggga cgcgtcaatt gagatctgga 540
tccggtaccg aattcgcggc cgcctcgacg actagcgttt aattaaacgc gtgtctgtct 600
gcacatttcg tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg 660
tgtaggttac ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga 720
gtcagcttgg cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac 780
caggagaagc cgtcacacag atccacaagc tcctgaggta agtgccgtgt gtggttcccg 840
cgggcctggc ctctttacgg gttatggccc ttgcgtgcct tgaattactg acactgacat 900
ccactttttc tttttctcca cagctagcgc caccatgcag attgagctgt ccacttgttt 960
cttcctgtgc ctcctgcgct tctgtttctc cgccactcgc cggtactacc ttggagccgt 1020
ggagctttca tgggactaca tgcagagcga cctgggcgaa ctccccgtgg atgccagatt 1080
ccccccccgc gtgccaaagt ccttcccctt taacacctcc gtggtgtaca agaaaaccct 1140
ctttgtcgag ttcactgacc acctgttcaa catcgccaag ccgcgcccac cttggatggg 1200
cctcctggga ccgaccattc aagctgaagt gtacgacacc gtggtgatca ccctgaagaa 1260
catggcgtcc caccccgtgt ccctgcatgc ggtcggagtg tcctactgga aggcctccga 1320
aggagctgag tacgacgacc agactagcca gcgggaaaag gaggacgata aagtgttccc 1380
gggcggctcg catacttacg tgtggcaagt cctgaaggaa aacggaccta tggcatccga 1440
tcctctgtgc ctgacttact cctacctttc ccatgtggac ctcgtgaagg acctgaacag 1500
cgggctgatt ggtgcacttc tcgtgtgccg cgaaggttcg ctcgctaagg aaaagaccca 1560
gaccctccat aagttcatcc ttttgttcgc tgtgttcgat gaaggaaagt catggcattc 1620
cgaaactaag aactcgctga tgcaggaccg ggatgccgcc tcagcccgcg cctggcctaa 1680
aatgcataca gtcaacggat acgtgaatcg gtcactgccc gggctcatcg gttgtcacag 1740
aaagtccgtg tactggcacg tcatcggcat gggcactacg cctgaagtgc actccatctt 1800
cctggaaggg cacaccttcc tcgtgcgcaa ccaccgccag gcctctctgg aaatctcccc 1860
gattaccttt ctgaccgccc agactctgct catggacctg gggcagttcc ttctcttctg 1920
ccacatctcc agccatcagc acgacggaat ggaggcctac gtgaaggtgg actcatgccc 1980
ggaagaacct cagttgcgga tgaagaacaa cgaggaggcc gaggactatg acgacgattt 2040
gactgactcc gagatggacg tcgtgcggtt cgatgacgac aacagcccca gcttcatcca 2100
gattcgcagc gtggccaaga agcaccccaa aacctgggtg cactacatcg cggccgagga 2160
agaagattgg gactacgccc cgttggtgct ggcacccgat gaccggtcgt acaagtccca 2220
gtatctgaac aatggtccgc agcggattgg cagaaagtac aagaaagtgc ggttcatggc 2280
gtacactgac gaaacgttta agacccggga ggccattcaa catgagagcg gcattctggg 2340
accactgctg tacggagagg tcggcgatac cctgctcatc atcttcaaaa accaggcctc 2400
ccggccttac aacatctacc ctcacggaat caccgacgtg cggccactct actcgcggcg 2460
cctgccgaag ggcgtcaagc acctgaaaga cttccctatc ctgccgggcg aaatcttcaa 2520
gtataagtgg accgtcaccg tggaggacgg gcccaccaag agcgatccta ggtgtctgac 2580
tcggtactac tccagcttcg tgaacatgga acgggacctg gcatcgggac tcattggacc 2640
gctgctgatc tgctacaaag agtcggtgga tcaacgcggc aaccagatca tgtccgacaa 2700
gcgcaacgtg atcctgttct ccgtgtttga tgaaaacaga tcctggtacc tcactgaaaa 2760
catccagagg ttcctcccaa accccgcagg agtgcaactg gaggaccctg agtttcaggc 2820
ctcgaatatc atgcactcga ttaacggtta cgtgttcgac tcgctgcaac tgagcgtgtg 2880
cctccatgaa gtcgcttact ggtacattct gtccatcggc gcccagactg acttcctgag 2940
cgtgttcttt tccggttaca cctttaagca caagatggtg tacgaagata ccctgaccct 3000
gttccctttc tccggcgaaa cggtgttcat gtcgatggag aacccgggtc tgtggattct 3060
gggatgccac aacagcgact ttcggaaccg cggaatgact gccctgctga aggtgtcctc 3120
atgcgacaag aacaccggag actactacga ggactcctac gaggatatct cagcctacct 3180
cctgtccaag aacaacgcga tcgagccgcg cagcttcagc cagaacggcg cgccaacatc 3240
agagagcgcc acccctgaaa gtggtcccgg gagcgagcca gccacatctg ggtcggaaac 3300
gccaggcaca agtgagtctg caactcccga gtccggacct ggctccgagc ctgccactag 3360
cggctccgag actccgggaa cttccgagag cgctacacca gaaagcggac ccggaaccag 3420
taccgaacct agcgagggct ctgctccggg cagcccagcc ggctctccta catccacgga 3480
ggagggcact tccgaatccg ccaccccgga gtcagggcca ggatctgaac ccgctacctc 3540
aggcagtgag acgccaggaa cgagcgagtc cgctacaccg gagagtgggc cagggagccc 3600
tgctggatct cctacgtcca ctgaggaagg gtcaccagcg ggctcgccca ccagcactga 3660
agaaggtgcc tcgagcccgc ctgtgctgaa gaggcaccag cgagaaatta cccggaccac 3720
cctccaatcg gatcaggagg aaatcgacta cgacgacacc atctcggtgg aaatgaagaa 3780
ggaagatttc gatatctacg acgaggacga aaatcagtcc cctcgctcat tccaaaagaa 3840
aactagacac tactttatcg ccgcggtgga aagactgtgg gactatggaa tgtcatccag 3900
ccctcacgtc cttcggaacc gggcccagag cggatcggtg cctcagttca agaaagtggt 3960
gttccaggag ttcaccgacg gcagcttcac ccagccgctg taccggggag aactgaacga 4020
acacctgggc ctgctcggtc cctacatccg cgcggaagtg gaggataaca tcatggtgac 4080
cttccgtaac caagcatcca gaccttactc cttctattcc tccctgatct catacgagga 4140
ggaccagcgc caaggcgccg agccccgcaa gaacttcgtc aagcccaacg agactaagac 4200
ctacttctgg aaggtccaac accatatggc cccgaccaag gatgagtttg actgcaaggc 4260
ctgggcctac ttctccgacg tggaccttga gaaggatgtc cattccggcc tgatcgggcc 4320
gctgctcgtg tgtcacacca acaccctgaa cccagcgcat ggacgccagg tcaccgtcca 4380
ggagtttgct ctgttcttca ccatttttga cgaaactaag tcctggtact tcaccgagaa 4440
tatggagcga aactgtagag cgccctgcaa tatccagatg gaagatccga ctttcaagga 4500
gaactataga ttccacgcca tcaacgggta catcatggat actctgccgg ggctggtcat 4560
ggcccaggat cagaggattc ggtggtactt gctgtcaatg ggatcgaacg aaaacattca 4620
ctccattcac ttctccggtc acgtgttcac tgtgcgcaag aaggaggagt acaagatggc 4680
gctgtacaat ctgtaccccg gggtgttcga aactgtggag atgctgccgt ccaaggccgg 4740
catctggaga gtggagtgcc tgatcggaga gcacctccac gcggggatgt ccaccctctt 4800
cctggtgtac tcgaataagt gccagacccc gctgggcatg gcctcgggcc acatcagaga 4860
cttccagatc acagcaagcg gacaatacgg ccaatgggcg ccgaagctgg cccgcttgca 4920
ctactccgga tcgatcaacg catggtccac caaggaaccg ttctcgtgga ttaaggtgga 4980
cctcctggcc cctatgatta tccacggaat taagacccag ggcgccaggc agaagttctc 5040
ctccctgtac atctcgcaat tcatcatcat gtacagcctg gacgggaaga agtggcagac 5100
ttacagggga aactccaccg gcaccctgat ggtctttttc ggcaacgtgg attcctccgg 5160
cattaagcac aacatcttca acccaccgat catagccaga tatattaggc tccaccccac 5220
tcactactca atccgctcaa ctcttcggat ggaactcatg gggtgcgacc tgaactcctg 5280
ctccatgccg ttggggatgg aatcaaaggc tattagcgac gcccagatca ccgcgagctc 5340
ctacttcact aacatgttcg ccacctggag cccctccaag gccaggctgc acttgcaggg 5400
acggtcaaat gcctggcggc cgcaagtgaa caatccgaag gaatggcttc aagtggattt 5460
ccaaaagacc atgaaagtga ccggagtcac cacccaggga gtgaagtccc ttctgacctc 5520
gatgtatgtg aaggagttcc tgattagcag cagccaggac gggcaccagt ggaccctgtt 5580
cttccaaaac ggaaaggtca aggtgttcca ggggaaccag gactcgttca cacccgtggt 5640
gaactccctg gaccccccac tgctgacgcg gtacttgagg attcatcctc agtcctgggt 5700
ccatcagatt gcattgcgaa tggaagtcct gggctgcgag gcccaggacc tgtactgaat 5760
cagcctgagc tcgctgatca taatcaacct ctggattaca aaatttgtga aagattgact 5820
ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt aatgcctttg 5880
tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa atcctggttg 5940
ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg 6000
tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct cctttccggg 6060
actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg ccttgcccgc 6120
tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc ggggaaatca 6180
tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc 6240
tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct gctgccggct 6300
ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc cctttgggcc 6360
gcctccccgc tgatcagcct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc 6420
ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 6480
tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 6540
gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg 6600
ctctatggct tctgaggcgg aaagaacggg ctcgagaagc ttctagatat cctctcttaa 6660
ggtagcatcg agatttaaat tagggataac agggtaatgg cgcgggccgc cacttcctgg 6720
cgcgcaaaat atcctcttgt ccttgagtct cattggaggg ttcgttcgtt cgaaccagcc 6780
aatcagggga gggggaagtg acgcaagttc cggtcacatg cttccggtga cgcacatccg 6840
gtgacgtagt tccggtcacg tgcttcctgt cacgtgtttc cggtcacgtg acttccggtc 6900
atgtgacttc cggtgacgtg tttccggctt aactattggg ctgaccgcgc ggcatgcgcg 6960
tggtcaacct aacagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac 7020
cggaaacacg tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga 7080
agcatgtgac cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg 7140
aaccctccaa tgag 7154
<210> 195
<211> 648
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая полинуклеотидная последовательность
<400> 195
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 60
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 120
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 180
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 240
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 300
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 360
ccatgcatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc 420
ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg 480
gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg 540
cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg 600
aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcg 648
<210> 196
<211> 1428
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая полинуклеотидная последовательность
<400> 196
atggactaca aagaccatga cggtgattat aaagatcatg atatcgatta caaggatgac 60
gatgacaagg ctgctgtggt tctggaaaat ggcgtgctga gccggaagct gagcgacttc 120
ggacaagaga caagctacat cgaggacaac agcaaccaga atggcgccgt gtctctgatc 180
ttcagcctga aagaagaagt gggcgccctg gccaaggtgc tgagactgtt cgaggaaaac 240
gagatcaatc tgacccacat cgagagcaga cccagcagac tgaacaagga cgagtacgag 300
ttcttcacct acctggacaa gcggagcaag cctgtgctgg gcagcatcat caagagcctg 360
agaaacgaca tcggcgccac cgtgcacgag ctgagcagag acaaagaaaa gaacaccgtg 420
ccatggttcc ccaggaccat ccaagagctg gacagattcg ccaaccagat cctgagctat 480
ggcgccgagc tggacgctga tcaccctggc tttaaggacc ccgtgtaccg ggccagaaga 540
aagcagtttg ccgatatcgc ctacaactac cggcacggcc agcctattcc tcgggtcgag 600
tacaccgagg aagagagaaa gacctggggc accgtgttca gaaccctgaa ggccctgtac 660
aagacccacg cctgctacga gcacaaccac atcttcccac tgctggaaaa gtactgcggc 720
ttccgcgagg acaatatccc tcagctcgaa gacgtgtccc agttcctgca gacctgcacc 780
ggctttagac tgaggcctgt tgccggactg ctgagcagca gagattttct cggcggcctg 840
gccttcagag tgttccactg tacccagtac atcagacacg gcagcaagcc catgtacacc 900
cctgagcctg atatctgcca cgagctgctg ggacatgtgc ccctgttcag cgatagaagc 960
ttcgcccagt tcagccaaga gatcggactg gcttctctgg gagcccctga cgagtacatt 1020
gagaagctgg ccaccatcta ctggttcacc gtggaattcg gcctgtgcaa agagggcgac 1080
agcatcaagg cttatggcgc tggactgctg tctagcttcg gcgagctgca gtactgtctg 1140
agcgacaagc ctaagctgct gcccctggaa ctggaaaaga ccgcctgcca agagtacaca 1200
gtgaccgagt tccagcctct gtactacgtg gccgagagct tcaacgacgc caaagaaaaa 1260
gtgcggacct tcgccgccac cattcctcgg ccttttagcg tcagatacga cccctacaca 1320
cagcgcgtgg aagtgctgga caacacacag cagctgaaga ttctggccga ctccatcaac 1380
agcgaagtgg gcattctgtg tcacgccctg cagaagatca agagctga 1428
<210> 197
<211> 4146
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая полинуклеотидная последовательность
<400> 197
ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60
ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120
ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180
ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240
taaattttgc ggcaattcag tcgataacta taacggtcct aaggtagcga tttaaatacg 300
cgctctctta aggtagcccc gggacgcgtc aattgagatc tggatccggt accgaattcg 360
cggccgcctc gacgactagc gtttagtaat gagacgcaca aactaatatc acaaactgga 420
aatgtctatc aatatatagt tgctctagtt attaatagta atcaattacg gggtcattag 480
ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 540
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 600
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 660
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 720
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 780
tctacgtatt agtcatcgct attaccatgc atggtcgagg tgagccccac gttctgcttc 840
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 900
ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg 960
ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg 1020
ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc 1080
gcgcggcggg cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc 1140
tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac 1200
ggcccttctc cttcgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg 1260
tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg 1320
gggctgtccg cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt 1380
ctggcgtgtg accggcggct ctagagcctc tgctaaccat gttcatgcct tcttcttttt 1440
cctacagctc ctgggcaacg tgctggttat tgtgctgtct catcattttg gcaaagaatt 1500
ggatcgcgaa gccgccacca tggactacaa agaccatgac ggtgattata aagatcatga 1560
tatcgattac aaggatgacg atgacaaggc tgctgtggtt ctggaaaatg gcgtgctgag 1620
ccggaagctg agcgacttcg gacaagagac aagctacatc gaggacaaca gcaaccagaa 1680
tggcgccgtg tctctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct 1740
gagactgttc gaggaaaacg agatcaatct gacccacatc gagagcagac ccagcagact 1800
gaacaaggac gagtacgagt tcttcaccta cctggacaag cggagcaagc ctgtgctggg 1860
cagcatcatc aagagcctga gaaacgacat cggcgccacc gtgcacgagc tgagcagaga 1920
caaagaaaag aacaccgtgc catggttccc caggaccatc caagagctgg acagattcgc 1980
caaccagatc ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc 2040
cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca 2100
gcctattcct cgggtcgagt acaccgagga agagagaaag acctggggca ccgtgttcag 2160
aaccctgaag gccctgtaca agacccacgc ctgctacgag cacaaccaca tcttcccact 2220
gctggaaaag tactgcggct tccgcgagga caatatccct cagctcgaag acgtgtccca 2280
gttcctgcag acctgcaccg gctttagact gaggcctgtt gccggactgc tgagcagcag 2340
agattttctc ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg 2400
cagcaagccc atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc 2460
cctgttcagc gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg 2520
agcccctgac gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg 2580
cctgtgcaaa gagggcgaca gcatcaaggc ttatggcgct ggactgctgt ctagcttcgg 2640
cgagctgcag tactgtctga gcgacaagcc taagctgctg cccctggaac tggaaaagac 2700
cgcctgccaa gagtacacag tgaccgagtt ccagcctctg tactacgtgg ccgagagctt 2760
caacgacgcc aaagaaaaag tgcggacctt cgccgccacc attcctcggc cttttagcgt 2820
cagatacgac ccctacacac agcgcgtgga agtgctggac aacacacagc agctgaagat 2880
tctggccgac tccatcaaca gcgaagtggg cattctgtgt cacgccctgc agaagatcaa 2940
gagctgagca agtaatgagc gctgatcata atcaacctct ggattacaaa atttgtgaaa 3000
gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 3060
tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 3120
cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt 3180
gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc tgtcagctcc 3240
tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc gccgcctgcc 3300
ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg gtgttgtcgg 3360
ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc cacctggatt ctgcgcggga 3420
cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc cgcggcctgc 3480
tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt cggatctccc 3540
tttgggccgc ctccccgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt 3600
gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 3660
taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 3720
ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 3780
gcggtgggct ctatggcttc tgaggcggaa agaacgggct cgagaagctt ctagatatcc 3840
tctcttaagg tagcatcgag atttaaatta gggataacag ggtaatggcg cgggccgcaa 3900
aatttaaaag aagacaccaa atcagatgcc gccggtcgcc gccggtaggc gggacttccg 3960
gtacaagatg gcggacaatt acgtcatttc ctgtgacgtc atttcctgtg acgtcacttc 4020
cggtgggcgg gacttccgga attagggttg gctctgggcc agcgcttggg gttgacgtgc 4080
cactaagatc aagcggcgcg ccgcttgtct tagtgtcaag gcaaccccaa gcaagctggc 4140
ccagag 4146
<210> 198
<211> 4214
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая полинуклеотидная последовательность
<400> 198
cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60
ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120
tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180
cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240
tgagactcaa ggacaagagg atattttgcg cgccaggaag tggcggcaat tcagtcgata 300
actataacgg tcctaaggta gcgatttaaa tacgcgctct cttaaggtag ccccgggacg 360
cgtcaattga gatctggatc cggtaccgaa ttcgcggccg cctcgacgac tagcgtttag 420
taatgagacg cacaaactaa tatcacaaac tggaaatgtc tatcaatata tagttgctct 480
agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc 540
gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg 600
acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa 660
tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca 720
agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac 780
atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc 840
atgcatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 900
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 960
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 1020
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 1080
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgcg 1140
ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1200
gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctccttcgg gctgtaatta 1260
gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc ttgaggggct 1320
ccgggagggc cctttgtgcg gggggagcgg ctcggggctg tccgcggggg gacggctgcc 1380
ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag 1440
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 1500
ttattgtgct gtctcatcat tttggcaaag aattggatcg cgaagccgcc accatggact 1560
acaaagacca tgacggtgat tataaagatc atgatatcga ttacaaggat gacgatgaca 1620
aggctgctgt ggttctggaa aatggcgtgc tgagccggaa gctgagcgac ttcggacaag 1680
agacaagcta catcgaggac aacagcaacc agaatggcgc cgtgtctctg atcttcagcc 1740
tgaaagaaga agtgggcgcc ctggccaagg tgctgagact gttcgaggaa aacgagatca 1800
atctgaccca catcgagagc agacccagca gactgaacaa ggacgagtac gagttcttca 1860
cctacctgga caagcggagc aagcctgtgc tgggcagcat catcaagagc ctgagaaacg 1920
acatcggcgc caccgtgcac gagctgagca gagacaaaga aaagaacacc gtgccatggt 1980
tccccaggac catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg 2040
agctggacgc tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt 2100
ttgccgatat cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacaccg 2160
aggaagagag aaagacctgg ggcaccgtgt tcagaaccct gaaggccctg tacaagaccc 2220
acgcctgcta cgagcacaac cacatcttcc cactgctgga aaagtactgc ggcttccgcg 2280
aggacaatat ccctcagctc gaagacgtgt cccagttcct gcagacctgc accggcttta 2340
gactgaggcc tgttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca 2400
gagtgttcca ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc 2460
ctgatatctg ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc 2520
agttcagcca agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc 2580
tggccaccat ctactggttc accgtggaat tcggcctgtg caaagagggc gacagcatca 2640
aggcttatgg cgctggactg ctgtctagct tcggcgagct gcagtactgt ctgagcgaca 2700
agcctaagct gctgcccctg gaactggaaa agaccgcctg ccaagagtac acagtgaccg 2760
agttccagcc tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga 2820
ccttcgccgc caccattcct cggcctttta gcgtcagata cgacccctac acacagcgcg 2880
tggaagtgct ggacaacaca cagcagctga agattctggc cgactccatc aacagcgaag 2940
tgggcattct gtgtcacgcc ctgcagaaga tcaagagctg agcaagtaat gagcgctgat 3000
cataatcaac ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt 3060
gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc 3120
cgtatggctt tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag 3180
ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc 3240
actggttggg gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc 3300
cctattgcca cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg 3360
ctgttgggca ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg 3420
ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc 3480
ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt 3540
cttcgccttc gccctcagac gagtcggatc tccctttggg ccgcctcccc gctgatcagc 3600
ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 3660
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 3720
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 3780
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc 3840
ggaaagaacg ggctcgagaa gcttctagat atcctctctt aaggtagcat cgagatttaa 3900
attagggata acagggtaat ggcgcgggcc gccacttcct ggcgcgcaaa atatcctctt 3960
gtccttgagt ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag 4020
tgacgcaagt tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca 4080
cgtgcttcct gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg 4140
tgtttccggc ttaactattg ggctgaccgc gcggcatgcg cgtggtcaac ctaacagccg 4200
gaaacacgtc accg 4214
<---
название | год | авторы | номер документа |
---|---|---|---|
МОЛЕКУЛЫ НУКЛЕИНОВОЙ КИСЛОТЫ И ПУТИ ИХ ПРИМЕНЕНИЯ | 2018 |
|
RU2819144C2 |
Выделенная нуклеиновая кислота, которая кодирует слитый белок на основе FVIII-BDD и гетерологичного сигнального пептида, и ее применение | 2022 |
|
RU2818229C2 |
ПРИМЕНЕНИЕ ЛЕНТИВИРУСНЫХ ВЕКТОРОВ, ЭКСПРЕССИРУЮЩИХ ФАКТОР VIII | 2019 |
|
RU2803163C2 |
ГЕННАЯ ТЕРАПИЯ ДЛЯ ЛЕЧЕНИЯ ГЕМОФИЛИИ A | 2017 |
|
RU2762257C2 |
ВЫСОКОГЛИКОЗИЛИРОВАННЫЙ СЛИТЫЙ БЕЛОК НА ОСНОВЕ ФАКТОРА СВЕРТЫВАНИЯ КРОВИ ЧЕЛОВЕКА VIII, СПОСОБ ЕГО ПОЛУЧЕНИЯ И ЕГО ПРИМЕНЕНИЕ | 2016 |
|
RU2722374C1 |
УЛУЧШЕННЫЙ БЕЛОК СЛИЯНИЯ FVIII И ЕГО ПРИМЕНЕНИЕ | 2019 |
|
RU2789085C2 |
СПОСОБЫ ВЫЯВЛЕНИЯ AAV | 2017 |
|
RU2771622C2 |
СПОСОБЫ ЛЕЧЕНИЯ ГЕМОФИЛИИ A | 2019 |
|
RU2812863C2 |
ПРЕПАРАТ, СОДЕРЖАЩИЙ ФАКТОР VIII И ПЕПТИДЫ ФАКТОРА ФОН ВИЛЛЕБРАНДА | 2015 |
|
RU2714154C2 |
ГЛИКОЗИЛИРОВАННЫЕ СЛИТЫЕ БЕЛКИ VWF С УЛУЧШЕННОЙ ФАРМАКОКИНЕТИКОЙ | 2017 |
|
RU2782212C2 |
Настоящее раскрытие относится к молекулам нуклеиновой кислоты, содержащим первый инвертированный концевой повтор (ITR), второй ITR и генную кассету, кодирующую целевую последовательность. В некоторых вариантах осуществления целевая последовательность кодирует miRNA и/или терапевтический белок. В некоторых вариантах осуществления терапевтический белок содержит фактор свертывания крови, фактор роста, гормон, цитокин, антитело, его фрагмент и их комбинацию. В некоторых вариантах осуществления первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (AAV). Настоящее раскрытие также относится к способам лечения метаболического нарушения печени у субъекта, включающим введение субъекту молекулы нуклеиновой кислоты или полипептида, кодируемого ею. 11 н. и 7 з.п. ф-лы, 22 ил., 16 табл., 7 пр.
1. Молекула нуклеиновой кислоты для экспрессии микроРНК (miRNA) и/или терапевтический белок, где молекула нуклеиновой кислоты содержит первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентична нуклеотидной последовательности, представленной в SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188;
где гетерологичная полинуклеотидная последовательность кодирует микроРНК (miRNA) и/или терапевтический белок.
2. Молекула нуклеиновой кислоты по п.1, где:
первый ITR содержит нуклеотидную последовательность, представленную в SEQ ID NO: 180, и второй ITR содержит нуклеотидную последовательность, представленную в SEQ ID NO: 181;
первый ITR содержит нуклеотидную последовательность, представленную в SEQ ID NO: 183, и второй ITR содержит нуклеотидную последовательность, представленную в SEQ ID NO: 184;
первый ITR содержит нуклеотидную последовательность, представленную в SEQ ID NO: 185, и второй ITR содержит нуклеотидную последовательность, представленную в SEQ ID NO: 186;
первый ITR содержит нуклеотидную последовательность, представленную в SEQ ID NO: 187, и второй ITR содержит нуклеотидную последовательность, представленную в SEQ ID NO: 188; и/или
первый ITR и второй ITR обратно комплементарны друг другу.
3. Молекула нуклеиновой кислоты по п.1, дополнительно содержащая промотор, где:
промотор расположен в направлении 5'-конца относительно гетерологичной полинуклеотидной последовательности;
промотор представляет собой тканеспецифический промотор;
промотор управляет экспрессией гетерологичной полинуклеотидной последовательности в органе, выбранном из мышцы, центральной нервной системы, глаза, печени, сердца, почки, поджелудочной железы, легких, кожи, мочевого пузыря, мочевыводящих путей или любой их комбинации;
промотор управляет экспрессией гетерологичной полинуклеотидной последовательности в гепатоцитах, эндотелиальных клетках, клетках сердечной мышцы, клетках скелетных мышц, синусоидальных клетках, афферентных нейронах, эфферентных нейронах, вставочных нейронах, глиальных клетках, астроцитах, олигодендроцитах, микроглии, эпендимальных клетках, эпителиальных клетках легкого, шванновских клетках, сателлитных клетках, фоторецепторных клетках, ганглиозных клетках сетчатки или любой их комбинации; и/или
промотор выбран из группы, состоящей из промотора тиретина мыши, эндогенного промотора фактора VIII человека, промотора альфа-1-антитрипсина человека, минимального промотора альбумина человека, промотора альбумина мыши, промотора тристетрапролина, промотора CASI, промотора CAG, промотора цитомегаловируса, промотора α1-антитрипсина, мышечной креатинкиназы, тяжелой цепи миозина альфа, миоглобина, десмина, SPc5-12, 2R5Sc5-12, dMCK, tMCK и фосфоглицераткиназы.
4. Молекула нуклеиновой кислоты по п.1, где:
гетерологичная полинуклеотидная последовательность дополнительно содержит интронную последовательность, где:
интронная последовательность расположена в направлении 5'-конца относительно гетерологичной полинуклеотидной последовательности;
интронная последовательность расположена в направлении 3'-конца относительно промотора;
интронная последовательность содержит синтетическую интронную последовательность; и/или
интронная последовательность содержит SEQ ID NO: 115 или 192;
гетерологичная полинуклеотидная последовательность кодирует терапевтический белок, выбранный из группы, состоящей из фактора свертывания крови, фактора роста, гормона, цитокина, антитела, его фрагмента и любой их комбинации, где:
гетерологичная полинуклеотидная последовательность кодирует фактор роста, выбранный из группы, состоящей из адреномедуллина, ангиопоэтина, аутокринного фактора подвижности, костного морфогенетического белка, представителя семейства цилиарных нейротрофических факторов, фактора ингибирования лейкоза, интерлейкина-6, колониестимулирующего фактора, гранулоцитарного колониестимулирующего фактора, гранулоцитарно-макрофагального колониестимулирующего фактора, эпидермального фактора роста, эфрина, эритропоэтина, фактора роста фибробластов, фетального бычьего соматотропина, представителя семейства GDNF, нейротурина, персефина и артемина, фактора роста и дифференцировки-9, фактора роста гепатоцитов, фактора роста, происходящего из гепатомы, инсулина, инсулиноподобных факторов роста или IGF-2, интерлейкина, фактора роста кератиноцитов, фактора, стимулирующего миграцию, белка, стимулирующего макрофаги, миостатина, нейрегулина, NRG2, NRG3, NRG4, нейротрофина, фактора роста нервов, нейротрофина-3, NT-4, плацентарного фактора роста, тромбоцитарного фактора роста, реналазы, фактора роста Т-клеток, тромбопоэтина, трансформирующего фактора роста, TGF-β, фактора некроза опухоли-альфа и фактора роста эндотелия сосудов и любой их комбинации;
гетерологичная полинуклеотидная последовательность кодирует гормон;
гетерологичная полинуклеотидная последовательность кодирует цитокин; или
гетерологичная полинуклеотидная последовательность кодирует антитело или его фрагмент;
гетерологичная полинуклеотидная последовательность кодирует терапевтический белок, выбранный из X-сцепленного дистрофина, MTM1, тирозингидроксилазы, AADC, циклогидролазы, SMN1, FXN, GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA, IDS, PAH, GAA и любой их комбинации;
гетерологичная полинуклеотидная последовательность кодирует микроРНК, где микроРНК понижает экспрессию целевого гена, выбранного из SOD1, HTT, RHO и любой их комбинации; и/или
гетерологичная полинуклеотидная последовательность является кодон-оптимизированной, и где гетерологичная полинуклеотидная последовательность является кодон-оптимизированной для экспрессии у человека.
5. Молекула нуклеиновой кислоты по п.1, где:
генная кассета дополнительно содержит посттранскрипционный регуляторный элемент, где:
посттранскрипционный регуляторный элемент расположен в направлении 3'-конца относительно гетерологичной полинуклеотидной последовательности; и/или
посттранскрипционный регуляторный элемент содержит мутантный посттранскрипционный регуляторный элемент вируса гепатита сурков, сайт связывания микроРНК, последовательность, направляющую ДНК к ядру, или любую их комбинацию, где сайт связывания микроРНК содержит сайт связывания с miR142-3p;
генная кассета дополнительно содержит 3'-UTR-последовательность поли(А)-хвоста, где 3'-UTR-последовательность поли(A)-хвоста выбрана из группы, состоящей из поли(A) bGH, поли(A) актина, поли(A) гемоглобина и любой их комбинации, 3'-UTR-последовательность поли(А)-хвоста содержит поли(A) bGH;
причем генная кассета дополнительно содержит энхансерную последовательность, где энхансерная последовательность расположена между первым ITR и вторым ITR;
генная кассета содержит однонитевую нуклеиновую кислоту; и/или
генная кассета содержит двухнитевую нуклеиновую кислоту.
6. Молекула нуклеиновой кислоты по п.1, где молекула нуклеиновой кислоты содержит в направлении от 5' до 3': первый ITR, генную кассету и второй ITR; где генная кассета содержит тканеспецифическую промоторную последовательность, интронную последовательность, гетерологичную полинуклеотидную последовательность, посттранскрипционный регуляторный элемент и 3'-UTR-последовательность поли(А)-хвоста, где генная кассета содержит в направлении от 5' до 3': тканеспецифическую промоторную последовательность, интронную последовательность, гетерологичную полинуклеотидную последовательность, посттранскрипционный регуляторный элемент и 3'-UTR-последовательность поли(А)-хвоста, где:
(a) тканеспецифическая промоторная последовательность содержит промотор тристетрапролина (TTP);
(b) интрон представляет собой синтетический интрон;
(c) посттранскрипционный регуляторный элемент содержит WPRE; и
(d) 3'-UTR-последовательность поли(A)-хвоста содержит bGHpA.
7. Молекула нуклеиновой кислоты по п.1, где гетерологичная полинуклеотидная последовательность кодирует фактор свертывания крови, выбранный из группы, состоящей из фактора I, фактора II, фактора III, фактора IV, фактора V, фактора VI, фактора VII, фактора VIII, фактора IX, фактора X, фактора XI, фактора XII, фактора XIII, фактора фон Виллебранда, прекалликреина, высокомолекулярного кининогена, фибронектина, антитромбина III, кофактора II гепарина, белка C, белка S, белка Z, ингибитора протеазы, связанного с белком Z, плазминогена, альфа-2-антиплазмина, тканевого активатора плазминогена, урокиназы, ингибитора-1 активатора плазминогена, ингибитора-2 активатора плазминогена и любой их комбинации, где фактор свертывания крови представляет собой FVIII, где FVIII содержит полноразмерный зрелый FVIII, где FVIII содержит аминокислотную последовательность, которая на по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентична аминокислотной последовательности, имеющей SEQ ID NO: 106, где FVIII содержит домен A1, домен A2, домен A3, домен C1, домен C2 и частичный домен B или вообще не содержит его, где FVIII содержит аминокислотную последовательность, которая на по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентична аминокислотной последовательности SEQ ID NO: 109, где:
фактор свертывания крови содержит гетерологичный компонент, где гетерологичный компонент выбран из группы, состоящей из альбумина или его фрагмента, Fc-области иммуноглобулина, C-концевого пептида β-субъединицы хорионического гонадотропина человека, последовательности PAS, последовательности HAP, трансферрина или его фрагмента, альбумин-связывающего компонента, их производного или любой их комбинации, где гетерологичный компонент связан с N-концом или C-концом FVIII или вставлен между двумя аминокислотами в FVIII;
FVIII дополнительно содержит домен A1, домен A2, домен C1, домен C2, необязательный домен B и гетерологичный компонент, где гетерологичный компонент вставлен непосредственно ниже аминокислоты 745 SEQ ID NO: 106;
FVIII дополнительно содержит партнера по связыванию FcRn, где партнер по связыванию FcRn содержит Fc-область константного домена иммуноглобулина;
последовательность нуклеиновой кислоты, кодирующая FVIII, является кодон-оптимизированной; и/или
последовательность нуклеиновой кислоты, кодирующая FVIII, является кодон-оптимизированной для экспрессии у человека, где последовательность нуклеиновой кислоты, кодирующая FVIII, содержит нуклеотидную последовательность, которая на по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентична нуклеотидной последовательности SEQ ID NO: 107, или последовательность нуклеиновой кислоты, кодирующая FVIII, содержит нуклеотидную последовательность, которая на по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентична нуклеотидной последовательности SEQ ID NO: 71.
8. Композиция для экспрессии микроРНК (miRNA) и/или терапевтического белка, содержащая молекулу нуклеиновой кислоты по п.1 и средство доставки, где средство доставки содержит липидную наночастицу, или средство доставки выбрано из группы, состоящей из липосом, нелипидных полимерных молекул и эндосом и любой их комбинации.
9. Вектор для экспрессии микроРНК (miRNA) и/или терапевтического белка, содержащий молекулу нуклеиновой кислоты по п.1.
10. Клетка-хозяин для экспрессии микроРНК (miRNA) и/или терапевтического белка, содержащая молекулу нуклеиновой кислоты по п.1.
11. Набор для экспрессии микроРНК (miRNA) и/или терапевтического белка у субъекта, содержащий молекулу нуклеиновой кислоты по п.1 и инструкции для введения молекулы нуклеиновой кислоты субъекту.
12. Бакуловирусная система для продуцирования молекулы нуклеиновой кислоты для экспрессии микроРНК (miRNA) и/или терапевтического белка, где система содержит молекулу нуклеиновой кислоты, содержащую первый инвертированный концевой повтор (ITR) и второй ITR, фланкирующий генетическую кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую микроРНК (miRNA) и/или терапевтический белок,
где первый ITR и второй ITR содержат нуклеотидную последовательность, представленную в SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188.
13. Способ получения терапевтического полипептида, включающий культивирование клетки-хозяина по п.10 в подходящих условиях и извлечение полипептида, где полипептид представляет собой полипептид со свертывающей активностью, и способ содержит извлечение полипептида со свертывающей активностью.
14. Способ обеспечения экспрессии гетерологичной полинуклеотидной последовательности для экспрессии микроРНК (miRNA) и/или терапевтического белка у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты по п.1.
15. Способ обеспечения экспрессии фактора свертывания крови у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты по п.7.
16. Способ лечения гемостатического нарушения у субъекта, включающий введение субъекту молекулы нуклеиновой кислоты по п.7.
17. Способ по п.16:
где молекулу нуклеиновой кислоты вводят внутривенно, чрескожно, внутрикожно, подкожно, перорально, посредством легочного пути или с помощью любой их комбинации, где молекулу нуклеиновой кислоты вводят внутривенно;
дополнительно включающий введение субъекту второго средства;
где субъект является млекопитающим;
где субъект является человеком;
где введение молекулы нуклеиновой кислоты субъекту приводит к увеличению активности FVIII относительно активности FVIII у субъекта до введения, где активность FVIII увеличивается в по меньшей мере 2 раза, по меньшей мере 3 раза, по меньшей мере 4 раза, по меньшей мере 5 раз, по меньшей мере 6 раз, по меньшей мере 7 раз, по меньшей мере 8 раз, по меньшей мере 9 раз, по меньшей мере 10 раз, по меньшей мере 11 раз, по меньшей мере 12 раз, по меньшей мере 13 раз, по меньшей мере 14 раз, по меньшей мере 15 раз, по меньшей мере 20 раз, по меньшей мере 25 раз, по меньшей мере 30 раз, по меньшей мере 35 раз, по меньшей мере 40 раз, по меньшей мере 50 раз, по меньшей мере 60 раз, по меньшей мере 70 раз, по меньшей мере 80 раз, по меньшей мере 90 раз или по меньшей мере 100 раз; и/или
где у субъекта имеется гемостатическое нарушение.
18. Способ лечения гемофилии A, включающий введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор и второй ITR, фланкирующие генную кассету, содержащую гетерологичную полинуклеотидную последовательность, кодирующую фактор свертывания крови, где первый ITR и/или второй ITR содержат нуклеотидную последовательность, которая на по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентична нуклеотидной последовательности, представленной в SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 или 188.
US 7598071 B2, 06.10.2009 | |||
WO 2008016391 A2, 07.02.2008 | |||
СПОСОБ АРГОНОДУГОВОЙ ОБРАБОТКИ СВАРНЫХ СОЕДИНЕНИЙ, ПОЛУЧЕННЫХ ЛИНЕЙНОЙ СВАРКОЙ ТРЕНИЕМ | 2012 |
|
RU2524037C1 |
КОМПОЗИЦИИ ВЕКТОРА AAV И СПОСОБЫ ПЕРЕНОСА ГЕНОВ В КЛЕТКИ, ОРГАНЫ И ТКАНИ | 2013 |
|
RU2653444C2 |
Авторы
Даты
2025-02-11—Публикация
2019-08-09—Подача