Настоящее изобретение относится к вариантам кислой α глюкозидазы (GAA) и их использованию. Указанные варианты связаны с гетерогенными сигнальными пептидами.
Болезнь Помпе, также известная как болезнь накопления гликогена (GSD) II типа и недостаточность кислой мальтазы, представляет собой аутосомно-рецессивную метаболическую миопатию, обусловленную недостаточностью лизосомного фермента кислой α-глюкозидазы (GAA). GAA представляет собой экзо-1,4 и 1,6-α-глюкозидазу, которая гидролизует гликоген до глюкозы в лизосоме. Недостаточность GAA ведет к накоплению гликогена в лизосомах и вызывает нарастающее повреждение дыхательных, сердечных и скелетных мышц. Заболевание варьирует от быстро прогрессирующего детского течения, которое обычно фатально к возрасту в 1-2 года, до более медленно прогрессирующего и гетерогенного течения, которое обуславливает значимую распространенность болезни и раннюю смертность у детей и взрослых. Hirschhorn RR, The Metabolic and Molecular Bases of Inherited Disease, 3: 3389-3420 (2001, McGraw-Hill); Van der Ploeg and Reuser, Lancet 372: 1342-1351 (2008).
Существующая терапия человека для лечения болезни Помпе включает введение рекомбинантной GAA человека, которое иначе называют ферментозаместительной терапией (ERT). Продемонстрирован ERT эффект при тяжелой детской GSDII. Однако польза ферментативной терапии ограничена необходимостью частых инфузий и развитием ингибиторных антител против рекомбинантной hGAA (Amalfitano, A., et al. (2001) Genet. In Med. 3:132-138). Кроме того, ERT не обеспечивает эффективную коррекцию во всем организме, вероятно, из-за комбинации плохого биораспределения белка после доставки в периферическую вену, отсутствия захвата из некоторых тканей и высокой иммуногенности.
В качестве альтернативы или вспомогательного средства для ERT исследовали выполнимость подходов генной терапии для того, чтобы лечить GSDII (Amalfitano, A., et al. (1999) Proc. Natl. Acad. Sci. USA 96:8861-8866, Ding, E., et al. (2002) Mol. Ther. 5:436-446, Fraites, T. J., et al. (2002) Mol. Ther. 5:571-578, Tsujino, S., et al. (1998) Hum. Gene Ther. 9:1609-1616). Однако направленный в мышцы перенос генов для того, чтобы корректировать генетический дефект, столкнулся с ограничением системной природой заболевания и тем фактом, что экспрессия трансгена в мышцах обычно бывает более иммуногенной по сравнению с другими тканями.
Doerfler et al., 2016 описывают комбинированное введение двух конструкций, кодирующих GAA человека с оптимизацией кодонов, одна под управлением специфического промотора печени и другая под управлением специфического промотора мышц. Управляемую специфическим промотором печени экспрессию GAA используют для содействия иммунологической толерантности к GAA в модели на Gaa-/- мышах, тогда как управляемая специфическим промотором мышц экспрессия GAA обеспечивает экспрессию терапевтического белка в части тканей, на которые направлена терапия. Однако эта стратегия не является полностью удовлетворительной в том отношении, что она требует использования нескольких конструкций и не ведет к экспрессии GAA по всему организму.
В прошлом предложены модифицированные белки GAA для усовершенствования лечения лизосомной болезни накопления. В частности, в заявке WO2004064750 и Sun et al., 2006, раскрыт химерный полипептид GAA, содержащий сигнальный пептид, функционально связанный с GAA, в качестве способа усиления направленности белка в секреторный путь.
Однако терапия, доступная пациенту, не является полностью удовлетворительной, и в данной области все еще необходимы усовершенствованные полипептиды GAA и продуцирование GAA. В частности, все еще существует потребность в долгосрочном эффекте лечения с использованием GAA, продуцировании GAA на высоком уровне, усовершенствованной иммунологической толерантности к получаемому полипептиду GAA и усовершенствованном захвате GAA клетками и тканями, нуждающимися в нем. Кроме того, в WO2004064750 и Sun et al., 2006, раскрыто распределение химерного полипептида GAA в тканях, которое не является полностью удовлетворительным. Следовательно, все еще существует потребность в полипептиде GAA, который будет полностью терапевтическим, допуская коррекцию накопления гликогена в большинстве, если не во всех, тканей, представляющих интерес.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Настоящее изобретение относится к вариантам GAA, которые экспрессируют и секретируют на более высоких уровнях по сравнению с белком GAA дикого типа и которые обеспечивают усовершенствованную коррекцию патологического накопления гликогена по всему организму и ведут к индукции иммунологической толерантности к GAA.
По одному из аспектов, изобретение относится к молекуле нуклеиновой кислоты, кодирующей функциональный химерный полипептид GAA, который содержит фрагмент сигнального пептида и фрагмент функциональной GAA. В кодируемом химерном полипептиде GAA эндогенный (или природный) сигнальный пептид полипептида GAA заменяют на сигнальный пептид другого белка. Молекула нуклеиновой кислоты, следовательно, кодирует химерный полипептид GAA, содержащий сигнальный пептид из другого белка, нежели GAA, функционально связанный с полипептидом GAA. Кодируемый химерный полипептид представляет собой функциональный белок GAA, в котором аминокислотную последовательность, соответствующую природному сигнальному пептиду GAA (такому как тот, что соответствует нуклеотидам с 1 до 81 в SEQ ID NO: 1, которая представляет собой нуклеиновую кислоту дикого типа, кодирующую GAA человека) заменяют аминокислотной последовательностью другого белка. В предпочтительном варианте осуществления кодируемый сигнальный пептид имеет аминокислотную последовательность, выбранную в группе, состоящей из SEQ ID NO: с 2 до 4. В конкретном варианте осуществления фрагмент GAA представляет собой усеченную по N-концу форму родительского полипептида GAA.
В конкретном варианте осуществления фрагмент GAA имеет от 1 до 75 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA, где родительский полипептид соответствует форме предшественника полипептида GAA, свободного от его сигнального пептида. В конкретном варианте осуществления указанный усеченный полипептид GAA имеет по меньшей мере 2, в частности, по меньшей мере 2, в частности, по меньшей мере 3, в частности, по меньшей мере 4, в частности, по меньшей мере 5, в частности, по меньшей мере 6, в частности, по меньшей мере 7, в частности, по меньшей мере 8 последовательных аминокислот, на его N-конце, по сравнению с родительским полипептидом GAA. В другом варианте осуществления указанный усеченный полипептид GAA имеет самое большее 75, в частности самое большее 70, в частности самое большее 60, в частности самое большее 55, в частности самое большее 50, в частности самое большее 47, в частности самое большее 46, в частности самое большее 45, в частности самое большее 44, в частности самое большее 43 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA. В дополнительном конкретном варианте осуществления, указанный усеченный полипептид GAA имеет самое большее 47, в частности самое большее 46, в частности самое большее 45, в частности самое большее 44, в частности самое большее 43 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA. В другом конкретном варианте осуществления указанный усеченный полипептид GAA имеет от 1 до 75, в частности, от 1 до 47, в частности, от 1 до 46, в частности, от 1 до 45, в частности, от 1 до 44, в частности, от 1 до 43 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA. В другом варианте осуществления указанный усеченный полипептид GAA имеет от 2 до 43, в частности, от 3 до 43, в частности, от 4 до 43, в частности, от 5 до 43, в частности, от 6 до 43, в частности, от 7 до 43, в частности, от 8 до 43 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA. В более конкретном варианте осуществления, указанный усеченный полипептид GAA имеет 6, 7, 8, 9, 10, 27, 28, 29, 30, 31, 40, 41, 42, 43, 44, 45, 46 или 47 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA, в частности, 7, 8, 9, 28, 29, 30, 41, 42, 43 или 44, более конкретно 8, 29, 42 или 43 последовательных аминокислот, усеченных на его N-конце, по сравнению с родительским полипептидом GAA. Иллюстративный родительский полипептид GAA представлен полипептидом GAA человека, приведенным в SEQ ID NO: 5 или SEQ ID NO: 36.
В другом конкретном варианте осуществления молекула нуклеиновой кислоты по изобретению представляет собой нуклеотидную последовательность, оптимизированную для того, чтобы усовершенствовать экспрессию химерной GAA и/или усовершенствовать иммунологическую толерантность к ней in vivo.
В конкретном варианте осуществления молекула нуклеиновой кислоты по изобретению кодирует химерный полипептид GAA, содержащий фрагменты, представленные в следующей таблице 1, таблице 1' или таблице 1'', в частности, таблице 1' или таблице 1'':
Таблица 1
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO: 3
SEQ ID NO: 4
Таблица 1'
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO: 3
SEQ ID NO: 4
Таблица 1''
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO: 3
SEQ ID NO: 4
Например, такие молекулы нуклеиновой кислоты могут представлять собой результат следующих комбинаций, представленных в таблице 2, таблице 2' или таблице 2'':
Таблица 2
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
Таблица 2'
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
Таблица 2''
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
SEQ ID NO: 27
SEQ ID NO: 28
В еще одном аспекте изобретение относится к конструкции нуклеиновой кислоты, которая содержит молекулу нуклеиновой кислоты по изобретению, функционально связанную с одной или несколькими регуляторными последовательностями, таким как промотор, интрон, сигнал полиаденилирования и/или энхансер (например, цис-регуляторный модуль, или CRM). В конкретном варианте осуществления промотор представляет собой специфический промотор печени, предпочтительно выбранный в группе, состоящей из промотора α-1-антитрипсина (hAAT), промотора транстиретина, промотора альбумина и промотора тироксинсвязывающего глобулина (TBG). В другом конкретном варианте осуществления промотор представляет собой специфически промотор мышц, такой как промоторы Spc5-12, MCK и десмина. В другом варианте осуществления промотор представляет собой универсальный промотор, такой как промоторы CMV, CAG и PGK. Конструкция нуклеиновой кислоты дополнительно может необязательно содержать интрон, в частности интрон, выбранный в группе, состоящей из интрона β-глобина b2 человека (или HBB2), интрона FIX, интрона β-глобина курицы и интрона SV40, где указанный интрон необязательно представляет собой модифицированный интрон, такой как модифицированный интрон HBB2 из SEQ ID NO: 7, модифицированный интрон FIX из SEQ ID NO: 9 или модифицированный интрон β-глобина курицы из SEQ ID NO: 11.
В другом конкретном варианте осуществления конструкция нуклеиновой кислоты содержит, предпочтительно в этом порядке: энхансер; интрон; промотор, в частности специфический промотор печени; последовательность нуклеиновой кислоты, кодирующую химерный полипептид GAA; и сигнал полиаденилирования, конструкцию, содержащую, предпочтительно в этом порядке: управляющую область ApoE; интрон HBB2, в частности, модифицированный интрон HBB2; промотор hAAT; последовательность нуклеиновой кислоты, кодирующую химерный полипептид GAA; и сигнал полиаденилирования бычьего гормона роста. В конкретном варианте осуществления конструкция нуклеиновой кислоты содержит нуклеотидную последовательность, выбранную в группе, состоящей из комбинаций последовательностей, представленных в таблице 2, таблице 2' или таблице 2'', в частности в таблице 2' или 2'', более конкретно нуклеотидную последовательность из SEQ ID NO: 17 (соответствующую слиянию из SEQ ID NO: 26 и SEQ ID NO: 32), 18 (соответствующую слиянию из SEQ ID NO: 27 и SEQ ID NO: 32) или 19 (соответствующую слиянию из SEQ ID NO: 28 и SEQ ID NO: 32).
По другому аспекту, изобретение относится к вектору, содержащему молекулу нуклеиновой кислоты или конструкцию нуклеиновой кислоты в соответствии с изобретением. В конкретном варианте осуществления вектор представляет собой вирусный вектор, предпочтительно ретровирусный вектор, такой как лентивирусный вектор, или AAV вектор.
В соответствии с другим вариантом осуществления, вирусный вектор представляет собой одноцепочечный или двухцепочечный самокомплементарный AAV вектор, предпочтительно AAV вектор с происходящим из AAV капсидом, например, AAV1, AAV2, вариант AAV2, AAV3, вариант AAV3, AAV3B, вариант AAV3B, AAV4, AAV5, AAV6, вариант AAV6, AAV7, AAV8, AAV9, AAV10, такой как AAVcy10 и AAVrh10, AAVrh74, AAVdj, AAV-Anc80, AAV-LK03, AAV2i8 и AAV свиньи, такой как капсид AAVpo4 и AAVpo6, или с химерным капсидом.
В соответствии с дополнительным конкретным вариантом осуществления, AAV вектор имеет капсид AAV8, AAV9, AAVrh74 или AAV2i8, в частности, капсид AAV8, AAV9 или AAVrh74, более конкретно капсид AAV8.
В другом аспекте изобретение относится к клетке трансформированной молекулой нуклеиновой кислоты, конструкцией нуклеиновой кислоты или вектором по изобретению. В конкретном варианте осуществления клетка представляет собой клетку печени или клетку мышцы.
По другому аспекту, изобретение относится к химерному полипептиду GAA, который содержит фрагмент сигнального пептида и фрагмент функциональной GAA. Фрагмент сигнального пептида выбирают в группе, состоящей из SEQ ID NO: с 2 до 4, предпочтительно SEQ ID NO: 2. Кроме того, фрагмент GAA может представлять собой усеченную форму родительского полипептида GAA, такую как фрагмент GAA, имеющий от 1 до 75 последовательных аминокислот, усеченных на его N-конце, по сравнению с родительским полипептидом GAA, в частности 6, 7, 8, 9, 10, 20, 41, 42, 43 или 44 последовательных аминокислот, усеченных на его N-конце, по сравнению с родительским полипептидом GAA, например, 8 или 42 последовательных аминокислот, усеченных на его N-конце, по сравнению с родительским полипептидом GAA, где фрагмент GAA, в частности, представляет собой усеченную форму белка GAA человека из SEQ ID NO: 5 или SEQ ID NO: 36, в частности из SEQ ID NO: 5. В конкретном варианте осуществления фрагмент GAA имеет 8 последовательных аминокислот, усеченных на его N-конце, по сравнению с родительским полипептидом GAA (более конкретно, родительским полипептидом GAA из SEQ ID NO: 5 или SEQ ID NO: 36, в частности из SEQ ID NO: 5). В конкретном варианте осуществления изобретения, химерный полипептид GAA по изобретению выбирают в группе, состоящей из комбинаций аминокислотных последовательностей, представленных в таблице 1, таблице 1' или таблице 1'', в частности в таблице 1' или таблиц* 1''. Дополнительные конкретные варианты осуществления химерного полипептида GAA, содержащего усеченную форму родительского полипептида GAA, раскрыты в дальнейшем подробное описание.
В другом аспекте изобретение относится к фармацевтической композиции, которая содержит, в фармацевтически приемлемом носителе, последовательность нуклеиновой кислоты, конструкцию нуклеиновой кислоты, вектор, клетку или химерный полипептид, раскрытые в настоящем описании.
Другой аспект изобретения относится к последовательности нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектору, клетке или химерному полипептиду по изобретению для применения в качестве лекарственного средства.
В еще одном аспекте изобретение относится к последовательности нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектору, клетке или химерному полипептиду по изобретению для применения в способе лечения болезни накопления гликогена. В конкретном варианте осуществления болезнь накопления гликогена представляет собой GSDI, GSDII, GSDIII, GSDIV, GSDV, GSDVI, GSDVII, GSDVIII или летальную врожденную болезнь накопления гликогена в сердце. В более конкретном варианте осуществления, болезнь накопления гликогена выбирают в группе, состоящей из GSDI, GSDII и GSDIII, более конкретно в группе, состоящей из GSDII и GSDIII. В даже более конкретном варианте осуществления болезнь накопления гликогена представляет собой GSDII.
ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг. 1. Сигнальные пептиды усиливают секрецию hGAA в вариабельной степени in vitro и in vivo. Часть A. Клетки гепатомы человека (Huh7) трансфицировали с использованием LipofectamineTM контрольной плазмидой (GFP), плазмидой, экспрессирующей hGAA дикого типа под транскрипционным управлением специфического промотора печени (обозначено как sp1), или плазмидами, экспрессирующими hGAA с оптимизированной последовательностью (hGAAco), слитой с сигнальными пептидами 1-8 (sp2 (sp1-8) синтетического происхождения или полученными из других высоко секретируемых белков. Через 48 часов после трансфекции активность hGAA в средах для культивирования измеряли с помощью флуорогенного ферментативного анализа и активность GAA оценивали по калибровочной кривой для 4-метилумбеллиферона. На графике гистограммы показано усредненное±SE для уровней секретируемого hGAA, происходящих из трех различных экспериментов. Статистический анализ выполняли посредством ANOVA (*=p<0,05 в сравнении с клетками с имитированной трансфекцией). Часть B. График гистограммы показывает усредненное±SE для активности hGAA в сыворотке мышей C57Bl6J в возрасте 3 месяцев (n=5 мышей/группа) через 1 месяц после инъекции PBS (PBS) или 1E12 вг/кг AAV8 векторов, экспрессирующих hGAA с оптимизированной последовательностью (hGAAco) под транскрипционным управлением промотора α-1-антитрипсина человека и слитой с сигнальными пептидами с 1 до 3 и 7-8 (sp1-3, 7-8). Активность hGAA в сыворотке количественно определяли посредством флуорогенного ферментативного анализа и активность GAA оценивали по калибровочной кривой для рекомбинантного белка hGAA. Статистический анализ выполняли посредством ANOVA (*=p<0,05 в сравнении с инъекцией PBS, =p<0,05 в сравнении с sp2).
Фиг. 2. Сигнальный пептид sp7 увеличивает уровни циркулирующей hGAA и купирует дыхательную недостаточность в модели болезни Помпе на мышах. В возрасте 4 месяцев мышам дикого типа (WT) и GAA-/- мышам (n=6-9 мышей/группа) внутривенно инъецировали PBS или 2E12 вг/кг AAV8 векторов, экспрессирующих hGAA с оптимизированной последовательностью (hGAAco) под транскрипционным управлением промотора α-1-антитрипсина человека и слитой с сигнальными пептидами 1, 2, 7 и 8 (sp1, 2, 7, 8). Часть A. График гистограммы показывает активность hGAA, измеряемую посредством флуорогенного анализа в крови через 3 месяца после инъекции векторов. Статистический анализ выполняли посредством ANOVA (*=p<0,05 как указано, =p<0,05 в сравнении с мышами, которые получали лечение с sp1). Часть B. Кривую выживаемости Каплана-Мейера измеряли на мышах, которых лечили, как описано выше, и наблюдали в течение 6 месяцев. Статистический анализ выполняли посредством логарифмического рангового критерия (*=p<0,05). Часть C. Оценка дыхательной функции. Гистограммы показывают дыхательный объем, в миллилитрах (мл), который измеряли через три (серые столбцы) и шесть (черные столбцы) месяцев после лечения указанными векторами. Статистический анализ выполняли посредством ANOVA, на гистограмме приведены p-значения, получаемые в сравнении с GAA-/- животными, которых лечили с sp1 (*=p<0,05).
Фиг. 3. Биохимическая коррекция содержания гликогена в квадрицепсе. В возрасте 4 месяцев GAA-/- мышам внутривенно инъецировали PBS или 2E12 вг/кг AAV8 векторов, экспрессирующих hGAA с оптимизированной последовательностью (hGAAco) под транскрипционным управлением промотора α-1-антитрипсина человека и слитой с сигнальными пептидами 1, 7 и 8 (sp1, 7, 8). Часть A. активность hGAA измеряли посредством флуорогенного анализа в квадрицепсе. Часть B. На гистограмме представлено содержание гликогена, выражаемое в виде глюкозы, высвобождаемой после ферментативного расщепления гликогена, измеряемого в квадрицепсе. Статистический анализ выполняли посредством ANOVA (*=p<0,05 в сравнении с GAA-/- мышами, которым инъецировали PBS).
Фиг. 4. Биохимическая коррекция содержания гликогена в сердце, диафрагме и квадрицепсе. В возрасте 4 месяцев мышам дикого типа (WT) и GAA-/- мышам (n=4-5 мышей/группа) внутривенно инъецировали PBS или 6E11 вг/кг AAV8 векторов, экспрессирующих hGAA с оптимизированной последовательностью (hGAAco) под транскрипционным управлением промотора α-1-антитрипсина человека и слитой с сигнальными пептидами 1, 7 и 8 (sp1, 7, 8). Часть A. График гистограммы показывает активность hGAA, измеряемую посредством флуорогенного анализа в крови через 3 месяца после инъекции вектора. Статистический анализ выполняли посредством ANOVA, на гистограмме приведены p-значения, полученные в сравнении с GAA-/- животными, которых лечили PBS (*=p<0,05). Часть B-D. Графики гистограмм показывают содержание гликогена, выражаемое в виде глюкозы, высвобождаемой после ферментативного расщепления гликогена, измеряемого в сердце (часть B), диафрагме (часть C) и квадрицепсе (часть D). Статистический анализ выполняли посредством ANOVA (*=p<0,05 в сравнении с GAA-/- мышами, которым инъецировали PBS, =p<0,05 в сравнении с мышами, которых лечили sp1).
Фиг. 5. Высоко секретируемая hGAA снижает гуморальные ответы, направленные на трансген в модели болезни Помпе на мышах. В возрасте 4 месяцев GAA-/- мышам внутривенно инъецировали PBS или две различные дозы (5E11 или 2E12 вг/кг) AAV8 векторов, содержащих оптимизированную последовательность под транскрипционным управлением промотора α-1-антитрипсина человека, которые кодируют Δ8 hGAA, слитой с сигнальным пептидом 1 (co), сигнальным пептидом 2 (sp2-Δ8-co), сигнальным пептидом 7 (sp7-Δ8-co) или сигнальным пептидом 8 (sp8-Δ8-co). Через 1 месяц после инъекций, сыворотки анализировали на присутствие антител против hGAA посредством ELISA. Количественное определение выполняли с использованием очищенного IgG мыши в качестве стандарта. Статистический анализ выполняли посредством ANOVA с использованием апостериорного критерия Даннета (*=p<0,01).
Фиг. 6. Инъекция AAV8-hAAT-sp7-Δ8-hGAAco1 ведет к эффективной секреции hGAA в крови и захвату в мышце у NHP. Двум обезьянам Macaca fascicularis в сутки 0 инъецировали 2E12 вг/кг AAV8-hAAT-sp7-Δ8-hGAAco1. Часть A. Выполняли вестерн-блоттинг hGAA в сыворотке от двух обезьян, которую получали за 12 суток до и через 30 суток после введения вектора. Слева показаны положения полос маркера молекулярной массы (st), идущего параллельно с образцами. Часть B. Через 3 месяца после инъекции вектора обезьян умерщвляли и собирали ткани для биохимической оценки захвата hGAA. Вестерн-блоттинг hGAA осуществляли в экстрактах тканей, полученных из бицепса и диафрагмы. Антитело против тубулина использовали в качестве контроля загрузки. Слева показаны положения полос маркера молекулярной массы, идущего параллельно с образцами.
Фиг. 7. Увеличенная активность GAA в средах клеток, трансфицированных плазмидами, кодирующими варианты GAA, комбинированные с гетерологичным сигнальным пептидом sp7 или sp8. Активность GAA измеряли в средах (части A) и лизатах (части B) клеток HuH7 через 48 часов после трансфекции плазмидами, содержащими оптимизированные последовательности, кодирующие нативную GAA, комбинированную с нативным сигнальным пептидом sp1 GAA (co), или кодирующие сконструированную GAA, содержащую нативную GAA, комбинированную с гетерологичным сигнальным пептидом sp7 или sp8 (sp7-co или sp8-co). Плазмиду, кодирующую eGFP, использовали в качестве отрицательного контроля. Статистический анализ осуществляли посредством однофакторного дисперсионного анализа с апостериорным критерием Тьюки. Данные представляют собой усредненные±SD для двух независимых экспериментов. *p<0,05, **p<0,01, ***p<0,001, ****p<0,0001.
Фиг. 8. Биохимическая коррекция содержания гликогена в печени GDE-/- животных, которым инъецировали экспрессирующий hGAA вектор. В возрасте 3 месяцев мышам дикого типа (WT) или GDE-/- мышам внутривенно инъецировали PBS или AAV8 векторы, экспрессирующие hGAA с оптимизированными кодонами под транскрипционным управлением промотора α-1-антитрипсина человека и слитую с сигнальным пептидом 7 (AAV8-hAAT-sp7-Δ8-hGAAco1) в дозе 1E11 или 1E12 вг/мышь. График гистограммы показывает содержание гликогена, выражаемое в виде глюкозы, высвобождаемой после ферментативного расщепления гликогена, измеряемого в печени. Статистический анализ осуществляли посредством ANOVA (*=p<0,05 в сравнении с GDE-/- мышами, которым инъецировали PBS, =p<0,05 в сравнении с животными WT, которым инъецировали PBS).
Фиг. 9. Активность GAA в средах клеток, трансфицированных плазмидами, кодирующими различные варианты GAA. Активность GAA измеряли в средах клеток HuH7 через 24 (часть A) и 48 (часть B) часов после трансфекции плазмидами, содержащими оптимизированные последовательности, кодирующие нативную GAA, комбинированную с нативным сигнальным пептидом sp1 GAA (co), или кодирующие сконструированную GAA, содержащую нативную GAA, комбинированную с гетерологичным сигнальным пептидом sp7 (sp7-co). Оценивали эффект различных делеций в кодирующей последовательности GAA после сигнального пептида sp7 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co). Плазмиду, кодирующую eGFP, использовали в качестве отрицательного контроля. Статистический анализ осуществляли посредством однофакторного дисперсионного анализа с апостериорным критерием Тьюки. Знак диез (#) в столбцах обозначает статистически значимые различия в сравнении с co; символ тау (τ) обозначает статистически значимые различия в сравнении с sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co. Данные представляют собой усредненное±SD для двух независимых экспериментов. *p<0,05, **p<0,01, ***p<0,001, ****p<0,0001, за исключением использования различных символов.
Фиг. 10. Внутриклеточная активность GAA различных вариантов GAA. Активность GAA измеряли в лизатах клеток HuH7 через 48 часов после трансфекции плазмидами, содержащими оптимизированные последовательности, кодирующие нативную GAA, комбинированную с нативным сигнальным пептидом sp1 GAA (co), или кодирующие сконструированную GAA, содержащую нативную GAA, комбинированную с гетерологичным сигнальным пептидом sp7 (sp7-co). Оценивали эффект различных делеций в кодирующей последовательности GAA после сигнального пептида (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co). Плазмиду, кодирующую eGFP, использовали в качестве отрицательного контроля. Статистический анализ осуществляли посредством однофакторного дисперсионного анализа с апостериорным критерием Тьюки. Символ тау (τ) обозначает статистически значимые различия в сравнении с sp7-co, sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co. Данные представляют собой усредненное±SD для двух независимых экспериментов. *p<0,05, **p<0,01, ***p<0,001, ****p<0,0001, за исключением использования различных символов.
Фиг. 11. Увеличенная активность GAA в средах клеток при использовании делеции Δ8, комбинированной с сигнальными пептидами sp6 или sp8. Активность GAA измеряли в средах (часть A) и лизатах (часть B) клеток HuH7 через 48 часов после трансфекции плазмидами, содержащими оптимизированные последовательности, кодирующие нативную GAA, комбинированную с нативным сигнальным пептидом sp1 GAA (co), или кодирующие сконструированную GAA, содержащую нативную GAA, комбинированную с гетерологичным сигнальным пептидом sp6 или sp8 (sp6-co или sp8-co). Оценивали эффект делеции 8 аминокислот в кодирующей последовательности GAA после сигнального пептида (sp6-Δ8-co, sp8-Δ8-co). Плазмиду, кодирующую eGFP, использовали в качестве отрицательного контроля. Статистический анализ осуществляли посредством однофакторного дисперсионного анализа с апостериорным критерием Тьюки. Звездочки в столбцах обозначают статистически значимые различия в сравнении с co. Данные представляют собой усредненное±SD для двух независимых экспериментов. *p<0,05, **p<0,01, ***p<0,001, ****p<0,0001, за исключением использования различных символов.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Настоящее изобретение относится к молекуле нуклеиновой кислоты, кодирующей химерный полипептид GAA. Этот химерный полипептид GAA содержит фрагмент сигнального пептида и фрагмент функциональной GAA, где фрагмент сигнального пептида выбирают в группе, состоящей из SEQ ID NO: с 2 до 4. Авторы изобретения к удивлению показали, что слияние одного из этих сигнальных пептидов с белком GAA значительно усовершенствует секрецию GAA, при этом снижая ее иммуногенность.
Лизосомная кислая α-глюкозидаза или «GAA» (E.C. 3.2.1.20) (1,4-α-D-глюканглюкогидролаза) представляет собой экзо-1,4-α-D-глюкозидазу, которая гидролизует как α-1,4, так и α-1,6 связи в олигосахаридах для того, чтобы высвобождать глюкозу. Недостаточность GAA ведет к болезни накопления гликогена II типа (GSDII), также обозначаемой как болезнь Помпе (несмотря на то, что этот термин формально относится к форме заболевания с детским началом). Она катализирует полное разрушение гликогена с замедлением в точках ветвления. ген кислой α-глюкозидазы человека в 28 т.о. на хромосоме 17 кодирует мРНК в 3,6 т.о., которая продуцирует полипептид из 952 аминокислот (Hoefsloot et al., (1988) EMBO J. 7: 1697; Martiniuk et al., (1990) DNA and Cell Biology 9: 85). Фермент допускает котрансляционное N-связанное гликозилирование в эндоплазматическом ретикулуме. Он синтезируются в виде формы предшественника 110 кДа, которая созревает путем обширной модификации гликозилирования, фосфорилирования и путем протеолитического процессинга через эндосомальную промежуточную структуру приблизительно 90 кДа до конечных лизосомных форм 76 и 67 кДа (Hoefsloot, (1988) EMBO J. 7: 1697; Hoefsloot et al., (1990) Biochem. J. 272: 485; Wisselaar et al., (1993) J. Biol. Chem. 268: 2223; Hermans et al., (1993) Biochem. J. 289: 681).
У пациентов с GSDII недостаточность кислой α-глюкозидазы вызывает массовое накопление гликогена в лизосомах, нарушая клеточную функцию (Hirschhorn, R. и Reuser, A. J. (2001), The Metabolic and Molecular Basis for Inherited Disease, (ред. Scriver, C. R. et al.), стр. 3389-3419 (McGraw-Hill, New York). При наиболее распространенной детской форме пациенты демонстрируют нарастающую дегенерацию мышц и кардиомиопатию и погибают до достижения возраста в два года. В формах с ювенильным и взрослым началом имеет место тяжелое истощение.
Кроме того, пациенты, имеющие другие GSD, могут получать пользу от введения оптимизированной формы GAA. Например, показано (Sun et al. (2013) Mol Genet Metab 108(2): 145; WO2010/005565), что введение GAA снижает гликоген в первичных миобластах у пациентов с болезнью накопления гликогена III типа (GSDIII).
Термин «GAA» или «полипептид GAA», как используют в настоящем описании, охватывает зрелый (~76 или ~67 кДа) и предшественника (например, ~110 кДа) GAA, в частности, форму предшественника, а также модифицированные или мутированные посредством инсерции(й), делеции(й) и/или замены(н)) белки GAA или их фрагменты, которые представляют собой функциональные производные GAA, т.е. которые сохраняют биологическую функцию GAA (т.е. имеют по меньшей мере одну биологическая активность нативного белка GAA, например, могут гидролизовать гликоген, как определено выше), и варианты GAA (например, GAA II, как описано Kunita et al., (1997) Biochemica et Biophysica Acta 1362: 269; полиморфизмы и SNP в GAA описаны Hirschhorn, R. and Reuser, A. J. (2001) The Metabolic and Molecular Basis for Inherited Disease (ред. Scriver, C. R., Beaudet, A. L., Sly, W. S. и Valle, D.), стр. 3389-3419. McGraw-Hill, New York, см. стр. 3403-3405). Любую кодирующую последовательность GAA, известную в данной области, можно использовать, например, см. SEQ ID NO: 1; номер доступа Genbank NM_00152 и Hoefsloot et al., (1988) EMBO J. 7: 1697 и Van Hove et al., (1996) Proc. Natl. Acad. Sci. USA 93: 65 (человек), номер доступа Genbank NM_008064 (мышь) и Kunita et al., (1997) Biochemica et Biophysica Acta 1362: 269 (перепелка).
В контексте настоящего изобретения, «форма предшественника GAA» представляет собой форму полипептида GAA, которая содержит ее природный сигнальный пептид. Например, последовательности из SEQ ID NO: 12 и SEQ ID NO: 37 представляют собой формы предшественника вариантов GAA человека (hGAA). В SEQ ID NO: 12 и SEQ ID NO: 37, аминокислотные остатки 1-27 соответствуют сигнальному пептиду полипептида hGAA.
В контексте настоящего изобретения, усеченный полипептид GAA по изобретению происходит из родительского полипептида GAA. В соответствии с настоящим изобретением, «родительский полипептид GAA» может представлять собой функциональную последовательность предшественника GAA, как определено выше, но свободную от ее сигнального пептида. Например, со ссылкой на полипептид GAA человека дикого типа, полный полипептид GAA дикого типа (т. е. форму предшественника GAA) представлен в SEQ ID NO: 12 или SEQ ID NO: 37 и имеет сигнальный пептид (соответствующий аминокислотам 1-27 из SEQ ID NO: 12 или SEQ ID NO: 37), тогда как родительский полипептид GAA, служащий в качестве основы для усеченных форм GAA этого этих полипептидов GAA человека дикого типа, представлены в SEQ ID NO: 5 и SEQ ID NO: 36 и не имеют сигнального пептида. В этом примере, последнее, соответствующее аминокислотам 28-952 из SEQ ID NO: 12 и аминокислотам 28-952 из SEQ ID NO: 37, обозначают как родительский полипептид GAA.
Кодирующая последовательность полипептида GAA может происходить из любого источника, в том числе биологических видов птиц и млекопитающих. Термин «птицы», как используют в настоящем описании, включает, но не ограничиваясь этим, курицу, утку, гуся, перепелку, индюшку и фазана. Термин «млекопитающее», как используют в настоящем описании, включает, но не ограничиваясь этим, человека, обезьянообразных и других не являющиеся человеком приматов, корову, овцу, козу, лошадь, кошку, собаку, зайцеобразных и т.д. В вариантах осуществления изобретения, нуклеиновые кислоты по изобретению кодируют полипептид GAA человека, мыши или перепелки, в частности человека. В дополнительном конкретном варианте осуществления полипептид GAA, кодируемый молекулой нуклеиновой кислоты по изобретению, содержит аминокислотную последовательность, приведенную в SEQ ID NO: 5 или в SEQ ID NO: 36, которая соответствует hGAA без ее сигнального пептида (следует отметить, что природный сигнальный пептид из hGAA соответствует аминокислотам 1-27 в SEQ ID NO: 12 или в SEQ ID NO: 37, которые соответствуют hGAA, содержащей ее природный сигнальный пептид).
В другом варианте осуществления изобретения, молекула нуклеиновой кислоты по изобретению обладает по меньшей мере 75% (например, по меньшей мере 77%), по меньшей мере 80% или по меньшей мере 82% (например, по меньшей мере 83%) идентичностью с нуклеотидами 82-2859 из последовательности, приведенной в SEQ ID NO: 1, которая представляет собой последовательность, кодирующую hGAA дикого типа из SEQ ID NO: 37 (нуклеотиды 1-81 из SEQ ID NO: 1 являются частью, кодирующей природный сигнальный пептид hGAA).
Фрагмент GAA молекулы нуклеиновой кислоты по изобретению предпочтительно обладает по меньшей мере 85%, более предпочтительно по меньшей мере 90% и даже более предпочтительно по меньшей мере 92% идентичностью, в частности, по меньшей мере 95% идентичность, например, по меньшей мере 98, 99 или 100% идентичностью с нуклеотидной последовательностью из SEQ ID NO: 13 или 14, которые представляют собой последовательности, оптимизированные для экспрессии трансгена in vivo.
Кроме того, фрагмент сигнального пептида химерного белка GAA, кодируемого молекулой нуклеиновой кислоты по изобретению, может содержать от 1 до 5, в частности от 1 до 4, в частности от 1 до 3, более конкретно от 1 до 2, в частности 1 аминокислотную делецию(и), инсерцию(и) или замену(ы) по сравнению с последовательностями, приведенными в SEQ ID NO: с 2 до 4, до тех пор пока получаемая последовательность соответствует функциональному сигнальному пептиду, т. е. сигнальному пептиду, который допускает секрецию белка GAA. В конкретном варианте осуществления последовательность фрагмента сигнального пептида состоит из последовательности, выбранной в группе, состоящей из SEQ ID NO: с 2 до 4.
Термин «идентичный» и его производные относятся к идентичности последовательностей между двумя молекулами нуклеиновой кислоты. Когда положение в обеих из двух сравниваемых последовательностей занимает одно и то же основание, например, если положение в каждой из двух молекул ДНК занимает аденин, то молекулы идентичны в этом положении. % идентичности между двумя последовательностями представляет собой функцию числа совпадающих положений, которыми обладают две последовательности, деленного на число сравниваемых положений, × 100. Например, если 6 из 10 положений в двух последовательностях совпадают, то две последовательности идентичны на 60%. В целом, сравнение выполняют, когда две последовательности выровнены для того, чтобы давать максимальную идентичность. Различные биоинформационные инструменты, известные специалисту в данной области, можно использовать для выравнивания последовательностей нуклеиновой кислоты, например, BLAST или FASTA.
В конкретном варианте осуществления фрагмент GAA молекулы нуклеиновой кислоты по изобретению содержит последовательность, приведенную в SEQ ID NO: 13 или SEQ ID NO: 14.
Молекула нуклеиновой кислоты по изобретению кодирует функциональный полипептид GAA, т.е. она кодирует полипептид GAA человека, который, при экспрессии, обладает функциональностью белка GAA дикого типа. Как определено выше, функциональность GAA дикого типа состоит в том, чтобы гидролизовать как α-1,4, так и α-1,6 связи олигосахаридов и полисахаридов, более конкретно гликогена, чтобы высвобождать глюкозу. Функциональный полипептид GAA, кодируемый нуклеиновой кислотой по изобретению, может обладать гидролитической активностью в отношении гликогена по меньшей мере в 50%, 60%, 70%, 80%, 90%, 95%, 99% или по меньшей мере 100% по сравнению с полипептидом GAA дикого типа, кодируемым последовательностью нуклеиновой кислоты из SEQ ID NO: 1, SEQ ID NO: 13 или SEQ ID NO: 14 (т.е. полипептидом GAA, который имеет аминокислотную последовательность из SEQ ID NO: 5). Активность белка GAA, кодируемого нуклеиновой кислотой по изобретению, может составлять даже больше чем 100%, например, больше чем 110%, 120%, 130%, 140% или даже больше чем 150% активности полипептида GAA дикого типа, кодируемого последовательностью нуклеиновой кислоты из SEQ ID SEQ ID NO: 1, № 13 или SEQ ID NO: 14 (т.е. полипептида GAA, имеющего аминокислотную последовательность из SEQ ID NO: 5).
Специалист без труда сможет определять, экспрессирует ли нуклеиновая кислота в соответствии с изобретением функциональный белок GAA. Подходящие способы будут видны специалистам в данной области. Например, один подходящий способ in vitro включает встраивание нуклеиновой кислоты в вектор, такой как плазмида или вирусный вектор, трансфекцию или трансдукцию клеток-хозяев, таких как клетки 293T или HeLa, или других клеток, таких как Huh7, с использованием вектора, и анализ активности GAA. Альтернативно, подходящий способ in vivo включает трансдукцию вектора, содержащего нуклеиновую кислоту, в модели болезни Помпе на мышах или другого нарушения накопления гликогена и анализ функциональной GAA в плазме мыши и присутствия GAA в тканях. Подходящие способы описаны более подробно далее в экспериментальной части.
Авторы изобретения обнаружили, что описанная выше молекула нуклеиновой кислоты обеспечивает к удивлению высокие уровни экспрессии функционального белка GAA как in vitro, так и in vivo, по сравнению с кДНК GAA дикого типа. Кроме того, что также показано авторами изобретения, химерный полипептид GAA, продуцируемый клетками печени и мышц, экспрессирующими молекулу нуклеиновой кислоты по изобретению, не индуцирует гуморальный иммунный ответ на трансген. Это обозначает, что эту молекулу нуклеиновой кислоты можно использовать для продуцирования высоких уровней полипептида GAA, и она обеспечивает терапевтические эффекты, такие как возможность избежать иммуносупрессорного лечения, возможность иммуносупрессорного лечения в низких дозах и возможность повторного введения молекулы нуклеиновой кислоты по изобретению нуждающемуся в этом субъекту. Следовательно, молекула нуклеиновой кислоты по изобретению представляет особый интерес в контексте, где имеет место дефицит экспрессии и/или активности GAA или где высокие уровни экспрессии GAA могут облегчать заболевание, например, при болезни накопления гликогена. Конкретно болезнь накопления гликогена может представлять собой GSDI (болезнь Гирке), GSDII (болезнь Помпе), GSDIII (болезнь Кори), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII или летальную врожденную болезнь накопления гликогена в сердце. Более конкретно, болезнь накопления гликогена выбирают в группе, состоящей из GSDI, GSDII и GSDIII, даже более конкретно в группе, состоящей из GSDII и GSDIII. В даже более конкретном варианте осуществления, болезнь накопления гликогена представляет собой GSDII. В частности, молекулы нуклеиновой кислоты по изобретению можно использовать при генной терапии для того, чтобы лечить GAA-дефицитные состояния или другие условия, ассоциированные с накоплением гликогена, такие как GSDI (болезнь Гирке), GSDII (болезнь Помпе), GSDIII (болезнь Кори), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII и летальная врожденная болезнь накопления гликогена в сердце, более конкретно GSDI, GSDII или GSDIII, даже более конкретно GSDII и GSDIII. В даже более конкретном варианте осуществления, молекулы нуклеиновой кислоты по изобретению можно использовать при генной терапии для того, чтобы лечить GSDII.
Последовательность молекулы нуклеиновой кислоты по изобретению, кодирующей функциональную GAA, оптимизируют для экспрессии полипептида GAA in vivo. Оптимизация последовательности может включать множество изменений в последовательности нуклеиновой кислоты, в том числе оптимизацию кодонов, увеличение содержания GC, снижение числа островков CpG, снижение числа альтернативных открытых рамок считывания (ARF) и снижение числа участков доноров сплайсинга и акцепторов сплайсинга. По причине вырожденности генетического кода, различные молекулы нуклеиновой кислоты могут кодировать один и тот же белок. Также хорошо известно, что генетические коды различных организмов часто смещены в сторону использования одного из нескольких кодонов, которые кодируют одну и ту же аминокислоту, относительно других. Через оптимизацию кодонов в нуклеотидную последовательность вводят изменения, которые дают преимущество предпочтения кодонов, существующего в заданном клеточном контексте, чтобы экспрессия получаемой нуклеотидной последовательности с оптимизированными кодонами с большей вероятностью происходила в таком заданном клеточном контексте на относительно высоком уровне по сравнению с последовательностью без оптимизированных кодонов. В предпочтительном варианте осуществления изобретения, такая нуклеотидная последовательность с оптимизированной последовательностью, кодирующая усеченную GAA, имеет оптимизацию кодонов для того, чтобы усовершенствовать ее экспрессию в клетках человека по сравнению с нуклеотидными последовательностями без оптимизированных кодонов, кодирующими тот же усеченный белок GAA, например, используя преимущество предпочтения конкретных кодонов у человека.
В таблице 3 приведено описание релевантных параметров в отношении оптимизации последовательности, проведенной авторами изобретения:
Таблица 3. Описание оптимизированных последовательностей. В таблице приведены характеристики двух оптимизированных последовательностей hGAA по сравнению с последовательностью дикого типа. a) коэффициент адаптации кодонов и b) содержание GC вычисляли с использованием инструмента анализа редких кодонов (http://www.genscript.com). c) и d) соответственно представляют собой альтернативные открытые рамки считывания, вычисленные на 5'-3' (aORF 5'→3') и 3'-5' (aORF 3'→5') нитях. e) и f) соответственно представляют собой участки акцепторов (SA) и доноров (SD) сплайсинга, вычисленные с использованием онлайн-инструмента предсказания участков сплайсинга (http://www.fruitfly.org/seq_tools/splice.html). g) и h) соответственно представляют собой процент идентичности, вычисляемый в сравнении с последовательностью дикого типа (wt) и оптимизированной последовательностью co1. i) островки CpG вычисляли с использованием онлайн-инструмента MethDB (http://www.methdb.de/links.html). Островки CpG представляют собой последовательности длиннее 100 п.о., с содержанием GC >60% и соотношением наблюдаемые/ожидаемые >0,6.
В конкретном варианте осуществления оптимизированная кодирующая последовательность GAA имеет оптимизированные кодоны и/или имеет повышенное содержание GC и/или имеет сниженное число альтернативных открытых рамок считывания и/или имеет сниженное число участков доноров сплайсинга и/или акцепторов сплайсинга, по сравнению с нуклеотидами 82-2859 кодирующей последовательности hGAA дикого типа из SEQ ID NO: 1. Например, последовательность нуклеиновой кислоты по изобретению ведет к по меньшей мере 2, 3, 4, 5 или 10% увеличению содержания GC в последовательности GAA по сравнению с последовательностью последовательности GAA дикого типа. В конкретном варианте осуществления последовательность нуклеиновой кислоты по изобретению ведет к 2, 3, 4 или, более конкретно, 5% или 10% (в частности, 5%) увеличению содержания GC в последовательности GAA по сравнению с последовательностью нуклеотидной последовательности GAA дикого типа. В конкретном варианте осуществления последовательность нуклеиновой кислоты по изобретению, кодирующая функциональный полипептид GAA, является «по существу идентичной», то есть приблизительно на 70% идентичной, более предпочтительно приблизительно на 80% идентичной, даже более предпочтительно приблизительно на 90% идентичной, даже более предпочтительно приблизительно на 95% идентичной, даже более предпочтительно приблизительно на 97%, 98% или даже 99% идентичной нуклеотидам 82-2859 из последовательности, приведенной в SEQ ID NO: 1. Как указано выше, в дополнение к содержанию GC и/или числу ARF, оптимизация последовательности также может включать снижение числа островков CpG в последовательности и/или снижение числа участков доноров сплайсинга и акцепторов сплайсинга. Конечно, специалистам в данной области хорошо известно, что оптимизация последовательности представляет собой баланс между всеми этими параметрами, что обозначает, что последовательность можно считать оптимизированной, если по меньшей мере один из вышеуказанных параметров усовершенствован, тогда как один или несколько других параметров нет, до тех пор пока оптимизированная последовательность ведет к усовершенствованию трансгена, такому как усовершенствованная экспрессия и/или сниженный иммунный ответ на трансген in vivo.
Кроме того, адаптивность нуклеотидной последовательности, кодирующей функциональную GAA, к использованию кодонов клетками человека можно выражать в виде коэффициента адаптации кодонов (CAI). Коэффициент адаптации кодонов определяют в настоящем описании как измерение относительной адаптивности к использованию кодонов гена относительно использования кодонов высоко экспрессируемыми генами человека. Относительная адаптивность (w) каждого кодона представляет собой соотношение использования каждого кодона к таковому для наиболее распространенного кодона для одной и той же аминокислоты. CAI определяют как геометрическое среднее этих значений относительной адаптивности. Не синонимические кодоны и терминирующие кодоны (в зависимости от генетического кода) исключают. Значения CAI находятся в диапазоне от 0 до 1, причем более высокие значения указывают на более высокую долю наиболее распространенных кодонов (см. Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295; также см.: Kim et al, Gen. 1997, 199:293-301; zur Megede et al, Journal of Virology, 2000, 74: 2628-2635). Предпочтительно, молекула нуклеиновой кислоты, кодирующая GAA, имеет CAI по меньшей мере 0,75 (в частности 0,77), 0,8, 0,85, 0,90, 0,92 или 0,94.
В одном из вариантов осуществления молекула нуклеиновой кислоты по изобретению кодирует белок, имеющий между 0 и 50, между 0 и 30, между 0 и 20, между 0 и 15, между 0 и 10 или между 0 и 5 аминокислотными изменениями в белке, кодируемом нуклеотидной последовательностью из SEQ ID NO: 13 или SEQ ID NO: 14. Кроме того, белок GAA, кодируемый нуклеиновой кислотой по изобретению, может представлять собой вариант функционального белка GAA, известный в данной области, где молекула нуклеиновой кислоты по изобретению кодирует белок, имеющий между 0 и 50, между 0 и 30, между 0 и 20, между 0 и 15, между 0 и 10 или между 0 и 5 аминокислотными изменениями в белке GAA, известном в данной области. Такой белок GAA, известный в данной области, который может служить в качестве основы для разработки функционального варианта, можно найти, в частности, в записи Uniprot для GAA (номер доступа P10253; соответствует BenBank CAA68763.1; SEQ ID NO: 37). В дополнительном конкретном варианте осуществления, фрагмент GAA последовательности нуклеиновой кислоты по изобретению кодирует варианты полипептидов GAA или функциональные варианты таких пептидов, как определено в настоящем описании, такие как те, которые выбраны в группе, состоящей из полипептидов, идентифицированных под номерами доступа Genbank AAA52506.1 (SEQ ID NO: 38), EAW89583.1 (SEQ ID NO: 39) и ABI53718.1 (SEQ ID NO: 40). Другие варианты полипептидов GAA включают те, которые описаны в WO2012/145644, WO00/34451 и US6858425. В конкретном варианте осуществления родительский полипептид GAA происходит из аминокислотной последовательности, приведенной в SEQ ID NO: 12 или SEQ ID NO: 37.
В конкретном варианте осуществления полипептид GAA, кодируемый молекулой нуклеиновой кислоты по изобретению, представляет собой функциональную GAA и обладает идентичностью последовательностей с белком hGAA, приведенным в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, необязательно с учетом проведенного усечения, если усеченную форму считают эталоном для идентичности последовательностей, по меньшей мере 80%, в частности, по меньшей мере 85%, 90%, 95%, более конкретно по меньшей мере 96%, 97%, 98% или 99%. В конкретном варианте осуществления белок GAA, кодируемый молекулой нуклеиновой кислоты по изобретению, имеет последовательность, приведенную в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5.
Термины «идентичный» и его производные, когда относятся к полипептиду, обозначают, что, когда положение в двух сравниваемых полипептидных последовательностях занимает одна и та же аминокислота (например, если положение в каждом из двух полипептидов занимает лейцин), то полипептиды идентичны в этом положении. % идентичности между двумя полипептидами представляет собой функцию числа совпадающих положений, которые имеют две последовательности, деленного на число сравниваемых положений, × 100. Например, если 6 из 10 положений в двух полипептидах совпадают, то две последовательности идентичны на 60%. В целом, сравнение выполняют, когда две последовательности выровнены так, чтобы давать максимальную идентичность. Различные биоинформационные инструменты, известные специалисту в данной области, можно использовать для выравнивания последовательностей нуклеиновой кислоты, такие как BLAST или FASTA.
Термин «последовательность нуклеиновой кислоты» (или молекула нуклеиновой кислоты) относится к молекуле ДНК или РНК в одно- или двухцепочечной форме, в частности, ДНК, кодирующей белок GAA в соответствии с изобретением.
Изобретение также относится к молекуле нуклеиновой кислоты, кодирующей химерный функциональный полипептид GAA, содержащий сигнальный пептид, выбранный в группе, состоящей из SEQ ID NO: с 2 до 4.
В частности, авторы изобретения, кроме того, к удивлению, показали, что замена сигнального пептида ведет к продуцированию более высоких уровней экспрессии и более высокой секреции функционального полипептида GAA по сравнению с другим химерным полипептидом GAA, содержащим GAA, слитую с сигнальным пептидом α-1-антитрипсина человека, о котором сообщалось ранее (hAAT, химерный белок GAA, описанный в WO2004064750 и Sun et al., 2006). В молекуле нуклеиновой кислоты по изобретению, фрагмент сигнального пептида соответствует последовательности, кодирующей сигнальный пептид, имеющий аминокислотную последовательность, выбранную в группе, состоящей из SEQ ID NO: с 2 до 4 (иначе обозначают в настоящем описании как «альтернативный сигнальный пептид»). Молекула нуклеиновой кислоты по изобретению дополнительно может представлять собой оптимизированную последовательность, кодирующую химерный полипептид GAA, содержащий альтернативный сигнальный пептид, функционально связанный с функциональным полипептидом GAA.
По сравнению с полипептид GAA дикого типа, эндогенный сигнальный пептид в GAA дикого типа заменяют на экзогенный сигнальный пептид, т.е. сигнальный пептид, происходящий из белка, отличного от GAA. Экзогенный сигнальный пептид, слитый с остальной частью белка GAA, увеличивает секрецию получаемого химерного полипептида GAA по сравнению с соответствующим полипептидом GAA, содержащим его природный сигнальный пептид. Кроме того, в соответствии с конкретным вариантом осуществления изобретения, нуклеотидная последовательность, соответствующая альтернативному сигнальному пептиду, может представлять собой оптимизированную последовательность, как предусмотрено выше.
Сигнальные пептиды, работающие в настоящем изобретении, включают аминокислоты 1-25 из идуронат-2-сульфатазы (SEQ ID NO: 3), аминокислоты 1-20 из химотрипсиногена B2 (SEQ ID NO: 2) и аминокислоты 1-23 из ингибитора протеазы C1 (SEQ ID NO: 4). Сигнальные пептиды из SEQ ID NO: с 2 до 4 делают возможной более высокую секрецию химерного белка GAA как in vitro, так и in vivo, по сравнению с GAA, содержащей ее природный сигнальный пептид, или с химерным белком GAA, содержащим сигнальный пептид hAAT.
Относительную долю вновь синтезированной GAA, которую секретирует клетка, можно обычным образом определять с помощью способов, известных в данной области и описанных в примерах. Секретируемые белки можно обнаруживать путем непосредственного измерения самого белка (например, посредством Вестерн-блоттинга) или путем анализа активности белка (например, ферментативного анализа) в клеточной культуральной среде, сыворотке, молоке и т.д.
Специалисты в данной области, кроме того, поймут, что химерный полипептид GAA может содержать дополнительные аминокислоты, например, в результате манипуляций с конструкцией нуклеиновой кислоты, таких как добавление участка рестрикции, до тех пор, пока эти дополнительные аминокислоты не делают сигнальный пептид или полипептид GAA не функциональным. Дополнительные аминокислоты можно отщеплять или сохранять в зрелом полипептиде до тех пор, пока сохранение не ведет к нефункциональному полипептиду.
Кроме того, химерный полипептид GAA, кодируемый молекулой нуклеиновой кислоты, как описано в настоящем описании, может содержать фрагмент GAA, который представляет собой функциональную усеченную форму GAA. Под «усеченной формой» понимают полипептид GAA, который содержит одну или несколько последовательных аминокислот, удаленных из N-концевой части родительского полипептида GAA. Следовательно, фрагмент GAA в химерном полипептиде GAA по изобретению может представлять собой усеченную по N-концу форму родительского полипептида GAA. В соответствии с настоящим изобретением, «родительский полипептид GAA» представляет собой полипептид GAA, свободный от сигнального пептида, такой как форма предшественника GAA, свободная от сигнального пептида, в частности полипептид hGAA, приведенный в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и может представлять собой любой из вариантов, как раскрыто выше. Например, со ссылкой на типичные полипептиды GAA человека дикого типа, полный полипептид GAA дикого типа представлен в SEQ ID NO: 12 или в SEQ ID NO: 37 и имеет сигнальный пептид, тогда как родительский полипептид GAA, служащий в качестве основы для усеченной формы GAA этого полипептида GAA человека дикого типа, представлен в SEQ ID NO: 5 или SEQ ID NO: 36, соответственно, и не имеет сигнального пептида. В этом примере, последний обозначают как родительский полипептид GAA. В варианте по этому конкретному варианту осуществления, по меньшей мере одну аминокислоту удаляют с N-конца родительского белка GAA. В конкретном варианте осуществления фрагмент GAA может иметь по меньшей мере 1, в частности, по меньшей мере 2, в частности, по меньшей мере 3, в частности, по меньшей мере 4, в частности, по меньшей мере 5, в частности, по меньшей мере 6, в частности, по меньшей мере 7, в частности, по меньшей мере 8 последовательных аминокислот, удаленных с его N-конца, по сравнению с родительским полипептидом GAA. Например, фрагмент GAA может иметь от 1 до 75 последовательных аминокислот или больше чем 75 последовательных аминокислот, удаленных с его N-конца, по сравнению с родительским полипептидом GAA. В другом варианте осуществления указанный фрагмент GAA имеет самое большее 75, в частности самое большее 70, в частности самое большее 60, в частности самое большее 55, в частности самое большее 50, в частности самое большее 47, в частности самое большее 46, в частности самое большее 45, в частности самое большее 44, в частности самое большее 43 последовательных аминокислоты, удаленных на его N-конце, по сравнению с родительским полипептидом GAA. В дополнительном конкретном варианте осуществления, указанный фрагмент GAA имеет самое большее 47, в частности самое большее 46, в частности самое большее 45, в частности самое большее 44, в частности самое большее 43 последовательных аминокислоты, удаленных на его N-конце, по сравнению с родительским полипептидом GAA. В частности, усеченный фрагмент GAA может иметь 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74 или 75 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским белком GAA (в частности, усеченная форма родительского полипептида hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5). В другом конкретном варианте осуществления указанный фрагмент GAA имеет от 1 до 75, в частности, от 1 до 47, в частности, от 1 до 46, в частности, от 1 до 45, в частности, от 1 до 44, в частности, от 1 до 43 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA. В другом варианте осуществления указанный фрагмент GAA имеет от 2 до 43, в частности, от 3 до 43, в частности, от 4 до 43, в частности, от 5 до 43, в частности, от 6 до 43, в частности, от 7 до 43, в частности, от 8 до 43 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA (в частности, усеченная форма родительского полипептида hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5). Используя альтернативную номенклатуру, полипептид GAA в результате усечения 1 аминокислоты в родительском полипептиде GAA обозначают как Δ1 усеченную форму GAA, полипептид GAA в результате усечения 2 последовательных аминокислот с N-конца обозначают как Δ2 усеченную форму GAA, полипептид GAA в результате усечения 3 последовательных аминокислот в родительском полипептиде GAA обозначают как Δ3 усеченную форму GAA) и т.д. В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50, Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 или Δ75 усеченной формы GAA (в частности, усеченную форму родительского белка hGAA, приведенную в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 или Δ47 усеченной формы GAA (в частности, усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45 или Δ46 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44 или Δ45 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43 или Δ44 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления химерный белок GAA по изобретению содержит фрагмент Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ6, Δ7, Δ8, Δ9 или Δ10 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ7, Δ8 или Δ9 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ8 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ27, Δ28, Δ29, Δ30 или Δ31 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ28, Δ29 или Δ30 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ29 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В другом конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ40, Δ41, Δ42, Δ43 или Δ44 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ41, Δ42 или Δ43 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ42 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В другом конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ41, Δ42, Δ43, Δ44 или Δ45 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ42, Δ43 или Δ44 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ43 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В другом конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 или Δ47 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В другом конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 или Δ44 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В другом конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 или Δ44 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В другом конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ8, Δ29, Δ42, Δ43 или Δ47 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В другом конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ8, Δ29, Δ42 или Δ43 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В другом конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ8 или Δ42 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В конкретном варианте осуществления изобретения, химерный полипептид GAA по изобретению содержит усеченный фрагмент GAA, происходящий из функционального родительского полипептида GAA человека. В дополнительном конкретном варианте осуществления, родительский полипептид hGAA представляет собой полипептид hGAA, приведенный в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5. В варианте по этому варианту осуществления, фрагмент GAA в химерном полипептиде GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50, Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 или Δ75 усеченную форму GAA полипептида hGAA и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 или SEQ ID NO: 36, в частности с SEQ ID NO: 5. В дополнительном конкретном варианте осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 или Δ47, в частности Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 или Δ44, в частности Δ8, Δ29, Δ42 или Δ43, в частности Δ8 или Δ42 усеченную форму полипептида hGAA и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью (например 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью) с SEQ ID NO: 5 или SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45 или Δ46 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44 или Δ45 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43 или Δ44 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, даже более конкретно в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 SEQ ID NO: 36, в частности с SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9 или Δ10, в частности Δ7, Δ8 или Δ9, более конкретно Δ8 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ27, Δ28, Δ29, Δ30 или Δ31, в частности Δ28, Δ29 или Δ30, более конкретно Δ29 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ40, Δ41, Δ42, Δ43 или Δ44, в частности Δ41, Δ42 или Δ43, более конкретно Δ42 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ41, Δ42, Δ43, Δ44 или Δ45, в частности Δ42, Δ43 или Δ44, более конкретно Δ43 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44 или Δ45, в частности Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 или Δ44, в частности Δ8, Δ29, Δ42 или Δ43 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 или Δ44, в частности Δ8 или Δ42 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ8, Δ29, Δ42, Δ43 или Δ47 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ8, Δ29, Δ42 или Δ43 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5.
В другом варианте по этому варианту осуществления, фрагмент GAA химерного полипептида GAA по изобретению представляет собой Δ8 или Δ42 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5.
В конкретном варианте осуществления фрагмент GAA в химерном полипептиде GAA по изобретению имеет аминокислотную последовательность, состоящую из последовательности, приведенной в SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41, SEQ ID NO: 42 или SEQ ID NO: 43, в частности аминокислотные последовательности, состоящие из последовательности, приведенной в SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41 или SEQ ID NO: 42, в частности аминокислотные последовательности, состоящие из последовательности, приведенной в SEQ ID NO: 29 или SEQ ID NO: 30.
Изобретение также относится к конструкции нуклеиновой кислоты, содержащей молекулу нуклеиновой кислоты по изобретению. Конструкция нуклеиновой кислоты может соответствовать экспрессирующей кассете, содержащей последовательность нуклеиновой кислоты по изобретению, функционально связанную с одной или несколькими управляющими экспрессией последовательностями и/или другими последовательностями, усовершенствующими экспрессию трансгена, и/или последовательностями, усиливающими секрецию кодируемого белка, и/или последовательностями, усиливающими захват кодируемого белка. Как используют в настоящем описании, термин «функционально связанный» относится к связи полинуклеотидных элементов в функциональных отношениях. Нуклеиновая кислота «функционально связана», когда ее помещают в функциональные отношения с другой последовательностью нуклеиновой кислоты. Например, промотор или другая регулирующая транскрипцию последовательность функционально связаны с кодирующей последовательностью, если они влияют на транскрипцию кодирующей последовательности. В данной области известны такие управляющие экспрессией последовательности, например, промоторы, энхансеры (такие как цис-регуляторные модули (CRM)), интроны, сигналы полиА и т.д.
В частности, экспрессирующая кассета может содержать промотор. Промотор может представлять собой универсальный или тканеспецифический промотор, в частности, промотор способен содействовать экспрессии в клетках или тканях, в которых экспрессия GAA желательна, например, в клетках или тканях, в которых экспрессия GAA желательна, у пациентов с дефицитом GAA. В конкретном варианте осуществления промотор представляет собой специфический промотор печени, такой как промотор α-1-антитрипсина (hAAT) (SEQ ID NO: 15), промотор транстиретина, промотор альбумина, промотор тироксинсвязывающего глобулина (TBG), промотор LSP (содержащий последовательность промотора глобулина, связывающего тиреоидный гормон, две копии энхансерной последовательности α1-микроглобулина/бикунина и лидерную последовательность - 34.Ill, C. R., et al. (1997). Optimization of the human factor VIII complementary DNA expression plasmid for gene therapy of hemophilia A. Blood Coag. Fibrinol. 8: S23-S30.) и т.д. Другие эффективные специфические промоторы печени известны в данной области, например, те, которые перечислены в Liver Specific Gene Promoter Database, компилированной Cold Spring Harbor Laboratory (http://rulai.cshl.edu/LSPD/). Предпочтительным промотором в контексте изобретения является промотор hAAT. В другом варианте осуществления промотор представляет собой промотор, управляющий экспрессией в одной ткани или клетке, представляющей интерес, (например, в клетках мышцы), и в клетках печени. Например, в определенной степени, промоторы со специфичностью к клеткам мышцы, такие как промоторы десмина, Spc5-12 и MCK, могут давать некоторую утечку экспрессии в клетки печени, что может быть благоприятно для индукции иммунологической толерантности у субъекта к белку GAA, экспрессируемому с нуклеиновой кислоты по изобретению.
Другие тканеспецифические или не тканеспецифические промоторы можно использовать при практической реализации изобретения. Например, экспрессирующая кассета может содержать тканеспецифический промотор, который представляет собой промотор, отличный от специфического промотора печени. Например, промотор может обладать специфичностью к мышцам, такой как промотор десмина (и вариант промотора десмина, такой как промотор десмина, содержащий природные или искусственные энхансеры), промотор SPc5-12 или промотор MCK. В другом варианте осуществления промотор представляет собой промотор со специфичностью к другой клеточной линии дифференцировки, такой как промотор эритропоэтина, для экспрессии полипептида GAA в клетках эритроидной линии дифференцировки.
В другом варианте осуществления промотор представляет собой универсальный промотор. Репрезентативные универсальные промоторы включают энхансер цитомегаловируса/промотор β-актина курицы (CAG), энхансер/промотор цитомегаловируса (CMV), промотор PGK, ранний промотор SV40 и т.д.
Кроме того, промотор также может представлять собой эндогенный промотор, такой как промотор альбумина или промотор GAA.
В конкретном варианте осуществления промотор ассоциирован с энхансерной последовательностью, такой как цис-регуляторные модули (CRM) или искусственная энхансерная последовательность. Например, промотор может быть ассоциирован с энхансерной последовательностью, такой как управляющая область ApoE человека (или локус гена аполипопротеина E/C-I человека, печеночная управляющая область HCR-1 - номер доступа GenBank U32510, приведена в SEQ ID NO: 16). В конкретном варианте осуществления энхансерная последовательность, такая как последовательность ApoE, ассоциирована со специфическим промотором печени, таким как те, что перечислены выше, и в частности такими, как промотор hAAT. Другие CRM, эффективные при практической реализации настоящего изобретения, включают те, которые описаны в Rincon et al., Mol Ther. 2015 Jan;23(1):43-52, Chuah et al., Mol Ther. 2014 Sep;22(9):1605-13 или Nair et al., Blood. 2014 May 15;123(20):3195-9.
В другом конкретном варианте осуществления конструкция нуклеиновой кислоты содержит интрон, в частности интрон, размещенный между промотором и кодирующей последовательностью GAA. Интрон можно вводить для увеличения стабильности мРНК и продуцирования белка. В дополнительном варианте осуществления конструкция нуклеиновой кислоты содержит интрон β-глобина b2 человека (или HBB2), интрон фактора свертывания IX (FIX), интрон SV40 или интрон β-глобина курицы. В другом дополнительном варианте осуществления, конструкция нуклеиновой кислоты по изобретению содержит модифицированный интрон (в частности, модифицированный интрон HBB2 или FIX), разработанный для уменьшения числа, или даже полного удаления, альтернативных открытых рамок считывания (ARF), найденных в указанном интроне. Предпочтительно, удаляют ARF, длина которых превышает 50 п.о. и которые имеют терминирующий кодон в рамке считывания инициирующего кодона. ARF может быть удалена посредством модификации последовательности интрона. Например, модификацию можно осуществлять посредством нуклеотидной замены, инсерции или делеции, предпочтительно посредством нуклеотидной замены. В качестве иллюстрации, один или несколько нуклеотидов, в частности один нуклеотид, в инициирующем кодоне ATG или GTG, присутствующем в последовательности интрона, представляющего интерес, можно заменить на ведущий к не инициирующему кодону. Например, ATG или GTG можно заменить на CTG, который не является инициирующим кодоном, в последовательности интрона, представляющего интерес.
Классический интрон HBB2, используемый в конструкциях нуклеиновой кислоты, приведен в SEQ ID NO: 6. Например, этот интрон HBB2 можно модифицировать посредством элиминации инициирующих кодонов (кодонов ATG и GTG) в указанном интроне. В конкретном варианте осуществления модифицированный интрон HBB2, содержащийся в конструкции, имеет последовательность, приведенную в SEQ ID NO: 7. Классический интрон FIX, используемый в конструкциях нуклеиновой кислоты, происходит из первого интрона FIX человека и приведен в SEQ ID NO: 8. Интрон FIX можно модифицировать посредством элиминации инициирующих кодонов (кодонов ATG и GTG) в указанном интроне. В конкретном варианте осуществления модифицированный интрон FIX, содержащийся в конструкции по изобретению, имеет последовательность, приведенную в SEQ ID NO: 9. Классический интрон β-глобина курицы, используемый в конструкциях нуклеиновой кислоты, приведен в SEQ ID NO: 10. Интрон β-глобина курицы можно модифицировать посредством элиминации инициирующих кодонов (кодонов ATG и GTG) в указанном интроне. В конкретном варианте осуществления модифицированный интрон β-глобина курицы, содержащийся в конструкции по изобретению, имеет последовательность, приведенную в SEQ ID NO: 11.
Авторы изобретения предварительно показали в WO2015/162302, что такой модифицированный интрон, в частности модифицированный интрон HBB2 или FIX, имеет благоприятные свойства и может значительно усовершенствовать экспрессию трансгена.
В конкретном варианте осуществления конструкция нуклеиновой кислоты по изобретению представляет собой экспрессирующую кассету, содержащую, в ориентации от 5' к 3', промотор, которому необязательно предшествует энхансер, кодирующую последовательность по изобретению (т.е. оптимизированную кодирующую последовательность GAA по изобретению, химерную кодирующую последовательность GAA по изобретению или химерную и оптимизированную кодирующую последовательность GAA по изобретению) и сигнал полиаденилирования (такой как сигнал полиаденилирования бычьего гормона роста, сигнал полиаденилирования SV40 или другой встречаемый в природе или искусственный сигнал полиаденилирования). В конкретном варианте осуществления конструкция нуклеиновой кислоты по изобретению представляет собой экспрессирующую кассету, содержащую, в ориентации от 5' к 3', промотор, которому необязательно предшествует энхансер, (такой как управляющая область ApoE), интрон (в частности, интрон как определено выше), кодирующую последовательность по изобретению и сигнал полиаденилирования. В дополнительном конкретном варианте осуществления, конструкция нуклеиновой кислоты по изобретению представляет собой экспрессирующую кассету, содержащую, в ориентации от 5' к 3', энхансер, такой как управляющая область ApoE, промотор, интрон (в частности, интрон как определено выше), кодирующую последовательность по изобретению и сигнал полиаденилирования. В дополнительном конкретном варианте осуществления изобретения экспрессирующая кассета содержит, в ориентации от 5' к 3', управляющую область ApoE, специфический промотор hAAT печени, интрон HBB2 (в частности, модифицированный интрон HBB2 как определено выше), кодирующую последовательность по изобретению и сигнал полиаденилирования бычьего гормона роста, например, конструкцию нуклеиновой кислоты, представленную в любой одной из SEQ ID NO: с 20 до 22, которые включают молекулу нуклеиновой кислоты GAA с оптимизированной последовательностью из SEQ ID NO: 13, комбинированную с каждой из кодирующих сигнальный пептид последовательностей, приведенных в SEQ ID NO: с 2 до 4. В других вариантах осуществления экспрессирующая кассета содержит кодирующую последовательность, являющуюся результатом одной из комбинаций последовательностей, представленных выше в таблице 2, таблице 2' или таблице 2'', в частности в таблице 2' или таблице 2''.
В конкретном варианте осуществления экспрессирующая кассета содержит управляющую область ApoE, специфический промотор hAAT печени, интрон HBB2 с оптимизацией кодонов, кодирующую последовательность по изобретению и сигнал полиаденилирования бычьего гормона роста.
При разработке конструкции нуклеиновой кислоты по изобретению, специалист в данной области уделит внимание ограничению размера вектора, используемого для доставки указанной конструкции в клетку или орган. В частности, специалист в данной области знает, что основное ограничение AAV вектора состоит в его полезной вместимости, которая может варьировать от одного серотипа AAV к другом, но предположительно ограничена приблизительным размером родительского вирусного генома. Например, 5 т.о. Это максимальный размер, который обычно планируют упаковать в капсид AAV8 (Wu Z. et al., Mol Ther., 2010, 18(1): 80-86; Lai Y. et al., Mol Ther., 2010, 18(1): 75-79; Wang Y. et al., Hum Gene Ther Methods, 2012, 23(4): 225-33). Соответственно, специалисты в данной области, при практическом осуществлении настоящего изобретения, уделят внимание тому, чтобы выбирать компоненты конструкции нуклеиновой кислоты по изобретению с тем, чтобы получаемая последовательность нуклеиновой кислоты, в том числе последовательности, кодирующие AAV 5'- и 3'-ITR, предпочтительно не превышала 110% от полезной вместимости внедряемого AAV вектора, в частности, предпочтительно не превышала 5,5 т.о.
Изобретение также относится к вектору, содержащему молекулу нуклеиновой кислоты или конструкцию, как раскрыто в настоящем описании. В частности, вектор по изобретению представляет собой вектор, подходящий для экспрессии белка, предпочтительно для использования в генной терапии. В одном из вариантов осуществления вектор представляет собой плазмидный вектор. В другом варианте осуществления вектор представляет собой наночастицу, содержащую молекулу нуклеиновой кислоты по изобретению, в частности информационную РНК, кодирующую полипептид GAA по изобретению. В другом варианте осуществления вектор представляет собой систему на основе транспозонов, которая делает возможным встраивание молекулы нуклеиновой кислоты или конструкции по изобретению в геном целевой клетки, такой как гиперактивная транспозонная система Sleeping Beauty (SB100X) (Mates et al., 2009). В другом варианте осуществления вектор представляет собой вирусный вектор, подходящий для генной терапии, который направлен на любую клетку, представляющую интерес, такую как ткань или клетки печени, клетка мышцы, клетки CNS (такие как клетки головного мозга) или гематопоэтические стволовые клетки, такие как клетки эритроидной линии дифференцировки (такие как эритроциты). В этом случае, конструкция нуклеиновой кислоты по изобретению также содержит последовательности, подходящие для получения эффективного вирусного вектора, как хорошо известно в данной области. В конкретном варианте осуществления вирусный вектор происходит из интегрирующего вируса. В частности, вирусный вектор может происходить из ретровируса или лентивируса. В дополнительном конкретном варианте осуществления, вирусный вектор представляет собой AAV вектор, такой как AAV вектор, подходящий для трансдукции тканей или клеток печени, более конкретно AAV-1, -2 и варианты AAV-2 (такие как оптимизированный AAV-2 с четверной мутацией капсида, содержащие сконструированный капсид с изменениями Y44+500+730F+T491V, как раскрыто в Ling et al., 2016, Jul 18, Hum Gene Ther Methods [электронная публикация перед печатью]), -3 и варианты AAV-3 (такие как вариант AAV3-ST, содержащий сконструированный капсид AAV3 с двумя аминокислотными изменениями, S663V+T492V, как раскрыто в Vercauteren et al., 2016, Mol. Ther. том 24(6), стр. 1042), -3B и варианты AAV-3B, -4, -5, -6 и варианты AAV-6 (такие как вариант AAV6, содержащий форму капсида AAV6 с тройной мутацией Y731F/Y705F/T492V, как раскрыто в Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, стр. 16026), -7, -8, -9, -10, например, -cy10 и -rh10, -rh74, -dj, Anc80, LK03, AAV2i8, серотипы AAV свиньи, такие как AAVpo4 и AAVpo6 и т. д., вектор или ретровирусный вектор, такой как лентивирусный вектор и альфаретровирус. Как известно в данной области, в зависимости от конкретного вирусного вектора, рассматриваемого для использования, дополнительные подходящие последовательности вводят в конструкцию нуклеиновой кислоты по изобретению для получения функционального вирусного вектора. Подходящие последовательности включают ITR AAV для AAV вектора или LTR для лентивирусных векторов. По существу, изобретение также относится к экспрессирующей кассете, как описано выше, фланкированной с помощью ITR или LTR с каждой стороны.
Преимущества вирусных векторов рассмотрены в следующей части этого раскрытия. Вирусные векторы предпочтительны для доставки молекулы нуклеиновой кислоты или конструкции по изобретению, такой как ретровирусный вектор, например, лентивирусный вектор, или непатогенный парвовирус, более предпочтительно AAV вектор. Парвовирусный аденоассоциированный вирус (AAV) человека представляет собой депендовирус, имеющий природный дефект репликации, который способен встраиваться в геном инфицированной клетки для того, чтобы устанавливать латентную инфекцию. Последнее свойство, по-видимому, является уникальным среди вирусов млекопитающих, поскольку встраивание происходит в конкретном участке в геноме человека, называемом AAVS1, который расположен на хромосоме 19 (19q13.3-qter).
Следовательно, AAV векторы вызывают существенный интерес в качестве потенциальных векторов для генной терапии человека. Среди благоприятных свойств вируса имеют место отсутствие у него связи с любым заболеванием человека, его способность инфицировать делящиеся и не делящиеся клетки, и широкий диапазон клеточных линий, происходящих из различных тканей, которые могут быть инфицированы.
Среди серотипов AAV, выделенных у человека или не являющихся человеком приматов (NHP) и хорошо охарактеризованных, серотип 2 человека представляет собой первый AAV, который разрабатывали в качестве вектора переноса генов. Другие используемые в настоящее время серотипы AAV включают AAV-1, варианты AAV-2 (такие как оптимизированный AAV-2 с четверной мутацией капсида, содержащий сконструированный капсид с изменениями Y44+500+730F+T491V, как раскрыто в Ling et al., 2016 Jul 18, Hum Gene Ther Methods [электронная публикация перед печатью]), -3 и варианты AAV-3 (такие как вариант AAV3-ST, содержащий сконструированный капсид AAV3 с двумя аминокислотными изменениями, S663V+T492V, как раскрыто в Vercauteren et al., 2016, Mol. Ther. том 24(6), стр. 1042), -3B и варианты AAV-3B, -4, -5, -6 и варианты AAV-6 (такие как вариант AAV6, содержащий форму капсида AAV6 с тройной мутацией Y731F/Y705F/T492V, как раскрыто в Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, стр. 16026), -7, -8, -9, -10, например, cy10 и -rh10, -rh74, -dj, Anc80, LK03, AAV2i8, серотипы AAV свиньи, такие как AAVpo4 и AAVpo6, и тирозиновые, лизиновые и сериновые мутантные капсиды серотипов AAV и т.д. Кроме того, другие не природные сконструированные варианты и химерные AAV также могут быть эффективны.
Вирусы AAV можно конструировать с использованием стандартных приемов молекулярной биологии, которые позволяют оптимизировать эти частицы для доставки последовательностей нуклеиновой кислоты в конкретные клетки, для минимизации иммуногенности, для корректировки стабильности и времени жизни частиц, для эффективного разрушения, для точной доставки в ядро.
Желательные фрагменты AAV для сборки в векторы включают белки cap, в том числе vp1, vp2, vp3 и гипервариабельные области, белки rep, в том числе rep 78, rep 68, rep 52 и rep 40, и последовательности, кодирующие эти белки. Эти фрагменты легко можно использовать в различных векторных системах и клетках-хозяевах.
Рекомбинантные векторы на основе AAV, лишенные белка Rep, встраиваются с низким эффектом в геном хозяина и преимущественно представлены в виде стабильных круглых эписом, которые могут персистировать в течение лет в целевых клетках.
Альтернативно использованию природных серотипов AAV, в контексте настоящего изобретения можно использовать искусственные серотипы AAV, в том числе, без ограничения, AAV с не встречаемым в природе белком капсида. Такой искусственный капсид можно создавать с помощью любого подходящего приема, используя выбранную AAV последовательность (например, фрагмент белка капсида vp1) в комбинации с гетерологичными последовательностями, которые можно получать из другого выбранного серотипа AAV, не связанных частей AAV того же серотипа, из не AAV вирусного источника или из не вирусного источника. Искусственный серотип AAV может представлять собой, без ограничения, химерный AAV капсид, рекомбинантный AAV капсид или «гуманизированный» AAV капсид.
Соответственно, настоящее изобретение относится к AAV вектору, содержащему молекулу нуклеиновой кислоты или конструкцию по изобретению. В контексте настоящего изобретения, AAV вектор содержит AAV капсид, способный трансдуцировать целевые клетки, представляющие интерес, в частности, гепатоциты. В соответствии с конкретным вариантом осуществления, AAV вектор относится к AAV-1, -2, вариантам AAV-2 (например, оптимизированный AAV-2 с четверной мутацией капсида, содержащий сконструированный капсид с изменениями Y44+500+730F+T491V, как раскрыто в Ling et al., 2016 Jul 18, Hum Gene Ther Methods [электронная публикация перед печатью]), -3 и варианты AAV-3 (например, вариант AAV3-ST, содержащий сконструированный капсид AAV3 с двумя аминокислотными изменениями, S663V+T492V, как раскрыто в Vercauteren et al., 2016, Mol. Ther. том 24(6), стр. 1042), -3B и варианты AAV-3B, -4, -5, -6 и варианты AAV-6 (например, вариант AAV6, содержащий форму капсида AAV6 с тройной мутацией Y731F/Y705F/T492V, как раскрыто в Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, стр. 16026), -7, -8, -9, -10, например, -cy10 и -rh10, -rh74, -dj, Anc80, LK03, AAV2i8, AAV свиньи, такой как AAVpo4 и AAVpo6, и тирозиновые, лизиновые и сериновые капсидные мутанты серотипов AAV, и т.д., серотип. В конкретном варианте осуществления AAV вектор относится к серотипу AAV8, AAV9, AAVrh74 или AAV2i8 (т.е. AAV вектор имеет капсид серотипа AAV8, AAV9, AAVrh74 или AAV2i8). В дополнительном конкретном варианте осуществления, AAV вектор представляет собой псевдотипированный вектор, т.е. его геном и капсид происходят из AAV различных серотипов. Например, псевдотипированный AAV вектор может представлять собой вектор, геном которого происходит из одного из указанных выше серотипов AAV и капсид которого происходит из другого серотипа. Например, геном псевдотипированного вектора может иметь капсид, происходящий из серотипа AAV8, AAV9, AAVrh74 или AAV2i8, и его геном может происходить из другого серотипа. В конкретном варианте осуществления AAV вектор имеет капсид серотипа AAV8, AAV9 или AAVrh74, в частности серотипа AAV8 или AAV9, более конкретно серотипа AAV8.
В конкретном варианте осуществления, в котором вектор предназначен для использования в доставке трансгена в клетки мышцы, AAV вектор можно выбирать, среди прочих, в группе, состоящей из AAV8, AAV9 и AAVrh74.
В другом конкретном варианте осуществления, в котором вектор предназначен для использования в доставке трансгена в клетки печени, AAV вектор можно выбирать, среди прочих, в группе, состоящей из AAV5, AAV8, AAV9, AAV-LK03, AAV-Anc80 и AAV3B.
В другом варианте осуществления капсид представляет собой модифицированный капсид. В контексте настоящего изобретения, «модифицированный капсид» может представлять собой химерный капсид или капсид, содержащий один или несколько вариантов белков капсида VP, происходящих из одного или нескольких белков капсида VP AAV дикого типа.
В конкретном варианте осуществления AAV вектор представляет собой химерный вектор, т.е. его капсид содержит белки капсида VP, происходящие из по меньшей мере двух различных серотипов AAV, или содержит по меньшей мере один химерный белок VP, объединяющий области или домены белков VP, происходящие из по меньшей мере двух серотипов AAV. Примеры таких химерных AAV векторов, эффективных для трансдукции клеток печени, описаны в Shen et al., Molecular Therapy, 2007, и в Tenney et al., Virology, 2014. Например, химерный AAV вектор может происходить из комбинации последовательности капсида AAV8 с последовательностью серотипа AAV, отличного от серотипа AAV8, такого как любой из тех, что конкретно указаны выше. В другом варианте осуществления капсид AAV вектора содержит один или несколько вариантов белков капсида VP, таких как те, что описаны в WO2015013313, в частности варианты капсида RHM4-1, RHM15-1, RHM15-2, RHM15-3/RHM15-5, RHM15-4 и RHM15-6, которые дают высокий тропизм к печени.
В другом варианте осуществления модифицированный капсид может происходить также из модификаций капсида, вставленных с помощью допускающей ошибки ПЦР и/или инсерции пептида (например, как описано в Bartel et al., 2011). Кроме того, варианты капсида могут содержать изменения одной аминокислоты, такие как тирозиновые мутанты (например, как описано в Zhong et al., 2008)
Кроме того, геном AAV вектора может представлять собой одноцепочечный или самокомплементарный двухцепочечный геном (McCarty et al., Gene Therapy, 2003). Самокомплементарные двухцепочечные AAV векторы создают посредством делеции сайта концевого разрешения (trs) из одного из концевых повторов AAV. Эти модифицированные векторы, реплицирующийся геном которых составляет половину длины от генома AAV дикого типа, обладают склонностью к упаковыванию димеров ДНК. В предпочтительном варианте осуществления AAV вектор, используемый при практической реализации настоящего изобретения, имеет одноцепочечный геном и дополнительно предпочтительно содержит капсид AAV8, AAV9, AAVrh74 или AAV2i8, в частности капсид AAV8, AAV9 или AAVrh74, такой как капсид AAV8 или AAV9, более конкретно капсид AAV8.
В особенно предпочтительном варианте осуществления изобретение относится к AAV вектору, содержащему, в одноцепочечном или двухцепочечном самокомплементарном геноме (например, одноцепочечном геноме), конструкцию нуклеиновой кислоты по изобретению. В одном из вариантов осуществления AAV вектор содержит капсид AAV8, AAV9, AAVrh74 или AAV2i8, в частности капсид AAV8, AAV9 или AAVrh74, такой как капсид AAV8 или AAV9, более конкретно капсид AAV8. В дополнительном конкретном варианте осуществления, указанная нуклеиновая кислота функционально связана с промотором, в частности, универсальным или специфическим промотором печени. В соответствии с вариантом осуществления конкретного варианта, промотор представляет собой универсальный промотор, такой как энхансер цитомегаловируса/промотор β-актина курицы (CAG), энхансер/промотор цитомегаловируса(CMV), промотор PGK и ранний промотор SV40. В конкретном варианте универсальный промотор представляет собой промотор CAG. В соответствии с другим вариантом, промотор представляет собой специфический промотор печени, такой как промотор α-1-антитрипсина (hAAT), промотор транстиретина, промотор альбумина и промотор тироксинсвязывающего глобулина (TBG). В конкретном варианте, специфический промотор печени представляет собой специфический промотор hAAT печени из SEQ ID NO: 15. В дополнительном конкретном варианте осуществления, конструкция нуклеиновой кислоты, содержащаяся в геноме AAV вектора по изобретению, дополнительно содержит интрон, как описано выше, такой как интрон, помещенный между промотором и последовательностью нуклеиновой кислоты, кодирующей кодирующую последовательность GAA (т.е. оптимизированную кодирующую последовательность GAA по изобретению, химерную кодирующую последовательность GAA по изобретению или химерную и оптимизированную кодирующую последовательность GAA по изобретению). Репрезентативные интроны, которые могут быть включены в конструкцию нуклеиновой кислоты, введенную в геном AAV вектора, включают, без ограничения, интрон β-глобина b2 человека (или HBB2), интрон FIX и интрон β-глобина курицы. Указанный интрон в геноме AAV вектора может представлять собой классический (или немодифицированный) интрон или модифицированный интрон, разработанный для снижения числа, или даже полного удаления, альтернативных открытых рамок считывания (ARF) в указанном интроне. Модифицированные и немодифицированные интроны, которые можно использовать при практической реализации этого варианта осуществления, где нуклеиновую кислоту по изобретению вводят в AAV вектор, тщательно описаны выше. В конкретном варианте осуществления AAV вектор, в частности AAV вектор, содержащий капсид AAV8, AAV9, AAVrh74 или AAV2i8, в частности капсид AAV8, AAV9 или AAVrh74, например, капсид AAV8 или AAV9, более конкретно капсид AAV8, по изобретению содержит в своем геноме модифицированный (или оптимизированный) интрон, такой как модифицированный интрон HBB2 из SEQ ID NO: 7, модифицированный интрон FIX из SEQ ID NO: 9 и модифицированный интрон β-глобина курицы из SEQ ID NO: 11. В дополнительном конкретном варианте осуществления, вектор по изобретению представляет собой AAV вектор, содержащий капсид AAV8, AAV9, AAVrh74 или AAV2i8, в частности капсид AAV8, AAV9 или AAVrh74, например, капсид AAV8 или AAV9, более конкретно капсид AAV8, который содержит геном, содержащий, в ориентации от 5' к 3': AAV 5'-ITR (например, AAV2 5'-ITR); управляющую область ApoE; специфический промотор hAAT печени; интрон HBB2 (в частности модифицированный интрон HBB2, как определено выше); кодирующую последовательность GAA по изобретению; сигнал полиаденилирования бычьего гормона роста; и AAV 3'-ITR (например, AAV2 3'-ITR), такой как геном, содержащий нуклеиновую кислоту, приведенную в SEQ ID NO: 20, 21 или 22 (включая последовательность нуклеиновой кислоты, приведенную в SEQ ID NO: 17, 18 и 19, соответственно, соответствующую оптимизированной последовательности, кодирующей Δ8 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 5), фланкированную с помощью AAV 5'-ITR (например, AAV2 5'-ITR) и AAV 3'-ITR (например, AAV2 3'-ITR). Другая экспрессирующая кассета, эффективная при практической реализации настоящего изобретения, содержит эти фрагмент сигнального пептида и фрагмент GAA в любой одной из комбинаций последовательностей, приведенных в таблице 2, таблице 2' или таблице 2'', в частности в таблице 2' или таблице 2'', выше.
В конкретном варианте осуществления изобретения, конструкция нуклеиновой кислоты по изобретению содержит специфический промотор печени, как описано выше, и вектор представляет собой вирусный вектор, способный к трансдукции ткани или клеток печени, как описано выше. Авторы изобретения приводят далее данные, показывающие, что протолерогенные и метаболические свойства печени благоприятно реализованы благодаря этому варианту осуществления для разработки высоко эффективных и оптимизированных векторов для экспрессии секретируемых форм GAA в гепатоцитах и индукции иммунологической толерантности на белок.
Кроме того, в дополнительном конкретном варианте осуществления, изобретение относится к комбинации двух векторов, например, двух вирусных векторов, в частности, двух AAV векторов, для усовершенствования доставки гена и эффекта лечения в клетках, представляющих интерес. Например, два вектора могут нести молекулу нуклеиновой кислоты по изобретению, кодирующую белок GAA по изобретению, под управлением одного промотора, различного в каждом из этих двух векторов. В конкретном варианте осуществления один вектор содержит промотор, который представляет собой специфический промотор печени (как один из описанных выше), и другой вектор содержит промотор, который обладает специфичностью к другой ткани, представляющей интерес, для лечения нарушения накопления гликогена, такой как специфический промотор мышц, например, промотор десмина. В конкретном варианте по этому варианту осуществления, эта комбинация векторов соответствует нескольким совместно упакованным AAV векторам, получаемым, как описано в WO2015196179.
В другом аспекте изобретение относится к химерному полипептиду GAA, который содержит фрагмент сигнального пептида и фрагмент GAA, в котором встречаемый в природе сигнальный пептид GAA заменяют на сигнальный пептид, выбранный в группе, состоящей из SEQ ID NO: с 2 до 4. В конкретном варианте осуществления химерный полипептид GAA по изобретению может представлять собой полипептид, происходящий из усеченной формы GAA, как описано выше. Например, химерный белок GAA по изобретению может представлять собой фрагмент Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50, Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 или Δ75 усеченной формы GAA (в частности усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), слитый на его N-конце с сигнальным пептидом, выбранным в группе, состоящей из SEQ ID NO: с 2 до 4.
В конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ6, Δ7, Δ8, Δ9 или Δ10 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ7, Δ8 или Δ9 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ8 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В другом конкретном варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ27, Δ28, Δ29, Δ30 или Δ31, в частности Δ28, Δ29 или Δ30, более конкретно Δ29 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.
В другом конкретном варианте осуществления фрагмент GAA химерного белка GAA представляет собой Δ40, Δ41, Δ42, Δ43 или Δ44 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ41, Δ42 или Δ43 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5), в частности Δ42 усеченную форму GAA (в частности родительского белка hGAA, как приведено в SEQ ID NO: 5 или SEQ ID NO: 36, в частности в SEQ ID NO: 5).
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ41, Δ42, Δ43, Δ44 или Δ45, в частности Δ42, Δ43 или Δ44, более конкретно Δ43 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44 или Δ45, в частности Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 или Δ44, в частности Δ8, Δ29, Δ42 или Δ43 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 или Δ44, в частности Δ8 или Δ42 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ8, Δ29, Δ42, Δ43 или Δ47 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ8, Δ29, Δ42 или Δ43 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ8 или Δ42 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.
В конкретном варианте осуществления усеченный полипептид hGAA по изобретению имеет аминокислотную последовательность, состоящую из последовательности, приведенной в SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41, SEQ ID NO: 42 или SEQ ID NO: 43, или ее функционального варианта, содержащего от 1 до 5, в частности от 1 до 4, в частности от 1 до 3, более конкретно от 1 до 2, в частности 1 замену аминокислоты по сравнению с последовательностью, приведенной в SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41, SEQ ID NO: 42 или SEQ ID NO: 43. В другом конкретном варианте осуществления, усеченный полипептид hGAA по изобретению имеет аминокислотную последовательность, состоящую из последовательности, приведенной в SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41 или SEQ ID NO: 42, или ее функционального варианта, содержащего от 1 до 5 замен аминокислот по сравнению с последовательностью, приведенной в SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41 или SEQ ID NO: 42. В конкретном варианте осуществления усеченный полипептид hGAA по изобретению имеет аминокислотную последовательность, состоящую из последовательности, приведенной в SEQ ID NO: 29 или SEQ ID NO: 30, или ее функционального варианта, содержащего от 1 до 5, в частности от 1 до 4, в частности от 1 до 3, более конкретно от 1 до 2, в частности 1 замену аминокислоты по сравнению с последовательностью, приведенной в SEQ ID NO: 29 или SEQ ID NO: 30.
В конкретном варианте осуществления химерный полипептид GAA имеет последовательность, являющуюся результатом одной из комбинаций, представленных выше в таблице 1, таблице 1' или таблице 1'', в частности в таблице 1' или таблице 1'', или представляет собой ее функциональное производное, обладающее по меньшей мере 90% идентичностью, в частности, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, или по меньшей мере 99% идентичностью с получаемой комбинацией последовательностей.
Изобретение также относится к клетке, например, клетке печени, которую трансформируют молекулой нуклеиновой кислоты или конструкцией по изобретению, как в случае генной терапии ex vivo. Клетки по изобретению можно доставлять субъекту, нуждающемуся в этом, такому как пациент с дефицитом GAA, с помощью любого подходящего пути введения, например, через инъекцию в печень или в кровоток указанного субъекта. В конкретном варианте осуществления изобретение включает введение нуклеиновой кислоты по изобретению в клетки печени, в частности в клетки печени субъекта, подлежащего лечению, и введение указанных трансформированных клеток печени, в которые вводили нуклеиновую кислоту, субъекту. Благоприятно, этот вариант осуществления можно использовать для секреции GAA из указанных клеток. В конкретном варианте осуществления клетки печени представляют собой клетки печени от пациента, подлежащего лечению, или стволовые клетки печени, которые дополнительно трансформируют и дифференцируют in vitro в клетки печени, для последующего введения пациенту.
Настоящее изобретение дополнительно относится к трансгенному не относящемуся к человеку животному, содержащему в своем геноме молекулу нуклеиновой кислоты или конструкцию, кодирующую белок GAA в соответствии с изобретением. В конкретном варианте осуществления животным является мышь.
Помимо систем специфической доставки, осуществляемых далее в примерах, известны различные системы доставки, которые можно использовать для того, чтобы вводить молекулу нуклеиновой кислоты или конструкцию по изобретению, например, инкапсулирование в липосомы, микрочастицы, микрокапсулы, рекомбинантные клетки, способные экспрессировать кодирующую последовательность по изобретению, рецептор-опосредованный эндоцитоз, конструкция терапевтической нуклеиновой кислоты в качестве части ретровирусного или другого вектора и т.д.
В соответствии с одним из вариантов осуществления, может быть желательно вводить химерный полипептид GAA, молекулу нуклеиновой кислоты, конструкцию нуклеиновой кислоты или клетку по изобретению в печень субъекта посредством любого подходящего пути. Вдобавок депротеинизированную ДНК, такую как миникольца и транспозоны, можно использовать для векторов доставки или лентивирусных векторов. Дополнительно, технологии редактирования генов, такие как нуклеазы с цинковым пальцем, мегануклеазы, TALEN и CRISPR, также можно использовать для того, чтобы доставлять кодирующую последовательность по изобретению.
Настоящее изобретение также относится к фармацевтическим композициям, содержащим молекулу нуклеиновой кислоты, конструкцию нуклеиновой кислоты, вектор, химерный полипептид GAA или клетку по изобретению. Такие композиции содержат терапевтически эффективное количество терапевтического средства (молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, химерного полипептида GAA или клетки по изобретению) и фармацевтически приемлемый носитель. В конкретном варианте осуществления термин «фармацевтически приемлемый» обозначает одобрение регулирующего органа государственного или регионального правительства или включение в фармакопею США или Европейскую фармакопею или другие общепризнанные фармакопеи для использования у животных и человека. Термин «носитель» относится к разбавителю, адъюванту, эксципиенту или носителю, с которым вводят терапевтическое средство. Такие фармацевтические носители могут представлять собой стерильные жидкости, такие как вода и масла, в том числе те, которые имеют происхождение из нефти, животных, овощей или синтеза, например, арахисовое масло, соевое масло, минеральное масло, сезамовое масло и т.п. Вода является предпочтительным носителем, когда фармацевтическую композицию вводят внутривенно. Солевые растворы и водные растворы декстрозы и глицерина также можно использовать в качестве жидких носителей, в частности, для инъецируемых растворов. Подходящие фармацевтические эксципиенты включают крахмал, глюкозу, лактозу, сахарозу, стеарат натрия, глицерина моностеарат, тальк, хлорид натрия, сухое обезжиренное молоко, глицерин, пропиленгликоль, воду, этанол и т.п.
Композиция, при желании, также может содержать незначительные количества смачивающих или эмульгирующих средств или pH буферных средств. Эти композиции могут принимать форму растворов, суспензий, эмульсий, таблеток, пилюль, капсул, порошков, составов с замедленным высвобождением и т.п. Оральный состав может содержать стандартные носители, такие как маннит, лактоза, крахмал, стеарат магния, сахарин натрия, целлюлоза, карбонат магния фармацевтической степени чистоты и т.д. Примеры подходящих фармацевтических носителей описаны в «Remington's Pharmaceutical Sciences», E. W. Martin. Такие композиции должны содержать терапевтически эффективное количество терапевтического средства, предпочтительно в очищенной форме, вместе с подходящим количеством носителя с тем, чтобы предоставлять форму для надлежащего введения субъекту. В конкретном варианте осуществления нуклеиновую кислоту, вектор или клетку по изобретению формулируют в композиции, содержащей фосфатно-солевой буфер, с добавлением 0,25% сывороточного альбумина человека. В другом конкретном варианте осуществления нуклеиновую кислоту, вектор или клетку по изобретению формулируют в композиции, содержащей лактат Рингера и неионное поверхностно-активное средство, такое как pluronic F68, в конечной концентрации 0,01-0,0001%, например, в концентрации 0,001%, по массе общей композиции. Состав дополнительно может содержать сывороточный альбумин, в частности сывороточный альбумин человека, такой как сывороточный альбумин человека 0,25%. Другие подходящие составы для хранения или введения известны в данной области, в частности, из WO 2005/118792 или Allay et al., 2011.
В предпочтительном варианте осуществления композицию формулируют в соответствии со стандартными процедурами в качестве фармацевтической композиции, адаптированной для внутривенного введения человеку. Обычно композиции для внутривенного введения представляют собой растворы в стерильном изотоническом водном буфере. При необходимости, композиция также может содержать солюбилизирующее средство и местный анестетик, такой как лигнокаин, чтобы снимать боль в месте инъекции.
В одном из вариантов осуществления молекулу нуклеиновой кислоты, конструкцию нуклеиновой кислоты, вектор, химерный полипептид GAA или клетку по изобретению можно доставлять в везикуле, в частности липосоме. В еще одном другом варианте осуществления молекулу нуклеиновой кислоты, конструкцию нуклеиновой кислоты, вектор, химерный полипептид GAA или клетку по изобретению можно доставлять в системе с контролируемым высвобождением.
Способы введения молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, химерного полипептида GAA или клетки по изобретению включают, но не ограничиваясь этим, внутрикожный, внутримышечный, интраперитонеальный, внутривенный, подкожный, интраназальный, эпидуральный и оральный пути. В конкретном варианте осуществления введение происходит через внутривенный или внутримышечный путь. Молекула нуклеиновой кислоты, конструкция нуклеиновой кислоты, вектор, химерный полипептид GAA или клетки по изобретению, в форме вектора или нет, можно вводить с помощью любого удобного пути, например, посредством инфузии или болюсной инъекции, посредством абсорбции через эпителиальные или кожно-слизистые оболочки (например, слизистую оболочку полости рта, слизистую оболочку прямой кишки и кишечника и т.д.), и можно вводить вместе с другими биологически активными средствами. Введение может быть системным или местным.
В конкретном варианте осуществления может быть желательно вводить фармацевтические композиции по изобретению локально в области, нуждающейся в лечении, например, печени. Этого можно достигать, например, посредством имплантата, указанный имплантат из пористого, непористого или гелеобразного материала, в том числе мембран, таких как мембраны «sialastic», или волокон.
Количество терапевтического средства (т.е. молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, химерного полипептида GAA или клетки по изобретению) по изобретению, которое будет эффективным при лечении болезни накопления гликогена, можно определять с помощью стандартных клинических приемов. Кроме того, анализы in vivo и/или in vitro необязательно можно использовать для того, чтобы помогать предсказывать оптимальные диапазоны доз. Точная доза, используемая в составе, также зависит от пути введения и тяжести заболевания, и ее следует выбирать в соответствии с суждением практикующего специалиста и обстоятельствами каждого пациента. Доза молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, химерного полипептида GAA или клетки по изобретению, вводимых субъекту, нуждающемуся в этом, варьирует в зависимости от нескольких факторов, включая, без ограничения, путь введения, конкретное заболевание, которое лечат, возраст субъекта или уровень экспрессии, необходимый для достижения терапевтического эффекта. Специалист в данной области может легко определять, на основе своих знаний в этой области, необходимый диапазон доз на основе этих и других факторов. В случае лечения, включающего введение вирусного вектора, такого как AAV вектор, субъекту, типичные дозы вектор составляют по меньшей мере 1×108 векторных геномов на килограмм массы тела (вг/кг), например, по меньшей мере 1×109 вг/кг, по меньшей мере 1×1010 вг/кг, по меньшей мере 1×1011 вг/кг, по меньшей мере 1×1012 вг/кг по меньшей мере 1×1013 вг/кг или по меньшей мере 1×1014 вг/кг.
Изобретение также относится к способу лечения болезни накопления гликогена, который включает стадию доставки терапевтически эффективного количества нуклеиновой кислоты, вектора, химерного полипептида, фармацевтической композиции или клетки по изобретению нуждающемуся в этом субъекту.
Изобретение также относится к способу лечения болезни накопления гликогена, указанный способ не индуцирует иммунный ответ на трансген (т.е. на химерный полипептид GAA по изобретению) или индуцирует сниженный иммунный ответ на трансген, который включает стадию доставки терапевтически эффективного количества молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, фармацевтической композиции или клетки по изобретению нуждающемуся в этом субъекту. Изобретение также относится к способу лечения болезни накопления гликогена, указанный способ включает повторное введение терапевтически эффективного количества молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, фармацевтической композиции или клетки по изобретению нуждающемуся в этом субъекту. В этом аспекте, молекула нуклеиновой кислоты или конструкция нуклеиновой кислоты по изобретению содержит промотор, который функционален в клетках печени, тем самым делая возможной иммунологическую толерантность к экспрессируемому химерному полипептиду GAA, продуцируемому ими. Также в этом аспекте фармацевтическая композиция, используемая в этом аспекте, содержит молекулу нуклеиновой кислоты или конструкцию нуклеиновой кислоты, содержащую промотор, который функционален в клетках печени. В случае доставки клеток печени, указанные клетки могут представлять собой клетки, предварительно взятые у субъекта, нуждающегося в лечении, и сконструированные посредством введения в них молекулы нуклеиновой кислоты или конструкции нуклеиновой кислоты по изобретению, чтобы тем самым делать их способными продуцировать химерный полипептид GAA по изобретению. В соответствии с одним из вариантов осуществления, в аспекте, включающем повторное введение, указанное введение можно повторять по меньшей мере один раз или больше, и даже можно рассматривать его выполнение в соответствии с периодической схемой, например, раз в неделю, в месяц или в год. Периодическая схема также может включать введение один раз каждые 2, 3, 4, 5, 6, 7, 8, 9 или 10 лет или больше чем 10 лет. В другом конкретном варианте осуществления введение каждого введения вирусного вектора по изобретению выполняют с использованием отличающегося вируса для каждого последующего введения, тем самым избегая снижения эффекта по причине возможного иммунного ответа на ранее введенный вирусный вектор. Например, можно осуществлять первое введение вирусного вектора, содержащего капсид AAV8, после чего следует введение вектора, содержащего AAV9 капсид, или даже введение вируса, не родственного с AAV, такого как ретровирусный или лентивирусный вектор.
В соответствии с настоящим изобретением, лечение может включать излечивающие, облегчающие или профилактические эффекты. Соответственно, терапевтическое и профилактическое лечение включает улучшение симптомов конкретной болезни накопления гликогена или предотвращение или иное снижение риска развития конкретной болезни накопления гликогена. Термин «профилактическое» можно рассматривать в качестве снижения тяжести или начала конкретного состояния. «Профилактическое» также включает предотвращение повторения конкретного состояния у пациента, у которого предварительно диагностировали состояние. «Терапевтическое» также может снижать тяжесть существующего состояния. Термин «лечение» используют в настоящем описании для обозначения любой схемы, которая может принести пользу животному, в частности млекопитающему, более конкретно человеческому субъекту.
Изобретение также относится к способу генной терапии ex vivo для лечения болезни накопления гликогена, который включает введение молекулы нуклеиновой кислоты или конструкции нуклеиновой кислоты по изобретению в выделенную клетку пациента, нуждающегося в этом, например, выделенную гематопоэтическую стволовую клетку, и введение указанной клетки указанному пациенту, нуждающемуся в этом. В конкретном варианте осуществления по этому аспекту, молекулу нуклеиновой кислоты или конструкцию вводят в клетку с использованием вектора, как определено выше. В конкретном варианте осуществления вектор представляет собой интегрирующий вирусный вектор. В дополнительном конкретном варианте осуществления вирусный вектор представляет собой ретровирусный вектор, такой как лентивирусный вектор. Например, лентивирусный вектор, как раскрыто в van Til et al., 2010, Blood, 115(26), стр. 5329, можно использовать при практической реализации способа по настоящему изобретению.
Изобретение также относится к молекуле нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектору, химерному полипептиду GAA или клетке по изобретению для применения в качестве лекарственного средства.
Изобретение также относится к молекуле нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектору, химерному полипептиду GAA или клетке по изобретению для использования в способе лечения заболевания, обусловленного мутацией в гене GAA, в частности, в способе лечения болезнь Помпе. Изобретение дополнительно относится к молекуле нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектору, химерному полипептиду GAA или клетке по изобретению для использования в способе лечения болезни накопления гликогена, такой как GSDI (болезнь Гирке), GSDII (болезнь Помпе), GSDIII (болезнь Кори), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII и летальная врожденная болезнь накопления гликогена в сердце, более конкретно GSDI, GSDII или GSDIII, даже более конкретно GSDII и GSDIII и наиболее конкретно GSDII. Химерный полипептид GAA по изобретению можно вводить нуждающемуся в этом пациенту для использования в ферментозаместительной терапии (ERT), например, для использования в ферментозаместительной терапии при одной из болезней накопления гликогена, такой как GSDI (болезнь Гирке), GSDII (болезнь Помпе), GSDIII (болезнь Кори), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII и летальная врожденная болезнь накопления гликогена в сердце, более конкретно GSDI, GSDII или GSDIII, даже более конкретно GSDII и GSDIII и наиболее конкретно GSDII.
Изобретение дополнительно относится к использованию молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, химерного полипептида GAA или клетки по изобретению при изготовлении лекарственного средства, эффективного для лечения болезни накопления гликогена, такой как GSDI (болезнь Гирке), GSDII (болезнь Помпе), GSDIII (болезнь Кори), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII и летальная врожденная болезнь накопления гликогена в сердце, более конкретно GSDI, GSDII или GSDIII, даже более конкретно GSDII и GSDIII и наиболее конкретно GSDII.
ПРИМЕРЫ
Изобретение дополнительно описано подробно со ссылкой на следующие экспериментальные примеры и приложенные фигуры. Эти примеры приведены лишь в иллюстративных целях и не предназначены в качестве ограничения.
МАТЕРИАЛЫ И СПОСОБЫ
Активность GAA
Активность GAA измеряли после гомогенизации замороженных образцов тканей в дистиллированной воде. 50-100 мг ткани взвешивали и гомогенизировали, затем центрифугировали в течение 20 минут на 10000×g. Реакцию проводили с использованием 10 мкл супернатанта и 20 мкл субстрата - 4MUα-D-глюкозида, в 96-луночном планшете. Реакционную смесь инкубировали при 37°C в течение одного часа и затем останавливали добавлением 150 мкл буфера с карбонатом натрия pH 10,5. Калибровочную кривую (4MU 0-2500 пмоль/мкл) использовали для того, чтобы измерять высвобождаемый флуоресцентный 4MU из индивидуальной реакционной смеси, используя считыватель планшетов EnSpire α (Perkin-Elmer) на 449 нм (испускание) и 360 нм (возбуждение). Концентрацию белка осветленного супернатанта количественно определяли с помощью BCA (Thermo Fisher Scientific). Для того чтобы вычислять активность GAA, концентрацию высвобождаемого 4MU делили на концентрацию белка в образце и активность приводили в виде нмоль/час/мг белка.
Содержание гликогена
Содержание гликогена измеряли опосредованно в виде глюкозы, высвобождаемой после полного расщепления тканевых гомогенатов, полученных как описано выше, с помощью амилоглюкозидазы Aspergillus niger. Реакцию проводили в 96-луночном планшете с 20 мкл тканевого гомогената и 55 мкл дистиллированной воды. Образцы инкубировали в течение 5 мин при 95°C и затем охлаждали при 4°C. 25 мкл амилоглюкозидазы (разведенной 1:50 в 0,1 M ацетате калия pH 5,5) добавляли в каждый образец. Контрольную реакцию без амилоглюкозидазы также проводили для каждого образца. Оба образца и контрольную реакцию инкубировали при 37°C в течение 90 минут. Реакцию останавливали посредством инкубации образцов в течение 5 мин при 95°C. Высвобождаемую глюкозу определяли с использованием набора для анализа глюкозы (Sigma-Aldrich) посредством измерения поглощения с использованием считывателя планшетов EnSpire α (Perkin-Elmer) на 540 нм.
Плетизмография
Проточный (0,5 л/мин) плетизмограф (EMKA Technologies) использовали для того, чтобы измерять паттерн дыхания у контрольных и Gaa-/- мышей. Прозрачную камеру из плексигласа калибровали с использованием известного потока воздуха и сигналов давления перед сбором данных. Сигналы анализировали с использованием программного обеспечения IOX2 (EMKA Technologies). Измеряли следующие переменные: частота дыхания, дыхательный объем и минутный объем вентиляции. Данные о вентиляции собирали в 5-минутные интервалы. Давали 5 минут для акклиматизации в камере. В ходе акклиматизации и получения данных мыши дышали нормоксическим воздухом (21% O2, 79% N2).
Исследования мышей
GAA-/- мышь создавали посредством направленного разрушения экзона 6 и поддерживали на фоне C57BL/6J/129X1/SvJ (Raben N. et al 1998). Векторы доставляли через хвостовую вену в объеме 0,2 мл. Образцы сыворотки брали ежемесячно для того, чтобы осуществлять мониторинг уровней секретируемой hGAA. Пораженных животных, которым инъецировали PBS, и однопометников дикого типа использовали в качестве контролей.
Определение антител против hGAA
96-луночные планшеты Maxisorp (Thermo Fisher Scientific) покрывали белком Myozime® в карбонатном буфере при 4°C в течение ночи. Для калибровочной кривой рекомбинантным IgG крысы (Sigma Aldrich) покрывали лунки в семи 2-кратных разведениях, начиная с 1 мкг/мл. После блокирования, образцы плазмы добавляли в планшеты и инкубировали 1 ч при 37°C. Обнаружение осуществляли посредством добавления в лунки субстрата 3,3′,5,5′-тетраметилбензидина (BD Biosciences) и развитие окраски измеряли при 450 и 570 нм (для вычитания фона) на считывателе планшетов Enspire (Perkin Elmer) после блокирования реакции с использованием H2SO4.
Исследование NHP
Самцов яванских макаков содержали в клетках из нержавеющей стали и с поддержанием 12-часового цикла свет/темнота. Все макаки имели титры нейтрализующих антител < 1:5 перед началом исследования. дозу 2E12 вг/кг AAV8-hAAT-sp7-Δ8-hGAAco1 инфузировали через подкожную вену. Образцы крови брали за 12 суток до и через 30 суток после инъекции через бедренную вену. Цельную кровь собрали в содержащие EDTA пробирки и центрифугировали для того, чтобы отделять сыворотку. Через 3 месяца после введения вектора всех макаков умерщвляли. Животных сначала анестезировали смесью кетамина/дексмедетомидина и затем эвтаназировали с использованием IV инъекции пентобарбитала натрия. Ткани собирали непосредственно и замораживали в жидком азоте.
Анализ вестерн-блоттинга
Получали полные гомогенаты замороженных мышц. Концентрацию белка определяли в экстрактах с помощью Pierce BCA Protein Assay (Thermo Fisher Scientific), придерживаясь инструкций производителя. Вестерн-блоттинг осуществляли с использованием антитела против hGAA (Abcam). Антитело против тубулина (Sigma Aldrich) использовали в качестве контроля загрузки.
РЕЗУЛЬТАТЫ
С целью усовершенствования существующей генной заместительной терапии для болезни Помпе, авторы изобретения конструировали последовательность hGAA для увеличения ее секреции посредством замены сигнального пептида дикого типа (обозначаемого здесь как sp1) на другие сигнальные пептиды (от sp2 до sp8, описанные в таблице 4) в последовательности hGAA с оптимизированной последовательностью (SEQ ID NO: 13).
Таблица 4
Авторы изобретения трансфицировали клетки гепатомы (Huh-7) плазмидами, экспрессирующими GFP или hGAA дикого типа (hGAA; SEQ ID NO: 37), параллельно с плазмидами, экспрессирующими hGAA с оптимизированными кодонами (hGAAco), слитую с сигнальными пептидами с 1 до 8. Через 48 часов после трансфекции среду для выращивания анализировали на присутствие hGAA. Стоит отметить, что только четыре из конструкций, несущих эффективных сигнальный пептид, вели к уровням секреции hGAA, значительно превышающим таковые, наблюдаемые в отрицательном контроле, представленном GFP-трансфицированными клетками (фиг. 1A). Конструкции, экспрессирующие химерный белок hGAA, несущий сигнальные пептиды sp2, sp6, sp7 и sp8, секретировали более высокие уровни hGAA в среду (p < 0,05 в сравнении с GFP).
Затем авторы изобретения упаковывали эти конструкции в AAV8 векторы, полученные посредством тройной трансфекции и очистки хлоридом цезия, и авторы изобретения инъецировали их мышам C57BL/6J дикого типа. Затем мы сравнивали уровни GAA в сыворотке in vivo среди конструкций, в которых использовали сигнальные пептиды sp1, 2, 3, 7 и 8 (фиг. 1B). Через один месяц после инъекции 1E12 вг/кг AAV8 векторов, экспрессирующих hGAAco, авторы изобретения наблюдали значительно более высокий уровень циркулирующей hGAA по сравнению с мышами, которым инъецировали PBS. Интересно, что уровень циркулирующей hGAA значительно выше у мышей, которых лечили векторами, экспрессирующими hGAAco, слитую с sp2, 7 и 8. К удивлению, уровни секреции, которых достигали с использованием sp2 конструкции in vivo, значительно ниже чем тех, что измеряли при использовании сконструированной sp7- и sp8-hGAA (фиг. 1B). В совокупности эти данные показывают, что замена сигнального пептида дикого типа на сигнальные пептиды, происходящие от белка, эффективно секретируемого в печени, является эффективной стратегией для увеличения уровня циркулирующей hGAA in vivo. Кроме того, неожиданные результаты, полученные in vivo при использовании сигнальных пептидов sp7 и 8, показывают, что не все сигнальные пептиды в равной мере эффективны in vivo и что сигнальные пептиды sp7 и sp8 оказывают превосходящий эффект на секрецию in vivo по сравнению с sp1 и sp2.
Затем эти находки подтверждали в модели заболевания на животных, GAA-/- мышах. Эта модель на мышах лишена остаточной активности фермента в мышце, при накоплении гликогена в различных органах, что ведет к ослаблению мышечной силы и уменьшенной продолжительности жизни.
Для того чтобы сравнивать эффективность различных векторов при предотвращении фенотипа болезни Помпе у GAA-/- мышей, авторы изобретения долгосрочно наблюдали эффекты инъекции 2E12 вг/кг векторов, экспрессирующих hGAAco и сконструированную версию, слитую с сигнальными пептидами sp2, 7 и 8. Через 3 месяца после инъекций авторы изобретения наблюдали значительно увеличенную циркулирующую hGAA после инъекции AAV8, экспрессирующего hGAAco, несущую высоко эффективные сигнальные пептиды sp2, 7 и 8 (фиг. 2A). Следует отметить, что hGAAco, слитая с сигнальным пептидом sp7, вела к уровням hGAA в циркуляции значительно выше таковых, наблюдаемых для двух других конструкций. Долгосрочное наблюдение в этом эксперименте позволяло авторам изобретения оценивать выживаемость GAA-/- мышей. Мыши получали инъекции в возрасте 4 месяцев, и затем их наблюдали в течение 6 месяцев. В течение этого периода 8/10 GAA-/- мышей погибали в группе инъекции PBS, тогда как только 1/45 смерть приведена у GAA-/- животных, которых лечили экспрессирующими hGAAco конструкциями, и у животных дикого типа. Статистическая значимость этой находки (фиг. 2B) указывает на то, что лечение всеми экспрессирующими hGAAco векторами, независимо от уровня секреции, предотвращает летальный фенотип, наблюдаемый у GAA-/- мышей. Другой фенотип, приведенный для этой модели на мышах, представляет собой сниженную дыхательную функцию. В частности, сообщалось о сниженном дыхательном объеме (DeRuisseau et al., PNAS 2008), и показано, что снижение обусловлено накоплением гликогена в нервной системе. Предотвращение уровня гликогена в нервной системе зависит от способности hGAA пересекать гематоэнцефалический барьер, и при других лизосомных болезнях накопления (Polito et al., Hum. Mol. Genet. 2010, Cho et al., Orph. J. of Rare Dis. 2015) продемонстрировано, что это зависит непосредственно от циркулирующих уровней белка. Следовательно, авторы изобретения оценивали эффект долгосрочного высокого уровня hGAA в циркуляции, оказываемый на дыхательный объем у GAA-/- мышей. Через 3 месяца после инъекций, GAA-/- мыши демонстрировали сниженный, хотя и незначительно (p=0,104), дыхательный объем, тогда как мыши, которых лечили с использованием sp7, демонстрировали дыхательный объем, очень схожий с тем, что наблюдали у WT мышей (p=0,974) (фиг. 2C, слева). Через 6 месяцев после инъекций только две GAA-/- мыши выживали, и они выглядели имеющими менее тяжелый дыхательный фенотип. Снова мыши, которых лечили с использованием sp7 hGAAco, имели дыхательный объем, схожий с тем, что наблюдали у WT животных (p=0,969) (фиг. 2C, справа). Важно, что отмечали статистически значимое различие между дыхательным объемом, измеренным у мышей, которых лечили с использованием sp1 и sp7 hGAAco (p=0,041), что демонстрирует более выраженное усовершенствование у мышей, которых лечили sp7-GAA. В совокупности эти данные показывают, что трансдукция печени с использованием AAV8, экспрессирующего hGAAco, слитую с сигнальным пептидом sp7, ведет к превосходящему уровню hGAA в крови с сопутствующей полной фенотипической коррекции дыхательной функции у GAA-/- мышей.
Затем авторы изобретения верифицировали, предотвращал ли высокий уровень циркулирующей hGAA накопление гликогена в скелетной мышце. Авторы изобретения измеряли активность hGAA в квадрицепсе мышей, получавших инъекции, как описано выше. Инъекция экспрессирующих hGAA векторов вела к увеличению активности hGAA в квадрицепсе до уровней, сравнимых с теми, которые наблюдали у WT животных (фиг. 3A). Измерение гликогена в квадрицепсе показывает, что GAA-/- мыши накапливают ~ в 20 раз больше гликогена, чем WT животные (p=3,5E-6). Это накопление обращают посредством лечения экспрессирующим hGAA вектором (p<0,05 в сравнении с GAA-/-), с использованием sp7, который показывал наименьшие уровни гликогена, неотличимые от уровней животных дикого типа (p=0,898 в сравнении с WT) (фиг. 3B).
Для того чтобы верифицировать, что слияние hGAA с эффективным сигнальным пептидом усовершенствует его секрецию и увеличивает фенотипическую коррекцию заболевания in vivo, авторы изобретения инъецировали GAA-/- мышам вектор в низкой дозе, и авторы изобретения оценивали биохимическую коррекцию фенотипа. Через 3 месяца после инъекции 6E11 вг/кг векторов, экспрессирующих hGAAco, слитую с сигнальным пептид 1, 7 и 8, авторы изобретения измеряли циркулирующую hGAA. Стоит отметить, что sp7 и 8 вели к трехкратному увеличению секретируемой hGAA, поддающейся обнаружению в сыворотке, по сравнению с мышами, которых лечили PBS (фиг. 4A). Авторы изобретения дополнительно исследовали терапевтические эффекты AAV8 векторов, экспрессирующих hGAAco, посредством выполнения биохимического анализа тканей от животных, получавших лечение, и контролей. Авторы изобретения оценивали содержание гликогена в сердце, диафрагме и квадрицепсе GAA-/- мышей, которых лечили, как описано выше. Следует отметить, что авторы изобретения наблюдали высокие уровни hGAA в тканях после лечения экспрессирующими hGAAco векторами (данные не представлены), которые коррелировали со значимым снижением содержания гликогена во всех рассмотренных тканях (фиг. 4B-D). В частности, в сердце (фиг. 4B) уровень гликогена, измеренный после лечения векторами, несущими высокоэффективные сигнальные пептиды sp7 и 8, неотличим от того, который наблюдали у не пораженных животных дикого типа (p=0,983 и 0,996 в сравнении с WT, соответственно). Важно, что уровень, наблюдаемый после лечения с использованием векторов sp7 и sp8, значительно снижался по сравнению с GAA-/- животными, которые получали инъекции PBS или лечение с использованием экспрессирующего hGAAco дикого типа вектора (обозначен как sp1).
Авторы изобретения также тестировали, индуцировала ли трансдукция печени с использованием векторов авторов изобретения гуморальный ответ на трансген. Мышам внутривенно инъецировали AAV8 векторы, экспрессирующие hGAAco1 с нативным сигнальным пептидом sp1 (co) или Δ8-hGAAco1, слитую с sp2, sp7 или sp8, под транскрипционным управлением специфического промотора печени. Результаты представлены на фиг. 5. Gaa-/- получали внутримышечную инъекцию AAV, экспрессирующего Δ8-hGAAco1 под транскрипционным управлением конститутивного промотора, который демонстрировал очень высокий уровень общего IgG (~150 мкг/мл), тогда как в целом вектор, экспрессирующий тот же белок в печени, демонстрировал более низкий уровень гуморального ответа. Интересно, что мыши, которым инъецировали экспрессирующий sp1 hGAAco1 (co) вектор, демонстрировали поддающийся обнаружению уровень антител при обеих дозах, тогда как мыши, которым инъецировали сконструированные векторы высокой секреции, имели неподдающиеся обнаружению уровни IgG. Эти данные показывают, что экспрессия трансгена в печени является необходимой для индукции периферической толерантности, также они предоставляют указания на то, что высокие уровни циркулирующей hGAA, которых достигали посредством слияния с эффективным сигнальным пептидом, индуцируют снижение гуморального ответа на сам белок.
Наиболее действенный вектор, выбранный в исследовании на мышах, инъецировали двум не являющимся человеком приматам (NHP, Macaca fascicularis sp.) для того, чтобы верифицировать эффект секреции вектора авторов изобретения и захват в мышцах. Авторы изобретения инъецировали двум обезьянам 2E12 вг/кг AAV8-hAAT-sp7-Δ8-hGAAco1. Через один месяц после инъекции авторы изобретения измеряли уровни hGAA в сыворотке двух животных посредством вестерн-блоттинга с использованием специфического антитела против hGAA. У двух обезьян авторы изобретения наблюдали четкую полосу с размером, совместимым с таковым у hGAA. Эта полоса отсутствовала в образцах сыворотки, полученных за 12 суток до инъекции вектора, что, таким образом, подтверждает специфичность способа обнаружения авторов изобретения (фиг. 6A). Через 3 месяца после инъекции авторы изобретения умерщвляли животных и авторы изобретения получали ткани для того, чтобы верифицировать, если hGAA, секретируемая печенью в кровоток, эффективно захватывалась мышцей. Авторы изобретения выполняли вестерн-блоттинг с использованием антитела со специфичностью к hGAA на общих лизатах, полученных из бицепса и диафрагмы двух обезьян. Интересно, что авторы изобретения могли наблюдать четкую полосу у животного № 2, которое также демонстрировало самые высокие уровни hGAA в кровотоке (фиг. 6B). Также у животного № 1 авторы изобретения могли наблюдать слабую полосу с молекулярной массы, соответствующей таковой у hGAA, в обеих анализируемых мышцах. Эти данные показывают, что вектор AAV8-hAAT-sp7-Δ8-hGAAco1 эффективно трансдуцирует печень у NHP. Также они демонстрируют, что белок, секретируемый в кровоток, эффективно захватывается мышцей и что это захват коррелирует с уровнем hGAA, измеряемой в крови.
Авторы изобретения дополнительно проводили анализ активности GAA в средах и лизатах клеток HuH7, трансфицированных различными версиями GAA (все с оптимизированными кодонами): 1. нативная GAA, содержащая нативный сигнальный пептид sp1 GAA (co), 2. сконструированная GAA, содержащая гетерологичный сигнальный пептид sp7 или sp8 (sp7-co, sp8-co). Анализ показывал (фиг. 7) значительно более высокую активность GAA в средах клеток, трансфицированных сконструированными версиями, по сравнению с нативной GAA (co). Интересно, что внутриклеточная активность GAA была наоборот значительно выше при использовании нативной GAA (co) по сравнению со сконструированными версиями, что указывает на то, что нативная GAA преимущественно удерживается в клетках.
Авторы изобретения также определяли эффект наиболее действенного вектора, выбранного в исследовании на мышах (AAV8-hAAT-sp7-Δ8-hGAAco1) в модели GSDIII на мышах. Авторы изобретения разрабатывали модель на мышах с нокаутом для гликоген-деветвящего фермента (GDE). Эта модель повторяет фенотип заболевания, наблюдаемый у людей, пораженных болезнью накопления гликогена III типа (GSDIII). В частности, GDE-/- мыши, у которых полностью отсутствует активность GDE, имеют ослабление силы мышц и накопление гликогена в различных тканях. Также интересно, что они накапливают гликоген в печени, что также наблюдают у человека. Здесь авторы изобретения тестировали, предотвращает ли сверхэкспрессия sp7-Δ8-hGAA в печени накопление гликогена, наблюдаемое у GDE-/- мышей. Авторы изобретения инъецировали GDE-/- мышам 1E11 или 1E12 вг/мышь AAV8-hAAT-sp7-Δ8-hGAAco1. В качестве контролей авторы изобретения параллельно инъецировали PBS мышам дикого типа (WT) и GDE-/- мышам. Через 3 месяца после введения вектора, мышей умерщвляли и количественно определяли уровень гликогена в печени. Результаты приведены на фиг. 8. Как уже сообщалось (Pagliarani et al., и модель авторов изобретения), GDE-/- мыши демонстрировали значимое увеличение накопления гликогена в печени (p=1,3E-7) - в 5 раз больше гликогена по сравнению с животными дикого типа. К удивлению, лечение с использованием 1E11 и 1E12 вг/мышь вектора AAV8-hAAT-sp7-Δ8-hGAAco1 вызывало статистически значимое снижение содержания гликогена (p=4,5E-5 и 1,4E-6, соответственно). Важно, что уровни гликогена, измеряемого в печени мышей, которым инъецировали вектор AAV8-hAAT-sp7-Δ8-hGAAco1, не отличались от таковых, измеряемых у животных дикого типа, в частности, в самой высокой дозе (p=0,053 для когорты дозы 1E11 и 0,244 для когорты дозы 1E12).
Авторы изобретения проводили анализ активности GAA в средах и лизатах клеток HuH7, трансфицированных различными версиями GAA (все с оптимизацией кодонов): 1. нативная GAA, содержащая нативный сигнальный пептид sp1 GAA (co), 2. сконструированная GAA, содержащая гетерологичный сигнальный пептид sp7 (sp7-co), и 3. сконструированная GAA, содержащая гетерологичный сигнальный пептид sp7, после которого следует делеция переменного числа аминокислот (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co и sp7-Δ62-co, в которых удаляют, соответственно, 8, 29, 42, 47 и 62 первых N-концевых аминокислот из SEQ ID NO: 5). Анализ показывал (фиг. 9) значительно более высокую активность GAA в средах клеток, трансфицированных с использованием Δ8, Δ29, Δ42 и Δ43 версий GAA по сравнению как со сконструированной GAA без делеций (sp7-co), так и с нативной GAA (co). Значительно более низкую активность GAA наоборот наблюдали в средах клеток, трансфицированных с использованием Δ47 и Δ62 версий GAA, по сравнению с другими сконструированными версиями GAA [с делециями (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) и без делеций (sp7-co)]. Интересно, что (фиг. 10) внутриклеточная активность GAA не различалась среди продуктивных делеций (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) и версии без делеций (sp7-co), что указывает на то, что все они эффективно продуцируются и процессируются в клетке. Внутриклеточная активность GAA наоборот была очень низкой для версий sp7-Δ47-co и sp7-Δ62-co и значительно ниже по сравнению со всеми другими сконструированными версиями [с делециями (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) и без делеций (sp7-co)].
Авторы изобретения также выполняли анализ активности GAA в средах и лизатах клеток HuH7, трансфицированных различными версиями GAA (все с оптимизированными кодонами): 1. нативная GAA, содержащая нативный сигнальный пептид sp1 GAA (co), 2. сконструированная GAA, содержащая гетерологичный сигнальный пептид sp6 или sp8 (sp6-co, sp8-co), и 3. сконструированная GAA, содержащая гетерологичный сигнальный пептид sp6 или sp8, после которого следует делеция 8 аминокислот (sp6-Δ8-co, sp8-Δ8-co). Анализ показывал (фиг. 11) значительно более высокую активность GAA в средах клеток, трансфицированных Δ8 версиями, по сравнению с: i. соответствующими им сконструированными версиями GAA без делеций (sp6-co или sp8-co); и ii. нативной GAA (co). Интересно, что внутриклеточная активность GAA не различалась среди всех сконструированных версий GAA (как с делециями, так и без делеций), что указывает на то, что все они эффективно продуцируются и процессируются в клетке (часть лизатов клеток). Внутриклеточная активность GAA наоборот была значительно выше при использовании нативной GAA (co) по сравнению со сконструированными версиями, что указывает на то, что нативная GAA преимущественно удерживается в клетке.
--->
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> GENETHON et al.
<120> ВАРИАНТЫ КИСЛОЙ АЛЬФА-ГЛЮКОЗИДАЗЫ И ИХ ИСПОЛЬЗОВАНИЕ
<130> B2298PC00
<160> 54
<170> PatentIn версии 3.3
<210> 1
<211> 2859
<212> ДНК
<213> homo sapiens
<400> 1
atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60
ttggcaaccg cagcgctcct ggggcacatc ctactccatg atttcctgct ggttccccga 120
gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180
agcagaccag ggccccggga tgcccaggca caccccgggc ggccgcgagc agtgcccaca 240
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300
gaacagtgcg aggcccgcgg ctgttgctac atccctgcaa agcaggggct gcagggagcc 360
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcatgtc 600
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660
atcgtgcgcc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200
cagtggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560
gagccttcca acttcatcag gggctctgag gacggctgcc ccaacaatga gctggagaac 1620
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccagta 2340
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520
atggccctgg ctgtggccct gaccaagggt ggggaggccc gaggggagct gttctgggac 2580
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820
ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859
<210> 2
<211> 18
<212> Белок
<213> Искусственная
<220>
<223> sp7
<400> 2
Met Ala Phe Leu Trp Leu Leu Ser Cys Trp Ala Leu Leu Gly Thr Thr
1. 5 10 15
Phe Gly
<210> 3
<211> 25
<212> Белок
<213> Искусственная
<220>
<223> sp6
<400> 3
Met Pro Pro Pro Arg Thr Gly Arg Gly Leu Leu Trp Leu Gly Leu Val
1. 5 10 15
Leu Ser Ser Val Cys Val Ala Leu Gly
20 25
<210> 4
<211> 22
<212> Белок
<213> Искусственная
<220>
<223> sp8
<400> 4
Met Ala Ser Arg Leu Thr Leu Leu Thr Leu Leu Leu Leu Leu Leu Ala
1. 5 10 15
Gly Asp Arg Ala Ser Ser
20
<210> 5
<211> 925
<212> Белок
<213> Искусственная
<220>
<223> hGAAwt без sp
<400> 5
Gly His Ile Leu Leu His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser
1. 5 10 15
Gly Ser Ser Pro Val Leu Glu Glu Thr His Pro Ala His Gln Gln Gly
20 25 30
Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro
35 40 45
Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp
50 55 60
Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly
65 70 75 80
Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly
85 90 95
Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu
100 105 110
Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr
115 120 125
Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val
130 135 140
Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala
145 150 155 160
Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val His Ser Arg
165 170 175
Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly
180 185 190
Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr
195 200 205
Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser
210 215 220
Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu
225 230 235 240
Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu
245 250 255
Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu
260 265 270
Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser
275 280 285
Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg
290 295 300
Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro
305 310 315 320
Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met
325 330 335
Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser
340 345 350
Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala His
355 360 365
Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg
370 375 380
Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met
385 390 395 400
Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp
405 410 415
Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp
420 425 430
Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro
435 440 445
Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr
450 455 460
Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe His
465 470 475 480
Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser
485 490 495
Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu
500 505 510
Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala
515 520 525
Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu
530 535 540
His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu
545 550 555 560
Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe
565 570 575
Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser
580 585 590
Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn
595 600 605
Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly
610 615 620
Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe
625 630 635 640
Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu
645 650 655
Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu
660 665 670
Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln
675 680 685
Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe
690 695 700
Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly
705 710 715 720
Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val
725 730 735
Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro
740 745 750
Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu
755 760 765
Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu
770 775 780
Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln
785 790 795 800
Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu
805 810 815
Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp
820 825 830
Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln
835 840 845
Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg
850 855 860
Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu
865 870 875 880
Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val
885 890 895
Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val
900 905 910
Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
915 920 925
<210> 6
<211> 441
<212> ДНК
<213> Искусственная
<220>
<223> интрон HBB2
<400> 6
gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60
cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120
gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180
atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240
aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300
ttattttatg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360
tcatgttcat acctcttatc ttcctcccac agctcctggg caacgtgctg gtctgtgtgc 420
tggcccatca ctttggcaaa g 441
<210> 7
<211> 441
<212> ДНК
<213> модифицировнный интрон HBB2
<400> 7
gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60
cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120
gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180
atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240
aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300
ttattttctg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360
tcttgttcat acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc 420
tggcccatca ctttggcaaa g 441
<210> 8
<211> 1438
<212> ДНК
<213> Искусственная
<220>
<223> интрон FIX
<400> 8
ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60
gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120
acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180
atttttaaaa ctaaatagat cgacaatgct tatgatgcat ttatgtttaa taaacactgt 240
tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300
aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360
tttttgtttg gacttaccac tttgaaatca aaatgggaaa caaaagcaca aacaatggcc 420
ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480
aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540
cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600
ggaaaaaatc attttgtctc tatgtcaaac atcttggagt tgatatttgg ggaaacacaa 660
tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720
agttagctaa tgcaacatat atcactttgt tttttcacaa ctacagtgac tttatgtatt 780
tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc atgttctcac 840
aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900
accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960
cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020
tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080
agggtgatgg atcactttgc aaagatcctc aatgagctat tttcaagtga tgacaaagtg 1140
tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200
agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260
cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320
aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 1380
aaattttcat gatgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438
<210> 9
<211> 1438
<212> ДНК
<213> Искусственная
<220>
<223> модифицированный интрон FIX
<400> 9
ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60
gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120
acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180
atttttaaaa ctaaatagat cgacattgct tttgttgcat ttatgtttaa taaacactgt 240
tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300
aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360
tttttgtttg gacttaccac tttgaaatca aattgggaaa caaaagcaca aacaatggcc 420
ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480
aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540
cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600
ggaaaaaatc attttgtctc tttgtcaaac atcttggagt tgatatttgg ggaaacacaa 660
tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720
agttagctat tgcaacatat atcactttgt tttttcacaa ctacagtgac tttttgtatt 780
tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc ttgttctcac 840
aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900
accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960
cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020
tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080
agggtgttgg atcactttgc aaagatcctc attgagctat tttcaagtgt tgacaaagtg 1140
tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200
agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260
cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320
aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 1380
aaattttctt gttgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438
<210> 10
<211> 881
<212> ДНК
<213> Искусственная
<220>
<223> интрон бета-глобина курицы
<400> 10
gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660
cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 720
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 840
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881
<210> 11
<211> 881
<212> ДНК
<213> Искусственная
<220>
<223> модифицированный интрон бета-глобина курицы
<400> 11
gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660
cggctgtcga ggcgcggcga gccgcagcca ttgccttttt tggtaatcgt gcgagagggc 720
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaat tgggcgggga 840
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881
<210> 12
<211> 952
<212> Белок
<213> homo sapiens
<400> 12
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1. 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 13
<211> 2778
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco1 без sp
<400> 13
ggccatatcc tgctgcacga ctttctacta gtgcccagag agctgagcgg cagctctccc 60
gtgctggaag aaacacaccc tgcccatcag cagggcgcct ctagacctgg acctagagat 120
gcccaggccc accccggcag acctagagct gtgcctaccc agtgtgacgt gccccccaac 180
agcagattcg actgcgcccc tgacaaggcc atcacccagg aacagtgcga ggccagaggc 240
tgctgctaca tccctgccaa gcagggactg cagggcgctc agatgggaca gccctggtgc 300
ttcttcccac cctcctaccc cagctacaag ctggaaaacc tgagcagcag cgagatgggc 360
tacaccgcca ccctgaccag aaccaccccc acattcttcc caaaggacat cctgaccctg 420
cggctggacg tgatgatgga aaccgagaac cggctgcact tcaccatcaa ggaccccgcc 480
aatcggagat acgaggtgcc cctggaaacc ccccacgtgc actctagagc ccccagccct 540
ctgtacagcg tggaattcag cgaggaaccc ttcggcgtga tcgtgcggag acagctggat 600
ggcagagtgc tgctgaacac caccgtggcc cctctgttct tcgccgacca gttcctgcag 660
ctgagcacca gcctgcccag ccagtacatc acaggactgg ccgagcacct gagccccctg 720
atgctgagca catcctggac ccggatcacc ctgtggaaca gggatctggc ccctacccct 780
ggcgccaatc tgtacggcag ccaccctttc tacctggccc tggaagatgg cggatctgcc 840
cacggagtgt ttctgctgaa ctccaacgcc atggacgtgg tgctgcagcc tagccctgcc 900
ctgtcttgga gaagcacagg cggcatcctg gatgtgtaca tctttctggg ccccgagccc 960
aagagcgtgg tgcagcagta tctggatgtc gtgggctacc ccttcatgcc cccttactgg 1020
ggcctgggat tccacctgtg cagatggggc tactccagca ccgccatcac cagacaggtg 1080
gtggaaaaca tgaccagagc ccacttccca ctggatgtgc agtggaacga cctggactac 1140
atggacagca gacgggactt caccttcaac aaggacggct tccgggactt ccccgccatg 1200
gtgcaggaac tgcatcaggg cggcagacgg tacatgatga tcgtggatcc cgccatcagc 1260
tcctctggcc ctgccggctc ttacagaccc tacgacgagg gcctgcggag aggcgtgttc 1320
atcaccaacg agacaggcca gcccctgatc ggcaaagtgt ggcctggcag cacagccttc 1380
cccgacttca ccaatcctac cgccctggct tggtgggagg acatggtggc cgagttccac 1440
gaccaggtgc ccttcgacgg catgtggatc gacatgaacg agcccagcaa cttcatccgg 1500
ggcagcgagg atggctgccc caacaacgaa ctggaaaatc ccccttacgt gcccggcgtc 1560
gtgggcggaa cactgcaggc cgctacaatc tgtgccagca gccaccagtt tctgagcacc 1620
cactacaacc tgcacaacct gtacggcctg accgaggcca ttgccagcca ccgcgctctc 1680
gtgaaagcca gaggcacacg gcccttcgtg atcagcagaa gcacctttgc cggccacggc 1740
agatacgccg gacattggac tggcgacgtg tggtcctctt gggagcagct ggcctctagc 1800
gtgcccgaga tcctgcagtt caatctgctg ggcgtgccac tcgtgggcgc cgatgtgtgt 1860
ggcttcctgg gcaacacctc cgaggaactg tgtgtgcggt ggacacagct gggcgccttc 1920
taccctttca tgagaaacca caacagcctg ctgagcctgc cccaggaacc ctacagcttt 1980
agcgagcctg cacagcaggc catgcggaag gccctgacac tgagatacgc tctgctgccc 2040
cacctgtaca ccctgtttca ccaggcccat gtggccggcg agacagtggc cagacctctg 2100
tttctggaat tccccaagga cagcagcacc tggaccgtgg accatcagct gctgtgggga 2160
gaggctctgc tgattacccc agtgctgcag gcaggcaagg ccgaagtgac cggctacttt 2220
cccctgggca cttggtacga cctgcagacc gtgcctgtgg aagccctggg atctctgcct 2280
ccacctcctg ccgctcctag agagcctgcc attcactctg agggccagtg ggtcacactg 2340
cctgcccccc tggataccat caacgtgcac ctgagggccg gctacatcat accactgcag 2400
ggacctggcc tgaccaccac cgagtctaga cagcagccaa tggccctggc cgtggccctg 2460
accaaaggcg gagaagctag gggcgagctg ttctgggacg atggcgagag cctggaagtg 2520
ctggaaagag gcgcctatac ccaagtgatc ttcctggccc ggaacaacac catcgtgaac 2580
gagctggtgc gcgtgacctc tgaaggcgct ggactgcagc tgcagaaagt gaccgtgctg 2640
ggagtggcca cagcccctca gcaggtgctg tctaatggcg tgcccgtgtc caacttcacc 2700
tacagccccg acaccaaggt gctggacatc tgcgtgtcac tgctgatggg agagcagttt 2760
ctggtgtcct ggtgctga 2778
<210> 14
<211> 2778
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco2 без sp
<400> 14
ggacacatcc tgctgcacga cttcctgttg gtgcctagag agctgagcgg atcatcccca 60
gtgctggagg agactcatcc tgctcaccaa cagggagctt ccagaccagg accgagagac 120
gcccaagccc atcctggtag accaagagct gtgcctaccc aatgcgacgt gccacccaac 180
tcccgattcg actgcgcgcc agataaggct attacccaag agcagtgtga agccagaggt 240
tgctgctaca tcccagcgaa gcaaggattg caaggcgccc aaatgggaca accttggtgt 300
ttcttccccc cttcgtaccc atcatataaa ctcgaaaacc tgtcctcttc ggaaatgggt 360
tatactgcca ccctcaccag aactactcct actttcttcc cgaaagacat cttgaccttg 420
aggctggacg tgatgatgga gactgaaaac cggctgcatt tcactatcaa agatcctgcc 480
aatcggcgat acgaggtccc tctggaaacc cctcacgtgc actcacgggc tccttctccg 540
ctttactccg tcgaattctc tgaggaaccc ttcggagtga tcgttagacg ccagctggat 600
ggtagagtgc tgttgaacac tactgtggcc ccacttttct tcgctgacca gtttctgcaa 660
ctgtccactt ccctgccatc ccagtacatt actggactcg ccgaacacct gtcgccactg 720
atgctctcga cctcttggac tagaatcact ttgtggaaca gagacttggc ccctactccg 780
ggagcaaatc tgtacggaag ccaccctttt tacctggcgc tcgaagatgg cggatccgct 840
cacggagtgt tcctgctgaa tagcaacgca atggacgtgg tgctgcaacc ttcccctgca 900
ctcagttgga gaagtaccgg gggtattctg gacgtgtaca tcttcctcgg accagaaccc 960
aagagcgtgg tgcagcaata tctggacgtg gtcggatacc cttttatgcc tccttactgg 1020
ggactgggat tccacctttg ccgttggggc tactcatcca ccgccattac cagacaggtg 1080
gtggagaata tgaccagagc ccacttccct ctcgacgtgc agtggaacga tctggactat 1140
atggactccc ggagagattt caccttcaac aaggacgggt tccgcgattt tcccgcgatg 1200
gttcaagagc tccaccaggg tggtcgaaga tatatgatga tcgtcgaccc agccatttcg 1260
agcagcggac ccgctggatc ttatagacct tacgacgaag gccttaggag aggagtgttc 1320
atcacaaacg agactggaca gcctttgatc ggtaaagtgt ggcctggatc aaccgccttt 1380
cctgacttta ccaatcccac tgccttggct tggtgggagg acatggtggc cgaattccac 1440
gaccaagtcc cctttgatgg aatgtggatc gatatgaacg aaccaagcaa ttttatcaga 1500
ggttccgaag acggttgccc caacaacgaa ctggaaaacc ctccttatgt gcccggagtc 1560
gtgggcggaa cattacaggc cgcgactatt tgcgccagca gccaccaatt cctgtccact 1620
cactacaacc tccacaacct ttatggatta accgaagcta ttgcaagtca cagggctctg 1680
gtgaaggcta gagggactag gccctttgtg atctcccgat ccacctttgc cggacacggg 1740
agatacgccg gtcactggac tggtgacgtg tggagctcat gggaacaact ggcctcctcc 1800
gtgccggaaa tcttacagtt caaccttctg ggtgtccctc ttgtcggagc agacgtgtgt 1860
gggtttcttg gtaacacctc cgaggaactg tgtgtgcgct ggactcaact gggtgcattc 1920
tacccattca tgagaaacca caactccttg ctgtccctgc cacaagagcc ctactcgttc 1980
agcgagcctg cacaacaggc tatgcggaag gcactgaccc tgagatacgc cctgcttcca 2040
cacttataca ctctcttcca tcaagcgcat gtggcaggag aaaccgttgc aaggcctctt 2100
ttccttgaat tccccaagga ttcctcgact tggacggtgg atcatcagct gctgtgggga 2160
gaagctctgc tgattactcc agtgttgcaa gccggaaaag ctgaggtgac cggatacttt 2220
ccgctgggaa cctggtacga cctccagact gtccctgttg aagcccttgg atcactgcct 2280
ccgcctccgg cagctccacg cgaaccagct atacattccg agggacagtg ggttacatta 2340
ccagctcctc tggacacaat caacgtccac ttaagagctg gctacattat ccctctgcaa 2400
ggaccaggac tgactacgac cgagagcaga cagcagccaa tggcactggc tgtggctctg 2460
accaagggag gggaagctag aggagaactc ttctgggatg atggggagtc ccttgaagtg 2520
ctggaaagag gcgcttacac tcaagtcatt ttccttgcac ggaacaacac cattgtgaac 2580
gaattggtgc gagtgaccag cgaaggagct ggacttcaac tgcagaaggt cactgtgctc 2640
ggagtggcta ccgctcctca gcaagtgctg tcgaatggag tccccgtgtc aaactttacc 2700
tactcccctg acactaaggt gctcgacatt tgcgtgtccc tcctgatggg agagcagttc 2760
cttgtgtcct ggtgttga 2778
<210> 15
<211> 397
<212> ДНК
<213> Искусственная
<220>
<223> промотор hAAT
<400> 15
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 360
cagcttcagg caccaccact gacctgggac agtgaat 397
<210> 16
<211> 321
<212> ДНК
<213> Искусственная
<220>
<223> управляющая область ApoE
<400> 16
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg g 321
<210> 17
<211> 2808
<212> ДНК
<213> Искусственная
<220>
<223> sp7+hGAAco1-дельта-8
<400> 17
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggcctacta 60
gtgcccagag agctgagcgg cagctctccc gtgctggaag aaacacaccc tgcccatcag 120
cagggcgcct ctagacctgg acctagagat gcccaggccc accccggcag acctagagct 180
gtgcctaccc agtgtgacgt gccccccaac agcagattcg actgcgcccc tgacaaggcc 240
atcacccagg aacagtgcga ggccagaggc tgctgctaca tccctgccaa gcagggactg 300
cagggcgctc agatgggaca gccctggtgc ttcttcccac cctcctaccc cagctacaag 360
ctggaaaacc tgagcagcag cgagatgggc tacaccgcca ccctgaccag aaccaccccc 420
acattcttcc caaaggacat cctgaccctg cggctggacg tgatgatgga aaccgagaac 480
cggctgcact tcaccatcaa ggaccccgcc aatcggagat acgaggtgcc cctggaaacc 540
ccccacgtgc actctagagc ccccagccct ctgtacagcg tggaattcag cgaggaaccc 600
ttcggcgtga tcgtgcggag acagctggat ggcagagtgc tgctgaacac caccgtggcc 660
cctctgttct tcgccgacca gttcctgcag ctgagcacca gcctgcccag ccagtacatc 720
acaggactgg ccgagcacct gagccccctg atgctgagca catcctggac ccggatcacc 780
ctgtggaaca gggatctggc ccctacccct ggcgccaatc tgtacggcag ccaccctttc 840
tacctggccc tggaagatgg cggatctgcc cacggagtgt ttctgctgaa ctccaacgcc 900
atggacgtgg tgctgcagcc tagccctgcc ctgtcttgga gaagcacagg cggcatcctg 960
gatgtgtaca tctttctggg ccccgagccc aagagcgtgg tgcagcagta tctggatgtc 1020
gtgggctacc ccttcatgcc cccttactgg ggcctgggat tccacctgtg cagatggggc 1080
tactccagca ccgccatcac cagacaggtg gtggaaaaca tgaccagagc ccacttccca 1140
ctggatgtgc agtggaacga cctggactac atggacagca gacgggactt caccttcaac 1200
aaggacggct tccgggactt ccccgccatg gtgcaggaac tgcatcaggg cggcagacgg 1260
tacatgatga tcgtggatcc cgccatcagc tcctctggcc ctgccggctc ttacagaccc 1320
tacgacgagg gcctgcggag aggcgtgttc atcaccaacg agacaggcca gcccctgatc 1380
ggcaaagtgt ggcctggcag cacagccttc cccgacttca ccaatcctac cgccctggct 1440
tggtgggagg acatggtggc cgagttccac gaccaggtgc ccttcgacgg catgtggatc 1500
gacatgaacg agcccagcaa cttcatccgg ggcagcgagg atggctgccc caacaacgaa 1560
ctggaaaatc ccccttacgt gcccggcgtc gtgggcggaa cactgcaggc cgctacaatc 1620
tgtgccagca gccaccagtt tctgagcacc cactacaacc tgcacaacct gtacggcctg 1680
accgaggcca ttgccagcca ccgcgctctc gtgaaagcca gaggcacacg gcccttcgtg 1740
atcagcagaa gcacctttgc cggccacggc agatacgccg gacattggac tggcgacgtg 1800
tggtcctctt gggagcagct ggcctctagc gtgcccgaga tcctgcagtt caatctgctg 1860
ggcgtgccac tcgtgggcgc cgatgtgtgt ggcttcctgg gcaacacctc cgaggaactg 1920
tgtgtgcggt ggacacagct gggcgccttc taccctttca tgagaaacca caacagcctg 1980
ctgagcctgc cccaggaacc ctacagcttt agcgagcctg cacagcaggc catgcggaag 2040
gccctgacac tgagatacgc tctgctgccc cacctgtaca ccctgtttca ccaggcccat 2100
gtggccggcg agacagtggc cagacctctg tttctggaat tccccaagga cagcagcacc 2160
tggaccgtgg accatcagct gctgtgggga gaggctctgc tgattacccc agtgctgcag 2220
gcaggcaagg ccgaagtgac cggctacttt cccctgggca cttggtacga cctgcagacc 2280
gtgcctgtgg aagccctggg atctctgcct ccacctcctg ccgctcctag agagcctgcc 2340
attcactctg agggccagtg ggtcacactg cctgcccccc tggataccat caacgtgcac 2400
ctgagggccg gctacatcat accactgcag ggacctggcc tgaccaccac cgagtctaga 2460
cagcagccaa tggccctggc cgtggccctg accaaaggcg gagaagctag gggcgagctg 2520
ttctgggacg atggcgagag cctggaagtg ctggaaagag gcgcctatac ccaagtgatc 2580
ttcctggccc ggaacaacac catcgtgaac gagctggtgc gcgtgacctc tgaaggcgct 2640
ggactgcagc tgcagaaagt gaccgtgctg ggagtggcca cagcccctca gcaggtgctg 2700
tctaatggcg tgcccgtgtc caacttcacc tacagccccg acaccaaggt gctggacatc 2760
tgcgtgtcac tgctgatggg agagcagttt ctggtgtcct ggtgctga 2808
<210> 18
<211> 2829
<212> ДНК
<213> Искусственная
<220>
<223> sp6+hGAAco1-дельта-8
<400> 18
atgcctccac ctagaacagg cagaggcctg ctgtggctgg gcctggtgct gtctagtgtg 60
tgtgtggccc tgggcctact agtgcccaga gagctgagcg gcagctctcc cgtgctggaa 120
gaaacacacc ctgcccatca gcagggcgcc tctagacctg gacctagaga tgcccaggcc 180
caccccggca gacctagagc tgtgcctacc cagtgtgacg tgccccccaa cagcagattc 240
gactgcgccc ctgacaaggc catcacccag gaacagtgcg aggccagagg ctgctgctac 300
atccctgcca agcagggact gcagggcgct cagatgggac agccctggtg cttcttccca 360
ccctcctacc ccagctacaa gctggaaaac ctgagcagca gcgagatggg ctacaccgcc 420
accctgacca gaaccacccc cacattcttc ccaaaggaca tcctgaccct gcggctggac 480
gtgatgatgg aaaccgagaa ccggctgcac ttcaccatca aggaccccgc caatcggaga 540
tacgaggtgc ccctggaaac cccccacgtg cactctagag cccccagccc tctgtacagc 600
gtggaattca gcgaggaacc cttcggcgtg atcgtgcgga gacagctgga tggcagagtg 660
ctgctgaaca ccaccgtggc ccctctgttc ttcgccgacc agttcctgca gctgagcacc 720
agcctgccca gccagtacat cacaggactg gccgagcacc tgagccccct gatgctgagc 780
acatcctgga cccggatcac cctgtggaac agggatctgg cccctacccc tggcgccaat 840
ctgtacggca gccacccttt ctacctggcc ctggaagatg gcggatctgc ccacggagtg 900
tttctgctga actccaacgc catggacgtg gtgctgcagc ctagccctgc cctgtcttgg 960
agaagcacag gcggcatcct ggatgtgtac atctttctgg gccccgagcc caagagcgtg 1020
gtgcagcagt atctggatgt cgtgggctac cccttcatgc ccccttactg gggcctggga 1080
ttccacctgt gcagatgggg ctactccagc accgccatca ccagacaggt ggtggaaaac 1140
atgaccagag cccacttccc actggatgtg cagtggaacg acctggacta catggacagc 1200
agacgggact tcaccttcaa caaggacggc ttccgggact tccccgccat ggtgcaggaa 1260
ctgcatcagg gcggcagacg gtacatgatg atcgtggatc ccgccatcag ctcctctggc 1320
cctgccggct cttacagacc ctacgacgag ggcctgcgga gaggcgtgtt catcaccaac 1380
gagacaggcc agcccctgat cggcaaagtg tggcctggca gcacagcctt ccccgacttc 1440
accaatccta ccgccctggc ttggtgggag gacatggtgg ccgagttcca cgaccaggtg 1500
cccttcgacg gcatgtggat cgacatgaac gagcccagca acttcatccg gggcagcgag 1560
gatggctgcc ccaacaacga actggaaaat cccccttacg tgcccggcgt cgtgggcgga 1620
acactgcagg ccgctacaat ctgtgccagc agccaccagt ttctgagcac ccactacaac 1680
ctgcacaacc tgtacggcct gaccgaggcc attgccagcc accgcgctct cgtgaaagcc 1740
agaggcacac ggcccttcgt gatcagcaga agcacctttg ccggccacgg cagatacgcc 1800
ggacattgga ctggcgacgt gtggtcctct tgggagcagc tggcctctag cgtgcccgag 1860
atcctgcagt tcaatctgct gggcgtgcca ctcgtgggcg ccgatgtgtg tggcttcctg 1920
ggcaacacct ccgaggaact gtgtgtgcgg tggacacagc tgggcgcctt ctaccctttc 1980
atgagaaacc acaacagcct gctgagcctg ccccaggaac cctacagctt tagcgagcct 2040
gcacagcagg ccatgcggaa ggccctgaca ctgagatacg ctctgctgcc ccacctgtac 2100
accctgtttc accaggccca tgtggccggc gagacagtgg ccagacctct gtttctggaa 2160
ttccccaagg acagcagcac ctggaccgtg gaccatcagc tgctgtgggg agaggctctg 2220
ctgattaccc cagtgctgca ggcaggcaag gccgaagtga ccggctactt tcccctgggc 2280
acttggtacg acctgcagac cgtgcctgtg gaagccctgg gatctctgcc tccacctcct 2340
gccgctccta gagagcctgc cattcactct gagggccagt gggtcacact gcctgccccc 2400
ctggatacca tcaacgtgca cctgagggcc ggctacatca taccactgca gggacctggc 2460
ctgaccacca ccgagtctag acagcagcca atggccctgg ccgtggccct gaccaaaggc 2520
ggagaagcta ggggcgagct gttctgggac gatggcgaga gcctggaagt gctggaaaga 2580
ggcgcctata cccaagtgat cttcctggcc cggaacaaca ccatcgtgaa cgagctggtg 2640
cgcgtgacct ctgaaggcgc tggactgcag ctgcagaaag tgaccgtgct gggagtggcc 2700
acagcccctc agcaggtgct gtctaatggc gtgcccgtgt ccaacttcac ctacagcccc 2760
gacaccaagg tgctggacat ctgcgtgtca ctgctgatgg gagagcagtt tctggtgtcc 2820
tggtgctga 2829
<210> 19
<211> 2820
<212> ДНК
<213> Искусственная
<220>
<223> sp8+hGAAco1-дельта-8
<400> 19
atggccagca gactgaccct gctgacactc cttctgctgc tgctggccgg cgatagagcc 60
agcagcctac tagtgcccag agagctgagc ggcagctctc ccgtgctgga agaaacacac 120
cctgcccatc agcagggcgc ctctagacct ggacctagag atgcccaggc ccaccccggc 180
agacctagag ctgtgcctac ccagtgtgac gtgcccccca acagcagatt cgactgcgcc 240
cctgacaagg ccatcaccca ggaacagtgc gaggccagag gctgctgcta catccctgcc 300
aagcagggac tgcagggcgc tcagatggga cagccctggt gcttcttccc accctcctac 360
cccagctaca agctggaaaa cctgagcagc agcgagatgg gctacaccgc caccctgacc 420
agaaccaccc ccacattctt cccaaaggac atcctgaccc tgcggctgga cgtgatgatg 480
gaaaccgaga accggctgca cttcaccatc aaggaccccg ccaatcggag atacgaggtg 540
cccctggaaa ccccccacgt gcactctaga gcccccagcc ctctgtacag cgtggaattc 600
agcgaggaac ccttcggcgt gatcgtgcgg agacagctgg atggcagagt gctgctgaac 660
accaccgtgg cccctctgtt cttcgccgac cagttcctgc agctgagcac cagcctgccc 720
agccagtaca tcacaggact ggccgagcac ctgagccccc tgatgctgag cacatcctgg 780
acccggatca ccctgtggaa cagggatctg gcccctaccc ctggcgccaa tctgtacggc 840
agccaccctt tctacctggc cctggaagat ggcggatctg cccacggagt gtttctgctg 900
aactccaacg ccatggacgt ggtgctgcag cctagccctg ccctgtcttg gagaagcaca 960
ggcggcatcc tggatgtgta catctttctg ggccccgagc ccaagagcgt ggtgcagcag 1020
tatctggatg tcgtgggcta ccccttcatg cccccttact ggggcctggg attccacctg 1080
tgcagatggg gctactccag caccgccatc accagacagg tggtggaaaa catgaccaga 1140
gcccacttcc cactggatgt gcagtggaac gacctggact acatggacag cagacgggac 1200
ttcaccttca acaaggacgg cttccgggac ttccccgcca tggtgcagga actgcatcag 1260
ggcggcagac ggtacatgat gatcgtggat cccgccatca gctcctctgg ccctgccggc 1320
tcttacagac cctacgacga gggcctgcgg agaggcgtgt tcatcaccaa cgagacaggc 1380
cagcccctga tcggcaaagt gtggcctggc agcacagcct tccccgactt caccaatcct 1440
accgccctgg cttggtggga ggacatggtg gccgagttcc acgaccaggt gcccttcgac 1500
ggcatgtgga tcgacatgaa cgagcccagc aacttcatcc ggggcagcga ggatggctgc 1560
cccaacaacg aactggaaaa tcccccttac gtgcccggcg tcgtgggcgg aacactgcag 1620
gccgctacaa tctgtgccag cagccaccag tttctgagca cccactacaa cctgcacaac 1680
ctgtacggcc tgaccgaggc cattgccagc caccgcgctc tcgtgaaagc cagaggcaca 1740
cggcccttcg tgatcagcag aagcaccttt gccggccacg gcagatacgc cggacattgg 1800
actggcgacg tgtggtcctc ttgggagcag ctggcctcta gcgtgcccga gatcctgcag 1860
ttcaatctgc tgggcgtgcc actcgtgggc gccgatgtgt gtggcttcct gggcaacacc 1920
tccgaggaac tgtgtgtgcg gtggacacag ctgggcgcct tctacccttt catgagaaac 1980
cacaacagcc tgctgagcct gccccaggaa ccctacagct ttagcgagcc tgcacagcag 2040
gccatgcgga aggccctgac actgagatac gctctgctgc cccacctgta caccctgttt 2100
caccaggccc atgtggccgg cgagacagtg gccagacctc tgtttctgga attccccaag 2160
gacagcagca cctggaccgt ggaccatcag ctgctgtggg gagaggctct gctgattacc 2220
ccagtgctgc aggcaggcaa ggccgaagtg accggctact ttcccctggg cacttggtac 2280
gacctgcaga ccgtgcctgt ggaagccctg ggatctctgc ctccacctcc tgccgctcct 2340
agagagcctg ccattcactc tgagggccag tgggtcacac tgcctgcccc cctggatacc 2400
atcaacgtgc acctgagggc cggctacatc ataccactgc agggacctgg cctgaccacc 2460
accgagtcta gacagcagcc aatggccctg gccgtggccc tgaccaaagg cggagaagct 2520
aggggcgagc tgttctggga cgatggcgag agcctggaag tgctggaaag aggcgcctat 2580
acccaagtga tcttcctggc ccggaacaac accatcgtga acgagctggt gcgcgtgacc 2640
tctgaaggcg ctggactgca gctgcagaaa gtgaccgtgc tgggagtggc cacagcccct 2700
cagcaggtgc tgtctaatgg cgtgcccgtg tccaacttca cctacagccc cgacaccaag 2760
gtgctggaca tctgcgtgtc actgctgatg ggagagcagt ttctggtgtc ctggtgctga 2820
<210> 20
<211> 4300
<212> ДНК
<213> Искусственная
<220>
<223> конструкция: sp7+hGAAco1-дельта-8
<400> 20
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780
cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020
taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 1140
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200
acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260
ctttggcaaa gcacgcgtgc caccatggcc tttctgtggc tgctgagctg ttgggccctg 1320
ctgggcacca ccttcggcct actagtgccc agagagctga gcggcagctc tcccgtgctg 1380
gaagaaacac accctgccca tcagcagggc gcctctagac ctggacctag agatgcccag 1440
gcccaccccg gcagacctag agctgtgcct acccagtgtg acgtgccccc caacagcaga 1500
ttcgactgcg cccctgacaa ggccatcacc caggaacagt gcgaggccag aggctgctgc 1560
tacatccctg ccaagcaggg actgcagggc gctcagatgg gacagccctg gtgcttcttc 1620
ccaccctcct accccagcta caagctggaa aacctgagca gcagcgagat gggctacacc 1680
gccaccctga ccagaaccac ccccacattc ttcccaaagg acatcctgac cctgcggctg 1740
gacgtgatga tggaaaccga gaaccggctg cacttcacca tcaaggaccc cgccaatcgg 1800
agatacgagg tgcccctgga aaccccccac gtgcactcta gagcccccag ccctctgtac 1860
agcgtggaat tcagcgagga acccttcggc gtgatcgtgc ggagacagct ggatggcaga 1920
gtgctgctga acaccaccgt ggcccctctg ttcttcgccg accagttcct gcagctgagc 1980
accagcctgc ccagccagta catcacagga ctggccgagc acctgagccc cctgatgctg 2040
agcacatcct ggacccggat caccctgtgg aacagggatc tggcccctac ccctggcgcc 2100
aatctgtacg gcagccaccc tttctacctg gccctggaag atggcggatc tgcccacgga 2160
gtgtttctgc tgaactccaa cgccatggac gtggtgctgc agcctagccc tgccctgtct 2220
tggagaagca caggcggcat cctggatgtg tacatctttc tgggccccga gcccaagagc 2280
gtggtgcagc agtatctgga tgtcgtgggc taccccttca tgccccctta ctggggcctg 2340
ggattccacc tgtgcagatg gggctactcc agcaccgcca tcaccagaca ggtggtggaa 2400
aacatgacca gagcccactt cccactggat gtgcagtgga acgacctgga ctacatggac 2460
agcagacggg acttcacctt caacaaggac ggcttccggg acttccccgc catggtgcag 2520
gaactgcatc agggcggcag acggtacatg atgatcgtgg atcccgccat cagctcctct 2580
ggccctgccg gctcttacag accctacgac gagggcctgc ggagaggcgt gttcatcacc 2640
aacgagacag gccagcccct gatcggcaaa gtgtggcctg gcagcacagc cttccccgac 2700
ttcaccaatc ctaccgccct ggcttggtgg gaggacatgg tggccgagtt ccacgaccag 2760
gtgcccttcg acggcatgtg gatcgacatg aacgagccca gcaacttcat ccggggcagc 2820
gaggatggct gccccaacaa cgaactggaa aatccccctt acgtgcccgg cgtcgtgggc 2880
ggaacactgc aggccgctac aatctgtgcc agcagccacc agtttctgag cacccactac 2940
aacctgcaca acctgtacgg cctgaccgag gccattgcca gccaccgcgc tctcgtgaaa 3000
gccagaggca cacggccctt cgtgatcagc agaagcacct ttgccggcca cggcagatac 3060
gccggacatt ggactggcga cgtgtggtcc tcttgggagc agctggcctc tagcgtgccc 3120
gagatcctgc agttcaatct gctgggcgtg ccactcgtgg gcgccgatgt gtgtggcttc 3180
ctgggcaaca cctccgagga actgtgtgtg cggtggacac agctgggcgc cttctaccct 3240
ttcatgagaa accacaacag cctgctgagc ctgccccagg aaccctacag ctttagcgag 3300
cctgcacagc aggccatgcg gaaggccctg acactgagat acgctctgct gccccacctg 3360
tacaccctgt ttcaccaggc ccatgtggcc ggcgagacag tggccagacc tctgtttctg 3420
gaattcccca aggacagcag cacctggacc gtggaccatc agctgctgtg gggagaggct 3480
ctgctgatta ccccagtgct gcaggcaggc aaggccgaag tgaccggcta ctttcccctg 3540
ggcacttggt acgacctgca gaccgtgcct gtggaagccc tgggatctct gcctccacct 3600
cctgccgctc ctagagagcc tgccattcac tctgagggcc agtgggtcac actgcctgcc 3660
cccctggata ccatcaacgt gcacctgagg gccggctaca tcataccact gcagggacct 3720
ggcctgacca ccaccgagtc tagacagcag ccaatggccc tggccgtggc cctgaccaaa 3780
ggcggagaag ctaggggcga gctgttctgg gacgatggcg agagcctgga agtgctggaa 3840
agaggcgcct atacccaagt gatcttcctg gcccggaaca acaccatcgt gaacgagctg 3900
gtgcgcgtga cctctgaagg cgctggactg cagctgcaga aagtgaccgt gctgggagtg 3960
gccacagccc ctcagcaggt gctgtctaat ggcgtgcccg tgtccaactt cacctacagc 4020
cccgacacca aggtgctgga catctgcgtg tcactgctga tgggagagca gtttctggtg 4080
tcctggtgct gactcgagag atctaccggt gaattcaccg cgggtttaaa ctgtgccttc 4140
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 4200
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 4260
tcattctatt ctggggggtg gggtgggggc tagctctaga 4300
<210> 21
<211> 4321
<212> ДНК
<213> Искусственная
<220>
<223> конструкция: sp6+hGAAco1-дельта-8
<400> 21
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780
cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020
taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 1140
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200
acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260
ctttggcaaa gcacgcgtgc caccatgcct ccacctagaa caggcagagg cctgctgtgg 1320
ctgggcctgg tgctgtctag tgtgtgtgtg gccctgggcc tactagtgcc cagagagctg 1380
agcggcagct ctcccgtgct ggaagaaaca caccctgccc atcagcaggg cgcctctaga 1440
cctggaccta gagatgccca ggcccacccc ggcagaccta gagctgtgcc tacccagtgt 1500
gacgtgcccc ccaacagcag attcgactgc gcccctgaca aggccatcac ccaggaacag 1560
tgcgaggcca gaggctgctg ctacatccct gccaagcagg gactgcaggg cgctcagatg 1620
ggacagccct ggtgcttctt cccaccctcc taccccagct acaagctgga aaacctgagc 1680
agcagcgaga tgggctacac cgccaccctg accagaacca cccccacatt cttcccaaag 1740
gacatcctga ccctgcggct ggacgtgatg atggaaaccg agaaccggct gcacttcacc 1800
atcaaggacc ccgccaatcg gagatacgag gtgcccctgg aaacccccca cgtgcactct 1860
agagccccca gccctctgta cagcgtggaa ttcagcgagg aacccttcgg cgtgatcgtg 1920
cggagacagc tggatggcag agtgctgctg aacaccaccg tggcccctct gttcttcgcc 1980
gaccagttcc tgcagctgag caccagcctg cccagccagt acatcacagg actggccgag 2040
cacctgagcc ccctgatgct gagcacatcc tggacccgga tcaccctgtg gaacagggat 2100
ctggccccta cccctggcgc caatctgtac ggcagccacc ctttctacct ggccctggaa 2160
gatggcggat ctgcccacgg agtgtttctg ctgaactcca acgccatgga cgtggtgctg 2220
cagcctagcc ctgccctgtc ttggagaagc acaggcggca tcctggatgt gtacatcttt 2280
ctgggccccg agcccaagag cgtggtgcag cagtatctgg atgtcgtggg ctaccccttc 2340
atgccccctt actggggcct gggattccac ctgtgcagat ggggctactc cagcaccgcc 2400
atcaccagac aggtggtgga aaacatgacc agagcccact tcccactgga tgtgcagtgg 2460
aacgacctgg actacatgga cagcagacgg gacttcacct tcaacaagga cggcttccgg 2520
gacttccccg ccatggtgca ggaactgcat cagggcggca gacggtacat gatgatcgtg 2580
gatcccgcca tcagctcctc tggccctgcc ggctcttaca gaccctacga cgagggcctg 2640
cggagaggcg tgttcatcac caacgagaca ggccagcccc tgatcggcaa agtgtggcct 2700
ggcagcacag ccttccccga cttcaccaat cctaccgccc tggcttggtg ggaggacatg 2760
gtggccgagt tccacgacca ggtgcccttc gacggcatgt ggatcgacat gaacgagccc 2820
agcaacttca tccggggcag cgaggatggc tgccccaaca acgaactgga aaatccccct 2880
tacgtgcccg gcgtcgtggg cggaacactg caggccgcta caatctgtgc cagcagccac 2940
cagtttctga gcacccacta caacctgcac aacctgtacg gcctgaccga ggccattgcc 3000
agccaccgcg ctctcgtgaa agccagaggc acacggccct tcgtgatcag cagaagcacc 3060
tttgccggcc acggcagata cgccggacat tggactggcg acgtgtggtc ctcttgggag 3120
cagctggcct ctagcgtgcc cgagatcctg cagttcaatc tgctgggcgt gccactcgtg 3180
ggcgccgatg tgtgtggctt cctgggcaac acctccgagg aactgtgtgt gcggtggaca 3240
cagctgggcg ccttctaccc tttcatgaga aaccacaaca gcctgctgag cctgccccag 3300
gaaccctaca gctttagcga gcctgcacag caggccatgc ggaaggccct gacactgaga 3360
tacgctctgc tgccccacct gtacaccctg tttcaccagg cccatgtggc cggcgagaca 3420
gtggccagac ctctgtttct ggaattcccc aaggacagca gcacctggac cgtggaccat 3480
cagctgctgt ggggagaggc tctgctgatt accccagtgc tgcaggcagg caaggccgaa 3540
gtgaccggct actttcccct gggcacttgg tacgacctgc agaccgtgcc tgtggaagcc 3600
ctgggatctc tgcctccacc tcctgccgct cctagagagc ctgccattca ctctgagggc 3660
cagtgggtca cactgcctgc ccccctggat accatcaacg tgcacctgag ggccggctac 3720
atcataccac tgcagggacc tggcctgacc accaccgagt ctagacagca gccaatggcc 3780
ctggccgtgg ccctgaccaa aggcggagaa gctaggggcg agctgttctg ggacgatggc 3840
gagagcctgg aagtgctgga aagaggcgcc tatacccaag tgatcttcct ggcccggaac 3900
aacaccatcg tgaacgagct ggtgcgcgtg acctctgaag gcgctggact gcagctgcag 3960
aaagtgaccg tgctgggagt ggccacagcc cctcagcagg tgctgtctaa tggcgtgccc 4020
gtgtccaact tcacctacag ccccgacacc aaggtgctgg acatctgcgt gtcactgctg 4080
atgggagagc agtttctggt gtcctggtgc tgactcgaga gatctaccgg tgaattcacc 4140
gcgggtttaa actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc 4200
ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc 4260
atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggg ctagctctag 4320
a 4321
<210> 22
<211> 4312
<212> ДНК
<213> Искусственная
<220>
<223> sp8+hGAAco1-дельта-8
<400> 22
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780
cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020
taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 1140
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200
acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260
ctttggcaaa gcacgcgtgc caccatggcc agcagactga ccctgctgac actccttctg 1320
ctgctgctgg ccggcgatag agccagcagc ctactagtgc ccagagagct gagcggcagc 1380
tctcccgtgc tggaagaaac acaccctgcc catcagcagg gcgcctctag acctggacct 1440
agagatgccc aggcccaccc cggcagacct agagctgtgc ctacccagtg tgacgtgccc 1500
cccaacagca gattcgactg cgcccctgac aaggccatca cccaggaaca gtgcgaggcc 1560
agaggctgct gctacatccc tgccaagcag ggactgcagg gcgctcagat gggacagccc 1620
tggtgcttct tcccaccctc ctaccccagc tacaagctgg aaaacctgag cagcagcgag 1680
atgggctaca ccgccaccct gaccagaacc acccccacat tcttcccaaa ggacatcctg 1740
accctgcggc tggacgtgat gatggaaacc gagaaccggc tgcacttcac catcaaggac 1800
cccgccaatc ggagatacga ggtgcccctg gaaacccccc acgtgcactc tagagccccc 1860
agccctctgt acagcgtgga attcagcgag gaacccttcg gcgtgatcgt gcggagacag 1920
ctggatggca gagtgctgct gaacaccacc gtggcccctc tgttcttcgc cgaccagttc 1980
ctgcagctga gcaccagcct gcccagccag tacatcacag gactggccga gcacctgagc 2040
cccctgatgc tgagcacatc ctggacccgg atcaccctgt ggaacaggga tctggcccct 2100
acccctggcg ccaatctgta cggcagccac cctttctacc tggccctgga agatggcgga 2160
tctgcccacg gagtgtttct gctgaactcc aacgccatgg acgtggtgct gcagcctagc 2220
cctgccctgt cttggagaag cacaggcggc atcctggatg tgtacatctt tctgggcccc 2280
gagcccaaga gcgtggtgca gcagtatctg gatgtcgtgg gctacccctt catgccccct 2340
tactggggcc tgggattcca cctgtgcaga tggggctact ccagcaccgc catcaccaga 2400
caggtggtgg aaaacatgac cagagcccac ttcccactgg atgtgcagtg gaacgacctg 2460
gactacatgg acagcagacg ggacttcacc ttcaacaagg acggcttccg ggacttcccc 2520
gccatggtgc aggaactgca tcagggcggc agacggtaca tgatgatcgt ggatcccgcc 2580
atcagctcct ctggccctgc cggctcttac agaccctacg acgagggcct gcggagaggc 2640
gtgttcatca ccaacgagac aggccagccc ctgatcggca aagtgtggcc tggcagcaca 2700
gccttccccg acttcaccaa tcctaccgcc ctggcttggt gggaggacat ggtggccgag 2760
ttccacgacc aggtgccctt cgacggcatg tggatcgaca tgaacgagcc cagcaacttc 2820
atccggggca gcgaggatgg ctgccccaac aacgaactgg aaaatccccc ttacgtgccc 2880
ggcgtcgtgg gcggaacact gcaggccgct acaatctgtg ccagcagcca ccagtttctg 2940
agcacccact acaacctgca caacctgtac ggcctgaccg aggccattgc cagccaccgc 3000
gctctcgtga aagccagagg cacacggccc ttcgtgatca gcagaagcac ctttgccggc 3060
cacggcagat acgccggaca ttggactggc gacgtgtggt cctcttggga gcagctggcc 3120
tctagcgtgc ccgagatcct gcagttcaat ctgctgggcg tgccactcgt gggcgccgat 3180
gtgtgtggct tcctgggcaa cacctccgag gaactgtgtg tgcggtggac acagctgggc 3240
gccttctacc ctttcatgag aaaccacaac agcctgctga gcctgcccca ggaaccctac 3300
agctttagcg agcctgcaca gcaggccatg cggaaggccc tgacactgag atacgctctg 3360
ctgccccacc tgtacaccct gtttcaccag gcccatgtgg ccggcgagac agtggccaga 3420
cctctgtttc tggaattccc caaggacagc agcacctgga ccgtggacca tcagctgctg 3480
tggggagagg ctctgctgat taccccagtg ctgcaggcag gcaaggccga agtgaccggc 3540
tactttcccc tgggcacttg gtacgacctg cagaccgtgc ctgtggaagc cctgggatct 3600
ctgcctccac ctcctgccgc tcctagagag cctgccattc actctgaggg ccagtgggtc 3660
acactgcctg cccccctgga taccatcaac gtgcacctga gggccggcta catcatacca 3720
ctgcagggac ctggcctgac caccaccgag tctagacagc agccaatggc cctggccgtg 3780
gccctgacca aaggcggaga agctaggggc gagctgttct gggacgatgg cgagagcctg 3840
gaagtgctgg aaagaggcgc ctatacccaa gtgatcttcc tggcccggaa caacaccatc 3900
gtgaacgagc tggtgcgcgt gacctctgaa ggcgctggac tgcagctgca gaaagtgacc 3960
gtgctgggag tggccacagc ccctcagcag gtgctgtcta atggcgtgcc cgtgtccaac 4020
ttcacctaca gccccgacac caaggtgctg gacatctgcg tgtcactgct gatgggagag 4080
cagtttctgg tgtcctggtg ctgactcgag agatctaccg gtgaattcac cgcgggttta 4140
aactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 4200
cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 4260
tctgagtagg tgtcattcta ttctgggggg tggggtgggg gctagctcta ga 4312
<210> 23
<211> 16
<212> Белок
<213> Искусственная
<220>
<223> sp3
<400> 23
Met Leu Leu Leu Ser Ala Leu Leu Leu Gly Leu Ala Phe Gly Tyr Ser
1. 5 10 15
<210> 24
<211> 16
<212> Белок
<213> Искусственная
<220>
<223> sp4
<400> 24
Met Leu Leu Ser Phe Ala Leu Leu Leu Gly Leu Ala Leu Gly Tyr Ser
1. 5 10 15
<210> 25
<211> 16
<212> Белок
<213> Искусственная
<220>
<223> sp5
<400> 25
Met Leu Leu Glu His Ala Leu Leu Leu Gly Leu Ala His Gly Tyr Ser
1. 5 10 15
<210> 26
<211> 54
<212> ДНК
<213> Искусственная
<220>
<223> sp7
<400> 26
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggc 54
<210> 27
<211> 75
<212> ДНК
<213> Искусственная
<220>
<223> sp6
<400> 27
atgcctccac ctagaacagg cagaggcctg ctgtggctgg gcctggtgct gtctagtgtg 60
tgtgtggccc tgggc 75
<210> 28
<211> 66
<212> ДНК
<213> Искусственная
<220>
<223> sp8
<400> 28
atggccagca gactgaccct gctgacactc cttctgctgc tgctggccgg cgatagagcc 60
agcagc 66
<210> 29
<211> 917
<212> Белок
<213> Искусственная
<220>
<223> hGAA-дельта-8
<400> 29
Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val Leu Glu Glu
1. 5 10 15
Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly Pro Arg Asp
20 25 30
Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp
35 40 45
Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr
50 55 60
Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln
65 70 75 80
Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro
85 90 95
Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly
100 105 110
Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp
115 120 125
Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu
130 135 140
His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu
145 150 155 160
Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val
165 170 175
Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp
180 185 190
Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp
195 200 205
Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly
210 215 220
Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg
225 230 235 240
Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu
245 250 255
Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala
260 265 270
His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln
275 280 285
Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val
290 295 300
Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu
305 310 315 320
Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe
325 330 335
His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val
340 345 350
Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn
355 360 365
Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp
370 375 380
Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly
385 390 395 400
Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro
405 410 415
Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe
420 425 430
Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly
435 440 445
Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp
450 455 460
Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met
465 470 475 480
Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp
485 490 495
Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val
500 505 510
Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln
515 520 525
Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu
530 535 540
Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro
545 550 555 560
Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly
565 570 575
His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser
580 585 590
Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly
595 600 605
Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val
610 615 620
Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn
625 630 635 640
Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala
645 650 655
Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro
660 665 670
His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val
675 680 685
Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr
690 695 700
Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val
705 710 715 720
Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr
725 730 735
Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro
740 745 750
Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln
755 760 765
Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg
770 775 780
Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu
785 790 795 800
Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly
805 810 815
Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val
820 825 830
Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn
835 840 845
Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu
850 855 860
Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln
865 870 875 880
Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp
885 890 895
Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe
900 905 910
Leu Val Ser Trp Cys
915
<210> 30
<211> 883
<212> Белок
<213> Искусственная
<220>
<223> hGAA-дельта-42
<400> 30
Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro
1. 5 10 15
Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu
20 25 30
Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu
35 40 45
Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr
50 55 60
Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr
65 70 75 80
Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu
85 90 95
Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe
100 105 110
Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr
115 120 125
Pro His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe
130 135 140
Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg
145 150 155 160
Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe
165 170 175
Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala
180 185 190
Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr
195 200 205
Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly
210 215 220
Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly
225 230 235 240
Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser
245 250 255
Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile
260 265 270
Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val
275 280 285
Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu
290 295 300
Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu
305 310 315 320
Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu
325 330 335
Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe
340 345 350
Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg
355 360 365
Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly
370 375 380
Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr
385 390 395 400
Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr
405 410 415
Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp
420 425 430
Met Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile
435 440 445
Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys
450 455 460
Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly
465 470 475 480
Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu
485 490 495
Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile
500 505 510
Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val
515 520 525
Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp
530 535 540
Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro
545 550 555 560
Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp
565 570 575
Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp
580 585 590
Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu
595 600 605
Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln
610 615 620
Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu
625 630 635 640
Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg
645 650 655
Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp
660 665 670
His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln
675 680 685
Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr
690 695 700
Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro
705 710 715 720
Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val
725 730 735
Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly
740 745 750
Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg
755 760 765
Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala
770 775 780
Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu
785 790 795 800
Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile
805 810 815
Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu
820 825 830
Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu
835 840 845
Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys
850 855 860
Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val
865 870 875 880
Ser Trp Cys
<210> 31
<211> 2778
<212> ДНК
<213> hGAAwt без sp
<400> 31
gggcacatcc tactccatga tttcctgctg gttccccgag agctgagtgg ctcctcccca 60
gtcctggagg agactcaccc agctcaccag cagggagcca gcagaccagg gccccgggat 120
gcccaggcac accccgggcg gccgcgagca gtgcccacac agtgcgacgt cccccccaac 180
agccgcttcg attgcgcccc tgacaaggcc atcacccagg aacagtgcga ggcccgcggc 240
tgttgctaca tccctgcaaa gcaggggctg cagggagccc agatggggca gccctggtgc 300
ttcttcccac ccagctaccc cagctacaag ctggagaacc tgagctcctc tgaaatgggc 360
tacacggcca ccctgacccg taccaccccc accttcttcc ccaaggacat cctgaccctg 420
cggctggacg tgatgatgga gactgagaac cgcctccact tcacgatcaa agatccagct 480
aacaggcgct acgaggtgcc cttggagacc ccgcatgtcc acagccgggc accgtcccca 540
ctctacagcg tggagttctc cgaggagccc ttcggggtga tcgtgcgccg gcagctggac 600
ggccgcgtgc tgctgaacac gacggtggcg cccctgttct ttgcggacca gttccttcag 660
ctgtccacct cgctgccctc gcagtatatc acaggcctcg ccgagcacct cagtcccctg 720
atgctcagca ccagctggac caggatcacc ctgtggaacc gggaccttgc gcccacgccc 780
ggtgcgaacc tctacgggtc tcaccctttc tacctggcgc tggaggacgg cgggtcggca 840
cacggggtgt tcctgctaaa cagcaatgcc atggatgtgg tcctgcagcc gagccctgcc 900
cttagctgga ggtcgacagg tgggatcctg gatgtctaca tcttcctggg cccagagccc 960
aagagcgtgg tgcagcagta cctggacgtt gtgggatacc cgttcatgcc gccatactgg 1020
ggcctgggct tccacctgtg ccgctggggc tactcctcca ccgctatcac ccgccaggtg 1080
gtggagaaca tgaccagggc ccacttcccc ctggacgtcc agtggaacga cctggactac 1140
atggactccc ggagggactt cacgttcaac aaggatggct tccgggactt cccggccatg 1200
gtgcaggagc tgcaccaggg cggccggcgc tacatgatga tcgtggatcc tgccatcagc 1260
agctcgggcc ctgccgggag ctacaggccc tacgacgagg gtctgcggag gggggttttc 1320
atcaccaacg agaccggcca gccgctgatt gggaaggtat ggcccgggtc cactgccttc 1380
cccgacttca ccaaccccac agccctggcc tggtgggagg acatggtggc tgagttccat 1440
gaccaggtgc ccttcgacgg catgtggatt gacatgaacg agccttccaa cttcatcagg 1500
ggctctgagg acggctgccc caacaatgag ctggagaacc caccctacgt gcctggggtg 1560
gttgggggga ccctccaggc ggccaccatc tgtgcctcca gccaccagtt tctctccaca 1620
cactacaacc tgcacaacct ctacggcctg accgaagcca tcgcctccca cagggcgctg 1680
gtgaaggctc gggggacacg cccatttgtg atctcccgct cgacctttgc tggccacggc 1740
cgatacgccg gccactggac gggggacgtg tggagctcct gggagcagct cgcctcctcc 1800
gtgccagaaa tcctgcagtt taacctgctg ggggtgcctc tggtcggggc cgacgtctgc 1860
ggcttcctgg gcaacacctc agaggagctg tgtgtgcgct ggacccagct gggggccttc 1920
taccccttca tgcggaacca caacagcctg ctcagtctgc cccaggagcc gtacagcttc 1980
agcgagccgg cccagcaggc catgaggaag gccctcaccc tgcgctacgc actcctcccc 2040
cacctctaca cactgttcca ccaggcccac gtcgcggggg agaccgtggc ccggcccctc 2100
ttcctggagt tccccaagga ctctagcacc tggactgtgg accaccagct cctgtggggg 2160
gaggccctgc tcatcacccc agtgctccag gccgggaagg ccgaagtgac tggctacttc 2220
cccttgggca catggtacga cctgcagacg gtgccagtag aggcccttgg cagcctccca 2280
cccccacctg cagctccccg tgagccagcc atccacagcg aggggcagtg ggtgacgctg 2340
ccggcccccc tggacaccat caacgtccac ctccgggctg ggtacatcat ccccctgcag 2400
ggccctggcc tcacaaccac agagtcccgc cagcagccca tggccctggc tgtggccctg 2460
accaagggtg gggaggcccg aggggagctg ttctgggacg atggagagag cctggaagtg 2520
ctggagcgag gggcctacac acaggtcatc ttcctggcca ggaataacac gatcgtgaat 2580
gagctggtac gtgtgaccag tgagggagct ggcctgcagc tgcagaaggt gactgtcctg 2640
ggcgtggcca cggcgcccca gcaggtcctc tccaacggtg tccctgtctc caacttcacc 2700
tacagccccg acaccaaggt cctggacatc tgtgtctcgc tgttgatggg agagcagttt 2760
ctcgtcagct ggtgttag 2778
<210> 32
<211> 2754
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco1-дельта-8 без sp
<400> 32
ctactagtgc ccagagagct gagcggcagc tctcccgtgc tggaagaaac acaccctgcc 60
catcagcagg gcgcctctag acctggacct agagatgccc aggcccaccc cggcagacct 120
agagctgtgc ctacccagtg tgacgtgccc cccaacagca gattcgactg cgcccctgac 180
aaggccatca cccaggaaca gtgcgaggcc agaggctgct gctacatccc tgccaagcag 240
ggactgcagg gcgctcagat gggacagccc tggtgcttct tcccaccctc ctaccccagc 300
tacaagctgg aaaacctgag cagcagcgag atgggctaca ccgccaccct gaccagaacc 360
acccccacat tcttcccaaa ggacatcctg accctgcggc tggacgtgat gatggaaacc 420
gagaaccggc tgcacttcac catcaaggac cccgccaatc ggagatacga ggtgcccctg 480
gaaacccccc acgtgcactc tagagccccc agccctctgt acagcgtgga attcagcgag 540
gaacccttcg gcgtgatcgt gcggagacag ctggatggca gagtgctgct gaacaccacc 600
gtggcccctc tgttcttcgc cgaccagttc ctgcagctga gcaccagcct gcccagccag 660
tacatcacag gactggccga gcacctgagc cccctgatgc tgagcacatc ctggacccgg 720
atcaccctgt ggaacaggga tctggcccct acccctggcg ccaatctgta cggcagccac 780
cctttctacc tggccctgga agatggcgga tctgcccacg gagtgtttct gctgaactcc 840
aacgccatgg acgtggtgct gcagcctagc cctgccctgt cttggagaag cacaggcggc 900
atcctggatg tgtacatctt tctgggcccc gagcccaaga gcgtggtgca gcagtatctg 960
gatgtcgtgg gctacccctt catgccccct tactggggcc tgggattcca cctgtgcaga 1020
tggggctact ccagcaccgc catcaccaga caggtggtgg aaaacatgac cagagcccac 1080
ttcccactgg atgtgcagtg gaacgacctg gactacatgg acagcagacg ggacttcacc 1140
ttcaacaagg acggcttccg ggacttcccc gccatggtgc aggaactgca tcagggcggc 1200
agacggtaca tgatgatcgt ggatcccgcc atcagctcct ctggccctgc cggctcttac 1260
agaccctacg acgagggcct gcggagaggc gtgttcatca ccaacgagac aggccagccc 1320
ctgatcggca aagtgtggcc tggcagcaca gccttccccg acttcaccaa tcctaccgcc 1380
ctggcttggt gggaggacat ggtggccgag ttccacgacc aggtgccctt cgacggcatg 1440
tggatcgaca tgaacgagcc cagcaacttc atccggggca gcgaggatgg ctgccccaac 1500
aacgaactgg aaaatccccc ttacgtgccc ggcgtcgtgg gcggaacact gcaggccgct 1560
acaatctgtg ccagcagcca ccagtttctg agcacccact acaacctgca caacctgtac 1620
ggcctgaccg aggccattgc cagccaccgc gctctcgtga aagccagagg cacacggccc 1680
ttcgtgatca gcagaagcac ctttgccggc cacggcagat acgccggaca ttggactggc 1740
gacgtgtggt cctcttggga gcagctggcc tctagcgtgc ccgagatcct gcagttcaat 1800
ctgctgggcg tgccactcgt gggcgccgat gtgtgtggct tcctgggcaa cacctccgag 1860
gaactgtgtg tgcggtggac acagctgggc gccttctacc ctttcatgag aaaccacaac 1920
agcctgctga gcctgcccca ggaaccctac agctttagcg agcctgcaca gcaggccatg 1980
cggaaggccc tgacactgag atacgctctg ctgccccacc tgtacaccct gtttcaccag 2040
gcccatgtgg ccggcgagac agtggccaga cctctgtttc tggaattccc caaggacagc 2100
agcacctgga ccgtggacca tcagctgctg tggggagagg ctctgctgat taccccagtg 2160
ctgcaggcag gcaaggccga agtgaccggc tactttcccc tgggcacttg gtacgacctg 2220
cagaccgtgc ctgtggaagc cctgggatct ctgcctccac ctcctgccgc tcctagagag 2280
cctgccattc actctgaggg ccagtgggtc acactgcctg cccccctgga taccatcaac 2340
gtgcacctga gggccggcta catcatacca ctgcagggac ctggcctgac caccaccgag 2400
tctagacagc agccaatggc cctggccgtg gccctgacca aaggcggaga agctaggggc 2460
gagctgttct gggacgatgg cgagagcctg gaagtgctgg aaagaggcgc ctatacccaa 2520
gtgatcttcc tggcccggaa caacaccatc gtgaacgagc tggtgcgcgt gacctctgaa 2580
ggcgctggac tgcagctgca gaaagtgacc gtgctgggag tggccacagc ccctcagcag 2640
gtgctgtcta atggcgtgcc cgtgtccaac ttcacctaca gccccgacac caaggtgctg 2700
gacatctgcg tgtcactgct gatgggagag cagtttctgg tgtcctggtg ctga 2754
<210> 33
<211> 2652
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco1-дельта-42 без sp
<400> 33
gcccaccccg gcagacctag agctgtgcct acccagtgtg acgtgccccc caacagcaga 60
ttcgactgcg cccctgacaa ggccatcacc caggaacagt gcgaggccag aggctgctgc 120
tacatccctg ccaagcaggg actgcagggc gctcagatgg gacagccctg gtgcttcttc 180
ccaccctcct accccagcta caagctggaa aacctgagca gcagcgagat gggctacacc 240
gccaccctga ccagaaccac ccccacattc ttcccaaagg acatcctgac cctgcggctg 300
gacgtgatga tggaaaccga gaaccggctg cacttcacca tcaaggaccc cgccaatcgg 360
agatacgagg tgcccctgga aaccccccac gtgcactcta gagcccccag ccctctgtac 420
agcgtggaat tcagcgagga acccttcggc gtgatcgtgc ggagacagct ggatggcaga 480
gtgctgctga acaccaccgt ggcccctctg ttcttcgccg accagttcct gcagctgagc 540
accagcctgc ccagccagta catcacagga ctggccgagc acctgagccc cctgatgctg 600
agcacatcct ggacccggat caccctgtgg aacagggatc tggcccctac ccctggcgcc 660
aatctgtacg gcagccaccc tttctacctg gccctggaag atggcggatc tgcccacgga 720
gtgtttctgc tgaactccaa cgccatggac gtggtgctgc agcctagccc tgccctgtct 780
tggagaagca caggcggcat cctggatgtg tacatctttc tgggccccga gcccaagagc 840
gtggtgcagc agtatctgga tgtcgtgggc taccccttca tgccccctta ctggggcctg 900
ggattccacc tgtgcagatg gggctactcc agcaccgcca tcaccagaca ggtggtggaa 960
aacatgacca gagcccactt cccactggat gtgcagtgga acgacctgga ctacatggac 1020
agcagacggg acttcacctt caacaaggac ggcttccggg acttccccgc catggtgcag 1080
gaactgcatc agggcggcag acggtacatg atgatcgtgg atcccgccat cagctcctct 1140
ggccctgccg gctcttacag accctacgac gagggcctgc ggagaggcgt gttcatcacc 1200
aacgagacag gccagcccct gatcggcaaa gtgtggcctg gcagcacagc cttccccgac 1260
ttcaccaatc ctaccgccct ggcttggtgg gaggacatgg tggccgagtt ccacgaccag 1320
gtgcccttcg acggcatgtg gatcgacatg aacgagccca gcaacttcat ccggggcagc 1380
gaggatggct gccccaacaa cgaactggaa aatccccctt acgtgcccgg cgtcgtgggc 1440
ggaacactgc aggccgctac aatctgtgcc agcagccacc agtttctgag cacccactac 1500
aacctgcaca acctgtacgg cctgaccgag gccattgcca gccaccgcgc tctcgtgaaa 1560
gccagaggca cacggccctt cgtgatcagc agaagcacct ttgccggcca cggcagatac 1620
gccggacatt ggactggcga cgtgtggtcc tcttgggagc agctggcctc tagcgtgccc 1680
gagatcctgc agttcaatct gctgggcgtg ccactcgtgg gcgccgatgt gtgtggcttc 1740
ctgggcaaca cctccgagga actgtgtgtg cggtggacac agctgggcgc cttctaccct 1800
ttcatgagaa accacaacag cctgctgagc ctgccccagg aaccctacag ctttagcgag 1860
cctgcacagc aggccatgcg gaaggccctg acactgagat acgctctgct gccccacctg 1920
tacaccctgt ttcaccaggc ccatgtggcc ggcgagacag tggccagacc tctgtttctg 1980
gaattcccca aggacagcag cacctggacc gtggaccatc agctgctgtg gggagaggct 2040
ctgctgatta ccccagtgct gcaggcaggc aaggccgaag tgaccggcta ctttcccctg 2100
ggcacttggt acgacctgca gaccgtgcct gtggaagccc tgggatctct gcctccacct 2160
cctgccgctc ctagagagcc tgccattcac tctgagggcc agtgggtcac actgcctgcc 2220
cccctggata ccatcaacgt gcacctgagg gccggctaca tcataccact gcagggacct 2280
ggcctgacca ccaccgagtc tagacagcag ccaatggccc tggccgtggc cctgaccaaa 2340
ggcggagaag ctaggggcga gctgttctgg gacgatggcg agagcctgga agtgctggaa 2400
agaggcgcct atacccaagt gatcttcctg gcccggaaca acaccatcgt gaacgagctg 2460
gtgcgcgtga cctctgaagg cgctggactg cagctgcaga aagtgaccgt gctgggagtg 2520
gccacagccc ctcagcaggt gctgtctaat ggcgtgcccg tgtccaactt cacctacagc 2580
cccgacacca aggtgctgga catctgcgtg tcactgctga tgggagagca gtttctggtg 2640
tcctggtgct ga 2652
<210> 34
<211> 2754
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco2-дельта-8
<400> 34
ctgttggtgc ctagagagct gagcggatca tccccagtgc tggaggagac tcatcctgct 60
caccaacagg gagcttccag accaggaccg agagacgccc aagcccatcc tggtagacca 120
agagctgtgc ctacccaatg cgacgtgcca cccaactccc gattcgactg cgcgccagat 180
aaggctatta cccaagagca gtgtgaagcc agaggttgct gctacatccc agcgaagcaa 240
ggattgcaag gcgcccaaat gggacaacct tggtgtttct tccccccttc gtacccatca 300
tataaactcg aaaacctgtc ctcttcggaa atgggttata ctgccaccct caccagaact 360
actcctactt tcttcccgaa agacatcttg accttgaggc tggacgtgat gatggagact 420
gaaaaccggc tgcatttcac tatcaaagat cctgccaatc ggcgatacga ggtccctctg 480
gaaacccctc acgtgcactc acgggctcct tctccgcttt actccgtcga attctctgag 540
gaacccttcg gagtgatcgt tagacgccag ctggatggta gagtgctgtt gaacactact 600
gtggccccac ttttcttcgc tgaccagttt ctgcaactgt ccacttccct gccatcccag 660
tacattactg gactcgccga acacctgtcg ccactgatgc tctcgacctc ttggactaga 720
atcactttgt ggaacagaga cttggcccct actccgggag caaatctgta cggaagccac 780
cctttttacc tggcgctcga agatggcgga tccgctcacg gagtgttcct gctgaatagc 840
aacgcaatgg acgtggtgct gcaaccttcc cctgcactca gttggagaag taccgggggt 900
attctggacg tgtacatctt cctcggacca gaacccaaga gcgtggtgca gcaatatctg 960
gacgtggtcg gatacccttt tatgcctcct tactggggac tgggattcca cctttgccgt 1020
tggggctact catccaccgc cattaccaga caggtggtgg agaatatgac cagagcccac 1080
ttccctctcg acgtgcagtg gaacgatctg gactatatgg actcccggag agatttcacc 1140
ttcaacaagg acgggttccg cgattttccc gcgatggttc aagagctcca ccagggtggt 1200
cgaagatata tgatgatcgt cgacccagcc atttcgagca gcggacccgc tggatcttat 1260
agaccttacg acgaaggcct taggagagga gtgttcatca caaacgagac tggacagcct 1320
ttgatcggta aagtgtggcc tggatcaacc gcctttcctg actttaccaa tcccactgcc 1380
ttggcttggt gggaggacat ggtggccgaa ttccacgacc aagtcccctt tgatggaatg 1440
tggatcgata tgaacgaacc aagcaatttt atcagaggtt ccgaagacgg ttgccccaac 1500
aacgaactgg aaaaccctcc ttatgtgccc ggagtcgtgg gcggaacatt acaggccgcg 1560
actatttgcg ccagcagcca ccaattcctg tccactcact acaacctcca caacctttat 1620
ggattaaccg aagctattgc aagtcacagg gctctggtga aggctagagg gactaggccc 1680
tttgtgatct cccgatccac ctttgccgga cacgggagat acgccggtca ctggactggt 1740
gacgtgtgga gctcatggga acaactggcc tcctccgtgc cggaaatctt acagttcaac 1800
cttctgggtg tccctcttgt cggagcagac gtgtgtgggt ttcttggtaa cacctccgag 1860
gaactgtgtg tgcgctggac tcaactgggt gcattctacc cattcatgag aaaccacaac 1920
tccttgctgt ccctgccaca agagccctac tcgttcagcg agcctgcaca acaggctatg 1980
cggaaggcac tgaccctgag atacgccctg cttccacact tatacactct cttccatcaa 2040
gcgcatgtgg caggagaaac cgttgcaagg cctcttttcc ttgaattccc caaggattcc 2100
tcgacttgga cggtggatca tcagctgctg tggggagaag ctctgctgat tactccagtg 2160
ttgcaagccg gaaaagctga ggtgaccgga tactttccgc tgggaacctg gtacgacctc 2220
cagactgtcc ctgttgaagc ccttggatca ctgcctccgc ctccggcagc tccacgcgaa 2280
ccagctatac attccgaggg acagtgggtt acattaccag ctcctctgga cacaatcaac 2340
gtccacttaa gagctggcta cattatccct ctgcaaggac caggactgac tacgaccgag 2400
agcagacagc agccaatggc actggctgtg gctctgacca agggagggga agctagagga 2460
gaactcttct gggatgatgg ggagtccctt gaagtgctgg aaagaggcgc ttacactcaa 2520
gtcattttcc ttgcacggaa caacaccatt gtgaacgaat tggtgcgagt gaccagcgaa 2580
ggagctggac ttcaactgca gaaggtcact gtgctcggag tggctaccgc tcctcagcaa 2640
gtgctgtcga atggagtccc cgtgtcaaac tttacctact cccctgacac taaggtgctc 2700
gacatttgcg tgtccctcct gatgggagag cagttccttg tgtcctggtg ttga 2754
<210> 35
<211> 2652
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco2-дельта-42
<400> 35
gcccatcctg gtagaccaag agctgtgcct acccaatgcg acgtgccacc caactcccga 60
ttcgactgcg cgccagataa ggctattacc caagagcagt gtgaagccag aggttgctgc 120
tacatcccag cgaagcaagg attgcaaggc gcccaaatgg gacaaccttg gtgtttcttc 180
cccccttcgt acccatcata taaactcgaa aacctgtcct cttcggaaat gggttatact 240
gccaccctca ccagaactac tcctactttc ttcccgaaag acatcttgac cttgaggctg 300
gacgtgatga tggagactga aaaccggctg catttcacta tcaaagatcc tgccaatcgg 360
cgatacgagg tccctctgga aacccctcac gtgcactcac gggctccttc tccgctttac 420
tccgtcgaat tctctgagga acccttcgga gtgatcgtta gacgccagct ggatggtaga 480
gtgctgttga acactactgt ggccccactt ttcttcgctg accagtttct gcaactgtcc 540
acttccctgc catcccagta cattactgga ctcgccgaac acctgtcgcc actgatgctc 600
tcgacctctt ggactagaat cactttgtgg aacagagact tggcccctac tccgggagca 660
aatctgtacg gaagccaccc tttttacctg gcgctcgaag atggcggatc cgctcacgga 720
gtgttcctgc tgaatagcaa cgcaatggac gtggtgctgc aaccttcccc tgcactcagt 780
tggagaagta ccgggggtat tctggacgtg tacatcttcc tcggaccaga acccaagagc 840
gtggtgcagc aatatctgga cgtggtcgga taccctttta tgcctcctta ctggggactg 900
ggattccacc tttgccgttg gggctactca tccaccgcca ttaccagaca ggtggtggag 960
aatatgacca gagcccactt ccctctcgac gtgcagtgga acgatctgga ctatatggac 1020
tcccggagag atttcacctt caacaaggac gggttccgcg attttcccgc gatggttcaa 1080
gagctccacc agggtggtcg aagatatatg atgatcgtcg acccagccat ttcgagcagc 1140
ggacccgctg gatcttatag accttacgac gaaggcctta ggagaggagt gttcatcaca 1200
aacgagactg gacagccttt gatcggtaaa gtgtggcctg gatcaaccgc ctttcctgac 1260
tttaccaatc ccactgcctt ggcttggtgg gaggacatgg tggccgaatt ccacgaccaa 1320
gtcccctttg atggaatgtg gatcgatatg aacgaaccaa gcaattttat cagaggttcc 1380
gaagacggtt gccccaacaa cgaactggaa aaccctcctt atgtgcccgg agtcgtgggc 1440
ggaacattac aggccgcgac tatttgcgcc agcagccacc aattcctgtc cactcactac 1500
aacctccaca acctttatgg attaaccgaa gctattgcaa gtcacagggc tctggtgaag 1560
gctagaggga ctaggccctt tgtgatctcc cgatccacct ttgccggaca cgggagatac 1620
gccggtcact ggactggtga cgtgtggagc tcatgggaac aactggcctc ctccgtgccg 1680
gaaatcttac agttcaacct tctgggtgtc cctcttgtcg gagcagacgt gtgtgggttt 1740
cttggtaaca cctccgagga actgtgtgtg cgctggactc aactgggtgc attctaccca 1800
ttcatgagaa accacaactc cttgctgtcc ctgccacaag agccctactc gttcagcgag 1860
cctgcacaac aggctatgcg gaaggcactg accctgagat acgccctgct tccacactta 1920
tacactctct tccatcaagc gcatgtggca ggagaaaccg ttgcaaggcc tcttttcctt 1980
gaattcccca aggattcctc gacttggacg gtggatcatc agctgctgtg gggagaagct 2040
ctgctgatta ctccagtgtt gcaagccgga aaagctgagg tgaccggata ctttccgctg 2100
ggaacctggt acgacctcca gactgtccct gttgaagccc ttggatcact gcctccgcct 2160
ccggcagctc cacgcgaacc agctatacat tccgagggac agtgggttac attaccagct 2220
cctctggaca caatcaacgt ccacttaaga gctggctaca ttatccctct gcaaggacca 2280
ggactgacta cgaccgagag cagacagcag ccaatggcac tggctgtggc tctgaccaag 2340
ggaggggaag ctagaggaga actcttctgg gatgatgggg agtcccttga agtgctggaa 2400
agaggcgctt acactcaagt cattttcctt gcacggaaca acaccattgt gaacgaattg 2460
gtgcgagtga ccagcgaagg agctggactt caactgcaga aggtcactgt gctcggagtg 2520
gctaccgctc ctcagcaagt gctgtcgaat ggagtccccg tgtcaaactt tacctactcc 2580
cctgacacta aggtgctcga catttgcgtg tccctcctga tgggagagca gttccttgtg 2640
tcctggtgtt ga 2652
<210> 36
<211> 925
<212> Белок
<213> Искусственная
<220>
<223> вариант hGAAwt без sp
<400> 36
Gly His Ile Leu Leu His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser
1. 5 10 15
Gly Ser Ser Pro Val Leu Glu Glu Thr His Pro Ala His Gln Gln Gly
20 25 30
Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro
35 40 45
Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp
50 55 60
Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly
65 70 75 80
Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly
85 90 95
Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu
100 105 110
Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr
115 120 125
Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val
130 135 140
Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala
145 150 155 160
Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro Arg Val His Ser Arg
165 170 175
Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly
180 185 190
Val Ile Val His Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr
195 200 205
Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser
210 215 220
Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu
225 230 235 240
Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu
245 250 255
Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu
260 265 270
Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser
275 280 285
Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg
290 295 300
Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro
305 310 315 320
Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met
325 330 335
Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser
340 345 350
Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala His
355 360 365
Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg
370 375 380
Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met
385 390 395 400
Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp
405 410 415
Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp
420 425 430
Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro
435 440 445
Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr
450 455 460
Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe His
465 470 475 480
Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser
485 490 495
Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu
500 505 510
Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala
515 520 525
Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu
530 535 540
His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu
545 550 555 560
Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe
565 570 575
Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser
580 585 590
Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn
595 600 605
Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly
610 615 620
Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe
625 630 635 640
Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu
645 650 655
Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu
660 665 670
Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln
675 680 685
Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe
690 695 700
Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly
705 710 715 720
Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val
725 730 735
Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro
740 745 750
Ile Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu
755 760 765
Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu
770 775 780
Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln
785 790 795 800
Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu
805 810 815
Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp
820 825 830
Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln
835 840 845
Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg
850 855 860
Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu
865 870 875 880
Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val
885 890 895
Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val
900 905 910
Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
915 920 925
<210> 37
<211> 952
<212> Белок
<213> homo sapiens
<400> 37
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1. 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro Arg Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val His Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 38
<211> 952
<212> Белок
<213> homo sapiens
<400> 38
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1. 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 39
<211> 957
<212> Белок
<213> homo sapiens
<400> 39
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1. 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Ala Arg Gly Pro Arg Val Leu Asp Ile Cys Val
930 935 940
Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
945 950 955
<210> 40
<211> 952
<212> Белок
<213> homo sapiens
<400> 40
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1. 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro Arg Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val His Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Leu Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 41
<211> 896
<212> Белок
<213> Искусственная
<220>
<223> hGAA-дельта-29
<400> 41
Gln Gln Gly Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro
1. 5 10 15
Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser
20 25 30
Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu
35 40 45
Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala
50 55 60
Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr
65 70 75 80
Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu
85 90 95
Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg
100 105 110
Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys
115 120 125
Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val
130 135 140
His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu
145 150 155 160
Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu
165 170 175
Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu
180 185 190
Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu
195 200 205
Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn
210 215 220
Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro
225 230 235 240
Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu
245 250 255
Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu
260 265 270
Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly
275 280 285
Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr
290 295 300
Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp
305 310 315 320
Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr
325 330 335
Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met
340 345 350
Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe
355 360 365
Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met
370 375 380
Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg
385 390 395 400
Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr
405 410 415
Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro
420 425 430
Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala
435 440 445
Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn
450 455 460
Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn
465 470 475 480
Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu
485 490 495
Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His
500 505 510
Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His
515 520 525
Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg
530 535 540
Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp
545 550 555 560
Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu
565 570 575
Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly
580 585 590
Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu
595 600 605
Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu
610 615 620
Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg
625 630 635 640
Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu
645 650 655
Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe
660 665 670
Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu
675 680 685
Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys
690 695 700
Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln
705 710 715 720
Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala
725 730 735
Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro
740 745 750
Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile
755 760 765
Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro
770 775 780
Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu
785 790 795 800
Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala
805 810 815
Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu
820 825 830
Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val
835 840 845
Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly
850 855 860
Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp
865 870 875 880
Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
885 890 895
<210> 42
<211> 882
<212> Белок
<213> Искусственная
<220>
<223> hGAA-дельта-43
<400> 42
His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro
1. 5 10 15
Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln
20 25 30
Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln
35 40 45
Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro
50 55 60
Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala
65 70 75 80
Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr
85 90 95
Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr
100 105 110
Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro
115 120 125
His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser
130 135 140
Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val
145 150 155 160
Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu
165 170 175
Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu
180 185 190
His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu
195 200 205
Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser
210 215 220
His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val
225 230 235 240
Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro
245 250 255
Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe
260 265 270
Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val
275 280 285
Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys
290 295 300
Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn
305 310 315 320
Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp
325 330 335
Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg
340 345 350
Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr
355 360 365
Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser
370 375 380
Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn
385 390 395 400
Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala
405 410 415
Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met
420 425 430
Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp
435 440 445
Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro
450 455 460
Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly
465 470 475 480
Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser
485 490 495
Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala
500 505 510
Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile
515 520 525
Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr
530 535 540
Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu
545 550 555 560
Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val
565 570 575
Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr
580 585 590
Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu
595 600 605
Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala
610 615 620
Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr
625 630 635 640
Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro
645 650 655
Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His
660 665 670
Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala
675 680 685
Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp
690 695 700
Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro
705 710 715 720
Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr
725 730 735
Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr
740 745 750
Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln
755 760 765
Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg
770 775 780
Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg
785 790 795 800
Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val
805 810 815
Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln
820 825 830
Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser
835 840 845
Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val
850 855 860
Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser
865 870 875 880
Trp Cys
<210> 43
<211> 878
<212> Белок
<213> Искусственная
<220>
<223> hGAA-дельта-47
<400> 43
Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe
1. 5 10 15
Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg
20 25 30
Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met
35 40 45
Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu
50 55 60
Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg
65 70 75 80
Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp
85 90 95
Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro
100 105 110
Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val His Ser
115 120 125
Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe
130 135 140
Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr
145 150 155 160
Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr
165 170 175
Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro
180 185 190
Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp
195 200 205
Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr
210 215 220
Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn
225 230 235 240
Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp
245 250 255
Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu
260 265 270
Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe
275 280 285
Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr
290 295 300
Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala
305 310 315 320
His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser
325 330 335
Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala
340 345 350
Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val
355 360 365
Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr
370 375 380
Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln
385 390 395 400
Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe
405 410 415
Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe
420 425 430
His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro
435 440 445
Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu
450 455 460
Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala
465 470 475 480
Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn
485 490 495
Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala
500 505 510
Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr
515 520 525
Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp
530 535 540
Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe
545 550 555 560
Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu
565 570 575
Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala
580 585 590
Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln
595 600 605
Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala
610 615 620
Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His
625 630 635 640
Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu
645 650 655
Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp
660 665 670
Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu
675 680 685
Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val
690 695 700
Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg
705 710 715 720
Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro
725 730 735
Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu
740 745 750
Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala
755 760 765
Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe
770 775 780
Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr
785 790 795 800
Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val
805 810 815
Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val
820 825 830
Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro
835 840 845
Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys
850 855 860
Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
865 870 875
<210> 44
<211> 2754
<212> ДНК
<213> Искусственная
<220>
<223> hGAAwt-дельта-8
<400> 44
ctgctggttc cccgagagct gagtggctcc tccccagtcc tggaggagac tcacccagct 60
caccagcagg gagccagcag accagggccc cgggatgccc aggcacaccc cgggcggccg 120
cgagcagtgc ccacacagtg cgacgtcccc cccaacagcc gcttcgattg cgcccctgac 180
aaggccatca cccaggaaca gtgcgaggcc cgcggctgtt gctacatccc tgcaaagcag 240
gggctgcagg gagcccagat ggggcagccc tggtgcttct tcccacccag ctaccccagc 300
tacaagctgg agaacctgag ctcctctgaa atgggctaca cggccaccct gacccgtacc 360
acccccacct tcttccccaa ggacatcctg accctgcggc tggacgtgat gatggagact 420
gagaaccgcc tccacttcac gatcaaagat ccagctaaca ggcgctacga ggtgcccttg 480
gagaccccgc atgtccacag ccgggcaccg tccccactct acagcgtgga gttctccgag 540
gagcccttcg gggtgatcgt gcgccggcag ctggacggcc gcgtgctgct gaacacgacg 600
gtggcgcccc tgttctttgc ggaccagttc cttcagctgt ccacctcgct gccctcgcag 660
tatatcacag gcctcgccga gcacctcagt cccctgatgc tcagcaccag ctggaccagg 720
atcaccctgt ggaaccggga ccttgcgccc acgcccggtg cgaacctcta cgggtctcac 780
cctttctacc tggcgctgga ggacggcggg tcggcacacg gggtgttcct gctaaacagc 840
aatgccatgg atgtggtcct gcagccgagc cctgccctta gctggaggtc gacaggtggg 900
atcctggatg tctacatctt cctgggccca gagcccaaga gcgtggtgca gcagtacctg 960
gacgttgtgg gatacccgtt catgccgcca tactggggcc tgggcttcca cctgtgccgc 1020
tggggctact cctccaccgc tatcacccgc caggtggtgg agaacatgac cagggcccac 1080
ttccccctgg acgtccagtg gaacgacctg gactacatgg actcccggag ggacttcacg 1140
ttcaacaagg atggcttccg ggacttcccg gccatggtgc aggagctgca ccagggcggc 1200
cggcgctaca tgatgatcgt ggatcctgcc atcagcagct cgggccctgc cgggagctac 1260
aggccctacg acgagggtct gcggaggggg gttttcatca ccaacgagac cggccagccg 1320
ctgattggga aggtatggcc cgggtccact gccttccccg acttcaccaa ccccacagcc 1380
ctggcctggt gggaggacat ggtggctgag ttccatgacc aggtgccctt cgacggcatg 1440
tggattgaca tgaacgagcc ttccaacttc atcaggggct ctgaggacgg ctgccccaac 1500
aatgagctgg agaacccacc ctacgtgcct ggggtggttg gggggaccct ccaggcggcc 1560
accatctgtg cctccagcca ccagtttctc tccacacact acaacctgca caacctctac 1620
ggcctgaccg aagccatcgc ctcccacagg gcgctggtga aggctcgggg gacacgccca 1680
tttgtgatct cccgctcgac ctttgctggc cacggccgat acgccggcca ctggacgggg 1740
gacgtgtgga gctcctggga gcagctcgcc tcctccgtgc cagaaatcct gcagtttaac 1800
ctgctggggg tgcctctggt cggggccgac gtctgcggct tcctgggcaa cacctcagag 1860
gagctgtgtg tgcgctggac ccagctgggg gccttctacc ccttcatgcg gaaccacaac 1920
agcctgctca gtctgcccca ggagccgtac agcttcagcg agccggccca gcaggccatg 1980
aggaaggccc tcaccctgcg ctacgcactc ctcccccacc tctacacact gttccaccag 2040
gcccacgtcg cgggggagac cgtggcccgg cccctcttcc tggagttccc caaggactct 2100
agcacctgga ctgtggacca ccagctcctg tggggggagg ccctgctcat caccccagtg 2160
ctccaggccg ggaaggccga agtgactggc tacttcccct tgggcacatg gtacgacctg 2220
cagacggtgc cagtagaggc ccttggcagc ctcccacccc cacctgcagc tccccgtgag 2280
ccagccatcc acagcgaggg gcagtgggtg acgctgccgg cccccctgga caccatcaac 2340
gtccacctcc gggctgggta catcatcccc ctgcagggcc ctggcctcac aaccacagag 2400
tcccgccagc agcccatggc cctggctgtg gccctgacca agggtgggga ggcccgaggg 2460
gagctgttct gggacgatgg agagagcctg gaagtgctgg agcgaggggc ctacacacag 2520
gtcatcttcc tggccaggaa taacacgatc gtgaatgagc tggtacgtgt gaccagtgag 2580
ggagctggcc tgcagctgca gaaggtgact gtcctgggcg tggccacggc gccccagcag 2640
gtcctctcca acggtgtccc tgtctccaac ttcacctaca gccccgacac caaggtcctg 2700
gacatctgtg tctcgctgtt gatgggagag cagtttctcg tcagctggtg ttag 2754
<210> 45
<211> 2691
<212> ДНК
<213> Искусственная
<220>
<223> hGAAwt-дельта-29
<400> 45
cagcagggag ccagcagacc agggccccgg gatgcccagg cacaccccgg gcggccgcga 60
gcagtgccca cacagtgcga cgtccccccc aacagccgct tcgattgcgc ccctgacaag 120
gccatcaccc aggaacagtg cgaggcccgc ggctgttgct acatccctgc aaagcagggg 180
ctgcagggag cccagatggg gcagccctgg tgcttcttcc cacccagcta ccccagctac 240
aagctggaga acctgagctc ctctgaaatg ggctacacgg ccaccctgac ccgtaccacc 300
cccaccttct tccccaagga catcctgacc ctgcggctgg acgtgatgat ggagactgag 360
aaccgcctcc acttcacgat caaagatcca gctaacaggc gctacgaggt gcccttggag 420
accccgcatg tccacagccg ggcaccgtcc ccactctaca gcgtggagtt ctccgaggag 480
cccttcgggg tgatcgtgcg ccggcagctg gacggccgcg tgctgctgaa cacgacggtg 540
gcgcccctgt tctttgcgga ccagttcctt cagctgtcca cctcgctgcc ctcgcagtat 600
atcacaggcc tcgccgagca cctcagtccc ctgatgctca gcaccagctg gaccaggatc 660
accctgtgga accgggacct tgcgcccacg cccggtgcga acctctacgg gtctcaccct 720
ttctacctgg cgctggagga cggcgggtcg gcacacgggg tgttcctgct aaacagcaat 780
gccatggatg tggtcctgca gccgagccct gcccttagct ggaggtcgac aggtgggatc 840
ctggatgtct acatcttcct gggcccagag cccaagagcg tggtgcagca gtacctggac 900
gttgtgggat acccgttcat gccgccatac tggggcctgg gcttccacct gtgccgctgg 960
ggctactcct ccaccgctat cacccgccag gtggtggaga acatgaccag ggcccacttc 1020
cccctggacg tccagtggaa cgacctggac tacatggact cccggaggga cttcacgttc 1080
aacaaggatg gcttccggga cttcccggcc atggtgcagg agctgcacca gggcggccgg 1140
cgctacatga tgatcgtgga tcctgccatc agcagctcgg gccctgccgg gagctacagg 1200
ccctacgacg agggtctgcg gaggggggtt ttcatcacca acgagaccgg ccagccgctg 1260
attgggaagg tatggcccgg gtccactgcc ttccccgact tcaccaaccc cacagccctg 1320
gcctggtggg aggacatggt ggctgagttc catgaccagg tgcccttcga cggcatgtgg 1380
attgacatga acgagccttc caacttcatc aggggctctg aggacggctg ccccaacaat 1440
gagctggaga acccacccta cgtgcctggg gtggttgggg ggaccctcca ggcggccacc 1500
atctgtgcct ccagccacca gtttctctcc acacactaca acctgcacaa cctctacggc 1560
ctgaccgaag ccatcgcctc ccacagggcg ctggtgaagg ctcgggggac acgcccattt 1620
gtgatctccc gctcgacctt tgctggccac ggccgatacg ccggccactg gacgggggac 1680
gtgtggagct cctgggagca gctcgcctcc tccgtgccag aaatcctgca gtttaacctg 1740
ctgggggtgc ctctggtcgg ggccgacgtc tgcggcttcc tgggcaacac ctcagaggag 1800
ctgtgtgtgc gctggaccca gctgggggcc ttctacccct tcatgcggaa ccacaacagc 1860
ctgctcagtc tgccccagga gccgtacagc ttcagcgagc cggcccagca ggccatgagg 1920
aaggccctca ccctgcgcta cgcactcctc ccccacctct acacactgtt ccaccaggcc 1980
cacgtcgcgg gggagaccgt ggcccggccc ctcttcctgg agttccccaa ggactctagc 2040
acctggactg tggaccacca gctcctgtgg ggggaggccc tgctcatcac cccagtgctc 2100
caggccggga aggccgaagt gactggctac ttccccttgg gcacatggta cgacctgcag 2160
acggtgccag tagaggccct tggcagcctc ccacccccac ctgcagctcc ccgtgagcca 2220
gccatccaca gcgaggggca gtgggtgacg ctgccggccc ccctggacac catcaacgtc 2280
cacctccggg ctgggtacat catccccctg cagggccctg gcctcacaac cacagagtcc 2340
cgccagcagc ccatggccct ggctgtggcc ctgaccaagg gtggggaggc ccgaggggag 2400
ctgttctggg acgatggaga gagcctggaa gtgctggagc gaggggccta cacacaggtc 2460
atcttcctgg ccaggaataa cacgatcgtg aatgagctgg tacgtgtgac cagtgaggga 2520
gctggcctgc agctgcagaa ggtgactgtc ctgggcgtgg ccacggcgcc ccagcaggtc 2580
ctctccaacg gtgtccctgt ctccaacttc acctacagcc ccgacaccaa ggtcctggac 2640
atctgtgtct cgctgttgat gggagagcag tttctcgtca gctggtgtta g 2691
<210> 46
<211> 2691
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco1-дельта-29
<400> 46
cagcagggcg cctctagacc tggacctaga gatgcccagg cccaccccgg cagacctaga 60
gctgtgccta cccagtgtga cgtgcccccc aacagcagat tcgactgcgc ccctgacaag 120
gccatcaccc aggaacagtg cgaggccaga ggctgctgct acatccctgc caagcaggga 180
ctgcagggcg ctcagatggg acagccctgg tgcttcttcc caccctccta ccccagctac 240
aagctggaaa acctgagcag cagcgagatg ggctacaccg ccaccctgac cagaaccacc 300
cccacattct tcccaaagga catcctgacc ctgcggctgg acgtgatgat ggaaaccgag 360
aaccggctgc acttcaccat caaggacccc gccaatcgga gatacgaggt gcccctggaa 420
accccccacg tgcactctag agcccccagc cctctgtaca gcgtggaatt cagcgaggaa 480
cccttcggcg tgatcgtgcg gagacagctg gatggcagag tgctgctgaa caccaccgtg 540
gcccctctgt tcttcgccga ccagttcctg cagctgagca ccagcctgcc cagccagtac 600
atcacaggac tggccgagca cctgagcccc ctgatgctga gcacatcctg gacccggatc 660
accctgtgga acagggatct ggcccctacc cctggcgcca atctgtacgg cagccaccct 720
ttctacctgg ccctggaaga tggcggatct gcccacggag tgtttctgct gaactccaac 780
gccatggacg tggtgctgca gcctagccct gccctgtctt ggagaagcac aggcggcatc 840
ctggatgtgt acatctttct gggccccgag cccaagagcg tggtgcagca gtatctggat 900
gtcgtgggct accccttcat gcccccttac tggggcctgg gattccacct gtgcagatgg 960
ggctactcca gcaccgccat caccagacag gtggtggaaa acatgaccag agcccacttc 1020
ccactggatg tgcagtggaa cgacctggac tacatggaca gcagacggga cttcaccttc 1080
aacaaggacg gcttccggga cttccccgcc atggtgcagg aactgcatca gggcggcaga 1140
cggtacatga tgatcgtgga tcccgccatc agctcctctg gccctgccgg ctcttacaga 1200
ccctacgacg agggcctgcg gagaggcgtg ttcatcacca acgagacagg ccagcccctg 1260
atcggcaaag tgtggcctgg cagcacagcc ttccccgact tcaccaatcc taccgccctg 1320
gcttggtggg aggacatggt ggccgagttc cacgaccagg tgcccttcga cggcatgtgg 1380
atcgacatga acgagcccag caacttcatc cggggcagcg aggatggctg ccccaacaac 1440
gaactggaaa atccccctta cgtgcccggc gtcgtgggcg gaacactgca ggccgctaca 1500
atctgtgcca gcagccacca gtttctgagc acccactaca acctgcacaa cctgtacggc 1560
ctgaccgagg ccattgccag ccaccgcgct ctcgtgaaag ccagaggcac acggcccttc 1620
gtgatcagca gaagcacctt tgccggccac ggcagatacg ccggacattg gactggcgac 1680
gtgtggtcct cttgggagca gctggcctct agcgtgcccg agatcctgca gttcaatctg 1740
ctgggcgtgc cactcgtggg cgccgatgtg tgtggcttcc tgggcaacac ctccgaggaa 1800
ctgtgtgtgc ggtggacaca gctgggcgcc ttctaccctt tcatgagaaa ccacaacagc 1860
ctgctgagcc tgccccagga accctacagc tttagcgagc ctgcacagca ggccatgcgg 1920
aaggccctga cactgagata cgctctgctg ccccacctgt acaccctgtt tcaccaggcc 1980
catgtggccg gcgagacagt ggccagacct ctgtttctgg aattccccaa ggacagcagc 2040
acctggaccg tggaccatca gctgctgtgg ggagaggctc tgctgattac cccagtgctg 2100
caggcaggca aggccgaagt gaccggctac tttcccctgg gcacttggta cgacctgcag 2160
accgtgcctg tggaagccct gggatctctg cctccacctc ctgccgctcc tagagagcct 2220
gccattcact ctgagggcca gtgggtcaca ctgcctgccc ccctggatac catcaacgtg 2280
cacctgaggg ccggctacat cataccactg cagggacctg gcctgaccac caccgagtct 2340
agacagcagc caatggccct ggccgtggcc ctgaccaaag gcggagaagc taggggcgag 2400
ctgttctggg acgatggcga gagcctggaa gtgctggaaa gaggcgccta tacccaagtg 2460
atcttcctgg cccggaacaa caccatcgtg aacgagctgg tgcgcgtgac ctctgaaggc 2520
gctggactgc agctgcagaa agtgaccgtg ctgggagtgg ccacagcccc tcagcaggtg 2580
ctgtctaatg gcgtgcccgt gtccaacttc acctacagcc ccgacaccaa ggtgctggac 2640
atctgcgtgt cactgctgat gggagagcag tttctggtgt cctggtgctg a 2691
<210> 47
<211> 2691
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco2-дельта-29
<400> 47
caacagggag cttccagacc aggaccgaga gacgcccaag cccatcctgg tagaccaaga 60
gctgtgccta cccaatgcga cgtgccaccc aactcccgat tcgactgcgc gccagataag 120
gctattaccc aagagcagtg tgaagccaga ggttgctgct acatcccagc gaagcaagga 180
ttgcaaggcg cccaaatggg acaaccttgg tgtttcttcc ccccttcgta cccatcatat 240
aaactcgaaa acctgtcctc ttcggaaatg ggttatactg ccaccctcac cagaactact 300
cctactttct tcccgaaaga catcttgacc ttgaggctgg acgtgatgat ggagactgaa 360
aaccggctgc atttcactat caaagatcct gccaatcggc gatacgaggt ccctctggaa 420
acccctcacg tgcactcacg ggctccttct ccgctttact ccgtcgaatt ctctgaggaa 480
cccttcggag tgatcgttag acgccagctg gatggtagag tgctgttgaa cactactgtg 540
gccccacttt tcttcgctga ccagtttctg caactgtcca cttccctgcc atcccagtac 600
attactggac tcgccgaaca cctgtcgcca ctgatgctct cgacctcttg gactagaatc 660
actttgtgga acagagactt ggcccctact ccgggagcaa atctgtacgg aagccaccct 720
ttttacctgg cgctcgaaga tggcggatcc gctcacggag tgttcctgct gaatagcaac 780
gcaatggacg tggtgctgca accttcccct gcactcagtt ggagaagtac cgggggtatt 840
ctggacgtgt acatcttcct cggaccagaa cccaagagcg tggtgcagca atatctggac 900
gtggtcggat acccttttat gcctccttac tggggactgg gattccacct ttgccgttgg 960
ggctactcat ccaccgccat taccagacag gtggtggaga atatgaccag agcccacttc 1020
cctctcgacg tgcagtggaa cgatctggac tatatggact cccggagaga tttcaccttc 1080
aacaaggacg ggttccgcga ttttcccgcg atggttcaag agctccacca gggtggtcga 1140
agatatatga tgatcgtcga cccagccatt tcgagcagcg gacccgctgg atcttataga 1200
ccttacgacg aaggccttag gagaggagtg ttcatcacaa acgagactgg acagcctttg 1260
atcggtaaag tgtggcctgg atcaaccgcc tttcctgact ttaccaatcc cactgccttg 1320
gcttggtggg aggacatggt ggccgaattc cacgaccaag tcccctttga tggaatgtgg 1380
atcgatatga acgaaccaag caattttatc agaggttccg aagacggttg ccccaacaac 1440
gaactggaaa accctcctta tgtgcccgga gtcgtgggcg gaacattaca ggccgcgact 1500
atttgcgcca gcagccacca attcctgtcc actcactaca acctccacaa cctttatgga 1560
ttaaccgaag ctattgcaag tcacagggct ctggtgaagg ctagagggac taggcccttt 1620
gtgatctccc gatccacctt tgccggacac gggagatacg ccggtcactg gactggtgac 1680
gtgtggagct catgggaaca actggcctcc tccgtgccgg aaatcttaca gttcaacctt 1740
ctgggtgtcc ctcttgtcgg agcagacgtg tgtgggtttc ttggtaacac ctccgaggaa 1800
ctgtgtgtgc gctggactca actgggtgca ttctacccat tcatgagaaa ccacaactcc 1860
ttgctgtccc tgccacaaga gccctactcg ttcagcgagc ctgcacaaca ggctatgcgg 1920
aaggcactga ccctgagata cgccctgctt ccacacttat acactctctt ccatcaagcg 1980
catgtggcag gagaaaccgt tgcaaggcct cttttccttg aattccccaa ggattcctcg 2040
acttggacgg tggatcatca gctgctgtgg ggagaagctc tgctgattac tccagtgttg 2100
caagccggaa aagctgaggt gaccggatac tttccgctgg gaacctggta cgacctccag 2160
actgtccctg ttgaagccct tggatcactg cctccgcctc cggcagctcc acgcgaacca 2220
gctatacatt ccgagggaca gtgggttaca ttaccagctc ctctggacac aatcaacgtc 2280
cacttaagag ctggctacat tatccctctg caaggaccag gactgactac gaccgagagc 2340
agacagcagc caatggcact ggctgtggct ctgaccaagg gaggggaagc tagaggagaa 2400
ctcttctggg atgatgggga gtcccttgaa gtgctggaaa gaggcgctta cactcaagtc 2460
attttccttg cacggaacaa caccattgtg aacgaattgg tgcgagtgac cagcgaagga 2520
gctggacttc aactgcagaa ggtcactgtg ctcggagtgg ctaccgctcc tcagcaagtg 2580
ctgtcgaatg gagtccccgt gtcaaacttt acctactccc ctgacactaa ggtgctcgac 2640
atttgcgtgt ccctcctgat gggagagcag ttccttgtgt cctggtgttg a 2691
<210> 48
<211> 2652
<212> ДНК
<213> Искусственная
<220>
<223> hGAAwt-дельта-42
<400> 48
gcacaccccg ggcggccgcg agcagtgccc acacagtgcg acgtcccccc caacagccgc 60
ttcgattgcg cccctgacaa ggccatcacc caggaacagt gcgaggcccg cggctgttgc 120
tacatccctg caaagcaggg gctgcaggga gcccagatgg ggcagccctg gtgcttcttc 180
ccacccagct accccagcta caagctggag aacctgagct cctctgaaat gggctacacg 240
gccaccctga cccgtaccac ccccaccttc ttccccaagg acatcctgac cctgcggctg 300
gacgtgatga tggagactga gaaccgcctc cacttcacga tcaaagatcc agctaacagg 360
cgctacgagg tgcccttgga gaccccgcat gtccacagcc gggcaccgtc cccactctac 420
agcgtggagt tctccgagga gcccttcggg gtgatcgtgc gccggcagct ggacggccgc 480
gtgctgctga acacgacggt ggcgcccctg ttctttgcgg accagttcct tcagctgtcc 540
acctcgctgc cctcgcagta tatcacaggc ctcgccgagc acctcagtcc cctgatgctc 600
agcaccagct ggaccaggat caccctgtgg aaccgggacc ttgcgcccac gcccggtgcg 660
aacctctacg ggtctcaccc tttctacctg gcgctggagg acggcgggtc ggcacacggg 720
gtgttcctgc taaacagcaa tgccatggat gtggtcctgc agccgagccc tgcccttagc 780
tggaggtcga caggtgggat cctggatgtc tacatcttcc tgggcccaga gcccaagagc 840
gtggtgcagc agtacctgga cgttgtggga tacccgttca tgccgccata ctggggcctg 900
ggcttccacc tgtgccgctg gggctactcc tccaccgcta tcacccgcca ggtggtggag 960
aacatgacca gggcccactt ccccctggac gtccagtgga acgacctgga ctacatggac 1020
tcccggaggg acttcacgtt caacaaggat ggcttccggg acttcccggc catggtgcag 1080
gagctgcacc agggcggccg gcgctacatg atgatcgtgg atcctgccat cagcagctcg 1140
ggccctgccg ggagctacag gccctacgac gagggtctgc ggaggggggt tttcatcacc 1200
aacgagaccg gccagccgct gattgggaag gtatggcccg ggtccactgc cttccccgac 1260
ttcaccaacc ccacagccct ggcctggtgg gaggacatgg tggctgagtt ccatgaccag 1320
gtgcccttcg acggcatgtg gattgacatg aacgagcctt ccaacttcat caggggctct 1380
gaggacggct gccccaacaa tgagctggag aacccaccct acgtgcctgg ggtggttggg 1440
gggaccctcc aggcggccac catctgtgcc tccagccacc agtttctctc cacacactac 1500
aacctgcaca acctctacgg cctgaccgaa gccatcgcct cccacagggc gctggtgaag 1560
gctcggggga cacgcccatt tgtgatctcc cgctcgacct ttgctggcca cggccgatac 1620
gccggccact ggacggggga cgtgtggagc tcctgggagc agctcgcctc ctccgtgcca 1680
gaaatcctgc agtttaacct gctgggggtg cctctggtcg gggccgacgt ctgcggcttc 1740
ctgggcaaca cctcagagga gctgtgtgtg cgctggaccc agctgggggc cttctacccc 1800
ttcatgcgga accacaacag cctgctcagt ctgccccagg agccgtacag cttcagcgag 1860
ccggcccagc aggccatgag gaaggccctc accctgcgct acgcactcct cccccacctc 1920
tacacactgt tccaccaggc ccacgtcgcg ggggagaccg tggcccggcc cctcttcctg 1980
gagttcccca aggactctag cacctggact gtggaccacc agctcctgtg gggggaggcc 2040
ctgctcatca ccccagtgct ccaggccggg aaggccgaag tgactggcta cttccccttg 2100
ggcacatggt acgacctgca gacggtgcca gtagaggccc ttggcagcct cccaccccca 2160
cctgcagctc cccgtgagcc agccatccac agcgaggggc agtgggtgac gctgccggcc 2220
cccctggaca ccatcaacgt ccacctccgg gctgggtaca tcatccccct gcagggccct 2280
ggcctcacaa ccacagagtc ccgccagcag cccatggccc tggctgtggc cctgaccaag 2340
ggtggggagg cccgagggga gctgttctgg gacgatggag agagcctgga agtgctggag 2400
cgaggggcct acacacaggt catcttcctg gccaggaata acacgatcgt gaatgagctg 2460
gtacgtgtga ccagtgaggg agctggcctg cagctgcaga aggtgactgt cctgggcgtg 2520
gccacggcgc cccagcaggt cctctccaac ggtgtccctg tctccaactt cacctacagc 2580
cccgacacca aggtcctgga catctgtgtc tcgctgttga tgggagagca gtttctcgtc 2640
agctggtgtt ag 2652
<210> 49
<211> 2649
<212> ДНК
<213> Искусственная
<220>
<223> hGAAwt-дельта-43
<400> 49
caccccgggc ggccgcgagc agtgcccaca cagtgcgacg tcccccccaa cagccgcttc 60
gattgcgccc ctgacaaggc catcacccag gaacagtgcg aggcccgcgg ctgttgctac 120
atccctgcaa agcaggggct gcagggagcc cagatggggc agccctggtg cttcttccca 180
cccagctacc ccagctacaa gctggagaac ctgagctcct ctgaaatggg ctacacggcc 240
accctgaccc gtaccacccc caccttcttc cccaaggaca tcctgaccct gcggctggac 300
gtgatgatgg agactgagaa ccgcctccac ttcacgatca aagatccagc taacaggcgc 360
tacgaggtgc ccttggagac cccgcatgtc cacagccggg caccgtcccc actctacagc 420
gtggagttct ccgaggagcc cttcggggtg atcgtgcgcc ggcagctgga cggccgcgtg 480
ctgctgaaca cgacggtggc gcccctgttc tttgcggacc agttccttca gctgtccacc 540
tcgctgccct cgcagtatat cacaggcctc gccgagcacc tcagtcccct gatgctcagc 600
accagctgga ccaggatcac cctgtggaac cgggaccttg cgcccacgcc cggtgcgaac 660
ctctacgggt ctcacccttt ctacctggcg ctggaggacg gcgggtcggc acacggggtg 720
ttcctgctaa acagcaatgc catggatgtg gtcctgcagc cgagccctgc ccttagctgg 780
aggtcgacag gtgggatcct ggatgtctac atcttcctgg gcccagagcc caagagcgtg 840
gtgcagcagt acctggacgt tgtgggatac ccgttcatgc cgccatactg gggcctgggc 900
ttccacctgt gccgctgggg ctactcctcc accgctatca cccgccaggt ggtggagaac 960
atgaccaggg cccacttccc cctggacgtc cagtggaacg acctggacta catggactcc 1020
cggagggact tcacgttcaa caaggatggc ttccgggact tcccggccat ggtgcaggag 1080
ctgcaccagg gcggccggcg ctacatgatg atcgtggatc ctgccatcag cagctcgggc 1140
cctgccggga gctacaggcc ctacgacgag ggtctgcgga ggggggtttt catcaccaac 1200
gagaccggcc agccgctgat tgggaaggta tggcccgggt ccactgcctt ccccgacttc 1260
accaacccca cagccctggc ctggtgggag gacatggtgg ctgagttcca tgaccaggtg 1320
cccttcgacg gcatgtggat tgacatgaac gagccttcca acttcatcag gggctctgag 1380
gacggctgcc ccaacaatga gctggagaac ccaccctacg tgcctggggt ggttgggggg 1440
accctccagg cggccaccat ctgtgcctcc agccaccagt ttctctccac acactacaac 1500
ctgcacaacc tctacggcct gaccgaagcc atcgcctccc acagggcgct ggtgaaggct 1560
cgggggacac gcccatttgt gatctcccgc tcgacctttg ctggccacgg ccgatacgcc 1620
ggccactgga cgggggacgt gtggagctcc tgggagcagc tcgcctcctc cgtgccagaa 1680
atcctgcagt ttaacctgct gggggtgcct ctggtcgggg ccgacgtctg cggcttcctg 1740
ggcaacacct cagaggagct gtgtgtgcgc tggacccagc tgggggcctt ctaccccttc 1800
atgcggaacc acaacagcct gctcagtctg ccccaggagc cgtacagctt cagcgagccg 1860
gcccagcagg ccatgaggaa ggccctcacc ctgcgctacg cactcctccc ccacctctac 1920
acactgttcc accaggccca cgtcgcgggg gagaccgtgg cccggcccct cttcctggag 1980
ttccccaagg actctagcac ctggactgtg gaccaccagc tcctgtgggg ggaggccctg 2040
ctcatcaccc cagtgctcca ggccgggaag gccgaagtga ctggctactt ccccttgggc 2100
acatggtacg acctgcagac ggtgccagta gaggcccttg gcagcctccc acccccacct 2160
gcagctcccc gtgagccagc catccacagc gaggggcagt gggtgacgct gccggccccc 2220
ctggacacca tcaacgtcca cctccgggct gggtacatca tccccctgca gggccctggc 2280
ctcacaacca cagagtcccg ccagcagccc atggccctgg ctgtggccct gaccaagggt 2340
ggggaggccc gaggggagct gttctgggac gatggagaga gcctggaagt gctggagcga 2400
ggggcctaca cacaggtcat cttcctggcc aggaataaca cgatcgtgaa tgagctggta 2460
cgtgtgacca gtgagggagc tggcctgcag ctgcagaagg tgactgtcct gggcgtggcc 2520
acggcgcccc agcaggtcct ctccaacggt gtccctgtct ccaacttcac ctacagcccc 2580
gacaccaagg tcctggacat ctgtgtctcg ctgttgatgg gagagcagtt tctcgtcagc 2640
tggtgttag 2649
<210> 50
<211> 2649
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco1-дельта-43
<400> 50
caccccggca gacctagagc tgtgcctacc cagtgtgacg tgccccccaa cagcagattc 60
gactgcgccc ctgacaaggc catcacccag gaacagtgcg aggccagagg ctgctgctac 120
atccctgcca agcagggact gcagggcgct cagatgggac agccctggtg cttcttccca 180
ccctcctacc ccagctacaa gctggaaaac ctgagcagca gcgagatggg ctacaccgcc 240
accctgacca gaaccacccc cacattcttc ccaaaggaca tcctgaccct gcggctggac 300
gtgatgatgg aaaccgagaa ccggctgcac ttcaccatca aggaccccgc caatcggaga 360
tacgaggtgc ccctggaaac cccccacgtg cactctagag cccccagccc tctgtacagc 420
gtggaattca gcgaggaacc cttcggcgtg atcgtgcgga gacagctgga tggcagagtg 480
ctgctgaaca ccaccgtggc ccctctgttc ttcgccgacc agttcctgca gctgagcacc 540
agcctgccca gccagtacat cacaggactg gccgagcacc tgagccccct gatgctgagc 600
acatcctgga cccggatcac cctgtggaac agggatctgg cccctacccc tggcgccaat 660
ctgtacggca gccacccttt ctacctggcc ctggaagatg gcggatctgc ccacggagtg 720
tttctgctga actccaacgc catggacgtg gtgctgcagc ctagccctgc cctgtcttgg 780
agaagcacag gcggcatcct ggatgtgtac atctttctgg gccccgagcc caagagcgtg 840
gtgcagcagt atctggatgt cgtgggctac cccttcatgc ccccttactg gggcctggga 900
ttccacctgt gcagatgggg ctactccagc accgccatca ccagacaggt ggtggaaaac 960
atgaccagag cccacttccc actggatgtg cagtggaacg acctggacta catggacagc 1020
agacgggact tcaccttcaa caaggacggc ttccgggact tccccgccat ggtgcaggaa 1080
ctgcatcagg gcggcagacg gtacatgatg atcgtggatc ccgccatcag ctcctctggc 1140
cctgccggct cttacagacc ctacgacgag ggcctgcgga gaggcgtgtt catcaccaac 1200
gagacaggcc agcccctgat cggcaaagtg tggcctggca gcacagcctt ccccgacttc 1260
accaatccta ccgccctggc ttggtgggag gacatggtgg ccgagttcca cgaccaggtg 1320
cccttcgacg gcatgtggat cgacatgaac gagcccagca acttcatccg gggcagcgag 1380
gatggctgcc ccaacaacga actggaaaat cccccttacg tgcccggcgt cgtgggcgga 1440
acactgcagg ccgctacaat ctgtgccagc agccaccagt ttctgagcac ccactacaac 1500
ctgcacaacc tgtacggcct gaccgaggcc attgccagcc accgcgctct cgtgaaagcc 1560
agaggcacac ggcccttcgt gatcagcaga agcacctttg ccggccacgg cagatacgcc 1620
ggacattgga ctggcgacgt gtggtcctct tgggagcagc tggcctctag cgtgcccgag 1680
atcctgcagt tcaatctgct gggcgtgcca ctcgtgggcg ccgatgtgtg tggcttcctg 1740
ggcaacacct ccgaggaact gtgtgtgcgg tggacacagc tgggcgcctt ctaccctttc 1800
atgagaaacc acaacagcct gctgagcctg ccccaggaac cctacagctt tagcgagcct 1860
gcacagcagg ccatgcggaa ggccctgaca ctgagatacg ctctgctgcc ccacctgtac 1920
accctgtttc accaggccca tgtggccggc gagacagtgg ccagacctct gtttctggaa 1980
ttccccaagg acagcagcac ctggaccgtg gaccatcagc tgctgtgggg agaggctctg 2040
ctgattaccc cagtgctgca ggcaggcaag gccgaagtga ccggctactt tcccctgggc 2100
acttggtacg acctgcagac cgtgcctgtg gaagccctgg gatctctgcc tccacctcct 2160
gccgctccta gagagcctgc cattcactct gagggccagt gggtcacact gcctgccccc 2220
ctggatacca tcaacgtgca cctgagggcc ggctacatca taccactgca gggacctggc 2280
ctgaccacca ccgagtctag acagcagcca atggccctgg ccgtggccct gaccaaaggc 2340
ggagaagcta ggggcgagct gttctgggac gatggcgaga gcctggaagt gctggaaaga 2400
ggcgcctata cccaagtgat cttcctggcc cggaacaaca ccatcgtgaa cgagctggtg 2460
cgcgtgacct ctgaaggcgc tggactgcag ctgcagaaag tgaccgtgct gggagtggcc 2520
acagcccctc agcaggtgct gtctaatggc gtgcccgtgt ccaacttcac ctacagcccc 2580
gacaccaagg tgctggacat ctgcgtgtca ctgctgatgg gagagcagtt tctggtgtcc 2640
tggtgctga 2649
<210> 51
<211> 2649
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco2-дельта-43
<400> 51
catcctggta gaccaagagc tgtgcctacc caatgcgacg tgccacccaa ctcccgattc 60
gactgcgcgc cagataaggc tattacccaa gagcagtgtg aagccagagg ttgctgctac 120
atcccagcga agcaaggatt gcaaggcgcc caaatgggac aaccttggtg tttcttcccc 180
ccttcgtacc catcatataa actcgaaaac ctgtcctctt cggaaatggg ttatactgcc 240
accctcacca gaactactcc tactttcttc ccgaaagaca tcttgacctt gaggctggac 300
gtgatgatgg agactgaaaa ccggctgcat ttcactatca aagatcctgc caatcggcga 360
tacgaggtcc ctctggaaac ccctcacgtg cactcacggg ctccttctcc gctttactcc 420
gtcgaattct ctgaggaacc cttcggagtg atcgttagac gccagctgga tggtagagtg 480
ctgttgaaca ctactgtggc cccacttttc ttcgctgacc agtttctgca actgtccact 540
tccctgccat cccagtacat tactggactc gccgaacacc tgtcgccact gatgctctcg 600
acctcttgga ctagaatcac tttgtggaac agagacttgg cccctactcc gggagcaaat 660
ctgtacggaa gccacccttt ttacctggcg ctcgaagatg gcggatccgc tcacggagtg 720
ttcctgctga atagcaacgc aatggacgtg gtgctgcaac cttcccctgc actcagttgg 780
agaagtaccg ggggtattct ggacgtgtac atcttcctcg gaccagaacc caagagcgtg 840
gtgcagcaat atctggacgt ggtcggatac ccttttatgc ctccttactg gggactggga 900
ttccaccttt gccgttgggg ctactcatcc accgccatta ccagacaggt ggtggagaat 960
atgaccagag cccacttccc tctcgacgtg cagtggaacg atctggacta tatggactcc 1020
cggagagatt tcaccttcaa caaggacggg ttccgcgatt ttcccgcgat ggttcaagag 1080
ctccaccagg gtggtcgaag atatatgatg atcgtcgacc cagccatttc gagcagcgga 1140
cccgctggat cttatagacc ttacgacgaa ggccttagga gaggagtgtt catcacaaac 1200
gagactggac agcctttgat cggtaaagtg tggcctggat caaccgcctt tcctgacttt 1260
accaatccca ctgccttggc ttggtgggag gacatggtgg ccgaattcca cgaccaagtc 1320
ccctttgatg gaatgtggat cgatatgaac gaaccaagca attttatcag aggttccgaa 1380
gacggttgcc ccaacaacga actggaaaac cctccttatg tgcccggagt cgtgggcgga 1440
acattacagg ccgcgactat ttgcgccagc agccaccaat tcctgtccac tcactacaac 1500
ctccacaacc tttatggatt aaccgaagct attgcaagtc acagggctct ggtgaaggct 1560
agagggacta ggccctttgt gatctcccga tccacctttg ccggacacgg gagatacgcc 1620
ggtcactgga ctggtgacgt gtggagctca tgggaacaac tggcctcctc cgtgccggaa 1680
atcttacagt tcaaccttct gggtgtccct cttgtcggag cagacgtgtg tgggtttctt 1740
ggtaacacct ccgaggaact gtgtgtgcgc tggactcaac tgggtgcatt ctacccattc 1800
atgagaaacc acaactcctt gctgtccctg ccacaagagc cctactcgtt cagcgagcct 1860
gcacaacagg ctatgcggaa ggcactgacc ctgagatacg ccctgcttcc acacttatac 1920
actctcttcc atcaagcgca tgtggcagga gaaaccgttg caaggcctct tttccttgaa 1980
ttccccaagg attcctcgac ttggacggtg gatcatcagc tgctgtgggg agaagctctg 2040
ctgattactc cagtgttgca agccggaaaa gctgaggtga ccggatactt tccgctggga 2100
acctggtacg acctccagac tgtccctgtt gaagcccttg gatcactgcc tccgcctccg 2160
gcagctccac gcgaaccagc tatacattcc gagggacagt gggttacatt accagctcct 2220
ctggacacaa tcaacgtcca cttaagagct ggctacatta tccctctgca aggaccagga 2280
ctgactacga ccgagagcag acagcagcca atggcactgg ctgtggctct gaccaaggga 2340
ggggaagcta gaggagaact cttctgggat gatggggagt cccttgaagt gctggaaaga 2400
ggcgcttaca ctcaagtcat tttccttgca cggaacaaca ccattgtgaa cgaattggtg 2460
cgagtgacca gcgaaggagc tggacttcaa ctgcagaagg tcactgtgct cggagtggct 2520
accgctcctc agcaagtgct gtcgaatgga gtccccgtgt caaactttac ctactcccct 2580
gacactaagg tgctcgacat ttgcgtgtcc ctcctgatgg gagagcagtt ccttgtgtcc 2640
tggtgttga 2649
<210> 52
<211> 2637
<212> ДНК
<213> Искусственная
<220>
<223> hGAAwt-дельта-47
<400> 52
ccgcgagcag tgcccacaca gtgcgacgtc ccccccaaca gccgcttcga ttgcgcccct 60
gacaaggcca tcacccagga acagtgcgag gcccgcggct gttgctacat ccctgcaaag 120
caggggctgc agggagccca gatggggcag ccctggtgct tcttcccacc cagctacccc 180
agctacaagc tggagaacct gagctcctct gaaatgggct acacggccac cctgacccgt 240
accaccccca ccttcttccc caaggacatc ctgaccctgc ggctggacgt gatgatggag 300
actgagaacc gcctccactt cacgatcaaa gatccagcta acaggcgcta cgaggtgccc 360
ttggagaccc cgcatgtcca cagccgggca ccgtccccac tctacagcgt ggagttctcc 420
gaggagccct tcggggtgat cgtgcgccgg cagctggacg gccgcgtgct gctgaacacg 480
acggtggcgc ccctgttctt tgcggaccag ttccttcagc tgtccacctc gctgccctcg 540
cagtatatca caggcctcgc cgagcacctc agtcccctga tgctcagcac cagctggacc 600
aggatcaccc tgtggaaccg ggaccttgcg cccacgcccg gtgcgaacct ctacgggtct 660
caccctttct acctggcgct ggaggacggc gggtcggcac acggggtgtt cctgctaaac 720
agcaatgcca tggatgtggt cctgcagccg agccctgccc ttagctggag gtcgacaggt 780
gggatcctgg atgtctacat cttcctgggc ccagagccca agagcgtggt gcagcagtac 840
ctggacgttg tgggataccc gttcatgccg ccatactggg gcctgggctt ccacctgtgc 900
cgctggggct actcctccac cgctatcacc cgccaggtgg tggagaacat gaccagggcc 960
cacttccccc tggacgtcca gtggaacgac ctggactaca tggactcccg gagggacttc 1020
acgttcaaca aggatggctt ccgggacttc ccggccatgg tgcaggagct gcaccagggc 1080
ggccggcgct acatgatgat cgtggatcct gccatcagca gctcgggccc tgccgggagc 1140
tacaggccct acgacgaggg tctgcggagg ggggttttca tcaccaacga gaccggccag 1200
ccgctgattg ggaaggtatg gcccgggtcc actgccttcc ccgacttcac caaccccaca 1260
gccctggcct ggtgggagga catggtggct gagttccatg accaggtgcc cttcgacggc 1320
atgtggattg acatgaacga gccttccaac ttcatcaggg gctctgagga cggctgcccc 1380
aacaatgagc tggagaaccc accctacgtg cctggggtgg ttggggggac cctccaggcg 1440
gccaccatct gtgcctccag ccaccagttt ctctccacac actacaacct gcacaacctc 1500
tacggcctga ccgaagccat cgcctcccac agggcgctgg tgaaggctcg ggggacacgc 1560
ccatttgtga tctcccgctc gacctttgct ggccacggcc gatacgccgg ccactggacg 1620
ggggacgtgt ggagctcctg ggagcagctc gcctcctccg tgccagaaat cctgcagttt 1680
aacctgctgg gggtgcctct ggtcggggcc gacgtctgcg gcttcctggg caacacctca 1740
gaggagctgt gtgtgcgctg gacccagctg ggggccttct accccttcat gcggaaccac 1800
aacagcctgc tcagtctgcc ccaggagccg tacagcttca gcgagccggc ccagcaggcc 1860
atgaggaagg ccctcaccct gcgctacgca ctcctccccc acctctacac actgttccac 1920
caggcccacg tcgcggggga gaccgtggcc cggcccctct tcctggagtt ccccaaggac 1980
tctagcacct ggactgtgga ccaccagctc ctgtgggggg aggccctgct catcacccca 2040
gtgctccagg ccgggaaggc cgaagtgact ggctacttcc ccttgggcac atggtacgac 2100
ctgcagacgg tgccagtaga ggcccttggc agcctcccac ccccacctgc agctccccgt 2160
gagccagcca tccacagcga ggggcagtgg gtgacgctgc cggcccccct ggacaccatc 2220
aacgtccacc tccgggctgg gtacatcatc cccctgcagg gccctggcct cacaaccaca 2280
gagtcccgcc agcagcccat ggccctggct gtggccctga ccaagggtgg ggaggcccga 2340
ggggagctgt tctgggacga tggagagagc ctggaagtgc tggagcgagg ggcctacaca 2400
caggtcatct tcctggccag gaataacacg atcgtgaatg agctggtacg tgtgaccagt 2460
gagggagctg gcctgcagct gcagaaggtg actgtcctgg gcgtggccac ggcgccccag 2520
caggtcctct ccaacggtgt ccctgtctcc aacttcacct acagccccga caccaaggtc 2580
ctggacatct gtgtctcgct gttgatggga gagcagtttc tcgtcagctg gtgttag 2637
<210> 53
<211> 2637
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco1-дельта-47
<400> 53
cctagagctg tgcctaccca gtgtgacgtg ccccccaaca gcagattcga ctgcgcccct 60
gacaaggcca tcacccagga acagtgcgag gccagaggct gctgctacat ccctgccaag 120
cagggactgc agggcgctca gatgggacag ccctggtgct tcttcccacc ctcctacccc 180
agctacaagc tggaaaacct gagcagcagc gagatgggct acaccgccac cctgaccaga 240
accaccccca cattcttccc aaaggacatc ctgaccctgc ggctggacgt gatgatggaa 300
accgagaacc ggctgcactt caccatcaag gaccccgcca atcggagata cgaggtgccc 360
ctggaaaccc cccacgtgca ctctagagcc cccagccctc tgtacagcgt ggaattcagc 420
gaggaaccct tcggcgtgat cgtgcggaga cagctggatg gcagagtgct gctgaacacc 480
accgtggccc ctctgttctt cgccgaccag ttcctgcagc tgagcaccag cctgcccagc 540
cagtacatca caggactggc cgagcacctg agccccctga tgctgagcac atcctggacc 600
cggatcaccc tgtggaacag ggatctggcc cctacccctg gcgccaatct gtacggcagc 660
caccctttct acctggccct ggaagatggc ggatctgccc acggagtgtt tctgctgaac 720
tccaacgcca tggacgtggt gctgcagcct agccctgccc tgtcttggag aagcacaggc 780
ggcatcctgg atgtgtacat ctttctgggc cccgagccca agagcgtggt gcagcagtat 840
ctggatgtcg tgggctaccc cttcatgccc ccttactggg gcctgggatt ccacctgtgc 900
agatggggct actccagcac cgccatcacc agacaggtgg tggaaaacat gaccagagcc 960
cacttcccac tggatgtgca gtggaacgac ctggactaca tggacagcag acgggacttc 1020
accttcaaca aggacggctt ccgggacttc cccgccatgg tgcaggaact gcatcagggc 1080
ggcagacggt acatgatgat cgtggatccc gccatcagct cctctggccc tgccggctct 1140
tacagaccct acgacgaggg cctgcggaga ggcgtgttca tcaccaacga gacaggccag 1200
cccctgatcg gcaaagtgtg gcctggcagc acagccttcc ccgacttcac caatcctacc 1260
gccctggctt ggtgggagga catggtggcc gagttccacg accaggtgcc cttcgacggc 1320
atgtggatcg acatgaacga gcccagcaac ttcatccggg gcagcgagga tggctgcccc 1380
aacaacgaac tggaaaatcc cccttacgtg cccggcgtcg tgggcggaac actgcaggcc 1440
gctacaatct gtgccagcag ccaccagttt ctgagcaccc actacaacct gcacaacctg 1500
tacggcctga ccgaggccat tgccagccac cgcgctctcg tgaaagccag aggcacacgg 1560
cccttcgtga tcagcagaag cacctttgcc ggccacggca gatacgccgg acattggact 1620
ggcgacgtgt ggtcctcttg ggagcagctg gcctctagcg tgcccgagat cctgcagttc 1680
aatctgctgg gcgtgccact cgtgggcgcc gatgtgtgtg gcttcctggg caacacctcc 1740
gaggaactgt gtgtgcggtg gacacagctg ggcgccttct accctttcat gagaaaccac 1800
aacagcctgc tgagcctgcc ccaggaaccc tacagcttta gcgagcctgc acagcaggcc 1860
atgcggaagg ccctgacact gagatacgct ctgctgcccc acctgtacac cctgtttcac 1920
caggcccatg tggccggcga gacagtggcc agacctctgt ttctggaatt ccccaaggac 1980
agcagcacct ggaccgtgga ccatcagctg ctgtggggag aggctctgct gattacccca 2040
gtgctgcagg caggcaaggc cgaagtgacc ggctactttc ccctgggcac ttggtacgac 2100
ctgcagaccg tgcctgtgga agccctggga tctctgcctc cacctcctgc cgctcctaga 2160
gagcctgcca ttcactctga gggccagtgg gtcacactgc ctgcccccct ggataccatc 2220
aacgtgcacc tgagggccgg ctacatcata ccactgcagg gacctggcct gaccaccacc 2280
gagtctagac agcagccaat ggccctggcc gtggccctga ccaaaggcgg agaagctagg 2340
ggcgagctgt tctgggacga tggcgagagc ctggaagtgc tggaaagagg cgcctatacc 2400
caagtgatct tcctggcccg gaacaacacc atcgtgaacg agctggtgcg cgtgacctct 2460
gaaggcgctg gactgcagct gcagaaagtg accgtgctgg gagtggccac agcccctcag 2520
caggtgctgt ctaatggcgt gcccgtgtcc aacttcacct acagccccga caccaaggtg 2580
ctggacatct gcgtgtcact gctgatggga gagcagtttc tggtgtcctg gtgctga 2637
<210> 54
<211> 2637
<212> ДНК
<213> Искусственная
<220>
<223> hGAAco2-дельта-47
<400> 54
ccaagagctg tgcctaccca atgcgacgtg ccacccaact cccgattcga ctgcgcgcca 60
gataaggcta ttacccaaga gcagtgtgaa gccagaggtt gctgctacat cccagcgaag 120
caaggattgc aaggcgccca aatgggacaa ccttggtgtt tcttcccccc ttcgtaccca 180
tcatataaac tcgaaaacct gtcctcttcg gaaatgggtt atactgccac cctcaccaga 240
actactccta ctttcttccc gaaagacatc ttgaccttga ggctggacgt gatgatggag 300
actgaaaacc ggctgcattt cactatcaaa gatcctgcca atcggcgata cgaggtccct 360
ctggaaaccc ctcacgtgca ctcacgggct ccttctccgc tttactccgt cgaattctct 420
gaggaaccct tcggagtgat cgttagacgc cagctggatg gtagagtgct gttgaacact 480
actgtggccc cacttttctt cgctgaccag tttctgcaac tgtccacttc cctgccatcc 540
cagtacatta ctggactcgc cgaacacctg tcgccactga tgctctcgac ctcttggact 600
agaatcactt tgtggaacag agacttggcc cctactccgg gagcaaatct gtacggaagc 660
cacccttttt acctggcgct cgaagatggc ggatccgctc acggagtgtt cctgctgaat 720
agcaacgcaa tggacgtggt gctgcaacct tcccctgcac tcagttggag aagtaccggg 780
ggtattctgg acgtgtacat cttcctcgga ccagaaccca agagcgtggt gcagcaatat 840
ctggacgtgg tcggataccc ttttatgcct ccttactggg gactgggatt ccacctttgc 900
cgttggggct actcatccac cgccattacc agacaggtgg tggagaatat gaccagagcc 960
cacttccctc tcgacgtgca gtggaacgat ctggactata tggactcccg gagagatttc 1020
accttcaaca aggacgggtt ccgcgatttt cccgcgatgg ttcaagagct ccaccagggt 1080
ggtcgaagat atatgatgat cgtcgaccca gccatttcga gcagcggacc cgctggatct 1140
tatagacctt acgacgaagg ccttaggaga ggagtgttca tcacaaacga gactggacag 1200
cctttgatcg gtaaagtgtg gcctggatca accgcctttc ctgactttac caatcccact 1260
gccttggctt ggtgggagga catggtggcc gaattccacg accaagtccc ctttgatgga 1320
atgtggatcg atatgaacga accaagcaat tttatcagag gttccgaaga cggttgcccc 1380
aacaacgaac tggaaaaccc tccttatgtg cccggagtcg tgggcggaac attacaggcc 1440
gcgactattt gcgccagcag ccaccaattc ctgtccactc actacaacct ccacaacctt 1500
tatggattaa ccgaagctat tgcaagtcac agggctctgg tgaaggctag agggactagg 1560
ccctttgtga tctcccgatc cacctttgcc ggacacggga gatacgccgg tcactggact 1620
ggtgacgtgt ggagctcatg ggaacaactg gcctcctccg tgccggaaat cttacagttc 1680
aaccttctgg gtgtccctct tgtcggagca gacgtgtgtg ggtttcttgg taacacctcc 1740
gaggaactgt gtgtgcgctg gactcaactg ggtgcattct acccattcat gagaaaccac 1800
aactccttgc tgtccctgcc acaagagccc tactcgttca gcgagcctgc acaacaggct 1860
atgcggaagg cactgaccct gagatacgcc ctgcttccac acttatacac tctcttccat 1920
caagcgcatg tggcaggaga aaccgttgca aggcctcttt tccttgaatt ccccaaggat 1980
tcctcgactt ggacggtgga tcatcagctg ctgtggggag aagctctgct gattactcca 2040
gtgttgcaag ccggaaaagc tgaggtgacc ggatactttc cgctgggaac ctggtacgac 2100
ctccagactg tccctgttga agcccttgga tcactgcctc cgcctccggc agctccacgc 2160
gaaccagcta tacattccga gggacagtgg gttacattac cagctcctct ggacacaatc 2220
aacgtccact taagagctgg ctacattatc cctctgcaag gaccaggact gactacgacc 2280
gagagcagac agcagccaat ggcactggct gtggctctga ccaagggagg ggaagctaga 2340
ggagaactct tctgggatga tggggagtcc cttgaagtgc tggaaagagg cgcttacact 2400
caagtcattt tccttgcacg gaacaacacc attgtgaacg aattggtgcg agtgaccagc 2460
gaaggagctg gacttcaact gcagaaggtc actgtgctcg gagtggctac cgctcctcag 2520
caagtgctgt cgaatggagt ccccgtgtca aactttacct actcccctga cactaaggtg 2580
ctcgacattt gcgtgtccct cctgatggga gagcagttcc ttgtgtcctg gtgttga 2637
<---
название | год | авторы | номер документа |
---|---|---|---|
ВАРИАНТЫ КИСЛОЙ АЛЬФА-ГЛЮКОЗИДАЗЫ И ИХ ИСПОЛЬЗОВАНИЕ | 2017 |
|
RU2780410C2 |
КОМПОЗИЦИИ И СПОСОБЫ ДЛЯ ИНТЕРНАЛИЗАЦИИ ФЕРМЕНТОВ | 2018 |
|
RU2806021C2 |
СПОСОБ ПОЛУЧЕНИЯ ХИМИЧЕСКИХ ПРОДУКТОВ ТОНКОГО СИНТЕЗА С ПОМОЩЬЮ CORYNEBACTERIUM, СЕКРЕТИРУЮЩЕЙ МОДИФИЦИРОВАННЫЕ α-1,6-ГЛЮКОЗИДАЗЫ | 2018 |
|
RU2763317C2 |
ПОЛИПЕПТИДНЫЕ КОНСТРУКЦИИ ЛИЗИН-ПРОТИВОМИКРОБНЫЙ ПЕПТИД (AMP), ЛИЗИНЫ, ВЫДЕЛЕННЫЕ ПОЛИНУКЛЕОТИДЫ, КОДИРУЮЩИЕ ИХ, А ТАКЖЕ ВАРИАНТЫ ИХ ПРИМЕНЕНИЯ | 2019 |
|
RU2803121C2 |
ФАРМАЦЕВТИЧЕСКАЯ КОМПОЗИЦИЯ ДЛЯ ЛЕЧЕНИЯ И/ИЛИ ПРОФИЛАКТИКИ ЗЛОКАЧЕСТВЕННОЙ ОПУХОЛИ | 2019 |
|
RU2781542C2 |
МАТЕРИАЛЫ И МЕТОДЫ, ИСПОЛЬЗУЕМЫЕ ДЛЯ ЛЕЧЕНИЯ РЕСПИРАТОРНЫХ ЗАБОЛЕВАНИЙ У СОБАК | 2020 |
|
RU2811752C2 |
ФАРМАЦЕВТИЧЕСКАЯ КОМПОЗИЦИЯ ДЛЯ ЛЕЧЕНИЯ И/ИЛИ ПРЕДУПРЕЖДЕНИЯ ЗЛОКАЧЕСТВЕННОЙ ОПУХОЛИ | 2017 |
|
RU2766586C2 |
ИММУНОИНДУЦИРУЮЩЕЕ СРЕДСТВО | 2016 |
|
RU2744843C2 |
ВИРУС ГРИППА, СПОСОБНЫЙ ИНФИЦИРОВАТЬ СОБАЧЬИХ, И ЕГО ПРИМЕНЕНИЕ | 2020 |
|
RU2802222C2 |
СПОСОБ УВЕЛИЧЕНИЯ ФОТОСИНТЕТИЧЕСКОЙ ФИКСАЦИИ УГЛЕРОДА С ИСПОЛЬЗОВАНИЕМ БЕЛКА СЛИЯНИЯ ИЗ МНОГИХ СУБЪЕДИНИЦ ГЛИКОЛАТДЕГИДРОГЕНАЗЫ | 2011 |
|
RU2651501C2 |
Настоящее изобретение относится к области биотехнологии, конкретно к вариантам кислой α-глюкозидазы (GAA), и может быть использовано в медицине для лечения болезни Помпе (GSDII) и болезни Кори (GSDIII). Химерный полипептид GAA содержит фрагмент сигнального пептида с SEQ ID NO: 2, 3 или 4 и функциональный фрагмент GAA человека с по меньшей мере 90% идентичностью последовательности SEQ ID NO:5 или 36. Изобретение обеспечивает экспрессию и секрецию вариантов GAA человека на более высоких уровнях по сравнению с белком GAA человека дикого типа, что обеспечивает усовершенствованную коррекцию патологического накопления гликогена по всему организму и индукцию иммунологической толерантности к GAA. 5 н. и 4 з.п. ф-лы, 4 табл., 11 ил., 1 пр.
1. Химерный полипептид кислой альфа-глюкозидазы (GAA), имеющий активность GAA, который содержит фрагмент сигнального пептида, имеющий аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 2-4, и функциональный фрагмент GAA человека, где функциональный фрагмент GAA человека является по меньшей мере на 90%, 95%, 96%, 97%, 98% или 99% идентичным последовательности SEQ ID NO:5 или SEQ ID NO:36.
2. Химерный полипептид GAA по п. 1, где указанный фрагмент сигнального пептида имеет аминокислотную последовательность, приведенную в SEQ ID NO: 2.
3. Химерный полипептид GAA по п. 1 или 2, в которой указанный функциональный фрагмент GAA человека имеет последовательности SEQ ID NO: 5 или SEQ ID NO: 36.
4. Химерный полипептид GAA по п. 3, в которой указанный функциональный фрагмент GAA человека имеет последовательность SEQ ID NO: 5.
5. Химерный полипептид GAA по любому из пп. 1-3, который содержит аминокислотную последовательность, являющуюся результатом комбинации следующих последовательностей:
SEQ ID NO: 3
SEQ ID NO: 4
SEQ ID NO:3
SEQ ID NO:4
6. Фармацевтическая композиция для лечения GSDII (болезни Помпе), содержащая фармацевтически приемлемый носитель и эффективное количество химерного полипептида GAA по любому из пп. 1-5.
7. Фармацевтическая композиция для лечения GSDIII (болезни Кори), содержащая фармацевтически приемлемый носитель и эффективное количество химерного полипептида GAA по любому из пп. 1-5.
8. Применение химерного полипептида GAA по любому из пп. 1-5 для изготовления лекарственного средства для лечения GSDII (болезни Помпе).
9. Применение химерного полипептида GAA по любому из пп. 1-5 для изготовления лекарственного средства для лечения GSDIII (болезни Кори).
WO 2005078077 A2, 25.08.2005, EP 2471929 А1, 04.07.2012, WO 2014130723 A1, 28.08.2014, US9018001 B2, 28.04.2015, SUN B | |||
Пломбировальные щипцы | 1923 |
|
SU2006A1 |
Авторы
Даты
2022-09-21—Публикация
2017-09-12—Подача