Область техники, к которой относится изобретение
Настоящая заявка относится к области генетики, генной терапии и молекулярной биологии. Более конкретно, настоящее изобретение относится к кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом), экспрессионной кассете и вектору на ее основе, клетке-хозяину для получения FVIII-BDD, а также к различным применениям вышеуказанного вектора.
Уровень техники
Гемофилия - это рецессивное, Х-сцепленное, врожденное нарушение, ведущее к дефициту одного из белков, участвующих во вторичном гемостазе. Гемофилия А, или классическая гемофилия, - наиболее распространенная форма гемофилии; встречается у 1 из 5000 новорожденных мальчиков (Report on the annual global survey 2019, WFH https://www.wfh.org/en/our-work-research-data/annual-global-survey) и обусловлена дефицитом белка фактора свертывания VIII. Согласно данным Всероссийского общества гемофилии, в России насчитывается более 6,5 тыс.пациентов с гемофилией A (Report on the annual global survey 2019, WFH).
Фактор свертывания VIII (FVIII) - это белок размером 280 кДа, который секретируется в кровь преимущественно из синусоидальных эпителиальных клеток печени (Fahs SA, Hille МТ, Shi Q, Weiler Н, Montgomery RR. A conditional knockout mouse model reveals endothelial cells as the principal and possibly exclusive source of plasma factor VIII/ Blood. 2014 Jun 12;123(24):3706-13. doi: 10.1182/blood-2014-02-555151. Epub 2014 Apr 4. РМЮ: 24705491 и Everett LA, Cleuren AC, Khoriaty RN, Ginsburg D. Murine coagulation factor VIII is synthesized in endothelial cells/ Blood. 2014 Jun 12;123(24):3697-705. doi: 10.1182/blood-2014-02-554501. Epub 2014 Apr 9. PMTD: 24719406). Активированный FVIII циркулирует в организме в виде гетеродимера, состоящего из тяжелой (домены A1, А2, В) и легкой (домены A3, C1, С3) цепей, связанных друг с другом за счет нековалентных металл-зависимых взаимодействий. В результате процессинга FVIII в активированной форме белка присутствуют только домены А1-А3, C1, С2. Этот факт способствовал созданию рекомбинантного FVIII с удаленным В доменом (FVIII-BDD), который не уступает по своей активности полноразмерному FVIII (Pittman DD, Alderman EM, Tomkinson KN, Wang JH, Giles AR, Kaufman RJ. Biochemical, immunological, and in vivo functional characterization of B-domain-deleted factor VIII/ Blood. 1993 Jun l;81(ll):2925-35. PMID: 8499631). В отличии от других белков каскада свертывания крови, которые преимущественно относятся к протеазам, FVIII -гликопротеин. Однако он играет критичную роль в формировании теназного комплекса, который необходим для образования активированного фактора свертывания X (FXa), первого члена окончательного общего пути коагуляции, что в итоге приводит к образованию сшитого фибрина.
Более чем в половине случаев к тяжелой форме гемофилии А приводят инверсии в 1 или 22 интроне гена FVIII (Habart D, Kalabova D, Novotny M, Vorlova Z. Thirty-four novel mutations detected in factor VIII gene by multiplex CSGE: modeling of 13 novel amino acid substitutions/ J Thromb Haemost. 2003 Apr; 1(4):773-81. doi: 10.1046/j.1538-7836.2003.00149.x. PMID: 1287141/ В других случаях нарушения в последовательности FVIII связаны с различными мутациями, в том числе антисмысловыми мутациями, сдвигами рамки считывания, мутациями в сплайсинг-сайтах, делециями и инсерциями.
Склонность к кровотечениям при гемофилии А взаимосвязана с определяемой активностью FVIII и классифицируется как легкая (0,05-0,40 ME / мл), умеренная (0,01-0,05 ME / мл) или тяжелая (<0,01 ME / мл). Пациенты с легкой формой гемофилии, как правило, испытывают аномальное кровотечение только в связи с оперативным вмешательством или полученными травмами. Напротив, у пациентов с умеренной формой гемофилии наблюдаются длительные реакции кровотечения на относительно незначительные травмы, а у пациентов с тяжелой формой заболевания часто возникают спонтанные кровотечения. Тяжелая форма гемофилии А проявляется спонтанными гемартрозом, гематомами мягких тканей, забрюшинными кровотечениями, внутримозговыми кровоизлияниями и отсроченными послеоперационными кровотечениями. Со временем осложнения от рецидивирующего гемартроза и гематом мягких тканей включают тяжелую артропатию, контрактуры суставов и псевдоопухоли, приводящие к хроническим заболеваниям. Доля пациентов с легкой, средней и тяжелой формами гемофилии А точно не установлена, но, согласно последним эпидемиологическим исследованиям, предполагается, что примерно 60% пациентов с гемофилией А имеют тяжелую форму (Report on the annual global survey 2019, WFH).
На сегодняшний день стандартная схема лечения пациентов, страдающих гемофилией А, заключается в пожизненной заместительной терапии в виде инъекций рекомбинантного FVIII (Report on the annual global survey 2019, WFH). Несмотря на успех терапии гемофилии, существуют серьезные проблемы подобного подхода. Профилактическая заместительная терапия гемофилии А предполагает внутривенные инъекции рекомбинантного FVIII каждые три дня в течение всей жизни пациента с тяжелой формой заболевания. Подобный формат лечения является очень дорогостоящим и не гарантирует отсутствия осложнений, связанных в первую очередь с гемартрозом. В некоторых случаях у пациентов вырабатываются ингибирующие антитела. Ингибиторные формы гемофилии А чаще наблюдаются у пациентов с тяжелой формой заболевания и требуют применения альтернативных подходов к лечению и профилактике заболевания (Eckhardt CL, van der Bom JG, van der Naald M, Peters M, Kamphuisen PW, Fijnvandraat K. Surgery and inhibitor development in hemophilia A: a systematic review/ J Thromb Haemost. 2011 Oct; 9(10): 1948-58. doi: 10.1ll1/j. 1538-7836.2011.04467.x. PMID: 21838755).
Генная терапия гемофилии А посредством вирусных (экспрессионных) векторов на основе аденоассоциированных вирусов (AAV), кодирующих ген FVIII, показала впечатляющие результаты в серии доклинических и клинических исследований (Bunting S, Zhang L, Xie L, Bullens S, Mahimkar R, Fong S, Sandza K, Harmon D, Yates B, Handyside B, Sihn CR, Galicia N, Tsuruda L, O'Neill CA, Bagri A, Colosi P, Long S, Vehar G, Carter B. Gene Therapy with BMN 270 Results in Therapeutic Levels of FVIII in Mice and Primates and Normalization of Bleeding in Hemophilic Mice/ Mol Ther. 2018 Feb 7;26(2):496-509. doi: 10.1016/j.ymthe. 2017.12.009. Epub 2017 Dec 14.PMID: 29292164 и Peyvandi F, Garagiola I. Clinical advances in gene therapy updates on clinical trials of gene therapy in haemophilia/ Haemophilia. 2019 Sep;25(5):738-746. doi: 10.1111/hae. 13816. Epub 2019 Jul 8.PMTD: 31282050). В отличие от традиционных подходов к лечению гемофилии, генная терапия с использованием AAV позволяет поддерживать уровень экспрессии привнесенного FVIII на достаточном уровне в течение нескольких лет после однократного введения препарата пациентам (Long BR, Veron Р, Kuranda К, Hardet R, Mitchell N, Hayes GM, Wong WY, Lau K, Li M, Hock MB, Zoog SJ, Vettermann C, Mingozzi F, Schweighardt B. Early Phase Clinical Immunogenicity of Valoctocogene Roxaparvovec, an AAV5-Mediated Gene Therapy for Hemophilia А/ Mol Ther. 2021 Feb 3;29(2): 597-610. doi: 10.1016/j.ymthe.2020.12.008. Epub 2020 Dec 10. PMID: 33309883).
На данный момент, в мире нет ни одного зарегистрированного генотерапевтического препарата для лечения гемофилии А.
Таким образом, является актуальным разработка генотерапевтического препарата для лечения гемофилии А, а также решений, которые позволят улучшить эффективность генотерапевтического препарата для лечения гемофилии А.
Раскрытие сущности изобретения
Одной из насущных целей исследований в области разработки эффективной генотерапии является кодон-оптимизация генов интереса в составе векторов для получения максимального уровня продукции белка интереса, что, в свою очередь, позволит использовать для достижения значимого эффекта более низкие дозы вектора.
Авторы изобретения неожиданно обнаружили, что кодон-оптимизиро ванная нуклеиновая кислота, которая кодирует белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) с аминокислотной последовательностью SEQ ID NO: 11 и включает нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 2 (вариант FVIII-BDDco-v1), SEQ ID NO: 3 (вариант FVIII-BDDco-v2), SEQ ID NO: 4 (вариант FVIII-BDDco-v3) или SEQ ID NO: 5 (вариант FVIII-BDDco-v4), неожиданно приводит к увеличению уровня экспрессии гена FVIII-BDD, увеличению уровня продукции белка фактора свертывания крови VIII-BDD, а также увеличению уровня активности белка фактора свертывания крови VIII-BDD в несколько раз по сравнению с геном дикого типа, кодирующим фактор свертывания крови VIII-BDD (FVIII-BDD-wt). Данные варианты кодон-оптимизированной нуклеиновой кислоты по изобретению с нуклеотидной последовательностью, которую выбирают из группы: SEQ ID NO: 2 (вариант FVIII-BDDco-v1), SEQ ID NO: 3 (вариант FVIII-BDDco-v2), SEQ ID NO: 4 (вариант FVIII-BDDco-v3) или SEQ ID NO: 5 (вариант FVIII-BDDco-v4) входят в состав экспрессионной кассеты и вектора на ее основе.
Определения и общие методы
Если иное не определено в настоящем документе, научные и технические термины, используемые в связи с настоящим изобретением, будут иметь значения, которые обычно понятны специалистам в данной области.
Кроме того, если по контексту не требуется иное, термины в единственном числе включают в себя термины во множественном числе, и термины во множественном числе включают в себя термины в единственном числе. Как правило, используемая классификация и методы культивирования клеток, молекулярной биологии, иммунологии, микробиологии, генетики, аналитической химии, химии органического синтеза, медицинской и фармацевтической химии, а также гибридизации и химии белка и нуклеиновых кислот, описанные в настоящем документе, хорошо известны специалистам и широко применяются в данной области. Ферментативные реакции и способы очистки осуществляют в соответствии с инструкциями производителя, как это обычно осуществляется в данной области, или как описано в настоящем документе.
Определения «встречающийся в природе», «нативный» или «дикого типа» используют для описания объекта, который можно обнаружить в природе как отличающийся от получаемого искусственно. Например, белок или нуклеотидная последовательность, присутствующие в организме, в том числе в составе вируса, которые можно изолировать из источника в природе, и которые не модифицированы умышленно специалистом в лаборатории, являются встречающимися в природе.
В настоящем описании и в последующей формуле изобретения, если контекстом не предусмотрено иное, слова «включать» и «содержать» или их вариации, такие как «включает», «включающий», «содержит» или «содержащий», следует понимать как включение указанного целого или группы целых, но не исключение любого другого целого или группы целых.
Белок (Пептид)
В настоящем описании термины «пептид», «полипептид» и «белок» используют взаимозаменяемо, и они относятся к соединению, состоящему из аминокислотных остатков, ковалентно связанных пептидными связями. Полипептиды включают природные пептиды, рекомбинантные пептиды, синтетические пептиды или их комбинацию.
Молекулы нуклеиновых кислот
Термины «нуклеиновая кислота», «нуклеиновая последовательность» или «нуклеиновокислотная последовательность», «полинуклеотид», «олигонуклеотид», «полинуклеотидная последовательность» и «нуклеотидная последовательность», которые используются равнозначно в данном описании, обозначают четкую последовательность нуклеотидов, модифицированных или не модифицированных, определяющую фрагмент или участок нуклеиновой кислоты, содержащую или не содержащую неприродные нуклеотиды и являющуюся либо двухцепочечной ДНК или РНК, либо одно цепочечной ДНК или РНК, либо продуктами транскрипции указанных ДНК.
Как применяют в настоящем описании, полинуклеотиды включают, в качестве неограничивающих примеров, все последовательности нуклеиновой кислоты, получаемые любыми способами, доступными в этой области, включая, в качестве неограничивающих примеров, рекомбинантные способы, т.е. клонирование последовательностей нуклеиновой кислоты из рекомбинантной библиотеки или генома клетки, использование обычной технологии клонирования и ПЦР и т.п., и способами синтеза.
Здесь также следует упомянуть, что данное изобретение не относится к нуклеотидным последовательностям в их природной хромосомной среде, т.е. в природном состоянии. Последовательности данного изобретения были выделены и/или очищены, т.е. были взяты прямо или косвенно, например, путем копирования, при этом их среда была по меньшей мере частично модифицирована. Таким образом, также здесь следует подразумевать изолированные нуклеиновые кислоты, полученные путем генетической рекомбинации, например, с помощью принимающих клеток (клеток-хозяев), или полученные путем химического синтеза.
Термин нуклеотидная последовательность охватывает его комплемент, если не указано иное. Таким образом, нуклеиновую кислоту, имеющую определенную последовательность следует понимать как охватывающие ее комплементарную цепь с ее комплементарной последовательностью.
Вектор
Термин «вектор» при использовании в настоящем документе означает молекулу нуклеиновой кислоты, способную транспортировать другую нуклеиновую кислоту, с которой она соединена. Кроме того, термин «вектор» в данном настоящем документе означает рекомбинантную вирусную частицу, способную транспортировать нуклеиновую кислоту.
Как применяют в настоящем описании, термин «экспрессия» определяют как транскрипцию и/или трансляцию конкретной нуклеотидной последовательности, запускаемую ее промотором.
Применение
«Генная терапия» представляет собой вставку генов в клетки и/или ткани субъекта для лечения заболевания, обычно, наследственных заболеваний, при этом дефектный мутантный аллель заменяется или дополняется функциональным аллелем.
«Лечить», «лечение» и «терапия» относятся к методу смягчения или устранения биологического расстройства и/или по меньшей мере одного из сопутствующих ему симптомов.
Термин «субъект», «пациент», «индивидуум» и т.п. используют в настоящем описании взаимозаменяемо, и они относятся к любому животному, которое поддается воздействию способами, представленными в настоящем описании. В конкретных неограничивающих вариантах осуществления субъект, пациент или индивидуум является человеком. Вышеупомянутый субъект может быть мужского или женского пола любого возраста.
«Терапевтически эффективным количеством» или «эффективным количеством» считается количество вводимого терапевтического агента, которое избавит в определенной степени от одного или нескольких симптомов заболевания, по поводу которого проводится лечение.
Подробное описание изобретения
Нуклеиновая кислота
В одном из аспектов настоящее изобретение относится к выделенной кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) с аминокислотной последовательностью SEQ ID NO: 11 и включает нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 или SEQ ID NO: 5.
«Выделенная» молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, которая идентифицирована и отделена от по меньшей мере одной молекулы нуклеиновой кислоты-примеси. Выделенная молекула нуклеиновой кислоты отличается от той формы или набора, в которых она находится в естественных условиях. Таким образом, выделенная молекула нуклеиновой кислоты отличается от молекулы нуклеиновой кислоты, существующей в клетках в естественных условиях.
Одним из свойств генетического кода является вырожденность - способность разных кодонов (тринуклеотидов) кодировать одну и ту же аминокислоту. Такие кодоны, которые дают одну и ту же аминокислоту в процессе трансляции, называются синонимичными. В природных последовательностях выбор одного из синонимичных кодонов осуществляется случайным образом в процессе эволюции, однако частоты использования синонимичных кодонов отличаются: для каждой аминокислоты есть более и менее предпочтительные. Кодон-оптимизация - это широко используемая в мире техника, направленная на повышение продуктивности наработки белковых молекул, которая заключается в рациональном сопоставлении каждой аминокислоте в белковой последовательности одного из подходящих синонимичных кодонов. Один из распространенных принципов кодон-оптимизации подразумевает использование наиболее частых кодонов, впоследствии были предложены и другие подходы, такие как гармонизация (воспроизведение распределения частот используемых кодонов), но и они не всегда дают увеличение продуктивности. Помимо частот кодонов на эффективность наработки может влиять GC-состав последовательности (отношение количества гуанинов и цитозинов к суммарной длине последовательности), в частности, было показано, что завышенный GC-состав ассоциирован с повышением количества мРНК в клетках млекопитающих Grzegorz Kudla ЕТ AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, June 2006, Volume 4, Issue 6, el80, pp. 933-942). Также стоит отметить, что устойчивые элементы вторичной структуры мРНК, т.е. имеющие низкую свободную энергию фолдинга, могут снижать эффективность.
Различные варианты кодон-оптимизации последовательности гена интереса могут приводить к следующему (в сравнение с геном дикого типа):
а) уровень экспрессии генов интереса будет незначительно увеличен;
б) уровень экспрессии генов интереса будет значительно увеличен;
в) уровень экспрессии генов интереса останется приблизительно на том же уровне;
г) уровень экспрессии генов интереса будет понижен.
Для получения вышеуказанной кодон-оптимизированной нуклеиновой кислоты по изобретению была проведена кодон-оптимизации нуклеиновой кислоты дикого типа с нуклеотидной последовательностью SEQ ID NO: 1.
В результате кодон-оптимизации нуклеиновой кислоты дикого типа, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 1 был получен ряд кодон-оптимизированных нуклеиновых кислот, которые были в дальнейшем протестированы на уровень продукции белка по сравнению с контролем FVIII-BDD-wt (нуклеиновая кислота дикого типа с SEQ ID N0:1).
Все кодон-оптимизированные нуклеиновые кислоты приводили к увеличению уровня продукции белка FVIII-BDD по сравнению с нуклеиновой кислотой дикого типа, при этом ряд кодон-оптимизированных нуклеиновых кислот приводил к незначительному увеличению уровня продукции белка FVIII-BDD по сравнению с нуклеиновой кислотой дикого типа. В свою очередь, кодон-оптимизированная нуклеиновая кислота по изобретению, которую выбирают из группы: SEQ ID NO: 2 (вариант FVIII-BDDco-v1), SEQ ID NO: 3 (вариант FVIII-BDDco-v2), SEQ ID NO: 4 (вариант FVIII-BDDco-v3) или SEQ ID NO: 5 (вариант FVIII-BDDco-v4), неожиданно приводит к увеличению уровня экспрессии гена FVIII-BDD, увеличению уровня продукции белка фактора свертывания крови VIII-BDD, а также увеличению уровня активности белка фактора свертывания крови VIII-BDD в несколько раз по сравнению с геном дикого типа (FVIII-BDD-wt).
Экспрессионная кассета. Экспрессионный вектор.
В одном из аспектов настоящее изобретение относится к экспрессионной кассете, которая включает любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD.
Термин «кассета, которая экспрессирует» или «экспрессионная кассета» при использовании в данном документе, в частности, относится к фрагменту ДНК, который способен в соответствующей обстановке запускать экспрессию полинуклеотида, кодирующего представляющий интерес полипептид, последовательность которого включена в указанную экспрессионную кассету. При введении в клетку-хозяина экспрессионная кассета помимо прочего способна задействовать клеточные механизмы для транскрипции полинуклеотида, кодирующего представляющий интерес полипептид, в РНК, которая затем обычно дополнительно процессируется и, наконец, транслируется в представляющий интерес полипептид. Экспрессионная кассета может содержаться в экспрессионном векторе.
Экспрессионная кассета по настоящему изобретению содержит в качестве элемента промотор. Термин «промотор», используемый в настоящем документе, в частности, относится к элементу ДНК, который способствует транскрипции полинуклеотида, с которым функционально связан промотор. Промотор может также составлять часть элемента «промотор/энхансер». Хотя физические границы между элементами «промотор» и «энхансер» не всегда ясны, термин «промотор» обычно относится к месту на молекуле нуклеиновой кислоты, с которым связывается РНК-полимераза и/или связанные с ней факторы, и с которого инициируется транскрипция. Энхансеры усиливают активность промотора во времени, а также пространственно. В данной области известно множество промоторов, которые транскрипционно активны в широком диапазоне типов клеток. Промоторы могут быть разделены на два класса: на тех, которые функционируют конститутивно, и тех, которые регулируются индукцией или снятием репрессии. Для экспрессии белка пригодны оба класса. Промоторы, которые используются для продукции высокого уровня полипептидов в эукариотических клетках и, в частности, в клетках млекопитающих, должны быть сильными и, предпочтительно, должны быть активными в широком диапазоне типов клеток. Сильные конститутивные промоторы, которые способны запускать экспрессию во многих типах клеток, хорошо известны в данной области и, поэтому, нет необходимости в их подробном описании в данном документе.
Согласно одному варианту осуществления изобретения промотор HLP используется в экспрессионной кассете по настоящему изобретению.
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:
левый (первый) ITR (инвертированные концевые повторы);
промотор;
нуклеиновую кислоту, кодирующую сигнальный пептид;
любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD;
сигнал полиаденилирования;
правый (второй) ITR.
Вышеуказанные структурные элементы экспрессионной кассеты являются функционально связанными между собой.
В контексте настоящего описания термин «функционально связанный» относится к связи полинуклеотидных (или полипептидных) элементов в функциональную связь. Нуклеиновая кислота является «функционально связанной», если она находится в условиях функциональной связи с другой последовательностью нуклеиновой кислоты. Например, регуляторная последовательность транскрипции функционально связана с кодирующей последовательностью, если она влияет на транскрипцию указанной кодирующей последовательности. Термин «функционально связанный» означает, что связанные последовательности ДНК являются, как правило, непрерывными, и при необходимости соединения двух участков, кодирующих белок, являются также непрерывными и находятся в рамке считывания.
В некоторых вариантах экспрессионная кассета включает левый (первый) ITR с нуклеотидной последовательностью SEQ ID NO: 13.
В некоторых вариантах экспрессионная кассета включает промотор HLP с нуклеотидной последовательностью SEQ ID NO: 14.
В некоторых вариантах экспрессионная кассета включает сигнал полиаденилирования с нуклеотидной последовательностью SEQ ID NO: 15.
В некоторых вариантах экспрессионная кассета включает правый (второй) ITR с нуклеотидной последовательностью SEQ ID NO: 16.
В некоторых вариантах нуклеиновая кислоту, кодирующая сигнальный пептид, имеет нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20 или SEQ ID NO: 21.
В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v1), имеет нуклеотидную последовательность SEQ ID NO: 7.
В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v2), имеет нуклеотидную последовательность SEQ ID NO: 8.
В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v3), имеет нуклеотидную последовательность SEQ ID NO: 9.
В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v4), имеет нуклеотидную последовательность SEQ ID NO: 10.
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:
левый (первый) ITR (инвертированные концевые повторы) с нуклеотидной последовательностью SEQ ID NO: 13;
промотор с нуклеотидной последовательностью SEQ ID NO: 14;
нуклеиновую кислоту, кодирующую сигнальный пептид, который имеет нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20 или SEQ ID NO: 21;
любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD;
сигнал полиаденилирования с нуклеотидной последовательностью SEQ ID NO: 15;
правый (второй) ITR с нуклеотидной последовательностью SEQ ID NO: 16.
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:
левый (первый) ITR (инвертированные концевые повторы) с нуклеотидной последовательностью SEQ ID NO: 13;
промотор с нуклеотидной последовательностью SEQ ID NO: 14;
кодон-оптимизированную нуклеиновую кислоту, кодирующую белок FVIII-BDD с сигнальным пептидом, которая имеет нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9 или SEQ ID NO: 10;
сигнал полиаденилирования с нуклеотидной последовательностью SEQ ID NO: 15;
правый (второй) ITR с нуклеотидной последовательностью SEQ ID NO: 16.
В одном из аспектов настоящее изобретение относится к экспрессионному вектору, который включает любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD, или любую из вышеуказанных экспрессионных кассет.
В некоторых вариантах осуществления изобретения вектор представляет собой плазмиду, т.е. кольцевую двухцепочечную часть ДНК, в которую могут быть вставлены дополнительные сегменты ДНК.
В некоторых вариантах осуществления изобретения вектор представляет собой вирусный (экспрессионный) вектор, в котором дополнительные сегменты ДНК могут быть вставлены в вирусный геном.
В некоторых вариантах осуществления изобретения векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, имеющие бактериальный сайт инициации репликации и эписомные векторы). В других вариантах осуществления изобретения векторы (например, неэписомальные векторы) могут быть интегрированы в геном клетки-хозяина при введении в клетку-хозяина, и таким образом реплицируются вместе с геном хозяина. Более того, некоторые векторы способны направлять экспрессию генов, с которыми они функционально соединены. Такие векторы упоминаются в данном документе как «рекомбинантные экспрессирующие векторы» (или просто «экспрессирующие векторы» («вектор экспрессии» или «экспрессионный вектор»)).
Экспрессионные векторы включают плазмиды, ретро вирусы, аденовирусы, аденоассоциированные вирусы (AAV), вирусы растений, такие как вирус мозаики цветной капусты, вирусы табачной мозаики, космиды, YAC, EBV и тому подобное. Молекулы ДНК могут быть вставлены в вектор таким образом, что последовательности, контролирующие транскрипцию и трансляцию в векторе, выполняют предусмотренную функцию регуляции транскрипции и трансляции ДНК. Экспрессионный вектор и последовательности контроля экспрессии могут быть выбраны таким образом, чтобы быть совместимыми с используемой экспрессирующей клеткой-хозяином. Молекулы ДНК могут быть введены в экспрессионный вектор стандартными способами (например, лигированием комплементарных сайтов рестрикции или лигированием тупых концов, если сайты рестрикции отсутствуют).
В некоторых вариантах экспрессионный вектор представляет собой рекомбинантный аденоассоциированный вирус (AAV).
В некоторых вариантах AAV выбирают из группы, включающей следующие серо типы AAV:
В некоторых вариантах осуществления изобретения вектор или кассета может включать последовательность контроля экспрессии. Термин «последовательность контроля экспрессии», используемый в данном описании, означает полинуклеотидные последовательности, которые необходимы для воздействия на экспрессию и процессинг кодирующих последовательностей, к которым они вставлены. Специалистам в этой области будет понятно, что дизайн экспрессионного вектора или кассеты, включая выбор последовательностей контроля экспрессии, может зависеть от таких факторов, как выбор типа клетки-хозяина для трансформации, требуемый уровень экспрессии белка, и т.д. Последовательности контроля экспрессии включают соответствующие последовательности инициации транскрипции, терминации, промотора и энхансера; эффективные сигналы процессинга РНК, такие как сплайсинг и сигналы полиаденилирования; последовательности, которые стабилизируют цитоплазматическую мРНК; последовательности, которые повышают эффективность трансляции (т.е. консенсусная последовательность Козака); последовательности, которые повышают стабильность белка; и, при желании, последовательности, которые усиливают секрецию белка. Характер таких контролирующих последовательностей различается в зависимости от организма-хозяина; в прокариотах такие контролирующие последовательности, как правило, включают промотор, сайт связывания рибосомы, а также последовательности терминации транскрипции; в эукариотах, как правило, такие контролирующие последовательности включают промоторы и последовательности терминации транскрипции. Предпочтительные последовательности контроля экспрессии для экспрессирующей клетки-хозяина млекопитающего включают вирусные элементы обеспечивающие высокий уровень экспрессии белков в клетках млекопитающих, таких как промоторы и/или энхансеры, полученные из ретровирусной LTR, цитомегаловируса (CMV) (например, CMV промотора/энхансера), обезьяньего вируса 40 (SV40) (например, SV40 промотора/энхансера), аденовируса, (например, большого позднего промотора аденовируса (AdMLP)), вирус полиомы, а также сильных промоторов млекопитающих, таких как TTR промотор, промотор нативных иммуноглобулинов, промотор актина, а также промотор HLP (hybrid liver-specific promotor). Последовательности контроля экспрессии включают, как минимум, все компоненты, наличие которых имеет важное значение для экспрессии и процессинга.
В дополнение к вышеуказанным генам и последовательностям контроля экспрессии, рекомбинантные векторы экспрессии изобретения могут нести дополнительные последовательности, такие как последовательности, которые регулируют репликацию вектора в клетках-хозяевах (например, точки начала репликации) и гены селектируемого маркера. Ген селектируемого маркера облегчает селекцию клеток-хозяев, в которые был введен вектор или кассету.
В одном из вариантов настоящего изобретения экспрессионный вектор относится к вектору, содержащему одну или несколько интересующих полинуклеотидных последовательностей, интересующих генов или трансгенов, которые фланкированы парвовирусными или инвертированными концевыми повторяющимися последовательностями (ITR).
Ни кассета, ни вектор по изобретению не содержит нуклеотидные последовательности генов, кодирующих неструктурные белки (Rep) и структурные белки (Сар) аденоассоциированного вируса.
Клетка-хозяин
В одном из аспектов настоящее изобретение относится к клетке-хозяину для получения белка FVIII-BDD или для получения любого из вышеуказанных экспрессионных векторов, которая содержит любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD.
Термин «клетка-хозяин» при использовании в данном документе означает клетку, в которую введен рекомбинантный экспрессионный вектор или кассету по изобретению. Настоящее изобретение относится к клеткам-хозяевам, которые могут включать, например, вектор в соответствии с настоящим изобретением, описанным выше. Следует понимать, что «клетка-хозяин» означает не только конкретную заявленную клетку, но также и потомство такой клетки. Поскольку модификации могут проходить в последующих поколениях вследствие мутации или воздействий окружающей среды, такое потомство не может, на самом деле, быть идентичным родительской клетке, но такие клетки по-прежнему включены в объем термина «клетка-хозяин» при использовании в настоящем документе.
Экспрессионные векторы или кассеты по изобретению могут быть использованы для трансфекции клетки млекопитающего, клетки растения, бактериальной или дрожжевой клетки-хозяина. Трансфекция может происходить любым известным способом для введения полинуклеотидов в клетку хозяина. Способы введения гетерологичных полинуклеотидов в клетки млекопитающих хорошо известны в данной области и включают декстран опосредованную трансфекцию, трансфекцию комплексом нуклеиновой кислоты и позитивно заряженного полимера, трансфекцию преципитатом нуклеиновой кислоты и фосфата кальция, полибрен опосредованную трансфекцию, слияние протопластов, трансфекцию инкапсулированными в липосомы полинуклеотидами и прямую микроинъекцию ДНК в ядра. В дополнение молекулы нуклеиновых кислот могут быть введены в клетки млекопитающих вирусными (экспрессионными) векторами.
Клеточные линии млекопитающих, используемые в качестве хозяев для трансформации, хорошо известны в данной области и включают множество иммортализованных доступных клеточных линий. К ним относятся, например, клетки яичников китайского хомячка (СНО), NS0 клетки, клетки SP2, НЕК-293Т клетки, 293 Фристайл клетки (Invitrogen), NIH-3T3 клетки, клетки HeLa, клетки почек хомячка (ВНК), клетки почек африканских зеленых мартышек (COS), клетки гепатоцеллюлярной карциномы человека (например, Hep G2), А549 клетки, SK-HEP1, HUH7, Нер-RG и ряд других клеточных линий. Клеточные линии выбираются путем определения, какие клеточные линии имеют высокие уровни экспрессии и обеспечивают необходимые характеристики продуцируемого белка. Другими клеточными линиями, которые могут быть использованы, являются клеточные линии насекомых, такие как Sf9 или Sf21 клетки. Когда векторы рекомбинантной экспрессии по изобретению вводятся в клетки-хозяева млекопитающих белок FVIII-BDD продуцируется путем культивирования клеток-хозяев в течение времени, достаточного для экспрессии слитого белка в клетках-хозяевах или, предпочтительнее, выделения слитого белка в питательную среду, в которой выращиваются клетки-хозяева. Слитый белок может быть выделен из питательной среды с использованием стандартных методов очистки белка. Клетки-хозяева растений, например, включают Nicotiana, Arabidopsis, ряску, кукурузу, пшеницу, картофель и т.д. Клетки бактерий хозяина включают виды Escherichia и Streptomyces. Дрожжевые клетки-хозяева включают Schizosaccharomyces pombe, Saccharomyces cerevisiae и Pichia pastoris.
Вышеуказанная клетка-хозяин не относится к клетке-хозяину, полученной с использованием человеческих эмбрионов.
Вышеуказанная клетка-хозяин не относится к клетке-хозяину, полученной с модификации генетической целостности клеток зародышевой линии человека.
Фармацевтическая композиция
В одном из аспектов настоящее изобретение относится к фармацевтической композиции для доставки гена FVIII-BDD в целевые клетки, который включает любой из вышеуказанных экспрессионных векторов или кассет.
В некоторых вариантах фармацевтическая композиция для доставки гена FVIII-BDD в целевые клетки включает любой из вышеуказанных экспрессионных векторов или кассет в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.
Действующее вещество в вышеуказанной композиции находится в эффективном количестве, например, в биологически эффективном количестве.
«Фармацевтическая композиция» обозначает композицию, включающую в себя любой из вышеуказанных экспрессионных векторов по изобретению и, по крайней мере, один из компонентов, выбранных из группы, состоящей из фармацевтически приемлемых и фармакологически совместимых эксипиентов, наполнителей, растворителей, разбавителей, носителей, вспомогательных средств, распределяющих средств или средств доставки.
Фармацевтические композиции по настоящему изобретению и способы их изготовления будут бесспорно очевидными для специалистов в этой области. Производство фармацевтических композиций предпочтительно должно соответствовать требованиям GMP (надлежащей производственной практики).
В некоторых вариантах осуществления фармацевтической композиции она может включать буферную композицию, тонические агенты (осмолитик или осмотический агент), стабилизаторы и/или солюбилизаторы.
«Фармацевтически приемлемым» считается материал, который не имеет биологических или других противопоказаний, например, материал можно вводить субъекту без каких-либо нежелательных биологических эффектов. Таким образом, такие фармацевтические композиции можно использовать, например, для трансфекции клетки ex vivo или для введения in vivo любого из вышеуказанных экспрессионных векторов по изобретению непосредственно субъекту.
Термин «эксципиент» или «вспомогательное вещество» используется в данном документе для описания любого компонента, отличающегося от ранее описанных по данному изобретению. Это вещества неорганического или органического происхождения, используемые в процессе производства, изготовления лекарственных препаратов для придания им необходимых физико-химических свойств.
Фармацевтическая композиция по изобретению является стабильной.
Фармацевтическая композиция является «стабильной», если активный агент сохраняет свою физическую стабильность и/или химическую стабильность и/или биологическую активность в течение заявленного срока годности при температуре хранения, например, при 2-8°С. Предпочтительно, чтобы активный агент сохранял и физическую, и химическую стабильность, а также биологическую активность. Период хранения выбирается на основании результатов исследования стабильности при ускоренном и естественном хранении.
В некоторых вариантах фармацевтическая композиция представляет собой раствор для внутривенного введения.
В некоторых вариантах фармацевтическая композиция представляет собой концентрат для приготовления раствора для внутривенного введения.
Применение
В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных экспрессионных кассет или векторов или вышеуказанной композиции для доставки гена FVIII-BDD в целевые клетки.
В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных экспрессионных кассет или векторов или вышеуказанной композиции для обеспечения белком FVIII-BDD субъекта, который имеет гемофилию А и/или не имеет функциональных копий гена FVIII.
Под отсутствием функциональных копий гена FVIII подразумеваются инактивирующие мутации или делеции во всех копиях гена FVIII в геноме, которые приводят к потере или дефекту функции гена FVIII.
В одном из аспектов настоящее изобретение относится к способу обеспечения белком FVIII-BDD субъекта с гемофилией А, который включает введение терапевтически эффективного количества любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции в клетки субъекта, нуждающегося в этом.
В одном из аспектов настоящее изобретение относится к способу доставки гена FVIII-BDD в целевые клетки субъекта с гемофилией А, который включает введение любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции в клетки субъекта.
Под субъектом, нуждающимся в доставке гена FVIII-BDD в целевые клетки, или субъектом, нуждающимся в обеспечении белком FVIII-BDD, подразумевается субъект, который имеет гемофилию А, или субъект, который имеет дефицит фактора свертывания крови FVIII, или субъект, который имеет инактивирующие мутации или делеции в гене FVIII, которые приводят к потере или дефекту функции гена FVIII.
В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции для лечения гемофилии А у субъекта, который имеет гемофилию А.
В одном из аспектов настоящее изобретение относится к способу лечения гемофилии А у субъекта, который включает ведение терапевтически эффективного количества любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции субъекту, который имеет гемофилию А.
В некоторых вариантах гемофилия А представляет собой тяжелую форму гемофилии А (активность фактора VIII <1%) или среднетяжелую форму гемофилии А (активность фактора VIII 1-5%).
Примеры способов введения включают в себя местное применение, интраназальное, ингаляционное, чрезслизистое, трансдермальное, энтеральное (например, пероральное, ректальное), парентеральное (например, внутривенное, подкожное, внутрикожное, внутримышечное) введения, а также инъекции непосредственно в ткань или в орган.
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов или вышеуказанная композиция вводится субъекту как внутривенная инфузия.
Любой из вышеуказанных экспрессионных векторов вводят в организм в эффективном количестве. Любой из вышеуказанных экспрессионных векторов предпочтительно вводят в организм в биологически эффективном количестве. «Биологически эффективное» количество экспрессио иного вектора представляет собой количество, которое достаточно, чтобы вызвать трансдукцию клеток и экспрессию последовательности нуклеиновой кислоты в клетке. Если экспрессионный вектор вводят в клетку in vivo, «биологически эффективное» количество экспрессио иного вектора представляет собой количество, которое достаточно, чтобы вызвать трансдукцию клеток-мишеней и экспрессию последовательности нуклеиновой кислоты в клетке-мишени.
Дозировки любого из вышеуказанных экспрессионных векторов по данному изобретению будут зависеть от способа введения конкретного вектора, и их можно определять рутинными способами.
Клетка для введения любого из вышеуказанных экспрессионных кассет или векторов по данному изобретению может быть клеткой любого типа, включая в себя без ограничения, эпителиальные клетки (например, эпителиальные клетки кожи, дыхательных путей и кишечника), печеночные клетки, мышечные клетки, клетки селезенки, фибробласты, эндотелиальные клетки и тому подобное.
Любой из вышеуказанных экспрессионных кассет или векторов по данному изобретению не используется для модификации генетической целостности клеток зародышевой линии человека.
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в формате монотерапии.
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в комбинации с заместительной терапией концентратами факторов свертывания, десмопрессином и/или ингибиторами фибринолиза.
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в комбинации с моноклональным антителом (например, эмицизумаб).
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в комбинации с препаратами на базе технологии РНК-интерференции (например, фитусиран).
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе вводят субъекту однократно.
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе вводят субъекту многократно.
Краткое описание чертежей
Фигура 1 представляет собой схему плазмиды pAAV-hFVIII-BDD, которая содержит последовательность гена фактора свертывания крови VIII (FVIII) человека, выбранную из SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5. Так же последовательность плазмиды содержит следующие элементы:
AmpR - ген бета-лактамазы, обеспечивающий устойчивость к ампициллину;
pUC origin- pUC ориджин репликации в бактериях;
ITR инвертированные терминальные повторы;
HLP promoter - искусственный тканеспецифичный промотор;
sPA искусственная последовательность сигнала полиаденилирования, для повышения стабильности мРНК.
Фигура 2 представляет собой график, который показывает увеличение уровня продукции белка FVIII-BDD в культуральную жидкость после трансфекции кодон-оптимизированными нуклеиновыми кислотами, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с нуклеиновой кислотой, кодирующей белок FVIII-BDD, дикого типа.
Уровень белка FVIII-BDD после трансфекции клеток:
1 - нуклеиновой кислотой дикого типа, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 1.
2 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.
3 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 3.
4 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 4.
5 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.
Фигура 3. представляет собой график, который показывает увеличение уровня активности белка FVIII-BDD в культуральной жидкости после трансфекции кодон-оптимизированными нуклеиновыми кислотами, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с нуклеиновой кислотой, кодирующей белок FVIII-BDD, дикого типа.
Уровень активности FVIII-BDD после трансфекции клеток:
1 - нуклеиновой кислотой дикого типа, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 1.
2 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.
3 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 3.
4 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 4.
5 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.
Фигура 4 представляет собой график, который показывает увеличение уровня продукции белка FVIII-BDD при доставке in vitro нуклеиновых кислот в виде экспрессионного вектора на основе AAV, содержащего кодон-оптимизированную нуклеиновую кислоту, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с экспрессионный вектором на основе AAV, содержащим нуклеиновую кислоту дикого типа, кодирующую белок FVIII-BDD.
Уровень белка FVIII-BDD после трансдукции клеток:
1 - контрольным раствор без AAV (негативный контроль).
2 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.
3 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.
4 - экспрессионными векторами на основе AAV серотипа 5, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.
Фигура 5 представляет собой график, который показывает увеличение уровня активности белка FVIII-BDD при доставке in vitro нуклеиновых кислот в виде экспрессионного вектора на основе AAV, содержащего кодон-оптимизированную нуклеиновую кислоту, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с экспрессионный вектором на основе AAV, содержащим нуклеиновую кислоту дикого типа, кодирующую белок FVIII-BDD.
Уровень активности FVIII-BDD после трансдукции клеток:
1 - контрольным раствор без AAV (негативный контроль).
2 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.
3 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.
4 - экспрессионными векторами на основе AAV серотипа 5, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.
Фигура 6 представляет собой график, который показывает увеличение уровня белка FVIII-BDD при доставке кодон-оптимизированной нуклеиновой кислоты, кодирующей белок FVIII-BDD, in vivo мышам линии В6.129S-F8tmlSmoc (HemA) в виде экспрессионного вектора на основе AAV.
Уровень белка FVIII-BDD в плазме крови животных после инъекции:
1 - контрольного раствора без AAV (негативный контроль).
2 - экспрессионного вектора на основе AAV серотипа 5, содержащего кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.
3 - экспрессионного вектора на основе AAV серотипа 6, содержащего кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.
Примеры
Для наилучшего понимания изобретения приводятся следующие примеры. Эти примеры приведены только в иллюстративных целях и не должны толковаться как ограничивающие сферу применения изобретения в любой форме.
Все публикации, патенты и патентные заявки, указанные в этой спецификации включены в данный документ путем отсылки. Хотя вышеупомянутое изобретение было довольно подробно описано путем иллюстрации и примера в целях исключения двусмысленного толкования, специалистам в данной области на основе идей, раскрытых в данном изобретении, будет вполне понятно, что могут быть внесены определенные изменения и модификации без отклонения от сущности и объема прилагаемых вариантов осуществления изобретения.
Материалы и общие методы
Методы рекомбинантной ДНК
Для манипуляций с ДНК использовали стандартные методы, описанные у Sambrook J. и др., Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989. Реагенты для молекулярной биологии использовали согласно инструкциям производителей. Вкратце, плазмидную ДНК нарабатывали для дальнейших манипуляций в клетках Е. coli, выращиваемых под селективным давлением с антибиотиками для того, чтобы плазмиды не терялись в клеточной популяции. Плазмидную ДНК выделяли из клеток коммерческими наборами, измеряли концентрацию и использовали для клонирования с помощью обработки эндонуклеазами рестрикции или методами ПЦР-амплификации. Фрагменты ДНК лигировали между собой с помощью лигаз и трансформировали в бактериальные клетки для отбора клонов и дальнейших наработок. Все полученные генетические конструкции подтверждали по паттернам рестрикции и полным секвенированием по Сэнгеру.
Синтез генов
Требуемые сегменты генов получали из олигонуклеотидов, созданных путем химического синтеза. Генные фрагменты длиной от 300 до 1000 п. н., которые фланкированы уникальными сайтами рестрикции, собирали путем ренатурации олигонуклеотидов друг на друге с последующей ГЩР-амплификацией с крайних праймеров. В результате получали смесь фрагментов, включая нужный. Фрагменты клонировали по сайтам рестрикции в промежуточные векторы, после чего последовательности ДНК субклонированных фрагментов подтверждали путем секвенирования ДНК.
Определение последовательностей ДНК
Последовательности ДНК определяли путем секвенирования по Сэнгеру. Анализ последовательностей ДНК и белков и обработку данных о последовательностях осуществляли в программе SnapGene 4.2 и выше для создания, картирования, анализа, аннотирования и иллюстрации последовательностей.
Культивирование клеточных культур
В экспериментах были использованы клеточные линии НЕК293 (Human Embryonic Kidney clone 293), SK-HEP1 (human adenocarcinoma endothelial cell line) и HUH7 (human hepatocellular carcinoma cell lines). Суспензионные клетки HEK293, используемые для наработки AAV, культивировались в стандартных условиях при 37°С и 5% CO2 на полной питательной среде без FBS и антибиотика. Адгезионные клетки SK-HEP1, используемые для проверки эффективности препаратов AAV, культивировались в стандартных условиях при 37°С и 5% СО2, на полной питательной среде ЕМЕМ с добавлением 10% FBS, антибиотика/антимикотика. Адгезионные клетки HUH7, используемые для проверки эффективности препаратов AAV, культивировались в стандартных условиях при 37°С и 5% СО2, на полной питательной среде DMEM с добавлением 10% FBS, антибиотика/антимикотика. Пересев клеток осуществлялся при достижении 80-90% конфлюентности. Для диссоциации клеточного монослоя использовался TrypLE Select enzyme (10х). Жизнеспособность клеток оценивалась с помощью окраски Trypan Blue и одноразовых камер для подсчета клеток с помощью автоматического счетчика Countess II.
Трансфекция клеточных культур
Для оценки функциональности новых кодон-оптимизированных нуклеиновых кислот, которые кодируют белок FVIII-BDD, при трансфекции использовались плазмиды, содержащие экспрессио иную кассету для экспрессии различных вариантов трансгенов hFVIII-BDD. Клетки линии SK-HEP1 заранее засевали в лунки 12-луночных планшетов с плотностью 10000 кл/см2. Через сутки вносились плазмиды в одинаковой копийности в составе комплекса с Lipofectamine 3000. На 7 день после трансфекции определяли содержание белка FVIII-BDD и его активность в культуральной жидкости методом ИФА и хромогенного теста. Работы по оценке уровня и активности белка FVIII-BDD в культуральной жидкости проводились в 6 независимых экспериментах. Для негативного контроля были использованы интактные клетки линии SK-HEP1.
Сборка и очистка экспрессионных векторов на основе AAV
Для сборки экспрессионных векторов на основе AAV, содержащих варианты гена FVIII-BDD, использовали клетки-продуценты НЕК293, которые трансфецировали 3-мя плазмидами:
1) плазмиды, содержащие экспрессионную кассету AAV для экспрессии различных вариантов трансгенов hFVIII-BDD (Фиг. 1.);
2) плазмида для экспрессии гена Сар серотипа AAV6 или AAV5 и гена Rep серотипа AAV2. Каждый ген с помощью альтернативных рамок считывания кодирует несколько белковых продуктов;
3) плазмида для экспрессии генов аденовируса Ad5, необходимых для сборки и упаковки капсидов AAV.
Через 72 часа клетки лизировали и проводили очистку и концентрирование векторов с помощью методов фильтрации, хроматографии и ультрацентифугирования. Титр вирусных векторов определяли с помощью количественной 1ТЦР с праймерами и пробой, специфичными к участку рекомбинантного вирусного генома, и выражали в виде количества копий вирусных геномов на 1 мл.
Трансдукция клеточных культур
Клеточную линию HUH7 заранее засевали в лунки 12-луночных планшетов с плотностью 10000 кл/см2. После прикрепления клеток к адгезивной подложке, вносились препараты AAV при MOI 500000 вг/кл. На 7 день после трансдукции определяли содержание белка FVIII-BDD и его активность в культуральной жидкости методом ИФА и хромогенным тестом. Работы по оценке уровня и активности белка FVilli в культуральной жидкости проводились в 6 независимых экспериментах. Для негативного контроля были использованы интактные клетки.
Определение количества белка фактора свертывания крови VIII-BDD методом ИФА
Оценка содержания белка фактора свертывания крови VIII-BDD в культуральной жидкости после трансфекции клеток целевыми кандидатами проводилась «сэндвич»-методом неконкурентного твердофазного иммуноферментного анализа (ИФА). Вкратце, разведенные в буфере для разведений образцы культуральной жидкости, вносились в лунки 96-луночного планшета, сенсибилизированные первичными специфическими к фактору свертывания крови VIII-BDD антителами. В этот же планшет вносились стандарты для построения калибровочной кривой, контроли. Планшет инкубировался 1 час при температуре 37°С. Производили отмывку лунок планшета отмывочным буфером перед внесением биотинилированных антител, раствора конъюгата стрептавидин-пероксидазы и ТМВ. Вносился раствор со специфическими биотинилированными детектирующими антителами к фактору VIII-BDD и планшет инкубировался 30 минут при температуре 37°С. Далее к образовавшемуся комплексу добавлялся раствор конъюгата стрептавидин-пероксидазы и планшет инкубировался 30 минут при температуре 37°С. Для визуализации ферментативной реакции вносился раствор ТМВ. По достижении нужной степени интенсивности окрашивания во все лунки добавляется стоп-раствор для остановки реакции. Далее измерялась оптическая плотность растворов в лунках планшета. Концентрация фактора свертывания крови VIII-BDD в исследуемых образцах определялась по калибровочной кривой с учетом предварительного разведения образцов.
Определение уровня активности белка фактора свертывания крови VIII-BDD методом ИФА
Оценка активности белка фактора свертывания крови VIII в культуральной жидкости после трансфекции клеток линии целевыми кандидатами проводилась при помощи хромогенного теста. Суть теста заключается в том, что в присутствии ионов кальция, фосфолипидов и фактора IXa фактор X переходит в активированную форму Ха, фактор VIII действует как кофактор в этой реакции, и скорость активации фактора X линейно связана с количество фактора VIII. Вкратце, разведенные в буфере для разведений образцы культуральной жидкости, стандарты для построения калибровочной кривой и контроли вносились в лунки 96-луночного планшета. Планшет инкубировался 3 минуты при температуре 37°С. Во все лунки планшета вносили раствор Factor reagent, содержащий фактор ГХа, фактор X, тромбин, CaCl2 и фосфолипиды. Планшет инкубировался 4 минуты при температуре 37°С. Во все лунки планшета вносили раствор хромогенного субстрата S-2765+I-2581. Планшет инкубировался 7 минут при температуре 37°С. По достижению нужной степени интенсивности окрашивания во все лунки добавляли 20% раствор уксусной кислоты для остановки реакции. Далее измерялась оптическая плотность растворов в лунках планшета. Активность фактора свертывания крови VIII в исследуемых образцах определялась по калибровочной кривой с учетом предварительного разведения образцов.
Проведение in vivo исследования на лабораторных животных
Для экспериментов были использованы мыши линии C57BL/6 (самцы возрастом 6-8 недель). Препараты вводили животным однократно путем внутривенного введения в хвостовую вену. Группе животных отрицательного контроля вводился буферный раствор, не содержащий AAV.
Отбор плазмы крови производился в день инъекции до введения препаратов, далее - на 35 и 56 дни после введения экспрессионных векторов. Статистический анализ данных
Результаты представлены в виде среднего значения±стандартное отклонение (SD), для сравнения результатов эксперимента использовали однофакторный дисперсионный анализ с поправкой на множественные попарные сравнения по методу Даннета (One-way ANOVA), и они были определены как статистически значимые.
Пример 1: Модификация последовательности гена hFVIII-BDD с помощью разработанного алгоритма кодон-оптимизации
Разработанные генетические конструкции представляют собой нуклеотидные последовательности, кодирующие экспрессионную кассету с геном человеческого фактора свертывания крови VIII с делетированным В доменом (FVIII-BDD).
Конечная экспрессионная кассета содержит все необходимые элементы как для экспрессии гена, так и сборки в составе генома рекомбинантного AAV (Фигура 1):
1) терминальные повторы ITR на концах последовательности, которая инкапсидируется в экспрессионный вектор;
2) элементы для экспрессии целевого гена (промотор, трансген, сайт полиаденилирования);
3) ориджин бактериальной репликации и ген устойчивости к антибиотику для наработки плазмидной ДНК в бактериальных клетках.
В качестве нуклеиновой кислоты дикого типа использовалась нуклеиновая кислота, которая кодирует белок человеческого фактора свертывания крови VIII с делетированным В доменом, и включает нуклеотидную последовательность SEQ ID NO: 1. Данная нуклеиновая кислота используется в составе экспрессионной кассеты в качестве контроля.
Дополнительно с целью повышения эффективности экспрессии природная нуклеотидная последовательность гена фактора свертывания крови VIII с делетированным В доменом была модифицирована с помощью алгоритма кодон-оптимизации.
В результате кодон-оптимизации нуклеиновой кислоты, соответствующей последовательности SEQ ID NO: 1, был получен ряд кодон-оптимизированных нуклеиновых кислот SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5, которые были в дальнейшем протестированы на уровень экспрессии белка фактора свертывания крови VIII-BDD и его активности по сравнению с контролем (нуклеиновая кислота SEQ ID NO: 1) в составе экспрессионной кассеты (Фигура 1).
Пример 2. Проверка работоспособности кодон-оптимизированных вариантов последовательности гена FVIII с делетированным В доменом in vitro
Полученные нами кодон-оптимизированные нуклеиновые кислоты, выбранные из SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5, кодирующие белок FVIII-BDD, были проверены при трансфекции клеток линии SK-HEP1 in vitro в составе экспрессионной кассеты, состоящей из левого (первого) ITR (инвертированные концевые повторы), тканеспецифичного промотора, трансгена, сигнала полиаденилирования, правого (второго) ITR, где трансгеном является одна из последовательностей SEQ ID NO: 2-5. В качестве контроля трансген представлял собой нуклеиновую кислоту без оптимизации, которая кодирует белок человеческого FVIII с делетированным В доменом, соответствующая последовательности SEQ ID NO:l.
Использование всех нуклеиновых кислот, выбранных из SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5, кодирующих белок FVIII-BDD, привели к увеличению уровня продукции (Фигура 2) и активности (Фигура 3) белка FVIII-BDD по сравнению с использованием нуклеиновой кислоты SEQ ID NO: 1 без оптимизации.
Кроме того, полученные нами кодон-оптимизированные нуклеиновые кислоты, кодирующие белок фактора свертывания крови VIII с делетированным В доменом (SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5), способны приводить к увеличению экспрессии белка FVIII-BDD in vitro в клетке-хозяине по сравнению с использованием нуклеиновой кислоты SEQ ID NO:l без оптимизации. Таким образом, кодон-оптимизированные нуклеиновые кислоты по изобретению обладают высоким потенциалом для получения рекомбинантного белка FVIII-BDD для терапии Гемофилии А.
Пример 3. Создание и проверка работоспособности экспрессионных векторов, несущих кодон-оптимизированные варианты последовательности гена FVIII-BDD in vitro
Для того чтобы показать эффективность доставки разработанных кодон-оптимизированных нуклеиновых кислот при помощи экспрессионного вектора in vitro, плазмиды, кодирующие целевые генетические конструкции вместе с остальными необходимыми плазмидами были использованы для наработки экспрессионных векторов на основе аденоассоциированного вируса серотипа 5, несущего нуклеотидную последовательность SEQ ID NO:2 (далее упоминается как AAV5-FVIII-BDDco-vl), и на основе аденоассоциированного вируса серотипа 6, несущего нуклеотидную последовательность SEQ ID N0:2 (далее упоминается как AAV6-FVIII-BDDco-vl) или нуклеотидную последовательность SEQ ID NO:5 (далее упоминается как AAV6-FVIII-BDDco-v4). Очищенные препараты AAV5-FVIII-BDDco-vl, AAV6-FVIII-BDDco-vl и AAV6-FVIII-BDDco-v4, используемые для проведения in vitro и in vivo исследований, были подготовлены с применением стандартных буферов и эксципиентов, которые являются безопасными и не изменяют свойств AAV.
Препараты AAV5-FVIII-BDDco-vl, AAV6-FVIII-BDDco-vl и AAV6-FVIII-BDDco-v4 были протестированы in vitro с использованием адгезионной клеточной линии HUH7 (Фиг. 4 и 5). В лунки 12-луночных планшетов были посеяны клетки линии с плотностью 10 ООО кл/см2. После прикрепления клеток к адгезивной подложке, вносились препараты AAV при MOI 500000 вг/кл. На 7 день после трансдукции определяли содержание белка FVIII-BDD и его активность в культуральной жидкости методом ИФА. Все образцы были поставлены в трипликатах. Для негативного контроля были использованы интактные клетки.
Было показано, что разработанные нами экспрессионные векторы AAV5-FVIII-BDDco-v1, AAV6-FVIII-BDDco-v1 и AAV6-FVIII-BDDco-v4, несущие кодон-оптимизированные версии гена фактора свертывания крови VIII-BDD, позволяют эффективно доставить трансген фактора свертывания крови VIII-BDD в клетки HUH7 и обеспечить продукцию целевого белка, что подтверждается при анализе культуральной жидкости методом ИФА (Фигура 4) и анализом активности (Фигура 5) белка фактора свертывания крови VIII-BDD. Доставка SEQ ID N0:2 при помощи экспрессионного вектора на основе AAV серотипа 5 приводит к продукции белка FVIII-BDD в культуральной жидкости на уровне 129 нг/мл и активности 97%. Доставка SEQ ID NO:2 при помощи экспрессионного вектора на основе AAV серотипа 6 приводит к продукции белка FVIII-BDD в культуральной жидкости на уровне 104 нг/мл и активности 91%. Доставка SEQ ID NO:5 при помощи экспрессионного вектора на основе AAV серотипа 6 приводит к продукции белка FVIII-BDD в культуральной жидкости на уровне 61 нг/мл и активности 68%.
Пример 4. Проверка работоспособности препаратов AAV5-FVIII-BDDco-vl и AAV6-FVIII-BDDco-v1 in vivo
Для того чтобы показать эффективность доставки разработанных кодон-оптимизированных нуклеиновых кислот при доставке в составе экспрессионного вектора in vivo, выбранные препараты AAV5-FVIII-BDDco-v1 и AAV6-FVIII-BDDco-v1 были введены лабораторным мышам линии C57BL/6. В исследовании использовали дозу AAV препаратов равную 6х1013 вг/мышь. В качестве негативного контроля был использованы контрольный раствор без AAV. Препараты вводили животным однократно путем внутривенного гидродинамического введения в хвостовую вену. Отбор плазмы крови производился в день инъекции до введения препаратов (0 день), далее на 35 и 56 дни после введения препаратов. В образцах плазмы крови определяли уровень белка фактора свертывания крови VIII-BDD методом ИФА, как было описано выше.
В результате проведенных in vivo исследований было показано, что в случае использования обоих препаратов AAV5-FVIII-BDDco-vl и AAV6-FVIII-BDDco-vl, содержащих кодон-оптимизированную последовательность гена фактора свертывания крови VIII-BDD SEQ ID NO:2, наблюдается достоверное увеличение количества фактора VIII-BDD в плазме крови животных на 35 и на 56 дни (Фигура 6). В случае использования препарата AAV5-FVIII-BDDco-vl, содержащего кодон-оптимизированную последовательность гена фактора свертывания крови VIII-BDD SEQ ID NO:2 в плазме крови животных на 35 и 56 дни после инъекции наблюдалась экспрессия FVIII-BDD на уровне 304 и 279 нг/мл, соответственно. В случае использования препарата AAV6-FVIII-BDDco-v1, содержащего кодон-оптимизированную последовательность гена фактора свертывания крови VIII-BDD SEQ ID N0:2 в плазме крови животных на 35 и 56 дни после инъекции наблюдалась экспрессия FVIII-BDD на уровне 415 и 459 нг/мл, соответственно.
Таким образом, разработанные экспрессионные вектора на основе AAV5 и AAV6, несущие кодон-оптимизированные версии гена фактора свертывания крови VIII с делетированным В доменом (AAV5-FVIII-BDDco-vl и AAV6-FVIII-BDDco-vl) способны приводить к экспрессии белка FVIII-BDD in vivo и обладают высоким потенциалом для генной терапии Гемофилии А.
--->
Перечень последовательностей
<110> АО "БИОКАД"
<120> Кодон-оптимизированная нуклеиновая кислота, которая кодирует
белок фактора свёртывания крови VIII c делетированным B доменом, и ее
применение
<160> 22
<170> BiSSAP 1.3.6
<210> 1
<211> 4314
<212> DNA
<213> Искусственная последовательность
<220>
<223> нуклеиновая кислота, кодирующая белок FVIII-BDD (фактор
свёртывания крови VIII c делетированным B доменом) (дикого
типа)
<400> 1
gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat
60
ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc
120
aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac
180
atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt
240
tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct
300
gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa
360
agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc
420
ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct
480
catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga
540
gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct
600
gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg
660
gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg
720
tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg
780
ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac
840
catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg
900
atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg
960
gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat
1020
gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt
1080
gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa
1140
acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc
1200
gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt
1260
aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa
1320
gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca
1380
ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc
1440
actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat
1500
tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg
1560
ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag
1620
agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat
1680
caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat
1740
gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga
1800
gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat
1860
gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta
1920
agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac
1980
aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg
2040
tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga
2100
ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag
2160
gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga
2220
agcttctctc aaaacccacc agtcttgaaa cgccatcaac gggaaataac tcgtactact
2280
cttcagtcag atcaagagga aattgactat gatgatacca tatcagttga aatgaagaag
2340
gaagattttg acatttatga tgaggatgaa aatcagagcc cccgcagctt tcaaaagaaa
2400
acacgacact attttattgc tgcagtggag aggctctggg attatgggat gagtagctcc
2460
ccacatgttc taagaaacag ggctcagagt ggcagtgtcc ctcagttcaa gaaagttgtt
2520
ttccaggaat ttactgatgg ctcctttact cagcccttat accgtggaga actaaatgaa
2580
catttgggac tcctggggcc atatataaga gcagaagttg aagataatat catggtaact
2640
ttcagaaatc aggcctctcg tccctattcc ttctattcta gccttatttc ttatgaggaa
2700
gatcagaggc aaggagcaga acctagaaaa aactttgtca agcctaatga aaccaaaact
2760
tacttttgga aagtgcaaca tcatatggca cccactaaag atgagtttga ctgcaaagcc
2820
tgggcttatt tctctgatgt tgacctggaa aaagatgtgc actcaggcct gattggaccc
2880
cttctggtct gccacactaa cacactgaac cctgctcatg ggagacaagt gacagtacag
2940
gaatttgctc tgtttttcac catctttgat gagaccaaaa gctggtactt cactgaaaat
3000
atggaaagaa actgcagggc tccctgcaat atccagatgg aagatcccac ttttaaagag
3060
aattatcgct tccatgcaat caatggctac ataatggata cactacctgg cttagtaatg
3120
gctcaggatc aaaggattcg atggtatctg ctcagcatgg gcagcaatga aaacatccat
3180
tctattcatt tcagtggaca tgtgttcact gtacgaaaaa aagaggagta taaaatggca
3240
ctgtacaatc tctatccagg tgtttttgag acagtggaaa tgttaccatc caaagctgga
3300
atttggcggg tggaatgcct tattggcgag catctacatg ctgggatgag cacacttttt
3360
ctggtgtaca gcaataagtg tcagactccc ctgggaatgg cttctggaca cattagagat
3420
tttcagatta cagcttcagg acaatatgga cagtgggccc caaagctggc cagacttcat
3480
tattccggat caatcaatgc ctggagcacc aaggagccct tttcttggat caaggtggat
3540
ctgttggcac caatgattat tcacggcatc aagacccagg gtgcccgtca gaagttctcc
3600
agcctctaca tctctcagtt tatcatcatg tatagtcttg atgggaagaa gtggcagact
3660
tatcgaggaa attccactgg aaccttaatg gtcttctttg gcaatgtgga ttcatctggg
3720
ataaaacaca atatttttaa ccctccaatt attgctcgat acatccgttt gcacccaact
3780
cattatagca ttcgcagcac tcttcgcatg gagttgatgg gctgtgattt aaatagttgc
3840
agcatgccat tgggaatgga gagtaaagca atatcagatg cacagattac tgcttcatcc
3900
tactttacca atatgtttgc cacctggtct ccttcaaaag ctcgacttca cctccaaggg
3960
aggagtaatg cctggagacc tcaggtgaat aatccaaaag agtggctgca agtggacttc
4020
cagaagacaa tgaaagtcac aggagtaact actcagggag taaaatctct gcttaccagc
4080
atgtatgtga aggagttcct catctccagc agtcaagatg gccatcagtg gactctcttt
4140
tttcagaatg gcaaagtaaa ggtttttcag ggaaatcaag actccttcac acctgtggtg
4200
aactctctag acccaccgtt actgactcgc taccttcgaa ttcaccccca gagttgggtg
4260
caccagattg ccctgaggat ggaggttctg ggctgcgagg cacaggacct ctac
4314
<210> 2
<211> 4314
<212> DNA
<213> Искусственная последовательность
<220>
<223> Кодон-оптимизированная нуклеотидная последовательность,
кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v1)
<400> 2
gccaccagaa ggtactacct gggcgccgtg gagctgagct gggactacat gcagagcgac
60
ctgggcgagc tgcctgtgga cgccagattc ccccccagag tgcctaagag cttccccttc
120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcaccgacca cctgttcaac
180
atcgccaagc ccagaccccc ctggatgggc ctgctgggcc ctaccatcca ggccgaggtg
240
tacgacaccg tggtgatcac cctgaagaac atggccagcc accccgtgag cctgcacgcc
300
gtgggcgtga gctactggaa ggccagcgag ggcgccgagt acgacgacca gaccagccag
360
agagagaagg aggacgacaa ggtgttcccc ggcggcagcc acacctacgt gtggcaggtg
420
ctgaaggaga acggccccat ggccagcgac cccctgtgcc tgacctacag ctacctgagc
480
cacgtggacc tggtgaagga cctgaacagc ggcctgatcg gcgccctgct ggtgtgcaga
540
gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc
600
gtgttcgacg agggcaagag ctggcacagc gagaccaaga acagcctgat gcaggacaga
660
gacgccgcca gcgccagagc ctggcccaag atgcacaccg tgaacggcta cgtgaacagg
720
agcctgcccg gcctgatcgg ctgccacaga aagagcgtgt actggcacgt gatcggcatg
780
ggcaccaccc ccgaggtgca cagcatcttc ctggagggcc acaccttcct ggtgaggaac
840
cacagacagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg
900
atggacctgg gccagttcct gctgttctgc cacatcagca gccaccagca cgacggcatg
960
gaggcctacg tgaaggtgga cagctgcccc gaggagcccc agctgagaat gaagaacaac
1020
gaggaggccg aggactacga cgacgacctg accgacagcg agatggacgt ggtgagattc
1080
gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag
1140
acctgggtgc actacatcgc cgccgaggag gaggactggg actacgcccc cctggtgctg
1200
gcccccgacg acagaagcta caagagccag tacctgaaca acggccccca gaggatcggc
1260
agaaagtaca agaaggtgcg gttcatggcc tacaccgacg agaccttcaa gaccagggag
1320
gccatccagc acgagagcgg catcctgggc cctctgctgt acggcgaggt gggcgacacc
1380
ctgctgatca tcttcaagaa ccaggccagc agaccctaca acatctaccc ccacggcatc
1440
accgacgtga gacccctgta cagcagaaga ctgcccaagg gcgtgaagca cctgaaggac
1500
ttccccatcc tgcccggcga gatcttcaag tacaagtgga ccgtgaccgt ggaggacggc
1560
cccaccaaga gcgaccccag atgcctgacc agatactaca gcagcttcgt gaacatggag
1620
cgggacctgg ccagcggcct gatcggcccc ctgctgatct gctacaagga gagcgtggac
1680
cagagaggca accagatcat gagcgacaag cggaacgtga tcctgttcag cgtgttcgac
1740
gagaaccgga gctggtacct gaccgagaac atccagaggt tcctgcccaa ccccgccggc
1800
gtgcagctgg aggaccccga gttccaggcc agcaacatca tgcacagcat caacggctac
1860
gtgttcgaca gcctgcagct gagcgtgtgc ctgcacgagg tggcctactg gtacatcctg
1920
agcatcggcg cccagaccga cttcctgagc gtgttcttca gcggctacac cttcaagcac
1980
aagatggtgt acgaggacac cctgaccctg ttccccttca gcggcgagac cgtgttcatg
2040
agcatggaga accccggcct gtggatcctg ggctgccaca acagcgactt cagaaacaga
2100
ggcatgaccg ccctgctgaa ggtgagcagc tgcgacaaga acaccggcga ctactacgag
2160
gacagctacg aggacatcag cgcctacctg ctgagcaaga acaacgccat cgagcccagg
2220
agcttcagcc agaacccccc cgtgctgaag agacaccaga gagagatcac caggaccacc
2280
ctgcagagcg accaggagga gatcgactac gacgacacca tcagcgtgga gatgaagaag
2340
gaggacttcg acatctacga cgaggacgag aaccagagcc ccagaagctt ccagaagaag
2400
accaggcact acttcatcgc cgccgtggag agactgtggg actacggcat gagcagcagc
2460
ccccacgtgc tgagaaacag agcccagagc ggcagcgtgc cccagttcaa gaaggtggtg
2520
ttccaggagt tcaccgacgg cagcttcacc cagcccctgt acagaggcga gctgaacgag
2580
cacctgggcc tgctgggccc ctacatcaga gccgaggtgg aggacaacat catggtgacc
2640
ttccggaacc aggccagcag accctacagc ttctacagca gcctgatcag ctacgaggag
2700
gaccagaggc agggcgccga gcccagaaag aacttcgtga agcccaacga gaccaagacc
2760
tacttctgga aggtgcagca ccacatggcc cccaccaagg acgagttcga ctgcaaggcc
2820
tgggcctact tcagcgacgt ggacctggag aaggacgtgc acagcggcct gatcggcccc
2880
ctgctggtgt gccacaccaa caccctgaac cccgcccacg gcagacaggt gaccgtgcag
2940
gagttcgccc tgttcttcac catcttcgac gagaccaaga gctggtactt caccgagaac
3000
atggagcgga actgcagagc cccctgcaac atccagatgg aggaccccac cttcaaggag
3060
aactacaggt tccacgccat caacggctac atcatggaca ccctgcccgg cctggtgatg
3120
gcccaggacc agagaatcag atggtacctg ctgagcatgg gcagcaacga gaacatccac
3180
agcatccact tcagcggcca cgtgttcacc gtgaggaaga aggaggagta caagatggcc
3240
ctgtacaacc tgtaccccgg cgtgttcgag accgtggaga tgctgcccag caaggccggc
3300
atctggagag tggagtgcct gatcggcgag cacctgcacg ccggcatgag caccctgttc
3360
ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg ccagcggcca catcagagac
3420
ttccagatca ccgccagcgg ccagtacggc cagtgggccc ccaagctggc cagactgcac
3480
tacagcggca gcatcaacgc ctggagcacc aaggagccct tcagctggat caaggtggac
3540
ctgctggccc ccatgatcat ccacggcatc aagacccagg gcgccagaca gaagttcagc
3600
agcctgtaca tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc
3660
tacagaggca acagcaccgg caccctgatg gtgttcttcg gcaacgtgga cagcagcggc
3720
atcaagcaca acatcttcaa cccccccatc atcgcccggt acatcaggct gcaccccacc
3780
cactacagca tcaggagcac cctgagaatg gagctgatgg gctgcgacct gaacagctgc
3840
agcatgcccc tgggcatgga gagcaaggcc atcagcgacg cccagatcac cgccagcagc
3900
tacttcacca acatgttcgc cacctggagc cccagcaagg ccagactgca cctgcagggc
3960
agaagcaacg cctggagacc ccaggtgaac aaccccaagg agtggctgca ggtggacttc
4020
cagaagacca tgaaggtgac cggcgtgacc acccagggcg tgaagagcct gctgaccagc
4080
atgtacgtga aggagttcct gatcagcagc agccaggacg gccaccagtg gaccctgttc
4140
ttccagaacg gcaaggtgaa ggtgttccag ggcaaccagg acagcttcac ccccgtggtg
4200
aacagcctgg acccccccct gctgaccaga tacctgagaa tccaccccca gagctgggtg
4260
caccagatcg ccctgagaat ggaggtgctg ggctgcgagg cccaggacct gtac
4314
<210> 3
<211> 4314
<212> DNA
<213> Искусственная последовательность
<220>
<223> Кодон-оптимизированная нуклеотидная последовательность,
кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v2)
<400> 3
gccacaagaa gatactatct gggcgccgtg gagctgagct gggattatat gcagtccgac
60
ctgggcgagc tgccagtgga tgctagattc cctcctagag tgcctaagag ctttccattc
120
aatacctccg tggtgtacaa gaagaccctg ttcgtggagt ttaccgacca cctgttcaac
180
atcgccaaac ctagaccacc ttggatggga ctgctgggcc caactattca ggccgaagtg
240
tacgataccg tggtgatcac tctgaagaat atggcctccc accctgtgag cctgcatgca
300
gttggcgtga gctattggaa ggccagcgag ggagccgaat acgatgacca gaccagccag
360
agggagaagg aagacgacaa ggtgtttccc ggaggaagcc acacctatgt gtggcaggtg
420
ctgaaggaga atggacctat ggccagcgat ccactgtgcc tgacctactc ttatctgagc
480
cacgtggacc tggtgaagga cctgaatagc ggcctgattg gcgcactgct ggtgtgtaga
540
gagggatctc tggccaaaga gaagacccag accctgcaca agtttatcct gctgtttgcc
600
gtgtttgacg agggcaaatc ttggcacagc gagaccaaaa acagcctgat gcaggataga
660
gacgcagcct ctgctagagc ttggcctaag atgcacaccg tgaatggcta cgtgaacaga
720
tccctgcccg gcctgattgg atgtcacaga aagagcgtgt actggcacgt gatcggaatg
780
ggaactaccc cagaagtgca cagcatcttt ctggagggac acacctttct ggtgcggaat
840
catagacagg ccagcctgga aatcagccct attacctttc tgaccgccca gacactgctg
900
atggatctgg gacagtttct gctgttctgc cacatcagct ctcaccagca tgacggaatg
960
gaagcctacg tgaaggtgga cagctgccct gaggaaccac agctgaggat gaagaataac
1020
gaggaggccg aggattacga cgatgacctg accgattctg agatggacgt ggtgagattc
1080
gacgacgata actctccctc cttcatccag atcagatccg tggccaaaaa gcaccctaaa
1140
acctgggtgc actatatcgc cgcagaggaa gaagactggg attacgcacc tctggtgctg
1200
gcccctgatg acagatctta taagtctcag tacctgaaca acggccctca gagaatcggc
1260
aggaagtaca agaaggtgag attcatggcc tacacagacg agacattcaa gaccagagag
1320
gccattcagc acgagtccgg cattctggga ccactgctgt acggagaggt gggcgataca
1380
ctgctgatca tcttcaaaaa tcaggccagc aggccctaca acatctaccc acatggcatc
1440
acagacgtga ggcctctgta cagcagaaga ctgcctaaag gcgtgaagca cctgaaggac
1500
ttccccattc tgccaggcga gattttcaag tacaagtgga cagtgaccgt ggaggatgga
1560
cccacaaagt ctgaccctag atgcctgacc aggtactata gctccttcgt gaacatggaa
1620
agggatctgg cctctggact gattggccca ctgctgatct gctacaagga atccgtggac
1680
cagagaggaa accagatcat gagcgataag aggaatgtga tcctgttcag cgtgttcgat
1740
gagaacagga gctggtatct gaccgagaac atccagagat tcctgccaaa tccagccggc
1800
gtgcagctgg aagatcctga atttcaggcc tccaatatca tgcactccat caatggctac
1860
gtgtttgaca gcctgcagct gtctgtgtgt ctgcacgaag tggcctactg gtacatcctg
1920
agcattggag cccagaccga ctttctgagc gtgtttttct ctggctacac cttcaagcac
1980
aagatggtgt acgaggacac cctgacactg ttcccattct caggcgaaac cgtgtttatg
2040
agcatggaga acccaggact gtggattctg ggctgccaca actccgactt caggaataga
2100
ggaatgaccg ccctgctgaa agtgagcagc tgcgataaga acaccggcga ttattacgag
2160
gactcctacg aggatatcag cgcctacctg ctgtccaaaa acaatgccat cgagcccagg
2220
agcttctccc agaatccacc tgtgctgaaa agacaccaga gggagatcac cagaaccaca
2280
ctgcagtctg atcaggagga gatcgactat gacgacacca tcagcgtgga gatgaagaag
2340
gaggactttg atatctacga cgaggatgag aaccagagcc ccaggagctt tcagaagaag
2400
accaggcact acttcatcgc cgcagtggag agactgtggg actacggaat gtcttcctcc
2460
cctcacgtgc tgagaaatag agcccagtct ggaagcgtgc cacagtttaa gaaggtggtg
2520
ttccaggagt ttaccgacgg ctctttcacc cagccactgt atagaggcga actgaacgaa
2580
cacctgggcc tgctgggacc ttatatcaga gccgaagtgg aggacaacat catggtgacc
2640
ttcagaaacc aggccagcag accttacagc ttctactcca gcctgatcag ctacgaagag
2700
gatcagagac agggcgccga acctaggaaa aattttgtga agccaaacga gaccaagacc
2760
tacttttgga aggtgcagca tcacatggcc cccaccaagg atgagttcga ttgtaaagcc
2820
tgggcctact tctccgatgt ggacctggaa aaggatgtgc acagcggact gatcggacca
2880
ctgctggtgt gccacacaaa taccctgaac cctgcccacg gaagacaggt gacagtgcag
2940
gaatttgccc tgttcttcac catctttgac gagaccaagt cctggtactt caccgagaac
3000
atggagagaa actgcagagc cccttgcaac attcagatgg aggacccaac attcaaggag
3060
aactacaggt tccacgccat caatggctac atcatggata cactgcctgg cctggtgatg
3120
gcccaggatc agagaattag gtggtacctg ctgtctatgg gctccaatga gaatatccac
3180
tccatccact tcagcggcca cgtgttcacc gtgagaaaga aagaggagta caagatggcc
3240
ctgtacaacc tgtacccagg cgtgtttgag accgtggaga tgctgccttc taaagctggc
3300
atctggagag tggagtgcct gatcggcgag catctgcatg ctggaatgtc taccctgttt
3360
ctggtgtact ccaacaagtg ccagacacct ctgggcatgg cttctggaca tatcagagac
3420
tttcagatca ccgcctccgg ccagtacgga caatgggctc caaagctggc cagactgcat
3480
tactctggct ctattaatgc ctggagcacc aaggagccct tttcctggat caaggtggat
3540
ctgctggccc ccatgattat ccacggcatc aaaacccagg gcgccaggca gaagttttct
3600
tccctgtaca tcagccagtt catcatcatg tacagcctgg atggcaagaa gtggcagacc
3660
tacagaggca atagcaccgg aaccctgatg gtgtttttcg gcaacgtgga ctcctccggc
3720
attaagcaca atatcttcaa cccacctatc atcgccaggt acatcagact gcaccccacc
3780
cactactcta tcagaagcac cctgaggatg gaactgatgg gctgtgacct gaattcctgt
3840
agcatgcctc tgggaatgga gtctaaagcc atcagtgacg cccagattac cgccagcagc
3900
tactttacca acatgtttgc tacatggtcc ccctctaagg ccagactgca cctgcaggga
3960
agatctaacg cctggagacc acaggtgaac aaccccaaag aatggctgca ggtggatttt
4020
cagaagacca tgaaagtgac cggcgtgaca acacagggcg tgaaatctct gctgacctct
4080
atgtacgtga aggagtttct gatcagcagc agccaggacg gccatcagtg gaccctgttt
4140
tttcagaatg gcaaggtgaa ggtgttccag ggcaatcagg actcattcac tccagtggtg
4200
aacagcctgg acccacctct gctgaccaga tacctgagaa ttcacccaca gtcctgggtg
4260
catcagatcg ccctgagaat ggaagtgctg ggatgtgagg cacaggacct gtac
4314
<210> 4
<211> 4314
<212> DNA
<213> Искусственная последовательность
<220>
<223> Кодон-оптимизированная нуклеотидная последовательность,
кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v3)
<400> 4
gccacaagga ggtactatct gggcgccgtg gaactgagct gggactatat gcagagcgac
60
ctgggagagc tgcctgtgga tgccagattt ccacctaggg tgcccaagag cttccccttc
120
aatacaagcg tggtgtacaa gaagaccctg ttcgtggagt ttaccgacca cctgttcaac
180
atcgccaagc ctagacctcc ttggatggga ctgctgggcc ctaccattca ggccgaagtg
240
tacgacacag tggtgatcac cctgaagaat atggccagcc atccagtgtc cctgcacgca
300
gtgggagtgt cttattggaa ggcctctgag ggcgccgagt acgatgatca gaccagccag
360
agagagaagg aggacgacaa ggtgttcccc ggaggaagcc acacctacgt gtggcaggtg
420
ctgaaagaga atggcccaat ggcctccgac cccctgtgtc tgacatacag ctacctgagc
480
cacgtggacc tggtgaagga cctgaactct ggcctgatcg gagctctgct ggtgtgtaga
540
gaaggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgtttgcc
600
gtgttcgatg agggcaaaag ctggcattcc gagaccaaga attccctgat gcaggatagg
660
gacgctgcca gcgctagagc ctggcctaag atgcacactg tgaatggcta cgtgaaccgg
720
agcctgccag gcctgatcgg ctgtcacaga aagagcgtgt actggcacgt gatcggcatg
780
ggcaccactc ctgaggtgca ctctatcttt ctggaaggcc acacctttct ggtgcggaac
840
catagacagg cctccctgga aatcagcccc atcacctttc tgaccgccca gaccctgctg
900
atggatctgg gacagttcct gctgttttgc cacatctcct ctcaccagca cgacggaatg
960
gaggcctacg tgaaagtgga cagctgtcct gaagaacctc agctgcggat gaagaataac
1020
gaggaggccg aggactacga cgatgacctg accgatagcg agatggacgt ggtgagattc
1080
gacgacgata acagccccag cttcatccag atcagatccg tggccaagaa gcaccccaag
1140
acatgggtgc actatatcgc cgcagaggag gaggattggg actacgcacc tctggtgctg
1200
gctcctgacg atagatccta caagtcccag tacctgaaca acggccccca gagaatcggc
1260
agaaagtaca agaaggtgag attcatggcc tacaccgacg agacctttaa gaccagagag
1320
gccatccagc acgagagcgg cattctggga ccactgctgt atggagaggt gggcgataca
1380
ctgctgatca tcttcaagaa tcaggcctcc cggccataca acatctatcc acacggcatc
1440
accgacgtga gaccactgta ctccaggaga ctgcccaagg gcgtgaagca cctgaaggac
1500
ttccctattc tgccaggcga gatcttcaag tacaagtgga cagtgaccgt ggaagacgga
1560
cctaccaaaa gcgaccccag atgcctgacc cggtactact ccagcttcgt gaacatggag
1620
agagatctgg ccagcggact gattggacct ctgctgattt gttacaagga gagcgtggac
1680
cagaggggca accagattat gagcgacaag cggaatgtga tcctgttctc cgtgttcgac
1740
gagaaccgca gctggtatct gaccgagaat atccagaggt tcctgccaaa ccccgccggc
1800
gttcagctgg aagatccaga gtttcaggcc tccaacatca tgcacagcat caatggctac
1860
gtgttcgaca gcctgcagct gtccgtgtgt ctgcatgaag tggcctactg gtatatcctg
1920
agcatcggcg cccagaccga ttttctgtcc gtgtttttct ccggctacac cttcaagcac
1980
aagatggtgt acgaggacac cctgaccctg tttcctttta gcggcgaaac cgtgttcatg
2040
agcatggaga acccaggact gtggattctg ggctgtcaca acagcgactt cagaaatcgg
2100
ggcatgaccg ctctgctgaa ggtgagctct tgtgacaaaa ataccggcga ctactacgag
2160
gacagctacg aggatatcag cgcctacctg ctgagcaaga acaacgccat cgagccaaga
2220
agcttcagcc agaatccccc cgtgctgaag agacatcaga gggagatcac cagaaccacc
2280
ctgcagagcg accaggagga gatcgattac gacgacacca tcagcgtgga gatgaagaag
2340
gaggatttcg acatctacga cgaggacgag aatcagagcc caaggagctt tcagaagaag
2400
acccggcact acttcatcgc tgccgtggag agactgtggg attatggcat gagctccagc
2460
cctcacgtgc tgagaaatag agcccagtct ggctccgtgc cccagttcaa gaaagtggtg
2520
ttccaggaat tcaccgacgg cagctttacc cagcccctgt atagaggcga actgaatgaa
2580
cacctgggcc tgctgggacc ttacatcaga gccgaagtgg aggacaacat catggtgacc
2640
tttaggaatc aggccagcag accctacagc ttctatagct ccctgatctc ctacgaggag
2700
gaccagagac agggcgctga gccaagaaag aatttcgtga agcccaacga gaccaagacc
2760
tacttctgga aagtgcagca ccacatggcc cctaccaagg atgagttcga ctgtaaagcc
2820
tgggcctact tcagcgacgt ggacctggag aaggacgtgc actccggact gatcggacca
2880
ctgctggtgt gccacacaaa caccctgaac cctgcccatg gaagacaggt gactgtgcag
2940
gaattcgccc tgttctttac catcttcgac gagaccaagt cctggtactt caccgagaat
3000
atggagagga attgcagagc cccctgtaac atccagatgg aggaccccac ctttaaggag
3060
aattacaggt ttcacgccat caacggctac atcatggaca cactgccagg cctggtgatg
3120
gcacaggatc agaggatcag atggtatctg ctgagcatgg gctccaacga gaacatccac
3180
tccatccact tcagcggcca cgtgtttacc gtgagaaaga aggaggagta caagatggcc
3240
ctgtacaacc tgtatcccgg cgtgttcgaa accgtggaga tgctgccttc caaagccgga
3300
atctggagag tggagtgcct gattggcgag cacctgcacg ctggaatgtc caccctgttc
3360
ctggtgtata gcaacaagtg ccagaccccc ctgggcatgg ctagcggaca cattagagac
3420
tttcagatca ccgcctccgg ccagtacgga cagtgggccc caaaactggc taggctgcat
3480
tacagcggct ccatcaatgc ctggtccacc aaggagccat tcagctggat caaagtggat
3540
ctgctggccc ccatgatcat ccacggcatt aagacacagg gcgccaggca gaagttcagc
3600
tctctgtaca tctcccagtt catcatcatg tactccctgg acggcaagaa gtggcagacc
3660
tacaggggca atagcaccgg cacactgatg gtgtttttcg gcaacgtgga ctcttccggc
3720
atcaagcaca acatctttaa cccccctatc atcgccaggt acatcaggct gcaccccact
3780
cactacagca tcagatccac cctgagaatg gagctgatgg gatgcgacct gaacagctgc
3840
agcatgcccc tgggcatgga gagcaaggcc atttctgacg cccagatcac cgccagcagc
3900
tatttcacca atatgttcgc tacctggagc cccagcaagg ccagactgca tctgcagggc
3960
agaagcaacg cctggagacc acaggtgaac aatcctaaag agtggctgca ggtggacttc
4020
cagaagacca tgaaggtgac cggcgtgaca acccagggcg tgaaatctct gctgacctcc
4080
atgtacgtga aggagttcct gatctcctcc agccaggatg gccatcagtg gaccctgttc
4140
ttccagaacg gcaaggtgaa agtgttccag ggcaaccagg acagctttac ccctgtggtg
4200
aactctctgg atccccccct gctgaccagg tacctgagaa ttcaccccca gagctgggtg
4260
caccagatcg ccctgagaat ggaagtgctg ggatgcgagg cacaggacct gtac
4314
<210> 5
<211> 4314
<212> DNA
<213> Искусственная последовательность
<220>
<223> Кодон-оптимизированная нуклеотидная последовательность,
кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v4)
<400> 5
gctacccgga ggtactacct gggcgctgtg gagctgagct gggactacat gcagagcgat
60
ctgggcgagc tgcccgtgga tgccagattt cccccaagag tgcctaagtc cttccccttc
120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcaccgacca cctgttcaac
180
atcgccaagc caaggccccc ctggatggga ctgctgggac ctacaattca ggccgaggtg
240
tacgataccg tggtgatcac cctgaagaac atggcctccc acccagtgtc cctgcatgcc
300
gtgggcgtga gctactggaa ggcttctgaa ggcgccgagt acgacgacca gaccagccag
360
agggagaagg aggacgacaa ggtgttccca ggcggatctc acacctacgt gtggcaggtg
420
ctgaaggaga atggcccaat ggccagcgac ccactgtgtc tgacctacag ctacctgtcc
480
cacgtggacc tggtgaagga cctgaactcc ggcctgatcg gcgccctgct ggtgtgtaga
540
gaaggatctc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc
600
gtgtttgacg agggcaagag ctggcattcc gagaccaaga acagcctgat gcaggacaga
660
gacgcagcca gcgctagagc ctggcccaag atgcacaccg tgaatggcta cgtgaaccgg
720
tccctgccag gcctgatcgg ctgtcacaga aaaagcgtgt actggcacgt gatcggcatg
780
ggcaccacac ccgaggtgca cagcatcttt ctggagggcc acaccttcct ggtgagaaac
840
cacaggcagg cctccctgga gatctccccc atcacctttc tgaccgccca gaccctgctg
900
atggatctgg gccagttcct gctgttctgc cacatcagct cccaccagca cgacggaatg
960
gaggcctacg tgaaggtgga tagctgcccc gaggagcccc agctgagaat gaagaacaac
1020
gaggaggccg aggactacga cgatgacctg accgattccg agatggacgt ggtgcgcttc
1080
gacgacgata atagccccag cttcatccag atcagatccg tggccaagaa gcacccaaag
1140
acctgggtgc actacatcgc tgccgaggag gaggactggg attacgcccc actggtgctg
1200
gcccctgatg acagatccta caagagccag tacctgaaca acggccccca gagaatcggc
1260
cggaagtaca agaaggtgag attcatggcc tacaccgacg agaccttcaa gaccagggaa
1320
gccatccagc acgagagcgg catcctggga ccactgctgt acggagaagt gggcgatacc
1380
ctgctgatca tcttcaagaa ccaggcctcc cggccctaca acatctaccc ccacggcatc
1440
accgacgtga ggccactgta cagcaggagg ctgcccaagg gcgtgaagca cctgaaggac
1500
ttccccatcc tgcccggcga gatctttaag tacaagtgga ccgtgaccgt ggaggacggc
1560
ccaaccaaga gcgacccaag atgcctgacc aggtactact cctccttcgt gaacatggag
1620
cgggatctgg ccagcggact gattggccct ctgctgatct gctacaagga gagcgtggac
1680
cagcgcggca atcagatcat gagcgacaag agaaacgtga tcctgttcag cgtgttcgac
1740
gagaatcgca gctggtacct gaccgagaac atccagaggt tcctgcccaa cccagccggc
1800
gtgcagctgg aagatcctga atttcaggcc agcaacatca tgcactccat caacggctac
1860
gtgttcgact ccctgcagct gagcgtgtgt ctgcacgaag tggcctactg gtacatcctg
1920
agcatcggcg cccagaccga cttcctgtcc gtgttctttt ccggctacac cttcaagcac
1980
aagatggtgt acgaggacac cctgaccctg ttccccttta gcggcgagac cgtgttcatg
2040
agcatggaga acccaggcct gtggattctg ggctgccaca acagcgactt ccgcaatagg
2100
ggcatgaccg ccctgctgaa agtgtccagc tgcgataaga acaccggcga ctactacgag
2160
gacagctacg aggacatctc cgcctacctg ctgagcaaga acaacgccat cgagcccaga
2220
tccttcagcc agaaccctcc agtgctgaag aggcaccagc gcgagatcac cagaaccacc
2280
ctgcagtctg atcaggagga gatcgactac gacgacacca tcagcgtgga gatgaagaag
2340
gaggacttcg acatctacga cgaggacgag aaccagagcc ctaggtcctt ccagaagaag
2400
acccggcact acttcatcgc cgcagtggag aggctgtggg attacggcat gagcagctcc
2460
ccacacgtgc tgagaaatag ggcccagagc ggcagcgtgc cccagttcaa aaaggtggtg
2520
ttccaggagt tcaccgacgg ctccttcacc cagcccctgt acagaggcga gctgaatgag
2580
cacctgggcc tgctgggacc ctacatcaga gcagaggtgg aggacaacat catggtgacc
2640
ttcaggaacc aggccagcag accctacagc ttctacagca gcctgatcag ctacgaggag
2700
gaccagagac agggagccga gccacgcaag aacttcgtga agcccaacga gaccaagacc
2760
tacttctgga aggtgcagca ccacatggcc cccaccaagg acgagttcga ttgtaaagcc
2820
tgggcctact tcagcgacgt ggacctggag aaggacgtgc acagcggcct gatcggacct
2880
ctgctggtgt gtcataccaa caccctgaac cccgcccacg gcagacaggt gactgtgcag
2940
gagtttgccc tgttcttcac catcttcgac gagaccaaga gctggtactt caccgagaac
3000
atggagagaa actgcagggc cccatgcaac atccagatgg aagaccccac cttcaaggag
3060
aactaccggt tccacgccat caacggctac atcatggata ccctgcctgg cctggtgatg
3120
gcccaggatc agagaatcag gtggtacctg ctgagcatgg gctccaacga gaacatccac
3180
agcatccact tctccggcca cgtgttcacc gtgaggaaaa aggaggagta caagatggcc
3240
ctgtacaacc tgtaccccgg cgtgtttgag accgtggaga tgctgccatc taaggccggc
3300
atttggagag tggagtgcct gatcggcgag cacctgcacg ccggaatgtc taccctgttc
3360
ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg ccagcggaca catcagagac
3420
ttccagatca ccgccagcgg ccagtacgga cagtgggctc ctaaactggc ccgcctgcac
3480
tatagcggca gcattaacgc ctggtccacc aaggagccat tcagctggat caaggtggat
3540
ctgctggccc ccatgatcat ccacggcatc aaaacacagg gcgccagaca gaagttctcc
3600
agcctgtaca tctcccagtt catcatcatg tactccctgg acggcaagaa gtggcagacc
3660
tacagaggca actccaccgg cacactgatg gtgttcttcg gcaacgtgga cagcagcggc
3720
atcaagcaca acatcttcaa cccccccatc atcgcccggt acatcagact gcacccaacc
3780
cactactcca tcaggtccac cctgaggatg gagctgatgg gctgcgatct gaattcctgc
3840
agcatgcccc tgggcatgga gtccaaagcc atctctgacg cccagatcac cgccagctcc
3900
tacttcacca acatgttcgc cacttggagc cccagcaagg ccagactgca cctgcagggc
3960
agaagcaatg cctggagacc ccaggtgaac aacccaaagg agtggctgca ggtggacttc
4020
cagaagacca tgaaggtgac cggcgtgacc acacagggcg tgaaaagcct gctgaccagc
4080
atgtacgtga aggagttcct gatcagctcc agccaggatg ggcaccagtg gaccctgttc
4140
tttcagaacg gcaaggtgaa ggtgttccag ggcaatcagg actcattcac ccctgtggtg
4200
aactctctgg acccccccct gctgacccgg tacctgagaa tccacccaca gtcttgggtg
4260
caccagatcg ccctgaggat ggaagtgctg ggctgcgagg ctcaggatct gtac
4314
<210> 6
<211> 4371
<212> DNA
<213> Искусственная последовательность
<220>
<223> Нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным
пептидом (дикого типа)
<400> 6
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc
60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc
120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac
180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc
240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat
300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt
360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg
420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg
480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat
540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa
600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta
660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat
720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct
780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc
840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat
900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg
960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa
1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa
1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat
1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact
1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc
1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg
1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct
1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg
1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact
1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt
1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca
1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga
1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa
1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag
1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg
1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt
1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc
1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa
2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg
2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc
2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac
2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc
2280
ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt
2340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa
2400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca
2460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca
2520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc
2580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat
2640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc
2700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat
2760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac
2820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg
2880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt
2940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa
3000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg
3060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat
3120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct
3180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct
3240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg
3300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt
3360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg
3420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt
3480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat
3540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg
3600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc
3660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat
3720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata
3780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat
3840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc
3900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac
3960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg
4020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag
4080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg
4140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt
4200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac
4260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac
4320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c
4371
<210> 7
<211> 4371
<212> DNA
<213> Искусственная последовательность
<220>
<223> Кодон-оптимизированная нуклеотидная последовательность,
кодирующая белок FVIII-BDD с сигнальным пептидом (вариант
FVIII-BDDco-v1)
<400> 7
atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttcagcgcc
60
accagaaggt actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg
120
ggcgagctgc ctgtggacgc cagattcccc cccagagtgc ctaagagctt ccccttcaac
180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc
240
gccaagccca gacccccctg gatgggcctg ctgggcccta ccatccaggc cgaggtgtac
300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg
360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagaga
420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg
480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac
540
gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgcagagag
600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg
660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagagac
720
gccgccagcg ccagagcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc
780
ctgcccggcc tgatcggctg ccacagaaag agcgtgtact ggcacgtgat cggcatgggc
840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac
900
agacaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg
960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag
1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgagaatgaa gaacaacgag
1080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gagattcgac
1140
gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc
1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc
1260
cccgacgaca gaagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcaga
1320
aagtacaaga aggtgcggtt catggcctac accgacgaga ccttcaagac cagggaggcc
1380
atccagcacg agagcggcat cctgggccct ctgctgtacg gcgaggtggg cgacaccctg
1440
ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccccca cggcatcacc
1500
gacgtgagac ccctgtacag cagaagactg cccaagggcg tgaagcacct gaaggacttc
1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc
1620
accaagagcg accccagatg cctgaccaga tactacagca gcttcgtgaa catggagcgg
1680
gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag
1740
agaggcaacc agatcatgag cgacaagcgg aacgtgatcc tgttcagcgt gttcgacgag
1800
aaccggagct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg
1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg
1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc
1980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag
2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc
2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag aaacagaggc
2160
atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac
2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggagc
2280
ttcagccaga acccccccgt gctgaagaga caccagagag agatcaccag gaccaccctg
2340
cagagcgacc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag
2400
gacttcgaca tctacgacga ggacgagaac cagagcccca gaagcttcca gaagaagacc
2460
aggcactact tcatcgccgc cgtggagaga ctgtgggact acggcatgag cagcagcccc
2520
cacgtgctga gaaacagagc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc
2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggcgagct gaacgagcac
2640
ctgggcctgc tgggccccta catcagagcc gaggtggagg acaacatcat ggtgaccttc
2700
cggaaccagg ccagcagacc ctacagcttc tacagcagcc tgatcagcta cgaggaggac
2760
cagaggcagg gcgccgagcc cagaaagaac ttcgtgaagc ccaacgagac caagacctac
2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg
2880
gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg
2940
ctggtgtgcc acaccaacac cctgaacccc gcccacggca gacaggtgac cgtgcaggag
3000
ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg
3060
gagcggaact gcagagcccc ctgcaacatc cagatggagg accccacctt caaggagaac
3120
tacaggttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc
3180
caggaccaga gaatcagatg gtacctgctg agcatgggca gcaacgagaa catccacagc
3240
atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg
3300
tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc
3360
tggagagtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg
3420
gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat cagagacttc
3480
cagatcaccg ccagcggcca gtacggccag tgggccccca agctggccag actgcactac
3540
agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg
3600
ctggccccca tgatcatcca cggcatcaag acccagggcg ccagacagaa gttcagcagc
3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac
3720
agaggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc
3780
aagcacaaca tcttcaaccc ccccatcatc gcccggtaca tcaggctgca ccccacccac
3840
tacagcatca ggagcaccct gagaatggag ctgatgggct gcgacctgaa cagctgcagc
3900
atgcccctgg gcatggagag caaggccatc agcgacgccc agatcaccgc cagcagctac
3960
ttcaccaaca tgttcgccac ctggagcccc agcaaggcca gactgcacct gcagggcaga
4020
agcaacgcct ggagacccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag
4080
aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg
4140
tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc
4200
cagaacggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac
4260
agcctggacc cccccctgct gaccagatac ctgagaatcc acccccagag ctgggtgcac
4320
cagatcgccc tgagaatgga ggtgctgggc tgcgaggccc aggacctgta c
4371
<210> 8
<211> 4371
<212> DNA
<213> Искусственная последовательность
<220>
<223> Кодон-оптимизированная нуклеотидная последовательность,
кодирующая белок FVIII-BDD с сигнальным пептидом (вариант
FVIII-BDDco-v2)
<400> 8
atgcagatcg agctgagcac ctgttttttt ctgtgcctgc tgaggttctg cttctccgcc
60
acaagaagat actatctggg cgccgtggag ctgagctggg attatatgca gtccgacctg
120
ggcgagctgc cagtggatgc tagattccct cctagagtgc ctaagagctt tccattcaat
180
acctccgtgg tgtacaagaa gaccctgttc gtggagttta ccgaccacct gttcaacatc
240
gccaaaccta gaccaccttg gatgggactg ctgggcccaa ctattcaggc cgaagtgtac
300
gataccgtgg tgatcactct gaagaatatg gcctcccacc ctgtgagcct gcatgcagtt
360
ggcgtgagct attggaaggc cagcgaggga gccgaatacg atgaccagac cagccagagg
420
gagaaggaag acgacaaggt gtttcccgga ggaagccaca cctatgtgtg gcaggtgctg
480
aaggagaatg gacctatggc cagcgatcca ctgtgcctga cctactctta tctgagccac
540
gtggacctgg tgaaggacct gaatagcggc ctgattggcg cactgctggt gtgtagagag
600
ggatctctgg ccaaagagaa gacccagacc ctgcacaagt ttatcctgct gtttgccgtg
660
tttgacgagg gcaaatcttg gcacagcgag accaaaaaca gcctgatgca ggatagagac
720
gcagcctctg ctagagcttg gcctaagatg cacaccgtga atggctacgt gaacagatcc
780
ctgcccggcc tgattggatg tcacagaaag agcgtgtact ggcacgtgat cggaatggga
840
actaccccag aagtgcacag catctttctg gagggacaca cctttctggt gcggaatcat
900
agacaggcca gcctggaaat cagccctatt acctttctga ccgcccagac actgctgatg
960
gatctgggac agtttctgct gttctgccac atcagctctc accagcatga cggaatggaa
1020
gcctacgtga aggtggacag ctgccctgag gaaccacagc tgaggatgaa gaataacgag
1080
gaggccgagg attacgacga tgacctgacc gattctgaga tggacgtggt gagattcgac
1140
gacgataact ctccctcctt catccagatc agatccgtgg ccaaaaagca ccctaaaacc
1200
tgggtgcact atatcgccgc agaggaagaa gactgggatt acgcacctct ggtgctggcc
1260
cctgatgaca gatcttataa gtctcagtac ctgaacaacg gccctcagag aatcggcagg
1320
aagtacaaga aggtgagatt catggcctac acagacgaga cattcaagac cagagaggcc
1380
attcagcacg agtccggcat tctgggacca ctgctgtacg gagaggtggg cgatacactg
1440
ctgatcatct tcaaaaatca ggccagcagg ccctacaaca tctacccaca tggcatcaca
1500
gacgtgaggc ctctgtacag cagaagactg cctaaaggcg tgaagcacct gaaggacttc
1560
cccattctgc caggcgagat tttcaagtac aagtggacag tgaccgtgga ggatggaccc
1620
acaaagtctg accctagatg cctgaccagg tactatagct ccttcgtgaa catggaaagg
1680
gatctggcct ctggactgat tggcccactg ctgatctgct acaaggaatc cgtggaccag
1740
agaggaaacc agatcatgag cgataagagg aatgtgatcc tgttcagcgt gttcgatgag
1800
aacaggagct ggtatctgac cgagaacatc cagagattcc tgccaaatcc agccggcgtg
1860
cagctggaag atcctgaatt tcaggcctcc aatatcatgc actccatcaa tggctacgtg
1920
tttgacagcc tgcagctgtc tgtgtgtctg cacgaagtgg cctactggta catcctgagc
1980
attggagccc agaccgactt tctgagcgtg tttttctctg gctacacctt caagcacaag
2040
atggtgtacg aggacaccct gacactgttc ccattctcag gcgaaaccgt gtttatgagc
2100
atggagaacc caggactgtg gattctgggc tgccacaact ccgacttcag gaatagagga
2160
atgaccgccc tgctgaaagt gagcagctgc gataagaaca ccggcgatta ttacgaggac
2220
tcctacgagg atatcagcgc ctacctgctg tccaaaaaca atgccatcga gcccaggagc
2280
ttctcccaga atccacctgt gctgaaaaga caccagaggg agatcaccag aaccacactg
2340
cagtctgatc aggaggagat cgactatgac gacaccatca gcgtggagat gaagaaggag
2400
gactttgata tctacgacga ggatgagaac cagagcccca ggagctttca gaagaagacc
2460
aggcactact tcatcgccgc agtggagaga ctgtgggact acggaatgtc ttcctcccct
2520
cacgtgctga gaaatagagc ccagtctgga agcgtgccac agtttaagaa ggtggtgttc
2580
caggagttta ccgacggctc tttcacccag ccactgtata gaggcgaact gaacgaacac
2640
ctgggcctgc tgggacctta tatcagagcc gaagtggagg acaacatcat ggtgaccttc
2700
agaaaccagg ccagcagacc ttacagcttc tactccagcc tgatcagcta cgaagaggat
2760
cagagacagg gcgccgaacc taggaaaaat tttgtgaagc caaacgagac caagacctac
2820
ttttggaagg tgcagcatca catggccccc accaaggatg agttcgattg taaagcctgg
2880
gcctacttct ccgatgtgga cctggaaaag gatgtgcaca gcggactgat cggaccactg
2940
ctggtgtgcc acacaaatac cctgaaccct gcccacggaa gacaggtgac agtgcaggaa
3000
tttgccctgt tcttcaccat ctttgacgag accaagtcct ggtacttcac cgagaacatg
3060
gagagaaact gcagagcccc ttgcaacatt cagatggagg acccaacatt caaggagaac
3120
tacaggttcc acgccatcaa tggctacatc atggatacac tgcctggcct ggtgatggcc
3180
caggatcaga gaattaggtg gtacctgctg tctatgggct ccaatgagaa tatccactcc
3240
atccacttca gcggccacgt gttcaccgtg agaaagaaag aggagtacaa gatggccctg
3300
tacaacctgt acccaggcgt gtttgagacc gtggagatgc tgccttctaa agctggcatc
3360
tggagagtgg agtgcctgat cggcgagcat ctgcatgctg gaatgtctac cctgtttctg
3420
gtgtactcca acaagtgcca gacacctctg ggcatggctt ctggacatat cagagacttt
3480
cagatcaccg cctccggcca gtacggacaa tgggctccaa agctggccag actgcattac
3540
tctggctcta ttaatgcctg gagcaccaag gagccctttt cctggatcaa ggtggatctg
3600
ctggccccca tgattatcca cggcatcaaa acccagggcg ccaggcagaa gttttcttcc
3660
ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac
3720
agaggcaata gcaccggaac cctgatggtg tttttcggca acgtggactc ctccggcatt
3780
aagcacaata tcttcaaccc acctatcatc gccaggtaca tcagactgca ccccacccac
3840
tactctatca gaagcaccct gaggatggaa ctgatgggct gtgacctgaa ttcctgtagc
3900
atgcctctgg gaatggagtc taaagccatc agtgacgccc agattaccgc cagcagctac
3960
tttaccaaca tgtttgctac atggtccccc tctaaggcca gactgcacct gcagggaaga
4020
tctaacgcct ggagaccaca ggtgaacaac cccaaagaat ggctgcaggt ggattttcag
4080
aagaccatga aagtgaccgg cgtgacaaca cagggcgtga aatctctgct gacctctatg
4140
tacgtgaagg agtttctgat cagcagcagc caggacggcc atcagtggac cctgtttttt
4200
cagaatggca aggtgaaggt gttccagggc aatcaggact cattcactcc agtggtgaac
4260
agcctggacc cacctctgct gaccagatac ctgagaattc acccacagtc ctgggtgcat
4320
cagatcgccc tgagaatgga agtgctggga tgtgaggcac aggacctgta c
4371
<210> 9
<211> 4371
<212> DNA
<213> Искусственная последовательность
<220>
<223> Кодон-оптимизированная нуклеотидная последовательность,
кодирующая белок FVIII-BDD с сигнальным пептидом (вариант
FVIII-BDDco-v3)
<400> 9
atgcagatcg agctgagcac ctgtttcttc ctgtgcctgc tgaggttctg tttcagcgcc
60
acaaggaggt actatctggg cgccgtggaa ctgagctggg actatatgca gagcgacctg
120
ggagagctgc ctgtggatgc cagatttcca cctagggtgc ccaagagctt ccccttcaat
180
acaagcgtgg tgtacaagaa gaccctgttc gtggagttta ccgaccacct gttcaacatc
240
gccaagccta gacctccttg gatgggactg ctgggcccta ccattcaggc cgaagtgtac
300
gacacagtgg tgatcaccct gaagaatatg gccagccatc cagtgtccct gcacgcagtg
360
ggagtgtctt attggaaggc ctctgagggc gccgagtacg atgatcagac cagccagaga
420
gagaaggagg acgacaaggt gttccccgga ggaagccaca cctacgtgtg gcaggtgctg
480
aaagagaatg gcccaatggc ctccgacccc ctgtgtctga catacagcta cctgagccac
540
gtggacctgg tgaaggacct gaactctggc ctgatcggag ctctgctggt gtgtagagaa
600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgccgtg
660
ttcgatgagg gcaaaagctg gcattccgag accaagaatt ccctgatgca ggatagggac
720
gctgccagcg ctagagcctg gcctaagatg cacactgtga atggctacgt gaaccggagc
780
ctgccaggcc tgatcggctg tcacagaaag agcgtgtact ggcacgtgat cggcatgggc
840
accactcctg aggtgcactc tatctttctg gaaggccaca cctttctggt gcggaaccat
900
agacaggcct ccctggaaat cagccccatc acctttctga ccgcccagac cctgctgatg
960
gatctgggac agttcctgct gttttgccac atctcctctc accagcacga cggaatggag
1020
gcctacgtga aagtggacag ctgtcctgaa gaacctcagc tgcggatgaa gaataacgag
1080
gaggccgagg actacgacga tgacctgacc gatagcgaga tggacgtggt gagattcgac
1140
gacgataaca gccccagctt catccagatc agatccgtgg ccaagaagca ccccaagaca
1200
tgggtgcact atatcgccgc agaggaggag gattgggact acgcacctct ggtgctggct
1260
cctgacgata gatcctacaa gtcccagtac ctgaacaacg gcccccagag aatcggcaga
1320
aagtacaaga aggtgagatt catggcctac accgacgaga cctttaagac cagagaggcc
1380
atccagcacg agagcggcat tctgggacca ctgctgtatg gagaggtggg cgatacactg
1440
ctgatcatct tcaagaatca ggcctcccgg ccatacaaca tctatccaca cggcatcacc
1500
gacgtgagac cactgtactc caggagactg cccaagggcg tgaagcacct gaaggacttc
1560
cctattctgc caggcgagat cttcaagtac aagtggacag tgaccgtgga agacggacct
1620
accaaaagcg accccagatg cctgacccgg tactactcca gcttcgtgaa catggagaga
1680
gatctggcca gcggactgat tggacctctg ctgatttgtt acaaggagag cgtggaccag
1740
aggggcaacc agattatgag cgacaagcgg aatgtgatcc tgttctccgt gttcgacgag
1800
aaccgcagct ggtatctgac cgagaatatc cagaggttcc tgccaaaccc cgccggcgtt
1860
cagctggaag atccagagtt tcaggcctcc aacatcatgc acagcatcaa tggctacgtg
1920
ttcgacagcc tgcagctgtc cgtgtgtctg catgaagtgg cctactggta tatcctgagc
1980
atcggcgccc agaccgattt tctgtccgtg tttttctccg gctacacctt caagcacaag
2040
atggtgtacg aggacaccct gaccctgttt ccttttagcg gcgaaaccgt gttcatgagc
2100
atggagaacc caggactgtg gattctgggc tgtcacaaca gcgacttcag aaatcggggc
2160
atgaccgctc tgctgaaggt gagctcttgt gacaaaaata ccggcgacta ctacgaggac
2220
agctacgagg atatcagcgc ctacctgctg agcaagaaca acgccatcga gccaagaagc
2280
ttcagccaga atccccccgt gctgaagaga catcagaggg agatcaccag aaccaccctg
2340
cagagcgacc aggaggagat cgattacgac gacaccatca gcgtggagat gaagaaggag
2400
gatttcgaca tctacgacga ggacgagaat cagagcccaa ggagctttca gaagaagacc
2460
cggcactact tcatcgctgc cgtggagaga ctgtgggatt atggcatgag ctccagccct
2520
cacgtgctga gaaatagagc ccagtctggc tccgtgcccc agttcaagaa agtggtgttc
2580
caggaattca ccgacggcag ctttacccag cccctgtata gaggcgaact gaatgaacac
2640
ctgggcctgc tgggacctta catcagagcc gaagtggagg acaacatcat ggtgaccttt
2700
aggaatcagg ccagcagacc ctacagcttc tatagctccc tgatctccta cgaggaggac
2760
cagagacagg gcgctgagcc aagaaagaat ttcgtgaagc ccaacgagac caagacctac
2820
ttctggaaag tgcagcacca catggcccct accaaggatg agttcgactg taaagcctgg
2880
gcctacttca gcgacgtgga cctggagaag gacgtgcact ccggactgat cggaccactg
2940
ctggtgtgcc acacaaacac cctgaaccct gcccatggaa gacaggtgac tgtgcaggaa
3000
ttcgccctgt tctttaccat cttcgacgag accaagtcct ggtacttcac cgagaatatg
3060
gagaggaatt gcagagcccc ctgtaacatc cagatggagg accccacctt taaggagaat
3120
tacaggtttc acgccatcaa cggctacatc atggacacac tgccaggcct ggtgatggca
3180
caggatcaga ggatcagatg gtatctgctg agcatgggct ccaacgagaa catccactcc
3240
atccacttca gcggccacgt gtttaccgtg agaaagaagg aggagtacaa gatggccctg
3300
tacaacctgt atcccggcgt gttcgaaacc gtggagatgc tgccttccaa agccggaatc
3360
tggagagtgg agtgcctgat tggcgagcac ctgcacgctg gaatgtccac cctgttcctg
3420
gtgtatagca acaagtgcca gacccccctg ggcatggcta gcggacacat tagagacttt
3480
cagatcaccg cctccggcca gtacggacag tgggccccaa aactggctag gctgcattac
3540
agcggctcca tcaatgcctg gtccaccaag gagccattca gctggatcaa agtggatctg
3600
ctggccccca tgatcatcca cggcattaag acacagggcg ccaggcagaa gttcagctct
3660
ctgtacatct cccagttcat catcatgtac tccctggacg gcaagaagtg gcagacctac
3720
aggggcaata gcaccggcac actgatggtg tttttcggca acgtggactc ttccggcatc
3780
aagcacaaca tctttaaccc ccctatcatc gccaggtaca tcaggctgca ccccactcac
3840
tacagcatca gatccaccct gagaatggag ctgatgggat gcgacctgaa cagctgcagc
3900
atgcccctgg gcatggagag caaggccatt tctgacgccc agatcaccgc cagcagctat
3960
ttcaccaata tgttcgctac ctggagcccc agcaaggcca gactgcatct gcagggcaga
4020
agcaacgcct ggagaccaca ggtgaacaat cctaaagagt ggctgcaggt ggacttccag
4080
aagaccatga aggtgaccgg cgtgacaacc cagggcgtga aatctctgct gacctccatg
4140
tacgtgaagg agttcctgat ctcctccagc caggatggcc atcagtggac cctgttcttc
4200
cagaacggca aggtgaaagt gttccagggc aaccaggaca gctttacccc tgtggtgaac
4260
tctctggatc cccccctgct gaccaggtac ctgagaattc acccccagag ctgggtgcac
4320
cagatcgccc tgagaatgga agtgctggga tgcgaggcac aggacctgta c
4371
<210> 10
<211> 4371
<212> DNA
<213> Искусственная последовательность
<220>
<223> Кодон-оптимизированная нуклеотидная последовательность,
кодирующая белок FVIII-BDD с сигнальным пептидом (вариант
FVIII-BDDco-v4)
<400> 10
atgcagatcg agctgtccac ctgcttcttc ctgtgcctgc tgcgcttctg tttctctgct
60
acccggaggt actacctggg cgctgtggag ctgagctggg actacatgca gagcgatctg
120
ggcgagctgc ccgtggatgc cagatttccc ccaagagtgc ctaagtcctt ccccttcaac
180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc
240
gccaagccaa ggcccccctg gatgggactg ctgggaccta caattcaggc cgaggtgtac
300
gataccgtgg tgatcaccct gaagaacatg gcctcccacc cagtgtccct gcatgccgtg
360
ggcgtgagct actggaaggc ttctgaaggc gccgagtacg acgaccagac cagccagagg
420
gagaaggagg acgacaaggt gttcccaggc ggatctcaca cctacgtgtg gcaggtgctg
480
aaggagaatg gcccaatggc cagcgaccca ctgtgtctga cctacagcta cctgtcccac
540
gtggacctgg tgaaggacct gaactccggc ctgatcggcg ccctgctggt gtgtagagaa
600
ggatctctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg
660
tttgacgagg gcaagagctg gcattccgag accaagaaca gcctgatgca ggacagagac
720
gcagccagcg ctagagcctg gcccaagatg cacaccgtga atggctacgt gaaccggtcc
780
ctgccaggcc tgatcggctg tcacagaaaa agcgtgtact ggcacgtgat cggcatgggc
840
accacacccg aggtgcacag catctttctg gagggccaca ccttcctggt gagaaaccac
900
aggcaggcct ccctggagat ctcccccatc acctttctga ccgcccagac cctgctgatg
960
gatctgggcc agttcctgct gttctgccac atcagctccc accagcacga cggaatggag
1020
gcctacgtga aggtggatag ctgccccgag gagccccagc tgagaatgaa gaacaacgag
1080
gaggccgagg actacgacga tgacctgacc gattccgaga tggacgtggt gcgcttcgac
1140
gacgataata gccccagctt catccagatc agatccgtgg ccaagaagca cccaaagacc
1200
tgggtgcact acatcgctgc cgaggaggag gactgggatt acgccccact ggtgctggcc
1260
cctgatgaca gatcctacaa gagccagtac ctgaacaacg gcccccagag aatcggccgg
1320
aagtacaaga aggtgagatt catggcctac accgacgaga ccttcaagac cagggaagcc
1380
atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg cgataccctg
1440
ctgatcatct tcaagaacca ggcctcccgg ccctacaaca tctaccccca cggcatcacc
1500
gacgtgaggc cactgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc
1560
cccatcctgc ccggcgagat ctttaagtac aagtggaccg tgaccgtgga ggacggccca
1620
accaagagcg acccaagatg cctgaccagg tactactcct ccttcgtgaa catggagcgg
1680
gatctggcca gcggactgat tggccctctg ctgatctgct acaaggagag cgtggaccag
1740
cgcggcaatc agatcatgag cgacaagaga aacgtgatcc tgttcagcgt gttcgacgag
1800
aatcgcagct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc agccggcgtg
1860
cagctggaag atcctgaatt tcaggccagc aacatcatgc actccatcaa cggctacgtg
1920
ttcgactccc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgagc
1980
atcggcgccc agaccgactt cctgtccgtg ttcttttccg gctacacctt caagcacaag
2040
atggtgtacg aggacaccct gaccctgttc ccctttagcg gcgagaccgt gttcatgagc
2100
atggagaacc caggcctgtg gattctgggc tgccacaaca gcgacttccg caataggggc
2160
atgaccgccc tgctgaaagt gtccagctgc gataagaaca ccggcgacta ctacgaggac
2220
agctacgagg acatctccgc ctacctgctg agcaagaaca acgccatcga gcccagatcc
2280
ttcagccaga accctccagt gctgaagagg caccagcgcg agatcaccag aaccaccctg
2340
cagtctgatc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag
2400
gacttcgaca tctacgacga ggacgagaac cagagcccta ggtccttcca gaagaagacc
2460
cggcactact tcatcgccgc agtggagagg ctgtgggatt acggcatgag cagctcccca
2520
cacgtgctga gaaatagggc ccagagcggc agcgtgcccc agttcaaaaa ggtggtgttc
2580
caggagttca ccgacggctc cttcacccag cccctgtaca gaggcgagct gaatgagcac
2640
ctgggcctgc tgggacccta catcagagca gaggtggagg acaacatcat ggtgaccttc
2700
aggaaccagg ccagcagacc ctacagcttc tacagcagcc tgatcagcta cgaggaggac
2760
cagagacagg gagccgagcc acgcaagaac ttcgtgaagc ccaacgagac caagacctac
2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgattg taaagcctgg
2880
gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggacctctg
2940
ctggtgtgtc ataccaacac cctgaacccc gcccacggca gacaggtgac tgtgcaggag
3000
tttgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg
3060
gagagaaact gcagggcccc atgcaacatc cagatggaag accccacctt caaggagaac
3120
taccggttcc acgccatcaa cggctacatc atggataccc tgcctggcct ggtgatggcc
3180
caggatcaga gaatcaggtg gtacctgctg agcatgggct ccaacgagaa catccacagc
3240
atccacttct ccggccacgt gttcaccgtg aggaaaaagg aggagtacaa gatggccctg
3300
tacaacctgt accccggcgt gtttgagacc gtggagatgc tgccatctaa ggccggcatt
3360
tggagagtgg agtgcctgat cggcgagcac ctgcacgccg gaatgtctac cctgttcctg
3420
gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggacacat cagagacttc
3480
cagatcaccg ccagcggcca gtacggacag tgggctccta aactggcccg cctgcactat
3540
agcggcagca ttaacgcctg gtccaccaag gagccattca gctggatcaa ggtggatctg
3600
ctggccccca tgatcatcca cggcatcaaa acacagggcg ccagacagaa gttctccagc
3660
ctgtacatct cccagttcat catcatgtac tccctggacg gcaagaagtg gcagacctac
3720
agaggcaact ccaccggcac actgatggtg ttcttcggca acgtggacag cagcggcatc
3780
aagcacaaca tcttcaaccc ccccatcatc gcccggtaca tcagactgca cccaacccac
3840
tactccatca ggtccaccct gaggatggag ctgatgggct gcgatctgaa ttcctgcagc
3900
atgcccctgg gcatggagtc caaagccatc tctgacgccc agatcaccgc cagctcctac
3960
ttcaccaaca tgttcgccac ttggagcccc agcaaggcca gactgcacct gcagggcaga
4020
agcaatgcct ggagacccca ggtgaacaac ccaaaggagt ggctgcaggt ggacttccag
4080
aagaccatga aggtgaccgg cgtgaccaca cagggcgtga aaagcctgct gaccagcatg
4140
tacgtgaagg agttcctgat cagctccagc caggatgggc accagtggac cctgttcttt
4200
cagaacggca aggtgaaggt gttccagggc aatcaggact cattcacccc tgtggtgaac
4260
tctctggacc cccccctgct gacccggtac ctgagaatcc acccacagtc ttgggtgcac
4320
cagatcgccc tgaggatgga agtgctgggc tgcgaggctc aggatctgta c
4371
<210> 11
<211> 1438
<212> PRT
<213> Искусственная последовательность
<220>
<223> белок FVIII-BDD (фактор свёртывания крови VIII c делетированным
B
доменом)
<400> 11
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe
1010 1015 1020
His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met
1025 1030 1035 1040
Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn
1045 1050 1055
Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg
1060 1065 1070
Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val
1075 1080 1085
Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1090 1095 1100
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe
1105 1110 1115 1120
Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly
1125 1130 1135
His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp
1140 1145 1150
Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp
1155 1160 1165
Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1170 1175 1180
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser
1185 1190 1195 1200
Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys
1205 1210 1215
Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe
1220 1225 1230
Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile
1250 1255 1260
Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys
1265 1270 1275 1280
Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile
1285 1290 1295
Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser
1300 1305 1310
Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln
1315 1320 1325
Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
1330 1335 1340
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser
1345 1350 1355 1360
Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln
1365 1370 1375
Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn
1380 1385 1390
Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu
1395 1400 1405
Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1410 1415 1420
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1425 1430 1435
<210> 12
<211> 1457
<212> PRT
<213> Искусственная последовательность
<220>
<223> белок FVIII-BDD с сигнальным пептидом
<400> 12
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu
755 760 765
Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln
770 775 780
Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu
785 790 795 800
Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe
805 810 815
Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp
820 825 830
Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln
835 840 845
Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
850 855 860
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His
865 870 875 880
Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile
885 890 895
Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser
900 905 910
Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
915 920 925
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val
930 935 940
Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp
945 950 955 960
Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu
965 970 975
Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His
980 985 990
Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
995 1000 1005
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys
1010 1015 1020
Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn
1025 1030 1035 1040
Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly
1045 1050 1055
Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1060 1065 1070
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe
1075 1080 1085
Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr
1090 1095 1100
Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile
1105 1110 1115 1120
Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser
1125 1130 1135
Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met
1140 1145 1150
Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
1155 1160 1165
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile
1170 1175 1180
Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu
1185 1190 1195 1200
Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln
1205 1210 1215
Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu
1220 1225 1230
Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1235 1240 1245
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile
1250 1255 1260
Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His
1265 1270 1275 1280
Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
1285 1290 1295
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1300 1305 1310
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp
1315 1320 1325
Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp
1330 1335 1340
Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln
1345 1350 1355 1360
Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu
1365 1370 1375
Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp
1380 1385 1390
Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
1395 1400 1405
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro
1410 1415 1420
Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His
1425 1430 1435 1440
Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu
1445 1450 1455
Tyr
<210> 13
<211> 130
<212> DNA
<213> Природная последовательность
<220>
<223> Левый (первый) ITR (инвертированные концевые повторы)
<400> 13
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt
60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact
120
aggggttcct
130
<210> 14
<211> 252
<212> DNA
<213> Искусственная последовательность
<220>
<223> Промотор HLP
<400> 14
tgtttgctgc ttgcaatgtt tgcccatttt agggtggaca caggacgctg tggtttctga
60
gccagggggc gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac
120
tggggtgacc ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg
180
cttaaatacg gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg
240
ggacagtgaa tc
252
<210> 15
<211> 60
<212> DNA
<213> Искусственная последовательность
<220>
<223> Сигнал полиаденилирования
<400> 15
cgcgaataaa agatctttat tttcattaga tctgtgtgtt ggttttttgt gtgatgcagc
60
<210> 16
<211> 141
<212> DNA
<213> Природная последовательность
<220>
<223> Правый ITR
<400> 16
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc
120
gagcgcgcag ctgcctgcag g
141
<210> 17
<211> 57
<212> DNA
<213> Искусственная последовательность
<220>
<223> Нуклеиновая кислота, кодирующую сигнальный пептид
<400> 17
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagt
57
<210> 18
<211> 57
<212> DNA
<213> Искусственная последовательность
<220>
<223> Нуклеиновая кислота, кодирующую сигнальный пептид
<400> 18
atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttcagc
57
<210> 19
<211> 57
<212> DNA
<213> Искусственная последовательность
<220>
<223> Нуклеиновая кислота, кодирующую сигнальный пептид
<400> 19
atgcagatcg agctgagcac ctgttttttt ctgtgcctgc tgaggttctg cttctcc
57
<210> 20
<211> 57
<212> DNA
<213> Искусственная последовательность
<220>
<223> Нуклеиновая кислота, кодирующую сигнальный пептид
<400> 20
atgcagatcg agctgagcac ctgtttcttc ctgtgcctgc tgaggttctg tttcagc
57
<210> 21
<211> 57
<212> DNA
<213> Искусственная последовательность
<220>
<223> Нуклеиновая кислота, кодирующую сигнальный пептид
<400> 21
atgcagatcg agctgtccac ctgcttcttc ctgtgcctgc tgcgcttctg tttctct
57
<210> 22
<211> 19
<212> PRT
<213> Искусственная последовательность
<220>
<223> сигнальный пептид
<400> 22
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser
<---
название | год | авторы | номер документа |
---|---|---|---|
Выделенная нуклеиновая кислота, которая кодирует слитый белок на основе FVIII-BDD и гетерологичного сигнального пептида, и ее применение | 2022 |
|
RU2818229C2 |
МОЛЕКУЛЫ НУКЛЕИНОВОЙ КИСЛОТЫ И ПУТИ ИХ ПРИМЕНЕНИЯ | 2018 |
|
RU2819144C2 |
ПРИМЕНЕНИЕ ЛЕНТИВИРУСНЫХ ВЕКТОРОВ, ЭКСПРЕССИРУЮЩИХ ФАКТОР VIII | 2019 |
|
RU2803163C2 |
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 | 2020 |
|
RU2760301C1 |
ГЕННАЯ ТЕРАПИЯ ДЛЯ ЛЕЧЕНИЯ ГЕМОФИЛИИ A | 2017 |
|
RU2762257C2 |
Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок SMN1, и ее применение | 2020 |
|
RU2742837C1 |
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 | 2020 |
|
RU2783313C1 |
КОДИРУЮЩИЕ ФАКТОР VIII ВАРИАНТЫ С ПОНИЖЕННЫМ СОДЕРЖАНИЕМ CPG, КОМПОЗИЦИИ И СПОСОБЫ И ПРИМЕНЕНИЕ В ЛЕЧЕНИИ НАРУШЕНИЙ ГЕМОСТАЗА | 2016 |
|
RU2745506C2 |
СПОСОБЫ ГЕНОТЕРАПИИ С ИСПОЛЬЗОВАНИЕМ ГЕНА ФАКТОРА VIII (FVIII) | 2018 |
|
RU2808274C2 |
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 | 2021 |
|
RU2761879C1 |
Изобретение относится к области биотехнологии, конкретно к рекомбинантному получению белка фактора свертывания крови VIII с делетированным В доменом (FVIII-BDD), и может быть использовано в генной терапии гемофилии А для доставки гена FVIII-BDD в целевые клетки. Предложены кодон-оптимизированные варианты кодирующих FVIII-BDD нуклеиновых кислот и экспрессионные конструкции для их доставки в целевые клетки. Изобретение обеспечивает получение препарата, обладающего высоким потенциалом для генной терапии гемофилии А. 6 н. и 3 з.п. ф-лы, 6 ил., 4 пр.
1. Выделенная кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) с аминокислотной последовательностью SEQ ID NO: 11, которая включает нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 или SEQ ID NO: 5.
2. Экспрессионная кассета, которая включает нуклеиновую кислоту по п. 1.
3. Экспрессионная кассета по п. 2, включающая следующие элементы в направлении от 5'-конца к 3'-концу:
левый (первый) ITR (инвертированные концевые повторы);
промотор;
нуклеиновую кислоту, кодирующую сигнальный пептид;
нуклеиновую кислоту по п. 1;
сигнал полиаденилирования;
правый (второй) ITR.
4. Экспрессионный вектор, который включает нуклеиновую кислоту по п. 1 или экспрессионную кассету по любому из пп. 2, 3.
5. Экспрессионный вектор по п. 4, где экспрессионный вектор представляет собой рекомбинантный аденоассоциированный вирус (AAV).
6. Экспрессионный вектор по п. 5, где AAV выбирают из группы, включающей следующие серотипы AAV: AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 AAV11, AAV12, AAV13, AAV14, AAV15, AAV16, rAAV.rh8, rAAV.rh10, rAAV.rh20, rAAV.rh39, rAAV.Rh74, rAAV.RHM4-1, AAV.hu37, rAAV.Anc80, rAAV.Anc80L65, rAAV.7m8, rAAV.PHP.B, rAAV2.5, rAAV2tYF, rAAV3B, rAAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15 или AAV.HSC16.
7. Фармацевтическая композиция для доставки гена FVIII-BDD в целевые клетки, включающая выделенную кодон-оптимизированную нуклеиновую кислоту по п. 1, экспрессионный вектор по любому из пп. 4-6 или кассету по любому из пп. 2, 3 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.
8. Применение выделенной кодон-оптимизированной нуклеиновой кислоты по п. 1, экспрессионного вектора по любому из пп. 4-6, кассеты по любому из пп. 2, 3 или композиции по п. 7 для доставки гена FVIII-BDD в целевые клетки.
9. Способ доставки гена FVIII-BDD в целевые клетки, включающий введение выделенной кодон-оптимизированной нуклеиновой кислоты по п. 1, экспрессионного вектора по любому из пп. 4-6, кассеты по любому из пп. 2, 3 или композиции по п. 7 в целевые клетки.
Ребристая труба для центрального отопления | 1933 |
|
SU38288A1 |
ГЕННАЯ ТЕРАПИЯ ДЛЯ ЛЕЧЕНИЯ ГЕМОФИЛИИ A | 2017 |
|
RU2762257C2 |
RU 2020108209 А, 02.09.2021 | |||
КОДИРУЮЩИЕ ФАКТОР VIII ВАРИАНТЫ С ПОНИЖЕННЫМ СОДЕРЖАНИЕМ CPG, КОМПОЗИЦИИ И СПОСОБЫ И ПРИМЕНЕНИЕ В ЛЕЧЕНИИ НАРУШЕНИЙ ГЕМОСТАЗА | 2016 |
|
RU2745506C2 |
WO 2020041773 A1, 27.02.2020. |
Авторы
Даты
2023-11-29—Публикация
2022-04-28—Подача