Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок фактора свёртывания крови VIII c делетированным B доменом, и ее применение Российский патент 2023 года по МПК C07K14/755 C12N15/12 C12N15/86 C12N5/10 A61K48/00 A61P7/04 

Описание патента на изобретение RU2808564C2

Область техники, к которой относится изобретение

Настоящая заявка относится к области генетики, генной терапии и молекулярной биологии. Более конкретно, настоящее изобретение относится к кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом), экспрессионной кассете и вектору на ее основе, клетке-хозяину для получения FVIII-BDD, а также к различным применениям вышеуказанного вектора.

Уровень техники

Гемофилия - это рецессивное, Х-сцепленное, врожденное нарушение, ведущее к дефициту одного из белков, участвующих во вторичном гемостазе. Гемофилия А, или классическая гемофилия, - наиболее распространенная форма гемофилии; встречается у 1 из 5000 новорожденных мальчиков (Report on the annual global survey 2019, WFH https://www.wfh.org/en/our-work-research-data/annual-global-survey) и обусловлена дефицитом белка фактора свертывания VIII. Согласно данным Всероссийского общества гемофилии, в России насчитывается более 6,5 тыс.пациентов с гемофилией A (Report on the annual global survey 2019, WFH).

Фактор свертывания VIII (FVIII) - это белок размером 280 кДа, который секретируется в кровь преимущественно из синусоидальных эпителиальных клеток печени (Fahs SA, Hille МТ, Shi Q, Weiler Н, Montgomery RR. A conditional knockout mouse model reveals endothelial cells as the principal and possibly exclusive source of plasma factor VIII/ Blood. 2014 Jun 12;123(24):3706-13. doi: 10.1182/blood-2014-02-555151. Epub 2014 Apr 4. РМЮ: 24705491 и Everett LA, Cleuren AC, Khoriaty RN, Ginsburg D. Murine coagulation factor VIII is synthesized in endothelial cells/ Blood. 2014 Jun 12;123(24):3697-705. doi: 10.1182/blood-2014-02-554501. Epub 2014 Apr 9. PMTD: 24719406). Активированный FVIII циркулирует в организме в виде гетеродимера, состоящего из тяжелой (домены A1, А2, В) и легкой (домены A3, C1, С3) цепей, связанных друг с другом за счет нековалентных металл-зависимых взаимодействий. В результате процессинга FVIII в активированной форме белка присутствуют только домены А1-А3, C1, С2. Этот факт способствовал созданию рекомбинантного FVIII с удаленным В доменом (FVIII-BDD), который не уступает по своей активности полноразмерному FVIII (Pittman DD, Alderman EM, Tomkinson KN, Wang JH, Giles AR, Kaufman RJ. Biochemical, immunological, and in vivo functional characterization of B-domain-deleted factor VIII/ Blood. 1993 Jun l;81(ll):2925-35. PMID: 8499631). В отличии от других белков каскада свертывания крови, которые преимущественно относятся к протеазам, FVIII -гликопротеин. Однако он играет критичную роль в формировании теназного комплекса, который необходим для образования активированного фактора свертывания X (FXa), первого члена окончательного общего пути коагуляции, что в итоге приводит к образованию сшитого фибрина.

Более чем в половине случаев к тяжелой форме гемофилии А приводят инверсии в 1 или 22 интроне гена FVIII (Habart D, Kalabova D, Novotny M, Vorlova Z. Thirty-four novel mutations detected in factor VIII gene by multiplex CSGE: modeling of 13 novel amino acid substitutions/ J Thromb Haemost. 2003 Apr; 1(4):773-81. doi: 10.1046/j.1538-7836.2003.00149.x. PMID: 1287141/ В других случаях нарушения в последовательности FVIII связаны с различными мутациями, в том числе антисмысловыми мутациями, сдвигами рамки считывания, мутациями в сплайсинг-сайтах, делециями и инсерциями.

Склонность к кровотечениям при гемофилии А взаимосвязана с определяемой активностью FVIII и классифицируется как легкая (0,05-0,40 ME / мл), умеренная (0,01-0,05 ME / мл) или тяжелая (<0,01 ME / мл). Пациенты с легкой формой гемофилии, как правило, испытывают аномальное кровотечение только в связи с оперативным вмешательством или полученными травмами. Напротив, у пациентов с умеренной формой гемофилии наблюдаются длительные реакции кровотечения на относительно незначительные травмы, а у пациентов с тяжелой формой заболевания часто возникают спонтанные кровотечения. Тяжелая форма гемофилии А проявляется спонтанными гемартрозом, гематомами мягких тканей, забрюшинными кровотечениями, внутримозговыми кровоизлияниями и отсроченными послеоперационными кровотечениями. Со временем осложнения от рецидивирующего гемартроза и гематом мягких тканей включают тяжелую артропатию, контрактуры суставов и псевдоопухоли, приводящие к хроническим заболеваниям. Доля пациентов с легкой, средней и тяжелой формами гемофилии А точно не установлена, но, согласно последним эпидемиологическим исследованиям, предполагается, что примерно 60% пациентов с гемофилией А имеют тяжелую форму (Report on the annual global survey 2019, WFH).

На сегодняшний день стандартная схема лечения пациентов, страдающих гемофилией А, заключается в пожизненной заместительной терапии в виде инъекций рекомбинантного FVIII (Report on the annual global survey 2019, WFH). Несмотря на успех терапии гемофилии, существуют серьезные проблемы подобного подхода. Профилактическая заместительная терапия гемофилии А предполагает внутривенные инъекции рекомбинантного FVIII каждые три дня в течение всей жизни пациента с тяжелой формой заболевания. Подобный формат лечения является очень дорогостоящим и не гарантирует отсутствия осложнений, связанных в первую очередь с гемартрозом. В некоторых случаях у пациентов вырабатываются ингибирующие антитела. Ингибиторные формы гемофилии А чаще наблюдаются у пациентов с тяжелой формой заболевания и требуют применения альтернативных подходов к лечению и профилактике заболевания (Eckhardt CL, van der Bom JG, van der Naald M, Peters M, Kamphuisen PW, Fijnvandraat K. Surgery and inhibitor development in hemophilia A: a systematic review/ J Thromb Haemost. 2011 Oct; 9(10): 1948-58. doi: 10.1ll1/j. 1538-7836.2011.04467.x. PMID: 21838755).

Генная терапия гемофилии А посредством вирусных (экспрессионных) векторов на основе аденоассоциированных вирусов (AAV), кодирующих ген FVIII, показала впечатляющие результаты в серии доклинических и клинических исследований (Bunting S, Zhang L, Xie L, Bullens S, Mahimkar R, Fong S, Sandza K, Harmon D, Yates B, Handyside B, Sihn CR, Galicia N, Tsuruda L, O'Neill CA, Bagri A, Colosi P, Long S, Vehar G, Carter B. Gene Therapy with BMN 270 Results in Therapeutic Levels of FVIII in Mice and Primates and Normalization of Bleeding in Hemophilic Mice/ Mol Ther. 2018 Feb 7;26(2):496-509. doi: 10.1016/j.ymthe. 2017.12.009. Epub 2017 Dec 14.PMID: 29292164 и Peyvandi F, Garagiola I. Clinical advances in gene therapy updates on clinical trials of gene therapy in haemophilia/ Haemophilia. 2019 Sep;25(5):738-746. doi: 10.1111/hae. 13816. Epub 2019 Jul 8.PMTD: 31282050). В отличие от традиционных подходов к лечению гемофилии, генная терапия с использованием AAV позволяет поддерживать уровень экспрессии привнесенного FVIII на достаточном уровне в течение нескольких лет после однократного введения препарата пациентам (Long BR, Veron Р, Kuranda К, Hardet R, Mitchell N, Hayes GM, Wong WY, Lau K, Li M, Hock MB, Zoog SJ, Vettermann C, Mingozzi F, Schweighardt B. Early Phase Clinical Immunogenicity of Valoctocogene Roxaparvovec, an AAV5-Mediated Gene Therapy for Hemophilia А/ Mol Ther. 2021 Feb 3;29(2): 597-610. doi: 10.1016/j.ymthe.2020.12.008. Epub 2020 Dec 10. PMID: 33309883).

На данный момент, в мире нет ни одного зарегистрированного генотерапевтического препарата для лечения гемофилии А.

Таким образом, является актуальным разработка генотерапевтического препарата для лечения гемофилии А, а также решений, которые позволят улучшить эффективность генотерапевтического препарата для лечения гемофилии А.

Раскрытие сущности изобретения

Одной из насущных целей исследований в области разработки эффективной генотерапии является кодон-оптимизация генов интереса в составе векторов для получения максимального уровня продукции белка интереса, что, в свою очередь, позволит использовать для достижения значимого эффекта более низкие дозы вектора.

Авторы изобретения неожиданно обнаружили, что кодон-оптимизиро ванная нуклеиновая кислота, которая кодирует белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) с аминокислотной последовательностью SEQ ID NO: 11 и включает нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 2 (вариант FVIII-BDDco-v1), SEQ ID NO: 3 (вариант FVIII-BDDco-v2), SEQ ID NO: 4 (вариант FVIII-BDDco-v3) или SEQ ID NO: 5 (вариант FVIII-BDDco-v4), неожиданно приводит к увеличению уровня экспрессии гена FVIII-BDD, увеличению уровня продукции белка фактора свертывания крови VIII-BDD, а также увеличению уровня активности белка фактора свертывания крови VIII-BDD в несколько раз по сравнению с геном дикого типа, кодирующим фактор свертывания крови VIII-BDD (FVIII-BDD-wt). Данные варианты кодон-оптимизированной нуклеиновой кислоты по изобретению с нуклеотидной последовательностью, которую выбирают из группы: SEQ ID NO: 2 (вариант FVIII-BDDco-v1), SEQ ID NO: 3 (вариант FVIII-BDDco-v2), SEQ ID NO: 4 (вариант FVIII-BDDco-v3) или SEQ ID NO: 5 (вариант FVIII-BDDco-v4) входят в состав экспрессионной кассеты и вектора на ее основе.

Определения и общие методы

Если иное не определено в настоящем документе, научные и технические термины, используемые в связи с настоящим изобретением, будут иметь значения, которые обычно понятны специалистам в данной области.

Кроме того, если по контексту не требуется иное, термины в единственном числе включают в себя термины во множественном числе, и термины во множественном числе включают в себя термины в единственном числе. Как правило, используемая классификация и методы культивирования клеток, молекулярной биологии, иммунологии, микробиологии, генетики, аналитической химии, химии органического синтеза, медицинской и фармацевтической химии, а также гибридизации и химии белка и нуклеиновых кислот, описанные в настоящем документе, хорошо известны специалистам и широко применяются в данной области. Ферментативные реакции и способы очистки осуществляют в соответствии с инструкциями производителя, как это обычно осуществляется в данной области, или как описано в настоящем документе.

Определения «встречающийся в природе», «нативный» или «дикого типа» используют для описания объекта, который можно обнаружить в природе как отличающийся от получаемого искусственно. Например, белок или нуклеотидная последовательность, присутствующие в организме, в том числе в составе вируса, которые можно изолировать из источника в природе, и которые не модифицированы умышленно специалистом в лаборатории, являются встречающимися в природе.

В настоящем описании и в последующей формуле изобретения, если контекстом не предусмотрено иное, слова «включать» и «содержать» или их вариации, такие как «включает», «включающий», «содержит» или «содержащий», следует понимать как включение указанного целого или группы целых, но не исключение любого другого целого или группы целых.

Белок (Пептид)

В настоящем описании термины «пептид», «полипептид» и «белок» используют взаимозаменяемо, и они относятся к соединению, состоящему из аминокислотных остатков, ковалентно связанных пептидными связями. Полипептиды включают природные пептиды, рекомбинантные пептиды, синтетические пептиды или их комбинацию.

Молекулы нуклеиновых кислот

Термины «нуклеиновая кислота», «нуклеиновая последовательность» или «нуклеиновокислотная последовательность», «полинуклеотид», «олигонуклеотид», «полинуклеотидная последовательность» и «нуклеотидная последовательность», которые используются равнозначно в данном описании, обозначают четкую последовательность нуклеотидов, модифицированных или не модифицированных, определяющую фрагмент или участок нуклеиновой кислоты, содержащую или не содержащую неприродные нуклеотиды и являющуюся либо двухцепочечной ДНК или РНК, либо одно цепочечной ДНК или РНК, либо продуктами транскрипции указанных ДНК.

Как применяют в настоящем описании, полинуклеотиды включают, в качестве неограничивающих примеров, все последовательности нуклеиновой кислоты, получаемые любыми способами, доступными в этой области, включая, в качестве неограничивающих примеров, рекомбинантные способы, т.е. клонирование последовательностей нуклеиновой кислоты из рекомбинантной библиотеки или генома клетки, использование обычной технологии клонирования и ПЦР и т.п., и способами синтеза.

Здесь также следует упомянуть, что данное изобретение не относится к нуклеотидным последовательностям в их природной хромосомной среде, т.е. в природном состоянии. Последовательности данного изобретения были выделены и/или очищены, т.е. были взяты прямо или косвенно, например, путем копирования, при этом их среда была по меньшей мере частично модифицирована. Таким образом, также здесь следует подразумевать изолированные нуклеиновые кислоты, полученные путем генетической рекомбинации, например, с помощью принимающих клеток (клеток-хозяев), или полученные путем химического синтеза.

Термин нуклеотидная последовательность охватывает его комплемент, если не указано иное. Таким образом, нуклеиновую кислоту, имеющую определенную последовательность следует понимать как охватывающие ее комплементарную цепь с ее комплементарной последовательностью.

Вектор

Термин «вектор» при использовании в настоящем документе означает молекулу нуклеиновой кислоты, способную транспортировать другую нуклеиновую кислоту, с которой она соединена. Кроме того, термин «вектор» в данном настоящем документе означает рекомбинантную вирусную частицу, способную транспортировать нуклеиновую кислоту.

Как применяют в настоящем описании, термин «экспрессия» определяют как транскрипцию и/или трансляцию конкретной нуклеотидной последовательности, запускаемую ее промотором.

Применение

«Генная терапия» представляет собой вставку генов в клетки и/или ткани субъекта для лечения заболевания, обычно, наследственных заболеваний, при этом дефектный мутантный аллель заменяется или дополняется функциональным аллелем.

«Лечить», «лечение» и «терапия» относятся к методу смягчения или устранения биологического расстройства и/или по меньшей мере одного из сопутствующих ему симптомов.

Термин «субъект», «пациент», «индивидуум» и т.п. используют в настоящем описании взаимозаменяемо, и они относятся к любому животному, которое поддается воздействию способами, представленными в настоящем описании. В конкретных неограничивающих вариантах осуществления субъект, пациент или индивидуум является человеком. Вышеупомянутый субъект может быть мужского или женского пола любого возраста.

«Терапевтически эффективным количеством» или «эффективным количеством» считается количество вводимого терапевтического агента, которое избавит в определенной степени от одного или нескольких симптомов заболевания, по поводу которого проводится лечение.

Подробное описание изобретения

Нуклеиновая кислота

В одном из аспектов настоящее изобретение относится к выделенной кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) с аминокислотной последовательностью SEQ ID NO: 11 и включает нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 или SEQ ID NO: 5.

«Выделенная» молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, которая идентифицирована и отделена от по меньшей мере одной молекулы нуклеиновой кислоты-примеси. Выделенная молекула нуклеиновой кислоты отличается от той формы или набора, в которых она находится в естественных условиях. Таким образом, выделенная молекула нуклеиновой кислоты отличается от молекулы нуклеиновой кислоты, существующей в клетках в естественных условиях.

Одним из свойств генетического кода является вырожденность - способность разных кодонов (тринуклеотидов) кодировать одну и ту же аминокислоту. Такие кодоны, которые дают одну и ту же аминокислоту в процессе трансляции, называются синонимичными. В природных последовательностях выбор одного из синонимичных кодонов осуществляется случайным образом в процессе эволюции, однако частоты использования синонимичных кодонов отличаются: для каждой аминокислоты есть более и менее предпочтительные. Кодон-оптимизация - это широко используемая в мире техника, направленная на повышение продуктивности наработки белковых молекул, которая заключается в рациональном сопоставлении каждой аминокислоте в белковой последовательности одного из подходящих синонимичных кодонов. Один из распространенных принципов кодон-оптимизации подразумевает использование наиболее частых кодонов, впоследствии были предложены и другие подходы, такие как гармонизация (воспроизведение распределения частот используемых кодонов), но и они не всегда дают увеличение продуктивности. Помимо частот кодонов на эффективность наработки может влиять GC-состав последовательности (отношение количества гуанинов и цитозинов к суммарной длине последовательности), в частности, было показано, что завышенный GC-состав ассоциирован с повышением количества мРНК в клетках млекопитающих Grzegorz Kudla ЕТ AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, June 2006, Volume 4, Issue 6, el80, pp. 933-942). Также стоит отметить, что устойчивые элементы вторичной структуры мРНК, т.е. имеющие низкую свободную энергию фолдинга, могут снижать эффективность.

Различные варианты кодон-оптимизации последовательности гена интереса могут приводить к следующему (в сравнение с геном дикого типа):

а) уровень экспрессии генов интереса будет незначительно увеличен;

б) уровень экспрессии генов интереса будет значительно увеличен;

в) уровень экспрессии генов интереса останется приблизительно на том же уровне;

г) уровень экспрессии генов интереса будет понижен.

Для получения вышеуказанной кодон-оптимизированной нуклеиновой кислоты по изобретению была проведена кодон-оптимизации нуклеиновой кислоты дикого типа с нуклеотидной последовательностью SEQ ID NO: 1.

В результате кодон-оптимизации нуклеиновой кислоты дикого типа, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 1 был получен ряд кодон-оптимизированных нуклеиновых кислот, которые были в дальнейшем протестированы на уровень продукции белка по сравнению с контролем FVIII-BDD-wt (нуклеиновая кислота дикого типа с SEQ ID N0:1).

Все кодон-оптимизированные нуклеиновые кислоты приводили к увеличению уровня продукции белка FVIII-BDD по сравнению с нуклеиновой кислотой дикого типа, при этом ряд кодон-оптимизированных нуклеиновых кислот приводил к незначительному увеличению уровня продукции белка FVIII-BDD по сравнению с нуклеиновой кислотой дикого типа. В свою очередь, кодон-оптимизированная нуклеиновая кислота по изобретению, которую выбирают из группы: SEQ ID NO: 2 (вариант FVIII-BDDco-v1), SEQ ID NO: 3 (вариант FVIII-BDDco-v2), SEQ ID NO: 4 (вариант FVIII-BDDco-v3) или SEQ ID NO: 5 (вариант FVIII-BDDco-v4), неожиданно приводит к увеличению уровня экспрессии гена FVIII-BDD, увеличению уровня продукции белка фактора свертывания крови VIII-BDD, а также увеличению уровня активности белка фактора свертывания крови VIII-BDD в несколько раз по сравнению с геном дикого типа (FVIII-BDD-wt).

Экспрессионная кассета. Экспрессионный вектор.

В одном из аспектов настоящее изобретение относится к экспрессионной кассете, которая включает любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD.

Термин «кассета, которая экспрессирует» или «экспрессионная кассета» при использовании в данном документе, в частности, относится к фрагменту ДНК, который способен в соответствующей обстановке запускать экспрессию полинуклеотида, кодирующего представляющий интерес полипептид, последовательность которого включена в указанную экспрессионную кассету. При введении в клетку-хозяина экспрессионная кассета помимо прочего способна задействовать клеточные механизмы для транскрипции полинуклеотида, кодирующего представляющий интерес полипептид, в РНК, которая затем обычно дополнительно процессируется и, наконец, транслируется в представляющий интерес полипептид. Экспрессионная кассета может содержаться в экспрессионном векторе.

Экспрессионная кассета по настоящему изобретению содержит в качестве элемента промотор. Термин «промотор», используемый в настоящем документе, в частности, относится к элементу ДНК, который способствует транскрипции полинуклеотида, с которым функционально связан промотор. Промотор может также составлять часть элемента «промотор/энхансер». Хотя физические границы между элементами «промотор» и «энхансер» не всегда ясны, термин «промотор» обычно относится к месту на молекуле нуклеиновой кислоты, с которым связывается РНК-полимераза и/или связанные с ней факторы, и с которого инициируется транскрипция. Энхансеры усиливают активность промотора во времени, а также пространственно. В данной области известно множество промоторов, которые транскрипционно активны в широком диапазоне типов клеток. Промоторы могут быть разделены на два класса: на тех, которые функционируют конститутивно, и тех, которые регулируются индукцией или снятием репрессии. Для экспрессии белка пригодны оба класса. Промоторы, которые используются для продукции высокого уровня полипептидов в эукариотических клетках и, в частности, в клетках млекопитающих, должны быть сильными и, предпочтительно, должны быть активными в широком диапазоне типов клеток. Сильные конститутивные промоторы, которые способны запускать экспрессию во многих типах клеток, хорошо известны в данной области и, поэтому, нет необходимости в их подробном описании в данном документе.

Согласно одному варианту осуществления изобретения промотор HLP используется в экспрессионной кассете по настоящему изобретению.

В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:

левый (первый) ITR (инвертированные концевые повторы);

промотор;

нуклеиновую кислоту, кодирующую сигнальный пептид;

любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD;

сигнал полиаденилирования;

правый (второй) ITR.

Вышеуказанные структурные элементы экспрессионной кассеты являются функционально связанными между собой.

В контексте настоящего описания термин «функционально связанный» относится к связи полинуклеотидных (или полипептидных) элементов в функциональную связь. Нуклеиновая кислота является «функционально связанной», если она находится в условиях функциональной связи с другой последовательностью нуклеиновой кислоты. Например, регуляторная последовательность транскрипции функционально связана с кодирующей последовательностью, если она влияет на транскрипцию указанной кодирующей последовательности. Термин «функционально связанный» означает, что связанные последовательности ДНК являются, как правило, непрерывными, и при необходимости соединения двух участков, кодирующих белок, являются также непрерывными и находятся в рамке считывания.

В некоторых вариантах экспрессионная кассета включает левый (первый) ITR с нуклеотидной последовательностью SEQ ID NO: 13.

В некоторых вариантах экспрессионная кассета включает промотор HLP с нуклеотидной последовательностью SEQ ID NO: 14.

В некоторых вариантах экспрессионная кассета включает сигнал полиаденилирования с нуклеотидной последовательностью SEQ ID NO: 15.

В некоторых вариантах экспрессионная кассета включает правый (второй) ITR с нуклеотидной последовательностью SEQ ID NO: 16.

В некоторых вариантах нуклеиновая кислоту, кодирующая сигнальный пептид, имеет нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20 или SEQ ID NO: 21.

В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v1), имеет нуклеотидную последовательность SEQ ID NO: 7.

В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v2), имеет нуклеотидную последовательность SEQ ID NO: 8.

В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v3), имеет нуклеотидную последовательность SEQ ID NO: 9.

В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v4), имеет нуклеотидную последовательность SEQ ID NO: 10.

В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:

левый (первый) ITR (инвертированные концевые повторы) с нуклеотидной последовательностью SEQ ID NO: 13;

промотор с нуклеотидной последовательностью SEQ ID NO: 14;

нуклеиновую кислоту, кодирующую сигнальный пептид, который имеет нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20 или SEQ ID NO: 21;

любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD;

сигнал полиаденилирования с нуклеотидной последовательностью SEQ ID NO: 15;

правый (второй) ITR с нуклеотидной последовательностью SEQ ID NO: 16.

В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:

левый (первый) ITR (инвертированные концевые повторы) с нуклеотидной последовательностью SEQ ID NO: 13;

промотор с нуклеотидной последовательностью SEQ ID NO: 14;

кодон-оптимизированную нуклеиновую кислоту, кодирующую белок FVIII-BDD с сигнальным пептидом, которая имеет нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9 или SEQ ID NO: 10;

сигнал полиаденилирования с нуклеотидной последовательностью SEQ ID NO: 15;

правый (второй) ITR с нуклеотидной последовательностью SEQ ID NO: 16.

В одном из аспектов настоящее изобретение относится к экспрессионному вектору, который включает любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD, или любую из вышеуказанных экспрессионных кассет.

В некоторых вариантах осуществления изобретения вектор представляет собой плазмиду, т.е. кольцевую двухцепочечную часть ДНК, в которую могут быть вставлены дополнительные сегменты ДНК.

В некоторых вариантах осуществления изобретения вектор представляет собой вирусный (экспрессионный) вектор, в котором дополнительные сегменты ДНК могут быть вставлены в вирусный геном.

В некоторых вариантах осуществления изобретения векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, имеющие бактериальный сайт инициации репликации и эписомные векторы). В других вариантах осуществления изобретения векторы (например, неэписомальные векторы) могут быть интегрированы в геном клетки-хозяина при введении в клетку-хозяина, и таким образом реплицируются вместе с геном хозяина. Более того, некоторые векторы способны направлять экспрессию генов, с которыми они функционально соединены. Такие векторы упоминаются в данном документе как «рекомбинантные экспрессирующие векторы» (или просто «экспрессирующие векторы» («вектор экспрессии» или «экспрессионный вектор»)).

Экспрессионные векторы включают плазмиды, ретро вирусы, аденовирусы, аденоассоциированные вирусы (AAV), вирусы растений, такие как вирус мозаики цветной капусты, вирусы табачной мозаики, космиды, YAC, EBV и тому подобное. Молекулы ДНК могут быть вставлены в вектор таким образом, что последовательности, контролирующие транскрипцию и трансляцию в векторе, выполняют предусмотренную функцию регуляции транскрипции и трансляции ДНК. Экспрессионный вектор и последовательности контроля экспрессии могут быть выбраны таким образом, чтобы быть совместимыми с используемой экспрессирующей клеткой-хозяином. Молекулы ДНК могут быть введены в экспрессионный вектор стандартными способами (например, лигированием комплементарных сайтов рестрикции или лигированием тупых концов, если сайты рестрикции отсутствуют).

В некоторых вариантах экспрессионный вектор представляет собой рекомбинантный аденоассоциированный вирус (AAV).

В некоторых вариантах AAV выбирают из группы, включающей следующие серо типы AAV:

В некоторых вариантах осуществления изобретения вектор или кассета может включать последовательность контроля экспрессии. Термин «последовательность контроля экспрессии», используемый в данном описании, означает полинуклеотидные последовательности, которые необходимы для воздействия на экспрессию и процессинг кодирующих последовательностей, к которым они вставлены. Специалистам в этой области будет понятно, что дизайн экспрессионного вектора или кассеты, включая выбор последовательностей контроля экспрессии, может зависеть от таких факторов, как выбор типа клетки-хозяина для трансформации, требуемый уровень экспрессии белка, и т.д. Последовательности контроля экспрессии включают соответствующие последовательности инициации транскрипции, терминации, промотора и энхансера; эффективные сигналы процессинга РНК, такие как сплайсинг и сигналы полиаденилирования; последовательности, которые стабилизируют цитоплазматическую мРНК; последовательности, которые повышают эффективность трансляции (т.е. консенсусная последовательность Козака); последовательности, которые повышают стабильность белка; и, при желании, последовательности, которые усиливают секрецию белка. Характер таких контролирующих последовательностей различается в зависимости от организма-хозяина; в прокариотах такие контролирующие последовательности, как правило, включают промотор, сайт связывания рибосомы, а также последовательности терминации транскрипции; в эукариотах, как правило, такие контролирующие последовательности включают промоторы и последовательности терминации транскрипции. Предпочтительные последовательности контроля экспрессии для экспрессирующей клетки-хозяина млекопитающего включают вирусные элементы обеспечивающие высокий уровень экспрессии белков в клетках млекопитающих, таких как промоторы и/или энхансеры, полученные из ретровирусной LTR, цитомегаловируса (CMV) (например, CMV промотора/энхансера), обезьяньего вируса 40 (SV40) (например, SV40 промотора/энхансера), аденовируса, (например, большого позднего промотора аденовируса (AdMLP)), вирус полиомы, а также сильных промоторов млекопитающих, таких как TTR промотор, промотор нативных иммуноглобулинов, промотор актина, а также промотор HLP (hybrid liver-specific promotor). Последовательности контроля экспрессии включают, как минимум, все компоненты, наличие которых имеет важное значение для экспрессии и процессинга.

В дополнение к вышеуказанным генам и последовательностям контроля экспрессии, рекомбинантные векторы экспрессии изобретения могут нести дополнительные последовательности, такие как последовательности, которые регулируют репликацию вектора в клетках-хозяевах (например, точки начала репликации) и гены селектируемого маркера. Ген селектируемого маркера облегчает селекцию клеток-хозяев, в которые был введен вектор или кассету.

В одном из вариантов настоящего изобретения экспрессионный вектор относится к вектору, содержащему одну или несколько интересующих полинуклеотидных последовательностей, интересующих генов или трансгенов, которые фланкированы парвовирусными или инвертированными концевыми повторяющимися последовательностями (ITR).

Ни кассета, ни вектор по изобретению не содержит нуклеотидные последовательности генов, кодирующих неструктурные белки (Rep) и структурные белки (Сар) аденоассоциированного вируса.

Клетка-хозяин

В одном из аспектов настоящее изобретение относится к клетке-хозяину для получения белка FVIII-BDD или для получения любого из вышеуказанных экспрессионных векторов, которая содержит любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD.

Термин «клетка-хозяин» при использовании в данном документе означает клетку, в которую введен рекомбинантный экспрессионный вектор или кассету по изобретению. Настоящее изобретение относится к клеткам-хозяевам, которые могут включать, например, вектор в соответствии с настоящим изобретением, описанным выше. Следует понимать, что «клетка-хозяин» означает не только конкретную заявленную клетку, но также и потомство такой клетки. Поскольку модификации могут проходить в последующих поколениях вследствие мутации или воздействий окружающей среды, такое потомство не может, на самом деле, быть идентичным родительской клетке, но такие клетки по-прежнему включены в объем термина «клетка-хозяин» при использовании в настоящем документе.

Экспрессионные векторы или кассеты по изобретению могут быть использованы для трансфекции клетки млекопитающего, клетки растения, бактериальной или дрожжевой клетки-хозяина. Трансфекция может происходить любым известным способом для введения полинуклеотидов в клетку хозяина. Способы введения гетерологичных полинуклеотидов в клетки млекопитающих хорошо известны в данной области и включают декстран опосредованную трансфекцию, трансфекцию комплексом нуклеиновой кислоты и позитивно заряженного полимера, трансфекцию преципитатом нуклеиновой кислоты и фосфата кальция, полибрен опосредованную трансфекцию, слияние протопластов, трансфекцию инкапсулированными в липосомы полинуклеотидами и прямую микроинъекцию ДНК в ядра. В дополнение молекулы нуклеиновых кислот могут быть введены в клетки млекопитающих вирусными (экспрессионными) векторами.

Клеточные линии млекопитающих, используемые в качестве хозяев для трансформации, хорошо известны в данной области и включают множество иммортализованных доступных клеточных линий. К ним относятся, например, клетки яичников китайского хомячка (СНО), NS0 клетки, клетки SP2, НЕК-293Т клетки, 293 Фристайл клетки (Invitrogen), NIH-3T3 клетки, клетки HeLa, клетки почек хомячка (ВНК), клетки почек африканских зеленых мартышек (COS), клетки гепатоцеллюлярной карциномы человека (например, Hep G2), А549 клетки, SK-HEP1, HUH7, Нер-RG и ряд других клеточных линий. Клеточные линии выбираются путем определения, какие клеточные линии имеют высокие уровни экспрессии и обеспечивают необходимые характеристики продуцируемого белка. Другими клеточными линиями, которые могут быть использованы, являются клеточные линии насекомых, такие как Sf9 или Sf21 клетки. Когда векторы рекомбинантной экспрессии по изобретению вводятся в клетки-хозяева млекопитающих белок FVIII-BDD продуцируется путем культивирования клеток-хозяев в течение времени, достаточного для экспрессии слитого белка в клетках-хозяевах или, предпочтительнее, выделения слитого белка в питательную среду, в которой выращиваются клетки-хозяева. Слитый белок может быть выделен из питательной среды с использованием стандартных методов очистки белка. Клетки-хозяева растений, например, включают Nicotiana, Arabidopsis, ряску, кукурузу, пшеницу, картофель и т.д. Клетки бактерий хозяина включают виды Escherichia и Streptomyces. Дрожжевые клетки-хозяева включают Schizosaccharomyces pombe, Saccharomyces cerevisiae и Pichia pastoris.

Вышеуказанная клетка-хозяин не относится к клетке-хозяину, полученной с использованием человеческих эмбрионов.

Вышеуказанная клетка-хозяин не относится к клетке-хозяину, полученной с модификации генетической целостности клеток зародышевой линии человека.

Фармацевтическая композиция

В одном из аспектов настоящее изобретение относится к фармацевтической композиции для доставки гена FVIII-BDD в целевые клетки, который включает любой из вышеуказанных экспрессионных векторов или кассет.

В некоторых вариантах фармацевтическая композиция для доставки гена FVIII-BDD в целевые клетки включает любой из вышеуказанных экспрессионных векторов или кассет в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.

Действующее вещество в вышеуказанной композиции находится в эффективном количестве, например, в биологически эффективном количестве.

«Фармацевтическая композиция» обозначает композицию, включающую в себя любой из вышеуказанных экспрессионных векторов по изобретению и, по крайней мере, один из компонентов, выбранных из группы, состоящей из фармацевтически приемлемых и фармакологически совместимых эксипиентов, наполнителей, растворителей, разбавителей, носителей, вспомогательных средств, распределяющих средств или средств доставки.

Фармацевтические композиции по настоящему изобретению и способы их изготовления будут бесспорно очевидными для специалистов в этой области. Производство фармацевтических композиций предпочтительно должно соответствовать требованиям GMP (надлежащей производственной практики).

В некоторых вариантах осуществления фармацевтической композиции она может включать буферную композицию, тонические агенты (осмолитик или осмотический агент), стабилизаторы и/или солюбилизаторы.

«Фармацевтически приемлемым» считается материал, который не имеет биологических или других противопоказаний, например, материал можно вводить субъекту без каких-либо нежелательных биологических эффектов. Таким образом, такие фармацевтические композиции можно использовать, например, для трансфекции клетки ex vivo или для введения in vivo любого из вышеуказанных экспрессионных векторов по изобретению непосредственно субъекту.

Термин «эксципиент» или «вспомогательное вещество» используется в данном документе для описания любого компонента, отличающегося от ранее описанных по данному изобретению. Это вещества неорганического или органического происхождения, используемые в процессе производства, изготовления лекарственных препаратов для придания им необходимых физико-химических свойств.

Фармацевтическая композиция по изобретению является стабильной.

Фармацевтическая композиция является «стабильной», если активный агент сохраняет свою физическую стабильность и/или химическую стабильность и/или биологическую активность в течение заявленного срока годности при температуре хранения, например, при 2-8°С. Предпочтительно, чтобы активный агент сохранял и физическую, и химическую стабильность, а также биологическую активность. Период хранения выбирается на основании результатов исследования стабильности при ускоренном и естественном хранении.

В некоторых вариантах фармацевтическая композиция представляет собой раствор для внутривенного введения.

В некоторых вариантах фармацевтическая композиция представляет собой концентрат для приготовления раствора для внутривенного введения.

Применение

В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных экспрессионных кассет или векторов или вышеуказанной композиции для доставки гена FVIII-BDD в целевые клетки.

В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных экспрессионных кассет или векторов или вышеуказанной композиции для обеспечения белком FVIII-BDD субъекта, который имеет гемофилию А и/или не имеет функциональных копий гена FVIII.

Под отсутствием функциональных копий гена FVIII подразумеваются инактивирующие мутации или делеции во всех копиях гена FVIII в геноме, которые приводят к потере или дефекту функции гена FVIII.

В одном из аспектов настоящее изобретение относится к способу обеспечения белком FVIII-BDD субъекта с гемофилией А, который включает введение терапевтически эффективного количества любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции в клетки субъекта, нуждающегося в этом.

В одном из аспектов настоящее изобретение относится к способу доставки гена FVIII-BDD в целевые клетки субъекта с гемофилией А, который включает введение любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции в клетки субъекта.

Под субъектом, нуждающимся в доставке гена FVIII-BDD в целевые клетки, или субъектом, нуждающимся в обеспечении белком FVIII-BDD, подразумевается субъект, который имеет гемофилию А, или субъект, который имеет дефицит фактора свертывания крови FVIII, или субъект, который имеет инактивирующие мутации или делеции в гене FVIII, которые приводят к потере или дефекту функции гена FVIII.

В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции для лечения гемофилии А у субъекта, который имеет гемофилию А.

В одном из аспектов настоящее изобретение относится к способу лечения гемофилии А у субъекта, который включает ведение терапевтически эффективного количества любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции субъекту, который имеет гемофилию А.

В некоторых вариантах гемофилия А представляет собой тяжелую форму гемофилии А (активность фактора VIII <1%) или среднетяжелую форму гемофилии А (активность фактора VIII 1-5%).

Примеры способов введения включают в себя местное применение, интраназальное, ингаляционное, чрезслизистое, трансдермальное, энтеральное (например, пероральное, ректальное), парентеральное (например, внутривенное, подкожное, внутрикожное, внутримышечное) введения, а также инъекции непосредственно в ткань или в орган.

В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов или вышеуказанная композиция вводится субъекту как внутривенная инфузия.

Любой из вышеуказанных экспрессионных векторов вводят в организм в эффективном количестве. Любой из вышеуказанных экспрессионных векторов предпочтительно вводят в организм в биологически эффективном количестве. «Биологически эффективное» количество экспрессио иного вектора представляет собой количество, которое достаточно, чтобы вызвать трансдукцию клеток и экспрессию последовательности нуклеиновой кислоты в клетке. Если экспрессионный вектор вводят в клетку in vivo, «биологически эффективное» количество экспрессио иного вектора представляет собой количество, которое достаточно, чтобы вызвать трансдукцию клеток-мишеней и экспрессию последовательности нуклеиновой кислоты в клетке-мишени.

Дозировки любого из вышеуказанных экспрессионных векторов по данному изобретению будут зависеть от способа введения конкретного вектора, и их можно определять рутинными способами.

Клетка для введения любого из вышеуказанных экспрессионных кассет или векторов по данному изобретению может быть клеткой любого типа, включая в себя без ограничения, эпителиальные клетки (например, эпителиальные клетки кожи, дыхательных путей и кишечника), печеночные клетки, мышечные клетки, клетки селезенки, фибробласты, эндотелиальные клетки и тому подобное.

Любой из вышеуказанных экспрессионных кассет или векторов по данному изобретению не используется для модификации генетической целостности клеток зародышевой линии человека.

В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в формате монотерапии.

В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в комбинации с заместительной терапией концентратами факторов свертывания, десмопрессином и/или ингибиторами фибринолиза.

В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в комбинации с моноклональным антителом (например, эмицизумаб).

В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в комбинации с препаратами на базе технологии РНК-интерференции (например, фитусиран).

В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе вводят субъекту однократно.

В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе вводят субъекту многократно.

Краткое описание чертежей

Фигура 1 представляет собой схему плазмиды pAAV-hFVIII-BDD, которая содержит последовательность гена фактора свертывания крови VIII (FVIII) человека, выбранную из SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5. Так же последовательность плазмиды содержит следующие элементы:

AmpR - ген бета-лактамазы, обеспечивающий устойчивость к ампициллину;

pUC origin- pUC ориджин репликации в бактериях;

ITR инвертированные терминальные повторы;

HLP promoter - искусственный тканеспецифичный промотор;

sPA искусственная последовательность сигнала полиаденилирования, для повышения стабильности мРНК.

Фигура 2 представляет собой график, который показывает увеличение уровня продукции белка FVIII-BDD в культуральную жидкость после трансфекции кодон-оптимизированными нуклеиновыми кислотами, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с нуклеиновой кислотой, кодирующей белок FVIII-BDD, дикого типа.

Уровень белка FVIII-BDD после трансфекции клеток:

1 - нуклеиновой кислотой дикого типа, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 1.

2 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.

3 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 3.

4 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 4.

5 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.

Фигура 3. представляет собой график, который показывает увеличение уровня активности белка FVIII-BDD в культуральной жидкости после трансфекции кодон-оптимизированными нуклеиновыми кислотами, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с нуклеиновой кислотой, кодирующей белок FVIII-BDD, дикого типа.

Уровень активности FVIII-BDD после трансфекции клеток:

1 - нуклеиновой кислотой дикого типа, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 1.

2 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.

3 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 3.

4 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 4.

5 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.

Фигура 4 представляет собой график, который показывает увеличение уровня продукции белка FVIII-BDD при доставке in vitro нуклеиновых кислот в виде экспрессионного вектора на основе AAV, содержащего кодон-оптимизированную нуклеиновую кислоту, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с экспрессионный вектором на основе AAV, содержащим нуклеиновую кислоту дикого типа, кодирующую белок FVIII-BDD.

Уровень белка FVIII-BDD после трансдукции клеток:

1 - контрольным раствор без AAV (негативный контроль).

2 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.

3 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.

4 - экспрессионными векторами на основе AAV серотипа 5, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.

Фигура 5 представляет собой график, который показывает увеличение уровня активности белка FVIII-BDD при доставке in vitro нуклеиновых кислот в виде экспрессионного вектора на основе AAV, содержащего кодон-оптимизированную нуклеиновую кислоту, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с экспрессионный вектором на основе AAV, содержащим нуклеиновую кислоту дикого типа, кодирующую белок FVIII-BDD.

Уровень активности FVIII-BDD после трансдукции клеток:

1 - контрольным раствор без AAV (негативный контроль).

2 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.

3 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.

4 - экспрессионными векторами на основе AAV серотипа 5, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.

Фигура 6 представляет собой график, который показывает увеличение уровня белка FVIII-BDD при доставке кодон-оптимизированной нуклеиновой кислоты, кодирующей белок FVIII-BDD, in vivo мышам линии В6.129S-F8tmlSmoc (HemA) в виде экспрессионного вектора на основе AAV.

Уровень белка FVIII-BDD в плазме крови животных после инъекции:

1 - контрольного раствора без AAV (негативный контроль).

2 - экспрессионного вектора на основе AAV серотипа 5, содержащего кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.

3 - экспрессионного вектора на основе AAV серотипа 6, содержащего кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.

Примеры

Для наилучшего понимания изобретения приводятся следующие примеры. Эти примеры приведены только в иллюстративных целях и не должны толковаться как ограничивающие сферу применения изобретения в любой форме.

Все публикации, патенты и патентные заявки, указанные в этой спецификации включены в данный документ путем отсылки. Хотя вышеупомянутое изобретение было довольно подробно описано путем иллюстрации и примера в целях исключения двусмысленного толкования, специалистам в данной области на основе идей, раскрытых в данном изобретении, будет вполне понятно, что могут быть внесены определенные изменения и модификации без отклонения от сущности и объема прилагаемых вариантов осуществления изобретения.

Материалы и общие методы

Методы рекомбинантной ДНК

Для манипуляций с ДНК использовали стандартные методы, описанные у Sambrook J. и др., Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989. Реагенты для молекулярной биологии использовали согласно инструкциям производителей. Вкратце, плазмидную ДНК нарабатывали для дальнейших манипуляций в клетках Е. coli, выращиваемых под селективным давлением с антибиотиками для того, чтобы плазмиды не терялись в клеточной популяции. Плазмидную ДНК выделяли из клеток коммерческими наборами, измеряли концентрацию и использовали для клонирования с помощью обработки эндонуклеазами рестрикции или методами ПЦР-амплификации. Фрагменты ДНК лигировали между собой с помощью лигаз и трансформировали в бактериальные клетки для отбора клонов и дальнейших наработок. Все полученные генетические конструкции подтверждали по паттернам рестрикции и полным секвенированием по Сэнгеру.

Синтез генов

Требуемые сегменты генов получали из олигонуклеотидов, созданных путем химического синтеза. Генные фрагменты длиной от 300 до 1000 п. н., которые фланкированы уникальными сайтами рестрикции, собирали путем ренатурации олигонуклеотидов друг на друге с последующей ГЩР-амплификацией с крайних праймеров. В результате получали смесь фрагментов, включая нужный. Фрагменты клонировали по сайтам рестрикции в промежуточные векторы, после чего последовательности ДНК субклонированных фрагментов подтверждали путем секвенирования ДНК.

Определение последовательностей ДНК

Последовательности ДНК определяли путем секвенирования по Сэнгеру. Анализ последовательностей ДНК и белков и обработку данных о последовательностях осуществляли в программе SnapGene 4.2 и выше для создания, картирования, анализа, аннотирования и иллюстрации последовательностей.

Культивирование клеточных культур

В экспериментах были использованы клеточные линии НЕК293 (Human Embryonic Kidney clone 293), SK-HEP1 (human adenocarcinoma endothelial cell line) и HUH7 (human hepatocellular carcinoma cell lines). Суспензионные клетки HEK293, используемые для наработки AAV, культивировались в стандартных условиях при 37°С и 5% CO2 на полной питательной среде без FBS и антибиотика. Адгезионные клетки SK-HEP1, используемые для проверки эффективности препаратов AAV, культивировались в стандартных условиях при 37°С и 5% СО2, на полной питательной среде ЕМЕМ с добавлением 10% FBS, антибиотика/антимикотика. Адгезионные клетки HUH7, используемые для проверки эффективности препаратов AAV, культивировались в стандартных условиях при 37°С и 5% СО2, на полной питательной среде DMEM с добавлением 10% FBS, антибиотика/антимикотика. Пересев клеток осуществлялся при достижении 80-90% конфлюентности. Для диссоциации клеточного монослоя использовался TrypLE Select enzyme (10х). Жизнеспособность клеток оценивалась с помощью окраски Trypan Blue и одноразовых камер для подсчета клеток с помощью автоматического счетчика Countess II.

Трансфекция клеточных культур

Для оценки функциональности новых кодон-оптимизированных нуклеиновых кислот, которые кодируют белок FVIII-BDD, при трансфекции использовались плазмиды, содержащие экспрессио иную кассету для экспрессии различных вариантов трансгенов hFVIII-BDD. Клетки линии SK-HEP1 заранее засевали в лунки 12-луночных планшетов с плотностью 10000 кл/см2. Через сутки вносились плазмиды в одинаковой копийности в составе комплекса с Lipofectamine 3000. На 7 день после трансфекции определяли содержание белка FVIII-BDD и его активность в культуральной жидкости методом ИФА и хромогенного теста. Работы по оценке уровня и активности белка FVIII-BDD в культуральной жидкости проводились в 6 независимых экспериментах. Для негативного контроля были использованы интактные клетки линии SK-HEP1.

Сборка и очистка экспрессионных векторов на основе AAV

Для сборки экспрессионных векторов на основе AAV, содержащих варианты гена FVIII-BDD, использовали клетки-продуценты НЕК293, которые трансфецировали 3-мя плазмидами:

1) плазмиды, содержащие экспрессионную кассету AAV для экспрессии различных вариантов трансгенов hFVIII-BDD (Фиг. 1.);

2) плазмида для экспрессии гена Сар серотипа AAV6 или AAV5 и гена Rep серотипа AAV2. Каждый ген с помощью альтернативных рамок считывания кодирует несколько белковых продуктов;

3) плазмида для экспрессии генов аденовируса Ad5, необходимых для сборки и упаковки капсидов AAV.

Через 72 часа клетки лизировали и проводили очистку и концентрирование векторов с помощью методов фильтрации, хроматографии и ультрацентифугирования. Титр вирусных векторов определяли с помощью количественной 1ТЦР с праймерами и пробой, специфичными к участку рекомбинантного вирусного генома, и выражали в виде количества копий вирусных геномов на 1 мл.

Трансдукция клеточных культур

Клеточную линию HUH7 заранее засевали в лунки 12-луночных планшетов с плотностью 10000 кл/см2. После прикрепления клеток к адгезивной подложке, вносились препараты AAV при MOI 500000 вг/кл. На 7 день после трансдукции определяли содержание белка FVIII-BDD и его активность в культуральной жидкости методом ИФА и хромогенным тестом. Работы по оценке уровня и активности белка FVilli в культуральной жидкости проводились в 6 независимых экспериментах. Для негативного контроля были использованы интактные клетки.

Определение количества белка фактора свертывания крови VIII-BDD методом ИФА

Оценка содержания белка фактора свертывания крови VIII-BDD в культуральной жидкости после трансфекции клеток целевыми кандидатами проводилась «сэндвич»-методом неконкурентного твердофазного иммуноферментного анализа (ИФА). Вкратце, разведенные в буфере для разведений образцы культуральной жидкости, вносились в лунки 96-луночного планшета, сенсибилизированные первичными специфическими к фактору свертывания крови VIII-BDD антителами. В этот же планшет вносились стандарты для построения калибровочной кривой, контроли. Планшет инкубировался 1 час при температуре 37°С. Производили отмывку лунок планшета отмывочным буфером перед внесением биотинилированных антител, раствора конъюгата стрептавидин-пероксидазы и ТМВ. Вносился раствор со специфическими биотинилированными детектирующими антителами к фактору VIII-BDD и планшет инкубировался 30 минут при температуре 37°С. Далее к образовавшемуся комплексу добавлялся раствор конъюгата стрептавидин-пероксидазы и планшет инкубировался 30 минут при температуре 37°С. Для визуализации ферментативной реакции вносился раствор ТМВ. По достижении нужной степени интенсивности окрашивания во все лунки добавляется стоп-раствор для остановки реакции. Далее измерялась оптическая плотность растворов в лунках планшета. Концентрация фактора свертывания крови VIII-BDD в исследуемых образцах определялась по калибровочной кривой с учетом предварительного разведения образцов.

Определение уровня активности белка фактора свертывания крови VIII-BDD методом ИФА

Оценка активности белка фактора свертывания крови VIII в культуральной жидкости после трансфекции клеток линии целевыми кандидатами проводилась при помощи хромогенного теста. Суть теста заключается в том, что в присутствии ионов кальция, фосфолипидов и фактора IXa фактор X переходит в активированную форму Ха, фактор VIII действует как кофактор в этой реакции, и скорость активации фактора X линейно связана с количество фактора VIII. Вкратце, разведенные в буфере для разведений образцы культуральной жидкости, стандарты для построения калибровочной кривой и контроли вносились в лунки 96-луночного планшета. Планшет инкубировался 3 минуты при температуре 37°С. Во все лунки планшета вносили раствор Factor reagent, содержащий фактор ГХа, фактор X, тромбин, CaCl2 и фосфолипиды. Планшет инкубировался 4 минуты при температуре 37°С. Во все лунки планшета вносили раствор хромогенного субстрата S-2765+I-2581. Планшет инкубировался 7 минут при температуре 37°С. По достижению нужной степени интенсивности окрашивания во все лунки добавляли 20% раствор уксусной кислоты для остановки реакции. Далее измерялась оптическая плотность растворов в лунках планшета. Активность фактора свертывания крови VIII в исследуемых образцах определялась по калибровочной кривой с учетом предварительного разведения образцов.

Проведение in vivo исследования на лабораторных животных

Для экспериментов были использованы мыши линии C57BL/6 (самцы возрастом 6-8 недель). Препараты вводили животным однократно путем внутривенного введения в хвостовую вену. Группе животных отрицательного контроля вводился буферный раствор, не содержащий AAV.

Отбор плазмы крови производился в день инъекции до введения препаратов, далее - на 35 и 56 дни после введения экспрессионных векторов. Статистический анализ данных

Результаты представлены в виде среднего значения±стандартное отклонение (SD), для сравнения результатов эксперимента использовали однофакторный дисперсионный анализ с поправкой на множественные попарные сравнения по методу Даннета (One-way ANOVA), и они были определены как статистически значимые.

Пример 1: Модификация последовательности гена hFVIII-BDD с помощью разработанного алгоритма кодон-оптимизации

Разработанные генетические конструкции представляют собой нуклеотидные последовательности, кодирующие экспрессионную кассету с геном человеческого фактора свертывания крови VIII с делетированным В доменом (FVIII-BDD).

Конечная экспрессионная кассета содержит все необходимые элементы как для экспрессии гена, так и сборки в составе генома рекомбинантного AAV (Фигура 1):

1) терминальные повторы ITR на концах последовательности, которая инкапсидируется в экспрессионный вектор;

2) элементы для экспрессии целевого гена (промотор, трансген, сайт полиаденилирования);

3) ориджин бактериальной репликации и ген устойчивости к антибиотику для наработки плазмидной ДНК в бактериальных клетках.

В качестве нуклеиновой кислоты дикого типа использовалась нуклеиновая кислота, которая кодирует белок человеческого фактора свертывания крови VIII с делетированным В доменом, и включает нуклеотидную последовательность SEQ ID NO: 1. Данная нуклеиновая кислота используется в составе экспрессионной кассеты в качестве контроля.

Дополнительно с целью повышения эффективности экспрессии природная нуклеотидная последовательность гена фактора свертывания крови VIII с делетированным В доменом была модифицирована с помощью алгоритма кодон-оптимизации.

В результате кодон-оптимизации нуклеиновой кислоты, соответствующей последовательности SEQ ID NO: 1, был получен ряд кодон-оптимизированных нуклеиновых кислот SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5, которые были в дальнейшем протестированы на уровень экспрессии белка фактора свертывания крови VIII-BDD и его активности по сравнению с контролем (нуклеиновая кислота SEQ ID NO: 1) в составе экспрессионной кассеты (Фигура 1).

Пример 2. Проверка работоспособности кодон-оптимизированных вариантов последовательности гена FVIII с делетированным В доменом in vitro

Полученные нами кодон-оптимизированные нуклеиновые кислоты, выбранные из SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5, кодирующие белок FVIII-BDD, были проверены при трансфекции клеток линии SK-HEP1 in vitro в составе экспрессионной кассеты, состоящей из левого (первого) ITR (инвертированные концевые повторы), тканеспецифичного промотора, трансгена, сигнала полиаденилирования, правого (второго) ITR, где трансгеном является одна из последовательностей SEQ ID NO: 2-5. В качестве контроля трансген представлял собой нуклеиновую кислоту без оптимизации, которая кодирует белок человеческого FVIII с делетированным В доменом, соответствующая последовательности SEQ ID NO:l.

Использование всех нуклеиновых кислот, выбранных из SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5, кодирующих белок FVIII-BDD, привели к увеличению уровня продукции (Фигура 2) и активности (Фигура 3) белка FVIII-BDD по сравнению с использованием нуклеиновой кислоты SEQ ID NO: 1 без оптимизации.

Кроме того, полученные нами кодон-оптимизированные нуклеиновые кислоты, кодирующие белок фактора свертывания крови VIII с делетированным В доменом (SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5), способны приводить к увеличению экспрессии белка FVIII-BDD in vitro в клетке-хозяине по сравнению с использованием нуклеиновой кислоты SEQ ID NO:l без оптимизации. Таким образом, кодон-оптимизированные нуклеиновые кислоты по изобретению обладают высоким потенциалом для получения рекомбинантного белка FVIII-BDD для терапии Гемофилии А.

Пример 3. Создание и проверка работоспособности экспрессионных векторов, несущих кодон-оптимизированные варианты последовательности гена FVIII-BDD in vitro

Для того чтобы показать эффективность доставки разработанных кодон-оптимизированных нуклеиновых кислот при помощи экспрессионного вектора in vitro, плазмиды, кодирующие целевые генетические конструкции вместе с остальными необходимыми плазмидами были использованы для наработки экспрессионных векторов на основе аденоассоциированного вируса серотипа 5, несущего нуклеотидную последовательность SEQ ID NO:2 (далее упоминается как AAV5-FVIII-BDDco-vl), и на основе аденоассоциированного вируса серотипа 6, несущего нуклеотидную последовательность SEQ ID N0:2 (далее упоминается как AAV6-FVIII-BDDco-vl) или нуклеотидную последовательность SEQ ID NO:5 (далее упоминается как AAV6-FVIII-BDDco-v4). Очищенные препараты AAV5-FVIII-BDDco-vl, AAV6-FVIII-BDDco-vl и AAV6-FVIII-BDDco-v4, используемые для проведения in vitro и in vivo исследований, были подготовлены с применением стандартных буферов и эксципиентов, которые являются безопасными и не изменяют свойств AAV.

Препараты AAV5-FVIII-BDDco-vl, AAV6-FVIII-BDDco-vl и AAV6-FVIII-BDDco-v4 были протестированы in vitro с использованием адгезионной клеточной линии HUH7 (Фиг. 4 и 5). В лунки 12-луночных планшетов были посеяны клетки линии с плотностью 10 ООО кл/см2. После прикрепления клеток к адгезивной подложке, вносились препараты AAV при MOI 500000 вг/кл. На 7 день после трансдукции определяли содержание белка FVIII-BDD и его активность в культуральной жидкости методом ИФА. Все образцы были поставлены в трипликатах. Для негативного контроля были использованы интактные клетки.

Было показано, что разработанные нами экспрессионные векторы AAV5-FVIII-BDDco-v1, AAV6-FVIII-BDDco-v1 и AAV6-FVIII-BDDco-v4, несущие кодон-оптимизированные версии гена фактора свертывания крови VIII-BDD, позволяют эффективно доставить трансген фактора свертывания крови VIII-BDD в клетки HUH7 и обеспечить продукцию целевого белка, что подтверждается при анализе культуральной жидкости методом ИФА (Фигура 4) и анализом активности (Фигура 5) белка фактора свертывания крови VIII-BDD. Доставка SEQ ID N0:2 при помощи экспрессионного вектора на основе AAV серотипа 5 приводит к продукции белка FVIII-BDD в культуральной жидкости на уровне 129 нг/мл и активности 97%. Доставка SEQ ID NO:2 при помощи экспрессионного вектора на основе AAV серотипа 6 приводит к продукции белка FVIII-BDD в культуральной жидкости на уровне 104 нг/мл и активности 91%. Доставка SEQ ID NO:5 при помощи экспрессионного вектора на основе AAV серотипа 6 приводит к продукции белка FVIII-BDD в культуральной жидкости на уровне 61 нг/мл и активности 68%.

Пример 4. Проверка работоспособности препаратов AAV5-FVIII-BDDco-vl и AAV6-FVIII-BDDco-v1 in vivo

Для того чтобы показать эффективность доставки разработанных кодон-оптимизированных нуклеиновых кислот при доставке в составе экспрессионного вектора in vivo, выбранные препараты AAV5-FVIII-BDDco-v1 и AAV6-FVIII-BDDco-v1 были введены лабораторным мышам линии C57BL/6. В исследовании использовали дозу AAV препаратов равную 6х1013 вг/мышь. В качестве негативного контроля был использованы контрольный раствор без AAV. Препараты вводили животным однократно путем внутривенного гидродинамического введения в хвостовую вену. Отбор плазмы крови производился в день инъекции до введения препаратов (0 день), далее на 35 и 56 дни после введения препаратов. В образцах плазмы крови определяли уровень белка фактора свертывания крови VIII-BDD методом ИФА, как было описано выше.

В результате проведенных in vivo исследований было показано, что в случае использования обоих препаратов AAV5-FVIII-BDDco-vl и AAV6-FVIII-BDDco-vl, содержащих кодон-оптимизированную последовательность гена фактора свертывания крови VIII-BDD SEQ ID NO:2, наблюдается достоверное увеличение количества фактора VIII-BDD в плазме крови животных на 35 и на 56 дни (Фигура 6). В случае использования препарата AAV5-FVIII-BDDco-vl, содержащего кодон-оптимизированную последовательность гена фактора свертывания крови VIII-BDD SEQ ID NO:2 в плазме крови животных на 35 и 56 дни после инъекции наблюдалась экспрессия FVIII-BDD на уровне 304 и 279 нг/мл, соответственно. В случае использования препарата AAV6-FVIII-BDDco-v1, содержащего кодон-оптимизированную последовательность гена фактора свертывания крови VIII-BDD SEQ ID N0:2 в плазме крови животных на 35 и 56 дни после инъекции наблюдалась экспрессия FVIII-BDD на уровне 415 и 459 нг/мл, соответственно.

Таким образом, разработанные экспрессионные вектора на основе AAV5 и AAV6, несущие кодон-оптимизированные версии гена фактора свертывания крови VIII с делетированным В доменом (AAV5-FVIII-BDDco-vl и AAV6-FVIII-BDDco-vl) способны приводить к экспрессии белка FVIII-BDD in vivo и обладают высоким потенциалом для генной терапии Гемофилии А.

--->

Перечень последовательностей

<110> АО "БИОКАД"

<120> Кодон-оптимизированная нуклеиновая кислота, которая кодирует

белок фактора свёртывания крови VIII c делетированным B доменом, и ее

применение

<160> 22

<170> BiSSAP 1.3.6

<210> 1

<211> 4314

<212> DNA

<213> Искусственная последовательность

<220>

<223> нуклеиновая кислота, кодирующая белок FVIII-BDD (фактор

свёртывания крови VIII c делетированным B доменом) (дикого

типа)

<400> 1

gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat

60

ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc

120

aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac

180

atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt

240

tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct

300

gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa

360

agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc

420

ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct

480

catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga

540

gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct

600

gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg

660

gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg

720

tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg

780

ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac

840

catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg

900

atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg

960

gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat

1020

gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt

1080

gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa

1140

acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc

1200

gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt

1260

aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa

1320

gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca

1380

ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc

1440

actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat

1500

tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg

1560

ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag

1620

agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat

1680

caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat

1740

gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga

1800

gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat

1860

gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta

1920

agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac

1980

aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg

2040

tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga

2100

ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag

2160

gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga

2220

agcttctctc aaaacccacc agtcttgaaa cgccatcaac gggaaataac tcgtactact

2280

cttcagtcag atcaagagga aattgactat gatgatacca tatcagttga aatgaagaag

2340

gaagattttg acatttatga tgaggatgaa aatcagagcc cccgcagctt tcaaaagaaa

2400

acacgacact attttattgc tgcagtggag aggctctggg attatgggat gagtagctcc

2460

ccacatgttc taagaaacag ggctcagagt ggcagtgtcc ctcagttcaa gaaagttgtt

2520

ttccaggaat ttactgatgg ctcctttact cagcccttat accgtggaga actaaatgaa

2580

catttgggac tcctggggcc atatataaga gcagaagttg aagataatat catggtaact

2640

ttcagaaatc aggcctctcg tccctattcc ttctattcta gccttatttc ttatgaggaa

2700

gatcagaggc aaggagcaga acctagaaaa aactttgtca agcctaatga aaccaaaact

2760

tacttttgga aagtgcaaca tcatatggca cccactaaag atgagtttga ctgcaaagcc

2820

tgggcttatt tctctgatgt tgacctggaa aaagatgtgc actcaggcct gattggaccc

2880

cttctggtct gccacactaa cacactgaac cctgctcatg ggagacaagt gacagtacag

2940

gaatttgctc tgtttttcac catctttgat gagaccaaaa gctggtactt cactgaaaat

3000

atggaaagaa actgcagggc tccctgcaat atccagatgg aagatcccac ttttaaagag

3060

aattatcgct tccatgcaat caatggctac ataatggata cactacctgg cttagtaatg

3120

gctcaggatc aaaggattcg atggtatctg ctcagcatgg gcagcaatga aaacatccat

3180

tctattcatt tcagtggaca tgtgttcact gtacgaaaaa aagaggagta taaaatggca

3240

ctgtacaatc tctatccagg tgtttttgag acagtggaaa tgttaccatc caaagctgga

3300

atttggcggg tggaatgcct tattggcgag catctacatg ctgggatgag cacacttttt

3360

ctggtgtaca gcaataagtg tcagactccc ctgggaatgg cttctggaca cattagagat

3420

tttcagatta cagcttcagg acaatatgga cagtgggccc caaagctggc cagacttcat

3480

tattccggat caatcaatgc ctggagcacc aaggagccct tttcttggat caaggtggat

3540

ctgttggcac caatgattat tcacggcatc aagacccagg gtgcccgtca gaagttctcc

3600

agcctctaca tctctcagtt tatcatcatg tatagtcttg atgggaagaa gtggcagact

3660

tatcgaggaa attccactgg aaccttaatg gtcttctttg gcaatgtgga ttcatctggg

3720

ataaaacaca atatttttaa ccctccaatt attgctcgat acatccgttt gcacccaact

3780

cattatagca ttcgcagcac tcttcgcatg gagttgatgg gctgtgattt aaatagttgc

3840

agcatgccat tgggaatgga gagtaaagca atatcagatg cacagattac tgcttcatcc

3900

tactttacca atatgtttgc cacctggtct ccttcaaaag ctcgacttca cctccaaggg

3960

aggagtaatg cctggagacc tcaggtgaat aatccaaaag agtggctgca agtggacttc

4020

cagaagacaa tgaaagtcac aggagtaact actcagggag taaaatctct gcttaccagc

4080

atgtatgtga aggagttcct catctccagc agtcaagatg gccatcagtg gactctcttt

4140

tttcagaatg gcaaagtaaa ggtttttcag ggaaatcaag actccttcac acctgtggtg

4200

aactctctag acccaccgtt actgactcgc taccttcgaa ttcaccccca gagttgggtg

4260

caccagattg ccctgaggat ggaggttctg ggctgcgagg cacaggacct ctac

4314

<210> 2

<211> 4314

<212> DNA

<213> Искусственная последовательность

<220>

<223> Кодон-оптимизированная нуклеотидная последовательность,

кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v1)

<400> 2

gccaccagaa ggtactacct gggcgccgtg gagctgagct gggactacat gcagagcgac

60

ctgggcgagc tgcctgtgga cgccagattc ccccccagag tgcctaagag cttccccttc

120

aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcaccgacca cctgttcaac

180

atcgccaagc ccagaccccc ctggatgggc ctgctgggcc ctaccatcca ggccgaggtg

240

tacgacaccg tggtgatcac cctgaagaac atggccagcc accccgtgag cctgcacgcc

300

gtgggcgtga gctactggaa ggccagcgag ggcgccgagt acgacgacca gaccagccag

360

agagagaagg aggacgacaa ggtgttcccc ggcggcagcc acacctacgt gtggcaggtg

420

ctgaaggaga acggccccat ggccagcgac cccctgtgcc tgacctacag ctacctgagc

480

cacgtggacc tggtgaagga cctgaacagc ggcctgatcg gcgccctgct ggtgtgcaga

540

gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc

600

gtgttcgacg agggcaagag ctggcacagc gagaccaaga acagcctgat gcaggacaga

660

gacgccgcca gcgccagagc ctggcccaag atgcacaccg tgaacggcta cgtgaacagg

720

agcctgcccg gcctgatcgg ctgccacaga aagagcgtgt actggcacgt gatcggcatg

780

ggcaccaccc ccgaggtgca cagcatcttc ctggagggcc acaccttcct ggtgaggaac

840

cacagacagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg

900

atggacctgg gccagttcct gctgttctgc cacatcagca gccaccagca cgacggcatg

960

gaggcctacg tgaaggtgga cagctgcccc gaggagcccc agctgagaat gaagaacaac

1020

gaggaggccg aggactacga cgacgacctg accgacagcg agatggacgt ggtgagattc

1080

gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag

1140

acctgggtgc actacatcgc cgccgaggag gaggactggg actacgcccc cctggtgctg

1200

gcccccgacg acagaagcta caagagccag tacctgaaca acggccccca gaggatcggc

1260

agaaagtaca agaaggtgcg gttcatggcc tacaccgacg agaccttcaa gaccagggag

1320

gccatccagc acgagagcgg catcctgggc cctctgctgt acggcgaggt gggcgacacc

1380

ctgctgatca tcttcaagaa ccaggccagc agaccctaca acatctaccc ccacggcatc

1440

accgacgtga gacccctgta cagcagaaga ctgcccaagg gcgtgaagca cctgaaggac

1500

ttccccatcc tgcccggcga gatcttcaag tacaagtgga ccgtgaccgt ggaggacggc

1560

cccaccaaga gcgaccccag atgcctgacc agatactaca gcagcttcgt gaacatggag

1620

cgggacctgg ccagcggcct gatcggcccc ctgctgatct gctacaagga gagcgtggac

1680

cagagaggca accagatcat gagcgacaag cggaacgtga tcctgttcag cgtgttcgac

1740

gagaaccgga gctggtacct gaccgagaac atccagaggt tcctgcccaa ccccgccggc

1800

gtgcagctgg aggaccccga gttccaggcc agcaacatca tgcacagcat caacggctac

1860

gtgttcgaca gcctgcagct gagcgtgtgc ctgcacgagg tggcctactg gtacatcctg

1920

agcatcggcg cccagaccga cttcctgagc gtgttcttca gcggctacac cttcaagcac

1980

aagatggtgt acgaggacac cctgaccctg ttccccttca gcggcgagac cgtgttcatg

2040

agcatggaga accccggcct gtggatcctg ggctgccaca acagcgactt cagaaacaga

2100

ggcatgaccg ccctgctgaa ggtgagcagc tgcgacaaga acaccggcga ctactacgag

2160

gacagctacg aggacatcag cgcctacctg ctgagcaaga acaacgccat cgagcccagg

2220

agcttcagcc agaacccccc cgtgctgaag agacaccaga gagagatcac caggaccacc

2280

ctgcagagcg accaggagga gatcgactac gacgacacca tcagcgtgga gatgaagaag

2340

gaggacttcg acatctacga cgaggacgag aaccagagcc ccagaagctt ccagaagaag

2400

accaggcact acttcatcgc cgccgtggag agactgtggg actacggcat gagcagcagc

2460

ccccacgtgc tgagaaacag agcccagagc ggcagcgtgc cccagttcaa gaaggtggtg

2520

ttccaggagt tcaccgacgg cagcttcacc cagcccctgt acagaggcga gctgaacgag

2580

cacctgggcc tgctgggccc ctacatcaga gccgaggtgg aggacaacat catggtgacc

2640

ttccggaacc aggccagcag accctacagc ttctacagca gcctgatcag ctacgaggag

2700

gaccagaggc agggcgccga gcccagaaag aacttcgtga agcccaacga gaccaagacc

2760

tacttctgga aggtgcagca ccacatggcc cccaccaagg acgagttcga ctgcaaggcc

2820

tgggcctact tcagcgacgt ggacctggag aaggacgtgc acagcggcct gatcggcccc

2880

ctgctggtgt gccacaccaa caccctgaac cccgcccacg gcagacaggt gaccgtgcag

2940

gagttcgccc tgttcttcac catcttcgac gagaccaaga gctggtactt caccgagaac

3000

atggagcgga actgcagagc cccctgcaac atccagatgg aggaccccac cttcaaggag

3060

aactacaggt tccacgccat caacggctac atcatggaca ccctgcccgg cctggtgatg

3120

gcccaggacc agagaatcag atggtacctg ctgagcatgg gcagcaacga gaacatccac

3180

agcatccact tcagcggcca cgtgttcacc gtgaggaaga aggaggagta caagatggcc

3240

ctgtacaacc tgtaccccgg cgtgttcgag accgtggaga tgctgcccag caaggccggc

3300

atctggagag tggagtgcct gatcggcgag cacctgcacg ccggcatgag caccctgttc

3360

ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg ccagcggcca catcagagac

3420

ttccagatca ccgccagcgg ccagtacggc cagtgggccc ccaagctggc cagactgcac

3480

tacagcggca gcatcaacgc ctggagcacc aaggagccct tcagctggat caaggtggac

3540

ctgctggccc ccatgatcat ccacggcatc aagacccagg gcgccagaca gaagttcagc

3600

agcctgtaca tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc

3660

tacagaggca acagcaccgg caccctgatg gtgttcttcg gcaacgtgga cagcagcggc

3720

atcaagcaca acatcttcaa cccccccatc atcgcccggt acatcaggct gcaccccacc

3780

cactacagca tcaggagcac cctgagaatg gagctgatgg gctgcgacct gaacagctgc

3840

agcatgcccc tgggcatgga gagcaaggcc atcagcgacg cccagatcac cgccagcagc

3900

tacttcacca acatgttcgc cacctggagc cccagcaagg ccagactgca cctgcagggc

3960

agaagcaacg cctggagacc ccaggtgaac aaccccaagg agtggctgca ggtggacttc

4020

cagaagacca tgaaggtgac cggcgtgacc acccagggcg tgaagagcct gctgaccagc

4080

atgtacgtga aggagttcct gatcagcagc agccaggacg gccaccagtg gaccctgttc

4140

ttccagaacg gcaaggtgaa ggtgttccag ggcaaccagg acagcttcac ccccgtggtg

4200

aacagcctgg acccccccct gctgaccaga tacctgagaa tccaccccca gagctgggtg

4260

caccagatcg ccctgagaat ggaggtgctg ggctgcgagg cccaggacct gtac

4314

<210> 3

<211> 4314

<212> DNA

<213> Искусственная последовательность

<220>

<223> Кодон-оптимизированная нуклеотидная последовательность,

кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v2)

<400> 3

gccacaagaa gatactatct gggcgccgtg gagctgagct gggattatat gcagtccgac

60

ctgggcgagc tgccagtgga tgctagattc cctcctagag tgcctaagag ctttccattc

120

aatacctccg tggtgtacaa gaagaccctg ttcgtggagt ttaccgacca cctgttcaac

180

atcgccaaac ctagaccacc ttggatggga ctgctgggcc caactattca ggccgaagtg

240

tacgataccg tggtgatcac tctgaagaat atggcctccc accctgtgag cctgcatgca

300

gttggcgtga gctattggaa ggccagcgag ggagccgaat acgatgacca gaccagccag

360

agggagaagg aagacgacaa ggtgtttccc ggaggaagcc acacctatgt gtggcaggtg

420

ctgaaggaga atggacctat ggccagcgat ccactgtgcc tgacctactc ttatctgagc

480

cacgtggacc tggtgaagga cctgaatagc ggcctgattg gcgcactgct ggtgtgtaga

540

gagggatctc tggccaaaga gaagacccag accctgcaca agtttatcct gctgtttgcc

600

gtgtttgacg agggcaaatc ttggcacagc gagaccaaaa acagcctgat gcaggataga

660

gacgcagcct ctgctagagc ttggcctaag atgcacaccg tgaatggcta cgtgaacaga

720

tccctgcccg gcctgattgg atgtcacaga aagagcgtgt actggcacgt gatcggaatg

780

ggaactaccc cagaagtgca cagcatcttt ctggagggac acacctttct ggtgcggaat

840

catagacagg ccagcctgga aatcagccct attacctttc tgaccgccca gacactgctg

900

atggatctgg gacagtttct gctgttctgc cacatcagct ctcaccagca tgacggaatg

960

gaagcctacg tgaaggtgga cagctgccct gaggaaccac agctgaggat gaagaataac

1020

gaggaggccg aggattacga cgatgacctg accgattctg agatggacgt ggtgagattc

1080

gacgacgata actctccctc cttcatccag atcagatccg tggccaaaaa gcaccctaaa

1140

acctgggtgc actatatcgc cgcagaggaa gaagactggg attacgcacc tctggtgctg

1200

gcccctgatg acagatctta taagtctcag tacctgaaca acggccctca gagaatcggc

1260

aggaagtaca agaaggtgag attcatggcc tacacagacg agacattcaa gaccagagag

1320

gccattcagc acgagtccgg cattctggga ccactgctgt acggagaggt gggcgataca

1380

ctgctgatca tcttcaaaaa tcaggccagc aggccctaca acatctaccc acatggcatc

1440

acagacgtga ggcctctgta cagcagaaga ctgcctaaag gcgtgaagca cctgaaggac

1500

ttccccattc tgccaggcga gattttcaag tacaagtgga cagtgaccgt ggaggatgga

1560

cccacaaagt ctgaccctag atgcctgacc aggtactata gctccttcgt gaacatggaa

1620

agggatctgg cctctggact gattggccca ctgctgatct gctacaagga atccgtggac

1680

cagagaggaa accagatcat gagcgataag aggaatgtga tcctgttcag cgtgttcgat

1740

gagaacagga gctggtatct gaccgagaac atccagagat tcctgccaaa tccagccggc

1800

gtgcagctgg aagatcctga atttcaggcc tccaatatca tgcactccat caatggctac

1860

gtgtttgaca gcctgcagct gtctgtgtgt ctgcacgaag tggcctactg gtacatcctg

1920

agcattggag cccagaccga ctttctgagc gtgtttttct ctggctacac cttcaagcac

1980

aagatggtgt acgaggacac cctgacactg ttcccattct caggcgaaac cgtgtttatg

2040

agcatggaga acccaggact gtggattctg ggctgccaca actccgactt caggaataga

2100

ggaatgaccg ccctgctgaa agtgagcagc tgcgataaga acaccggcga ttattacgag

2160

gactcctacg aggatatcag cgcctacctg ctgtccaaaa acaatgccat cgagcccagg

2220

agcttctccc agaatccacc tgtgctgaaa agacaccaga gggagatcac cagaaccaca

2280

ctgcagtctg atcaggagga gatcgactat gacgacacca tcagcgtgga gatgaagaag

2340

gaggactttg atatctacga cgaggatgag aaccagagcc ccaggagctt tcagaagaag

2400

accaggcact acttcatcgc cgcagtggag agactgtggg actacggaat gtcttcctcc

2460

cctcacgtgc tgagaaatag agcccagtct ggaagcgtgc cacagtttaa gaaggtggtg

2520

ttccaggagt ttaccgacgg ctctttcacc cagccactgt atagaggcga actgaacgaa

2580

cacctgggcc tgctgggacc ttatatcaga gccgaagtgg aggacaacat catggtgacc

2640

ttcagaaacc aggccagcag accttacagc ttctactcca gcctgatcag ctacgaagag

2700

gatcagagac agggcgccga acctaggaaa aattttgtga agccaaacga gaccaagacc

2760

tacttttgga aggtgcagca tcacatggcc cccaccaagg atgagttcga ttgtaaagcc

2820

tgggcctact tctccgatgt ggacctggaa aaggatgtgc acagcggact gatcggacca

2880

ctgctggtgt gccacacaaa taccctgaac cctgcccacg gaagacaggt gacagtgcag

2940

gaatttgccc tgttcttcac catctttgac gagaccaagt cctggtactt caccgagaac

3000

atggagagaa actgcagagc cccttgcaac attcagatgg aggacccaac attcaaggag

3060

aactacaggt tccacgccat caatggctac atcatggata cactgcctgg cctggtgatg

3120

gcccaggatc agagaattag gtggtacctg ctgtctatgg gctccaatga gaatatccac

3180

tccatccact tcagcggcca cgtgttcacc gtgagaaaga aagaggagta caagatggcc

3240

ctgtacaacc tgtacccagg cgtgtttgag accgtggaga tgctgccttc taaagctggc

3300

atctggagag tggagtgcct gatcggcgag catctgcatg ctggaatgtc taccctgttt

3360

ctggtgtact ccaacaagtg ccagacacct ctgggcatgg cttctggaca tatcagagac

3420

tttcagatca ccgcctccgg ccagtacgga caatgggctc caaagctggc cagactgcat

3480

tactctggct ctattaatgc ctggagcacc aaggagccct tttcctggat caaggtggat

3540

ctgctggccc ccatgattat ccacggcatc aaaacccagg gcgccaggca gaagttttct

3600

tccctgtaca tcagccagtt catcatcatg tacagcctgg atggcaagaa gtggcagacc

3660

tacagaggca atagcaccgg aaccctgatg gtgtttttcg gcaacgtgga ctcctccggc

3720

attaagcaca atatcttcaa cccacctatc atcgccaggt acatcagact gcaccccacc

3780

cactactcta tcagaagcac cctgaggatg gaactgatgg gctgtgacct gaattcctgt

3840

agcatgcctc tgggaatgga gtctaaagcc atcagtgacg cccagattac cgccagcagc

3900

tactttacca acatgtttgc tacatggtcc ccctctaagg ccagactgca cctgcaggga

3960

agatctaacg cctggagacc acaggtgaac aaccccaaag aatggctgca ggtggatttt

4020

cagaagacca tgaaagtgac cggcgtgaca acacagggcg tgaaatctct gctgacctct

4080

atgtacgtga aggagtttct gatcagcagc agccaggacg gccatcagtg gaccctgttt

4140

tttcagaatg gcaaggtgaa ggtgttccag ggcaatcagg actcattcac tccagtggtg

4200

aacagcctgg acccacctct gctgaccaga tacctgagaa ttcacccaca gtcctgggtg

4260

catcagatcg ccctgagaat ggaagtgctg ggatgtgagg cacaggacct gtac

4314

<210> 4

<211> 4314

<212> DNA

<213> Искусственная последовательность

<220>

<223> Кодон-оптимизированная нуклеотидная последовательность,

кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v3)

<400> 4

gccacaagga ggtactatct gggcgccgtg gaactgagct gggactatat gcagagcgac

60

ctgggagagc tgcctgtgga tgccagattt ccacctaggg tgcccaagag cttccccttc

120

aatacaagcg tggtgtacaa gaagaccctg ttcgtggagt ttaccgacca cctgttcaac

180

atcgccaagc ctagacctcc ttggatggga ctgctgggcc ctaccattca ggccgaagtg

240

tacgacacag tggtgatcac cctgaagaat atggccagcc atccagtgtc cctgcacgca

300

gtgggagtgt cttattggaa ggcctctgag ggcgccgagt acgatgatca gaccagccag

360

agagagaagg aggacgacaa ggtgttcccc ggaggaagcc acacctacgt gtggcaggtg

420

ctgaaagaga atggcccaat ggcctccgac cccctgtgtc tgacatacag ctacctgagc

480

cacgtggacc tggtgaagga cctgaactct ggcctgatcg gagctctgct ggtgtgtaga

540

gaaggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgtttgcc

600

gtgttcgatg agggcaaaag ctggcattcc gagaccaaga attccctgat gcaggatagg

660

gacgctgcca gcgctagagc ctggcctaag atgcacactg tgaatggcta cgtgaaccgg

720

agcctgccag gcctgatcgg ctgtcacaga aagagcgtgt actggcacgt gatcggcatg

780

ggcaccactc ctgaggtgca ctctatcttt ctggaaggcc acacctttct ggtgcggaac

840

catagacagg cctccctgga aatcagcccc atcacctttc tgaccgccca gaccctgctg

900

atggatctgg gacagttcct gctgttttgc cacatctcct ctcaccagca cgacggaatg

960

gaggcctacg tgaaagtgga cagctgtcct gaagaacctc agctgcggat gaagaataac

1020

gaggaggccg aggactacga cgatgacctg accgatagcg agatggacgt ggtgagattc

1080

gacgacgata acagccccag cttcatccag atcagatccg tggccaagaa gcaccccaag

1140

acatgggtgc actatatcgc cgcagaggag gaggattggg actacgcacc tctggtgctg

1200

gctcctgacg atagatccta caagtcccag tacctgaaca acggccccca gagaatcggc

1260

agaaagtaca agaaggtgag attcatggcc tacaccgacg agacctttaa gaccagagag

1320

gccatccagc acgagagcgg cattctggga ccactgctgt atggagaggt gggcgataca

1380

ctgctgatca tcttcaagaa tcaggcctcc cggccataca acatctatcc acacggcatc

1440

accgacgtga gaccactgta ctccaggaga ctgcccaagg gcgtgaagca cctgaaggac

1500

ttccctattc tgccaggcga gatcttcaag tacaagtgga cagtgaccgt ggaagacgga

1560

cctaccaaaa gcgaccccag atgcctgacc cggtactact ccagcttcgt gaacatggag

1620

agagatctgg ccagcggact gattggacct ctgctgattt gttacaagga gagcgtggac

1680

cagaggggca accagattat gagcgacaag cggaatgtga tcctgttctc cgtgttcgac

1740

gagaaccgca gctggtatct gaccgagaat atccagaggt tcctgccaaa ccccgccggc

1800

gttcagctgg aagatccaga gtttcaggcc tccaacatca tgcacagcat caatggctac

1860

gtgttcgaca gcctgcagct gtccgtgtgt ctgcatgaag tggcctactg gtatatcctg

1920

agcatcggcg cccagaccga ttttctgtcc gtgtttttct ccggctacac cttcaagcac

1980

aagatggtgt acgaggacac cctgaccctg tttcctttta gcggcgaaac cgtgttcatg

2040

agcatggaga acccaggact gtggattctg ggctgtcaca acagcgactt cagaaatcgg

2100

ggcatgaccg ctctgctgaa ggtgagctct tgtgacaaaa ataccggcga ctactacgag

2160

gacagctacg aggatatcag cgcctacctg ctgagcaaga acaacgccat cgagccaaga

2220

agcttcagcc agaatccccc cgtgctgaag agacatcaga gggagatcac cagaaccacc

2280

ctgcagagcg accaggagga gatcgattac gacgacacca tcagcgtgga gatgaagaag

2340

gaggatttcg acatctacga cgaggacgag aatcagagcc caaggagctt tcagaagaag

2400

acccggcact acttcatcgc tgccgtggag agactgtggg attatggcat gagctccagc

2460

cctcacgtgc tgagaaatag agcccagtct ggctccgtgc cccagttcaa gaaagtggtg

2520

ttccaggaat tcaccgacgg cagctttacc cagcccctgt atagaggcga actgaatgaa

2580

cacctgggcc tgctgggacc ttacatcaga gccgaagtgg aggacaacat catggtgacc

2640

tttaggaatc aggccagcag accctacagc ttctatagct ccctgatctc ctacgaggag

2700

gaccagagac agggcgctga gccaagaaag aatttcgtga agcccaacga gaccaagacc

2760

tacttctgga aagtgcagca ccacatggcc cctaccaagg atgagttcga ctgtaaagcc

2820

tgggcctact tcagcgacgt ggacctggag aaggacgtgc actccggact gatcggacca

2880

ctgctggtgt gccacacaaa caccctgaac cctgcccatg gaagacaggt gactgtgcag

2940

gaattcgccc tgttctttac catcttcgac gagaccaagt cctggtactt caccgagaat

3000

atggagagga attgcagagc cccctgtaac atccagatgg aggaccccac ctttaaggag

3060

aattacaggt ttcacgccat caacggctac atcatggaca cactgccagg cctggtgatg

3120

gcacaggatc agaggatcag atggtatctg ctgagcatgg gctccaacga gaacatccac

3180

tccatccact tcagcggcca cgtgtttacc gtgagaaaga aggaggagta caagatggcc

3240

ctgtacaacc tgtatcccgg cgtgttcgaa accgtggaga tgctgccttc caaagccgga

3300

atctggagag tggagtgcct gattggcgag cacctgcacg ctggaatgtc caccctgttc

3360

ctggtgtata gcaacaagtg ccagaccccc ctgggcatgg ctagcggaca cattagagac

3420

tttcagatca ccgcctccgg ccagtacgga cagtgggccc caaaactggc taggctgcat

3480

tacagcggct ccatcaatgc ctggtccacc aaggagccat tcagctggat caaagtggat

3540

ctgctggccc ccatgatcat ccacggcatt aagacacagg gcgccaggca gaagttcagc

3600

tctctgtaca tctcccagtt catcatcatg tactccctgg acggcaagaa gtggcagacc

3660

tacaggggca atagcaccgg cacactgatg gtgtttttcg gcaacgtgga ctcttccggc

3720

atcaagcaca acatctttaa cccccctatc atcgccaggt acatcaggct gcaccccact

3780

cactacagca tcagatccac cctgagaatg gagctgatgg gatgcgacct gaacagctgc

3840

agcatgcccc tgggcatgga gagcaaggcc atttctgacg cccagatcac cgccagcagc

3900

tatttcacca atatgttcgc tacctggagc cccagcaagg ccagactgca tctgcagggc

3960

agaagcaacg cctggagacc acaggtgaac aatcctaaag agtggctgca ggtggacttc

4020

cagaagacca tgaaggtgac cggcgtgaca acccagggcg tgaaatctct gctgacctcc

4080

atgtacgtga aggagttcct gatctcctcc agccaggatg gccatcagtg gaccctgttc

4140

ttccagaacg gcaaggtgaa agtgttccag ggcaaccagg acagctttac ccctgtggtg

4200

aactctctgg atccccccct gctgaccagg tacctgagaa ttcaccccca gagctgggtg

4260

caccagatcg ccctgagaat ggaagtgctg ggatgcgagg cacaggacct gtac

4314

<210> 5

<211> 4314

<212> DNA

<213> Искусственная последовательность

<220>

<223> Кодон-оптимизированная нуклеотидная последовательность,

кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v4)

<400> 5

gctacccgga ggtactacct gggcgctgtg gagctgagct gggactacat gcagagcgat

60

ctgggcgagc tgcccgtgga tgccagattt cccccaagag tgcctaagtc cttccccttc

120

aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcaccgacca cctgttcaac

180

atcgccaagc caaggccccc ctggatggga ctgctgggac ctacaattca ggccgaggtg

240

tacgataccg tggtgatcac cctgaagaac atggcctccc acccagtgtc cctgcatgcc

300

gtgggcgtga gctactggaa ggcttctgaa ggcgccgagt acgacgacca gaccagccag

360

agggagaagg aggacgacaa ggtgttccca ggcggatctc acacctacgt gtggcaggtg

420

ctgaaggaga atggcccaat ggccagcgac ccactgtgtc tgacctacag ctacctgtcc

480

cacgtggacc tggtgaagga cctgaactcc ggcctgatcg gcgccctgct ggtgtgtaga

540

gaaggatctc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc

600

gtgtttgacg agggcaagag ctggcattcc gagaccaaga acagcctgat gcaggacaga

660

gacgcagcca gcgctagagc ctggcccaag atgcacaccg tgaatggcta cgtgaaccgg

720

tccctgccag gcctgatcgg ctgtcacaga aaaagcgtgt actggcacgt gatcggcatg

780

ggcaccacac ccgaggtgca cagcatcttt ctggagggcc acaccttcct ggtgagaaac

840

cacaggcagg cctccctgga gatctccccc atcacctttc tgaccgccca gaccctgctg

900

atggatctgg gccagttcct gctgttctgc cacatcagct cccaccagca cgacggaatg

960

gaggcctacg tgaaggtgga tagctgcccc gaggagcccc agctgagaat gaagaacaac

1020

gaggaggccg aggactacga cgatgacctg accgattccg agatggacgt ggtgcgcttc

1080

gacgacgata atagccccag cttcatccag atcagatccg tggccaagaa gcacccaaag

1140

acctgggtgc actacatcgc tgccgaggag gaggactggg attacgcccc actggtgctg

1200

gcccctgatg acagatccta caagagccag tacctgaaca acggccccca gagaatcggc

1260

cggaagtaca agaaggtgag attcatggcc tacaccgacg agaccttcaa gaccagggaa

1320

gccatccagc acgagagcgg catcctggga ccactgctgt acggagaagt gggcgatacc

1380

ctgctgatca tcttcaagaa ccaggcctcc cggccctaca acatctaccc ccacggcatc

1440

accgacgtga ggccactgta cagcaggagg ctgcccaagg gcgtgaagca cctgaaggac

1500

ttccccatcc tgcccggcga gatctttaag tacaagtgga ccgtgaccgt ggaggacggc

1560

ccaaccaaga gcgacccaag atgcctgacc aggtactact cctccttcgt gaacatggag

1620

cgggatctgg ccagcggact gattggccct ctgctgatct gctacaagga gagcgtggac

1680

cagcgcggca atcagatcat gagcgacaag agaaacgtga tcctgttcag cgtgttcgac

1740

gagaatcgca gctggtacct gaccgagaac atccagaggt tcctgcccaa cccagccggc

1800

gtgcagctgg aagatcctga atttcaggcc agcaacatca tgcactccat caacggctac

1860

gtgttcgact ccctgcagct gagcgtgtgt ctgcacgaag tggcctactg gtacatcctg

1920

agcatcggcg cccagaccga cttcctgtcc gtgttctttt ccggctacac cttcaagcac

1980

aagatggtgt acgaggacac cctgaccctg ttccccttta gcggcgagac cgtgttcatg

2040

agcatggaga acccaggcct gtggattctg ggctgccaca acagcgactt ccgcaatagg

2100

ggcatgaccg ccctgctgaa agtgtccagc tgcgataaga acaccggcga ctactacgag

2160

gacagctacg aggacatctc cgcctacctg ctgagcaaga acaacgccat cgagcccaga

2220

tccttcagcc agaaccctcc agtgctgaag aggcaccagc gcgagatcac cagaaccacc

2280

ctgcagtctg atcaggagga gatcgactac gacgacacca tcagcgtgga gatgaagaag

2340

gaggacttcg acatctacga cgaggacgag aaccagagcc ctaggtcctt ccagaagaag

2400

acccggcact acttcatcgc cgcagtggag aggctgtggg attacggcat gagcagctcc

2460

ccacacgtgc tgagaaatag ggcccagagc ggcagcgtgc cccagttcaa aaaggtggtg

2520

ttccaggagt tcaccgacgg ctccttcacc cagcccctgt acagaggcga gctgaatgag

2580

cacctgggcc tgctgggacc ctacatcaga gcagaggtgg aggacaacat catggtgacc

2640

ttcaggaacc aggccagcag accctacagc ttctacagca gcctgatcag ctacgaggag

2700

gaccagagac agggagccga gccacgcaag aacttcgtga agcccaacga gaccaagacc

2760

tacttctgga aggtgcagca ccacatggcc cccaccaagg acgagttcga ttgtaaagcc

2820

tgggcctact tcagcgacgt ggacctggag aaggacgtgc acagcggcct gatcggacct

2880

ctgctggtgt gtcataccaa caccctgaac cccgcccacg gcagacaggt gactgtgcag

2940

gagtttgccc tgttcttcac catcttcgac gagaccaaga gctggtactt caccgagaac

3000

atggagagaa actgcagggc cccatgcaac atccagatgg aagaccccac cttcaaggag

3060

aactaccggt tccacgccat caacggctac atcatggata ccctgcctgg cctggtgatg

3120

gcccaggatc agagaatcag gtggtacctg ctgagcatgg gctccaacga gaacatccac

3180

agcatccact tctccggcca cgtgttcacc gtgaggaaaa aggaggagta caagatggcc

3240

ctgtacaacc tgtaccccgg cgtgtttgag accgtggaga tgctgccatc taaggccggc

3300

atttggagag tggagtgcct gatcggcgag cacctgcacg ccggaatgtc taccctgttc

3360

ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg ccagcggaca catcagagac

3420

ttccagatca ccgccagcgg ccagtacgga cagtgggctc ctaaactggc ccgcctgcac

3480

tatagcggca gcattaacgc ctggtccacc aaggagccat tcagctggat caaggtggat

3540

ctgctggccc ccatgatcat ccacggcatc aaaacacagg gcgccagaca gaagttctcc

3600

agcctgtaca tctcccagtt catcatcatg tactccctgg acggcaagaa gtggcagacc

3660

tacagaggca actccaccgg cacactgatg gtgttcttcg gcaacgtgga cagcagcggc

3720

atcaagcaca acatcttcaa cccccccatc atcgcccggt acatcagact gcacccaacc

3780

cactactcca tcaggtccac cctgaggatg gagctgatgg gctgcgatct gaattcctgc

3840

agcatgcccc tgggcatgga gtccaaagcc atctctgacg cccagatcac cgccagctcc

3900

tacttcacca acatgttcgc cacttggagc cccagcaagg ccagactgca cctgcagggc

3960

agaagcaatg cctggagacc ccaggtgaac aacccaaagg agtggctgca ggtggacttc

4020

cagaagacca tgaaggtgac cggcgtgacc acacagggcg tgaaaagcct gctgaccagc

4080

atgtacgtga aggagttcct gatcagctcc agccaggatg ggcaccagtg gaccctgttc

4140

tttcagaacg gcaaggtgaa ggtgttccag ggcaatcagg actcattcac ccctgtggtg

4200

aactctctgg acccccccct gctgacccgg tacctgagaa tccacccaca gtcttgggtg

4260

caccagatcg ccctgaggat ggaagtgctg ggctgcgagg ctcaggatct gtac

4314

<210> 6

<211> 4371

<212> DNA

<213> Искусственная последовательность

<220>

<223> Нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным

пептидом (дикого типа)

<400> 6

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc

60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc

120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac

180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc

240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat

300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt

360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg

420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg

480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat

540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa

600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta

660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat

720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct

780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc

840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat

900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg

960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa

1020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa

1080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat

1140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact

1200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc

1260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg

1320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct

1380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg

1440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact

1500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt

1560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca

1620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga

1680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa

1740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag

1800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg

1860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt

1920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc

1980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa

2040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg

2100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc

2160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac

2220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc

2280

ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt

2340

cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa

2400

gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca

2460

cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca

2520

catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc

2580

caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat

2640

ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc

2700

agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat

2760

cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac

2820

ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg

2880

gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt

2940

ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa

3000

tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg

3060

gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat

3120

tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct

3180

caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct

3240

attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg

3300

tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt

3360

tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg

3420

gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt

3480

cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat

3540

tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg

3600

ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc

3660

ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat

3720

cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata

3780

aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat

3840

tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc

3900

atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac

3960

tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg

4020

agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag

4080

aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg

4140

tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt

4200

cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac

4260

tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac

4320

cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c

4371

<210> 7

<211> 4371

<212> DNA

<213> Искусственная последовательность

<220>

<223> Кодон-оптимизированная нуклеотидная последовательность,

кодирующая белок FVIII-BDD с сигнальным пептидом (вариант

FVIII-BDDco-v1)

<400> 7

atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttcagcgcc

60

accagaaggt actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg

120

ggcgagctgc ctgtggacgc cagattcccc cccagagtgc ctaagagctt ccccttcaac

180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc

240

gccaagccca gacccccctg gatgggcctg ctgggcccta ccatccaggc cgaggtgtac

300

gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg

360

ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagaga

420

gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg

480

aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac

540

gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgcagagag

600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg

660

ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagagac

720

gccgccagcg ccagagcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc

780

ctgcccggcc tgatcggctg ccacagaaag agcgtgtact ggcacgtgat cggcatgggc

840

accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac

900

agacaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg

960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag

1020

gcctacgtga aggtggacag ctgccccgag gagccccagc tgagaatgaa gaacaacgag

1080

gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gagattcgac

1140

gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc

1200

tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc

1260

cccgacgaca gaagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcaga

1320

aagtacaaga aggtgcggtt catggcctac accgacgaga ccttcaagac cagggaggcc

1380

atccagcacg agagcggcat cctgggccct ctgctgtacg gcgaggtggg cgacaccctg

1440

ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccccca cggcatcacc

1500

gacgtgagac ccctgtacag cagaagactg cccaagggcg tgaagcacct gaaggacttc

1560

cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc

1620

accaagagcg accccagatg cctgaccaga tactacagca gcttcgtgaa catggagcgg

1680

gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag

1740

agaggcaacc agatcatgag cgacaagcgg aacgtgatcc tgttcagcgt gttcgacgag

1800

aaccggagct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg

1860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg

1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc

1980

atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag

2040

atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc

2100

atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag aaacagaggc

2160

atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac

2220

agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggagc

2280

ttcagccaga acccccccgt gctgaagaga caccagagag agatcaccag gaccaccctg

2340

cagagcgacc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag

2400

gacttcgaca tctacgacga ggacgagaac cagagcccca gaagcttcca gaagaagacc

2460

aggcactact tcatcgccgc cgtggagaga ctgtgggact acggcatgag cagcagcccc

2520

cacgtgctga gaaacagagc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc

2580

caggagttca ccgacggcag cttcacccag cccctgtaca gaggcgagct gaacgagcac

2640

ctgggcctgc tgggccccta catcagagcc gaggtggagg acaacatcat ggtgaccttc

2700

cggaaccagg ccagcagacc ctacagcttc tacagcagcc tgatcagcta cgaggaggac

2760

cagaggcagg gcgccgagcc cagaaagaac ttcgtgaagc ccaacgagac caagacctac

2820

ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg

2880

gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg

2940

ctggtgtgcc acaccaacac cctgaacccc gcccacggca gacaggtgac cgtgcaggag

3000

ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg

3060

gagcggaact gcagagcccc ctgcaacatc cagatggagg accccacctt caaggagaac

3120

tacaggttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc

3180

caggaccaga gaatcagatg gtacctgctg agcatgggca gcaacgagaa catccacagc

3240

atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg

3300

tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc

3360

tggagagtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg

3420

gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat cagagacttc

3480

cagatcaccg ccagcggcca gtacggccag tgggccccca agctggccag actgcactac

3540

agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg

3600

ctggccccca tgatcatcca cggcatcaag acccagggcg ccagacagaa gttcagcagc

3660

ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac

3720

agaggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc

3780

aagcacaaca tcttcaaccc ccccatcatc gcccggtaca tcaggctgca ccccacccac

3840

tacagcatca ggagcaccct gagaatggag ctgatgggct gcgacctgaa cagctgcagc

3900

atgcccctgg gcatggagag caaggccatc agcgacgccc agatcaccgc cagcagctac

3960

ttcaccaaca tgttcgccac ctggagcccc agcaaggcca gactgcacct gcagggcaga

4020

agcaacgcct ggagacccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag

4080

aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg

4140

tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc

4200

cagaacggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac

4260

agcctggacc cccccctgct gaccagatac ctgagaatcc acccccagag ctgggtgcac

4320

cagatcgccc tgagaatgga ggtgctgggc tgcgaggccc aggacctgta c

4371

<210> 8

<211> 4371

<212> DNA

<213> Искусственная последовательность

<220>

<223> Кодон-оптимизированная нуклеотидная последовательность,

кодирующая белок FVIII-BDD с сигнальным пептидом (вариант

FVIII-BDDco-v2)

<400> 8

atgcagatcg agctgagcac ctgttttttt ctgtgcctgc tgaggttctg cttctccgcc

60

acaagaagat actatctggg cgccgtggag ctgagctggg attatatgca gtccgacctg

120

ggcgagctgc cagtggatgc tagattccct cctagagtgc ctaagagctt tccattcaat

180

acctccgtgg tgtacaagaa gaccctgttc gtggagttta ccgaccacct gttcaacatc

240

gccaaaccta gaccaccttg gatgggactg ctgggcccaa ctattcaggc cgaagtgtac

300

gataccgtgg tgatcactct gaagaatatg gcctcccacc ctgtgagcct gcatgcagtt

360

ggcgtgagct attggaaggc cagcgaggga gccgaatacg atgaccagac cagccagagg

420

gagaaggaag acgacaaggt gtttcccgga ggaagccaca cctatgtgtg gcaggtgctg

480

aaggagaatg gacctatggc cagcgatcca ctgtgcctga cctactctta tctgagccac

540

gtggacctgg tgaaggacct gaatagcggc ctgattggcg cactgctggt gtgtagagag

600

ggatctctgg ccaaagagaa gacccagacc ctgcacaagt ttatcctgct gtttgccgtg

660

tttgacgagg gcaaatcttg gcacagcgag accaaaaaca gcctgatgca ggatagagac

720

gcagcctctg ctagagcttg gcctaagatg cacaccgtga atggctacgt gaacagatcc

780

ctgcccggcc tgattggatg tcacagaaag agcgtgtact ggcacgtgat cggaatggga

840

actaccccag aagtgcacag catctttctg gagggacaca cctttctggt gcggaatcat

900

agacaggcca gcctggaaat cagccctatt acctttctga ccgcccagac actgctgatg

960

gatctgggac agtttctgct gttctgccac atcagctctc accagcatga cggaatggaa

1020

gcctacgtga aggtggacag ctgccctgag gaaccacagc tgaggatgaa gaataacgag

1080

gaggccgagg attacgacga tgacctgacc gattctgaga tggacgtggt gagattcgac

1140

gacgataact ctccctcctt catccagatc agatccgtgg ccaaaaagca ccctaaaacc

1200

tgggtgcact atatcgccgc agaggaagaa gactgggatt acgcacctct ggtgctggcc

1260

cctgatgaca gatcttataa gtctcagtac ctgaacaacg gccctcagag aatcggcagg

1320

aagtacaaga aggtgagatt catggcctac acagacgaga cattcaagac cagagaggcc

1380

attcagcacg agtccggcat tctgggacca ctgctgtacg gagaggtggg cgatacactg

1440

ctgatcatct tcaaaaatca ggccagcagg ccctacaaca tctacccaca tggcatcaca

1500

gacgtgaggc ctctgtacag cagaagactg cctaaaggcg tgaagcacct gaaggacttc

1560

cccattctgc caggcgagat tttcaagtac aagtggacag tgaccgtgga ggatggaccc

1620

acaaagtctg accctagatg cctgaccagg tactatagct ccttcgtgaa catggaaagg

1680

gatctggcct ctggactgat tggcccactg ctgatctgct acaaggaatc cgtggaccag

1740

agaggaaacc agatcatgag cgataagagg aatgtgatcc tgttcagcgt gttcgatgag

1800

aacaggagct ggtatctgac cgagaacatc cagagattcc tgccaaatcc agccggcgtg

1860

cagctggaag atcctgaatt tcaggcctcc aatatcatgc actccatcaa tggctacgtg

1920

tttgacagcc tgcagctgtc tgtgtgtctg cacgaagtgg cctactggta catcctgagc

1980

attggagccc agaccgactt tctgagcgtg tttttctctg gctacacctt caagcacaag

2040

atggtgtacg aggacaccct gacactgttc ccattctcag gcgaaaccgt gtttatgagc

2100

atggagaacc caggactgtg gattctgggc tgccacaact ccgacttcag gaatagagga

2160

atgaccgccc tgctgaaagt gagcagctgc gataagaaca ccggcgatta ttacgaggac

2220

tcctacgagg atatcagcgc ctacctgctg tccaaaaaca atgccatcga gcccaggagc

2280

ttctcccaga atccacctgt gctgaaaaga caccagaggg agatcaccag aaccacactg

2340

cagtctgatc aggaggagat cgactatgac gacaccatca gcgtggagat gaagaaggag

2400

gactttgata tctacgacga ggatgagaac cagagcccca ggagctttca gaagaagacc

2460

aggcactact tcatcgccgc agtggagaga ctgtgggact acggaatgtc ttcctcccct

2520

cacgtgctga gaaatagagc ccagtctgga agcgtgccac agtttaagaa ggtggtgttc

2580

caggagttta ccgacggctc tttcacccag ccactgtata gaggcgaact gaacgaacac

2640

ctgggcctgc tgggacctta tatcagagcc gaagtggagg acaacatcat ggtgaccttc

2700

agaaaccagg ccagcagacc ttacagcttc tactccagcc tgatcagcta cgaagaggat

2760

cagagacagg gcgccgaacc taggaaaaat tttgtgaagc caaacgagac caagacctac

2820

ttttggaagg tgcagcatca catggccccc accaaggatg agttcgattg taaagcctgg

2880

gcctacttct ccgatgtgga cctggaaaag gatgtgcaca gcggactgat cggaccactg

2940

ctggtgtgcc acacaaatac cctgaaccct gcccacggaa gacaggtgac agtgcaggaa

3000

tttgccctgt tcttcaccat ctttgacgag accaagtcct ggtacttcac cgagaacatg

3060

gagagaaact gcagagcccc ttgcaacatt cagatggagg acccaacatt caaggagaac

3120

tacaggttcc acgccatcaa tggctacatc atggatacac tgcctggcct ggtgatggcc

3180

caggatcaga gaattaggtg gtacctgctg tctatgggct ccaatgagaa tatccactcc

3240

atccacttca gcggccacgt gttcaccgtg agaaagaaag aggagtacaa gatggccctg

3300

tacaacctgt acccaggcgt gtttgagacc gtggagatgc tgccttctaa agctggcatc

3360

tggagagtgg agtgcctgat cggcgagcat ctgcatgctg gaatgtctac cctgtttctg

3420

gtgtactcca acaagtgcca gacacctctg ggcatggctt ctggacatat cagagacttt

3480

cagatcaccg cctccggcca gtacggacaa tgggctccaa agctggccag actgcattac

3540

tctggctcta ttaatgcctg gagcaccaag gagccctttt cctggatcaa ggtggatctg

3600

ctggccccca tgattatcca cggcatcaaa acccagggcg ccaggcagaa gttttcttcc

3660

ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac

3720

agaggcaata gcaccggaac cctgatggtg tttttcggca acgtggactc ctccggcatt

3780

aagcacaata tcttcaaccc acctatcatc gccaggtaca tcagactgca ccccacccac

3840

tactctatca gaagcaccct gaggatggaa ctgatgggct gtgacctgaa ttcctgtagc

3900

atgcctctgg gaatggagtc taaagccatc agtgacgccc agattaccgc cagcagctac

3960

tttaccaaca tgtttgctac atggtccccc tctaaggcca gactgcacct gcagggaaga

4020

tctaacgcct ggagaccaca ggtgaacaac cccaaagaat ggctgcaggt ggattttcag

4080

aagaccatga aagtgaccgg cgtgacaaca cagggcgtga aatctctgct gacctctatg

4140

tacgtgaagg agtttctgat cagcagcagc caggacggcc atcagtggac cctgtttttt

4200

cagaatggca aggtgaaggt gttccagggc aatcaggact cattcactcc agtggtgaac

4260

agcctggacc cacctctgct gaccagatac ctgagaattc acccacagtc ctgggtgcat

4320

cagatcgccc tgagaatgga agtgctggga tgtgaggcac aggacctgta c

4371

<210> 9

<211> 4371

<212> DNA

<213> Искусственная последовательность

<220>

<223> Кодон-оптимизированная нуклеотидная последовательность,

кодирующая белок FVIII-BDD с сигнальным пептидом (вариант

FVIII-BDDco-v3)

<400> 9

atgcagatcg agctgagcac ctgtttcttc ctgtgcctgc tgaggttctg tttcagcgcc

60

acaaggaggt actatctggg cgccgtggaa ctgagctggg actatatgca gagcgacctg

120

ggagagctgc ctgtggatgc cagatttcca cctagggtgc ccaagagctt ccccttcaat

180

acaagcgtgg tgtacaagaa gaccctgttc gtggagttta ccgaccacct gttcaacatc

240

gccaagccta gacctccttg gatgggactg ctgggcccta ccattcaggc cgaagtgtac

300

gacacagtgg tgatcaccct gaagaatatg gccagccatc cagtgtccct gcacgcagtg

360

ggagtgtctt attggaaggc ctctgagggc gccgagtacg atgatcagac cagccagaga

420

gagaaggagg acgacaaggt gttccccgga ggaagccaca cctacgtgtg gcaggtgctg

480

aaagagaatg gcccaatggc ctccgacccc ctgtgtctga catacagcta cctgagccac

540

gtggacctgg tgaaggacct gaactctggc ctgatcggag ctctgctggt gtgtagagaa

600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgccgtg

660

ttcgatgagg gcaaaagctg gcattccgag accaagaatt ccctgatgca ggatagggac

720

gctgccagcg ctagagcctg gcctaagatg cacactgtga atggctacgt gaaccggagc

780

ctgccaggcc tgatcggctg tcacagaaag agcgtgtact ggcacgtgat cggcatgggc

840

accactcctg aggtgcactc tatctttctg gaaggccaca cctttctggt gcggaaccat

900

agacaggcct ccctggaaat cagccccatc acctttctga ccgcccagac cctgctgatg

960

gatctgggac agttcctgct gttttgccac atctcctctc accagcacga cggaatggag

1020

gcctacgtga aagtggacag ctgtcctgaa gaacctcagc tgcggatgaa gaataacgag

1080

gaggccgagg actacgacga tgacctgacc gatagcgaga tggacgtggt gagattcgac

1140

gacgataaca gccccagctt catccagatc agatccgtgg ccaagaagca ccccaagaca

1200

tgggtgcact atatcgccgc agaggaggag gattgggact acgcacctct ggtgctggct

1260

cctgacgata gatcctacaa gtcccagtac ctgaacaacg gcccccagag aatcggcaga

1320

aagtacaaga aggtgagatt catggcctac accgacgaga cctttaagac cagagaggcc

1380

atccagcacg agagcggcat tctgggacca ctgctgtatg gagaggtggg cgatacactg

1440

ctgatcatct tcaagaatca ggcctcccgg ccatacaaca tctatccaca cggcatcacc

1500

gacgtgagac cactgtactc caggagactg cccaagggcg tgaagcacct gaaggacttc

1560

cctattctgc caggcgagat cttcaagtac aagtggacag tgaccgtgga agacggacct

1620

accaaaagcg accccagatg cctgacccgg tactactcca gcttcgtgaa catggagaga

1680

gatctggcca gcggactgat tggacctctg ctgatttgtt acaaggagag cgtggaccag

1740

aggggcaacc agattatgag cgacaagcgg aatgtgatcc tgttctccgt gttcgacgag

1800

aaccgcagct ggtatctgac cgagaatatc cagaggttcc tgccaaaccc cgccggcgtt

1860

cagctggaag atccagagtt tcaggcctcc aacatcatgc acagcatcaa tggctacgtg

1920

ttcgacagcc tgcagctgtc cgtgtgtctg catgaagtgg cctactggta tatcctgagc

1980

atcggcgccc agaccgattt tctgtccgtg tttttctccg gctacacctt caagcacaag

2040

atggtgtacg aggacaccct gaccctgttt ccttttagcg gcgaaaccgt gttcatgagc

2100

atggagaacc caggactgtg gattctgggc tgtcacaaca gcgacttcag aaatcggggc

2160

atgaccgctc tgctgaaggt gagctcttgt gacaaaaata ccggcgacta ctacgaggac

2220

agctacgagg atatcagcgc ctacctgctg agcaagaaca acgccatcga gccaagaagc

2280

ttcagccaga atccccccgt gctgaagaga catcagaggg agatcaccag aaccaccctg

2340

cagagcgacc aggaggagat cgattacgac gacaccatca gcgtggagat gaagaaggag

2400

gatttcgaca tctacgacga ggacgagaat cagagcccaa ggagctttca gaagaagacc

2460

cggcactact tcatcgctgc cgtggagaga ctgtgggatt atggcatgag ctccagccct

2520

cacgtgctga gaaatagagc ccagtctggc tccgtgcccc agttcaagaa agtggtgttc

2580

caggaattca ccgacggcag ctttacccag cccctgtata gaggcgaact gaatgaacac

2640

ctgggcctgc tgggacctta catcagagcc gaagtggagg acaacatcat ggtgaccttt

2700

aggaatcagg ccagcagacc ctacagcttc tatagctccc tgatctccta cgaggaggac

2760

cagagacagg gcgctgagcc aagaaagaat ttcgtgaagc ccaacgagac caagacctac

2820

ttctggaaag tgcagcacca catggcccct accaaggatg agttcgactg taaagcctgg

2880

gcctacttca gcgacgtgga cctggagaag gacgtgcact ccggactgat cggaccactg

2940

ctggtgtgcc acacaaacac cctgaaccct gcccatggaa gacaggtgac tgtgcaggaa

3000

ttcgccctgt tctttaccat cttcgacgag accaagtcct ggtacttcac cgagaatatg

3060

gagaggaatt gcagagcccc ctgtaacatc cagatggagg accccacctt taaggagaat

3120

tacaggtttc acgccatcaa cggctacatc atggacacac tgccaggcct ggtgatggca

3180

caggatcaga ggatcagatg gtatctgctg agcatgggct ccaacgagaa catccactcc

3240

atccacttca gcggccacgt gtttaccgtg agaaagaagg aggagtacaa gatggccctg

3300

tacaacctgt atcccggcgt gttcgaaacc gtggagatgc tgccttccaa agccggaatc

3360

tggagagtgg agtgcctgat tggcgagcac ctgcacgctg gaatgtccac cctgttcctg

3420

gtgtatagca acaagtgcca gacccccctg ggcatggcta gcggacacat tagagacttt

3480

cagatcaccg cctccggcca gtacggacag tgggccccaa aactggctag gctgcattac

3540

agcggctcca tcaatgcctg gtccaccaag gagccattca gctggatcaa agtggatctg

3600

ctggccccca tgatcatcca cggcattaag acacagggcg ccaggcagaa gttcagctct

3660

ctgtacatct cccagttcat catcatgtac tccctggacg gcaagaagtg gcagacctac

3720

aggggcaata gcaccggcac actgatggtg tttttcggca acgtggactc ttccggcatc

3780

aagcacaaca tctttaaccc ccctatcatc gccaggtaca tcaggctgca ccccactcac

3840

tacagcatca gatccaccct gagaatggag ctgatgggat gcgacctgaa cagctgcagc

3900

atgcccctgg gcatggagag caaggccatt tctgacgccc agatcaccgc cagcagctat

3960

ttcaccaata tgttcgctac ctggagcccc agcaaggcca gactgcatct gcagggcaga

4020

agcaacgcct ggagaccaca ggtgaacaat cctaaagagt ggctgcaggt ggacttccag

4080

aagaccatga aggtgaccgg cgtgacaacc cagggcgtga aatctctgct gacctccatg

4140

tacgtgaagg agttcctgat ctcctccagc caggatggcc atcagtggac cctgttcttc

4200

cagaacggca aggtgaaagt gttccagggc aaccaggaca gctttacccc tgtggtgaac

4260

tctctggatc cccccctgct gaccaggtac ctgagaattc acccccagag ctgggtgcac

4320

cagatcgccc tgagaatgga agtgctggga tgcgaggcac aggacctgta c

4371

<210> 10

<211> 4371

<212> DNA

<213> Искусственная последовательность

<220>

<223> Кодон-оптимизированная нуклеотидная последовательность,

кодирующая белок FVIII-BDD с сигнальным пептидом (вариант

FVIII-BDDco-v4)

<400> 10

atgcagatcg agctgtccac ctgcttcttc ctgtgcctgc tgcgcttctg tttctctgct

60

acccggaggt actacctggg cgctgtggag ctgagctggg actacatgca gagcgatctg

120

ggcgagctgc ccgtggatgc cagatttccc ccaagagtgc ctaagtcctt ccccttcaac

180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc

240

gccaagccaa ggcccccctg gatgggactg ctgggaccta caattcaggc cgaggtgtac

300

gataccgtgg tgatcaccct gaagaacatg gcctcccacc cagtgtccct gcatgccgtg

360

ggcgtgagct actggaaggc ttctgaaggc gccgagtacg acgaccagac cagccagagg

420

gagaaggagg acgacaaggt gttcccaggc ggatctcaca cctacgtgtg gcaggtgctg

480

aaggagaatg gcccaatggc cagcgaccca ctgtgtctga cctacagcta cctgtcccac

540

gtggacctgg tgaaggacct gaactccggc ctgatcggcg ccctgctggt gtgtagagaa

600

ggatctctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg

660

tttgacgagg gcaagagctg gcattccgag accaagaaca gcctgatgca ggacagagac

720

gcagccagcg ctagagcctg gcccaagatg cacaccgtga atggctacgt gaaccggtcc

780

ctgccaggcc tgatcggctg tcacagaaaa agcgtgtact ggcacgtgat cggcatgggc

840

accacacccg aggtgcacag catctttctg gagggccaca ccttcctggt gagaaaccac

900

aggcaggcct ccctggagat ctcccccatc acctttctga ccgcccagac cctgctgatg

960

gatctgggcc agttcctgct gttctgccac atcagctccc accagcacga cggaatggag

1020

gcctacgtga aggtggatag ctgccccgag gagccccagc tgagaatgaa gaacaacgag

1080

gaggccgagg actacgacga tgacctgacc gattccgaga tggacgtggt gcgcttcgac

1140

gacgataata gccccagctt catccagatc agatccgtgg ccaagaagca cccaaagacc

1200

tgggtgcact acatcgctgc cgaggaggag gactgggatt acgccccact ggtgctggcc

1260

cctgatgaca gatcctacaa gagccagtac ctgaacaacg gcccccagag aatcggccgg

1320

aagtacaaga aggtgagatt catggcctac accgacgaga ccttcaagac cagggaagcc

1380

atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg cgataccctg

1440

ctgatcatct tcaagaacca ggcctcccgg ccctacaaca tctaccccca cggcatcacc

1500

gacgtgaggc cactgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc

1560

cccatcctgc ccggcgagat ctttaagtac aagtggaccg tgaccgtgga ggacggccca

1620

accaagagcg acccaagatg cctgaccagg tactactcct ccttcgtgaa catggagcgg

1680

gatctggcca gcggactgat tggccctctg ctgatctgct acaaggagag cgtggaccag

1740

cgcggcaatc agatcatgag cgacaagaga aacgtgatcc tgttcagcgt gttcgacgag

1800

aatcgcagct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc agccggcgtg

1860

cagctggaag atcctgaatt tcaggccagc aacatcatgc actccatcaa cggctacgtg

1920

ttcgactccc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgagc

1980

atcggcgccc agaccgactt cctgtccgtg ttcttttccg gctacacctt caagcacaag

2040

atggtgtacg aggacaccct gaccctgttc ccctttagcg gcgagaccgt gttcatgagc

2100

atggagaacc caggcctgtg gattctgggc tgccacaaca gcgacttccg caataggggc

2160

atgaccgccc tgctgaaagt gtccagctgc gataagaaca ccggcgacta ctacgaggac

2220

agctacgagg acatctccgc ctacctgctg agcaagaaca acgccatcga gcccagatcc

2280

ttcagccaga accctccagt gctgaagagg caccagcgcg agatcaccag aaccaccctg

2340

cagtctgatc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag

2400

gacttcgaca tctacgacga ggacgagaac cagagcccta ggtccttcca gaagaagacc

2460

cggcactact tcatcgccgc agtggagagg ctgtgggatt acggcatgag cagctcccca

2520

cacgtgctga gaaatagggc ccagagcggc agcgtgcccc agttcaaaaa ggtggtgttc

2580

caggagttca ccgacggctc cttcacccag cccctgtaca gaggcgagct gaatgagcac

2640

ctgggcctgc tgggacccta catcagagca gaggtggagg acaacatcat ggtgaccttc

2700

aggaaccagg ccagcagacc ctacagcttc tacagcagcc tgatcagcta cgaggaggac

2760

cagagacagg gagccgagcc acgcaagaac ttcgtgaagc ccaacgagac caagacctac

2820

ttctggaagg tgcagcacca catggccccc accaaggacg agttcgattg taaagcctgg

2880

gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggacctctg

2940

ctggtgtgtc ataccaacac cctgaacccc gcccacggca gacaggtgac tgtgcaggag

3000

tttgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg

3060

gagagaaact gcagggcccc atgcaacatc cagatggaag accccacctt caaggagaac

3120

taccggttcc acgccatcaa cggctacatc atggataccc tgcctggcct ggtgatggcc

3180

caggatcaga gaatcaggtg gtacctgctg agcatgggct ccaacgagaa catccacagc

3240

atccacttct ccggccacgt gttcaccgtg aggaaaaagg aggagtacaa gatggccctg

3300

tacaacctgt accccggcgt gtttgagacc gtggagatgc tgccatctaa ggccggcatt

3360

tggagagtgg agtgcctgat cggcgagcac ctgcacgccg gaatgtctac cctgttcctg

3420

gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggacacat cagagacttc

3480

cagatcaccg ccagcggcca gtacggacag tgggctccta aactggcccg cctgcactat

3540

agcggcagca ttaacgcctg gtccaccaag gagccattca gctggatcaa ggtggatctg

3600

ctggccccca tgatcatcca cggcatcaaa acacagggcg ccagacagaa gttctccagc

3660

ctgtacatct cccagttcat catcatgtac tccctggacg gcaagaagtg gcagacctac

3720

agaggcaact ccaccggcac actgatggtg ttcttcggca acgtggacag cagcggcatc

3780

aagcacaaca tcttcaaccc ccccatcatc gcccggtaca tcagactgca cccaacccac

3840

tactccatca ggtccaccct gaggatggag ctgatgggct gcgatctgaa ttcctgcagc

3900

atgcccctgg gcatggagtc caaagccatc tctgacgccc agatcaccgc cagctcctac

3960

ttcaccaaca tgttcgccac ttggagcccc agcaaggcca gactgcacct gcagggcaga

4020

agcaatgcct ggagacccca ggtgaacaac ccaaaggagt ggctgcaggt ggacttccag

4080

aagaccatga aggtgaccgg cgtgaccaca cagggcgtga aaagcctgct gaccagcatg

4140

tacgtgaagg agttcctgat cagctccagc caggatgggc accagtggac cctgttcttt

4200

cagaacggca aggtgaaggt gttccagggc aatcaggact cattcacccc tgtggtgaac

4260

tctctggacc cccccctgct gacccggtac ctgagaatcc acccacagtc ttgggtgcac

4320

cagatcgccc tgaggatgga agtgctgggc tgcgaggctc aggatctgta c

4371

<210> 11

<211> 1438

<212> PRT

<213> Искусственная последовательность

<220>

<223> белок FVIII-BDD (фактор свёртывания крови VIII c делетированным

B

доменом)

<400> 11

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys

485 490 495

His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys

500 505 510

Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys

515 520 525

Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala

530 535 540

Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp

545 550 555 560

Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe

565 570 575

Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln

580 585 590

Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe

595 600 605

Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser

610 615 620

Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu

625 630 635 640

Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr

645 650 655

Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro

660 665 670

Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp

675 680 685

Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala

690 695 700

Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu

705 710 715 720

Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala

725 730 735

Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His

740 745 750

Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile

755 760 765

Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp

770 775 780

Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys

785 790 795 800

Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly

805 810 815

Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser

820 825 830

Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser

835 840 845

Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu

850 855 860

Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr

865 870 875 880

Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile

885 890 895

Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe

900 905 910

Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His

915 920 925

Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe

930 935 940

Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro

945 950 955 960

Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln

965 970 975

Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr

980 985 990

Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro

995 1000 1005

Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe

1010 1015 1020

His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met

1025 1030 1035 1040

Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn

1045 1050 1055

Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg

1060 1065 1070

Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val

1075 1080 1085

Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val

1090 1095 1100

Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe

1105 1110 1115 1120

Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly

1125 1130 1135

His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp

1140 1145 1150

Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp

1155 1160 1165

Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro

1170 1175 1180

Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser

1185 1190 1195 1200

Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys

1205 1210 1215

Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe

1220 1225 1230

Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro

1235 1240 1245

Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile

1250 1255 1260

Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys

1265 1270 1275 1280

Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile

1285 1290 1295

Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser

1300 1305 1310

Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln

1315 1320 1325

Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met

1330 1335 1340

Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser

1345 1350 1355 1360

Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln

1365 1370 1375

Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn

1380 1385 1390

Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu

1395 1400 1405

Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala

1410 1415 1420

Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr

1425 1430 1435

<210> 12

<211> 1457

<212> PRT

<213> Искусственная последовательность

<220>

<223> белок FVIII-BDD с сигнальным пептидом

<400> 12

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1 5 10 15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

20 25 30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

35 40 45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

50 55 60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

65 70 75 80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

85 90 95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

100 105 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

115 120 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

130 135 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145 150 155 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

165 170 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

180 185 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

195 200 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

210 215 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225 230 235 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

245 250 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

260 265 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

275 280 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

290 295 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305 310 315 320

Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His

325 330 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

340 345 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

355 360 365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

370 375 380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385 390 395 400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

405 410 415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

420 425 430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

435 440 445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

450 455 460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465 470 475 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

485 490 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

500 505 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

515 520 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530 535 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545 550 555 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

565 570 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

580 585 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

595 600 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

610 615 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625 630 635 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

645 650 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

660 665 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

675 680 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

690 695 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705 710 715 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

725 730 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

740 745 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu

755 760 765

Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln

770 775 780

Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu

785 790 795 800

Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe

805 810 815

Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp

820 825 830

Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln

835 840 845

Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr

850 855 860

Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His

865 870 875 880

Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile

885 890 895

Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser

900 905 910

Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg

915 920 925

Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val

930 935 940

Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp

945 950 955 960

Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu

965 970 975

Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His

980 985 990

Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe

995 1000 1005

Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys

1010 1015 1020

Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn

1025 1030 1035 1040

Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly

1045 1050 1055

Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met

1060 1065 1070

Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe

1075 1080 1085

Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr

1090 1095 1100

Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile

1105 1110 1115 1120

Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser

1125 1130 1135

Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met

1140 1145 1150

Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr

1155 1160 1165

Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile

1170 1175 1180

Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu

1185 1190 1195 1200

Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln

1205 1210 1215

Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu

1220 1225 1230

Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu

1235 1240 1245

Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile

1250 1255 1260

Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His

1265 1270 1275 1280

Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu

1285 1290 1295

Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp

1300 1305 1310

Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp

1315 1320 1325

Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp

1330 1335 1340

Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln

1345 1350 1355 1360

Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu

1365 1370 1375

Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp

1380 1385 1390

Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe

1395 1400 1405

Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro

1410 1415 1420

Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His

1425 1430 1435 1440

Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu

1445 1450 1455

Tyr

<210> 13

<211> 130

<212> DNA

<213> Природная последовательность

<220>

<223> Левый (первый) ITR (инвертированные концевые повторы)

<400> 13

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt

60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact

120

aggggttcct

130

<210> 14

<211> 252

<212> DNA

<213> Искусственная последовательность

<220>

<223> Промотор HLP

<400> 14

tgtttgctgc ttgcaatgtt tgcccatttt agggtggaca caggacgctg tggtttctga

60

gccagggggc gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac

120

tggggtgacc ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg

180

cttaaatacg gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg

240

ggacagtgaa tc

252

<210> 15

<211> 60

<212> DNA

<213> Искусственная последовательность

<220>

<223> Сигнал полиаденилирования

<400> 15

cgcgaataaa agatctttat tttcattaga tctgtgtgtt ggttttttgt gtgatgcagc

60

<210> 16

<211> 141

<212> DNA

<213> Природная последовательность

<220>

<223> Правый ITR

<400> 16

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc

120

gagcgcgcag ctgcctgcag g

141

<210> 17

<211> 57

<212> DNA

<213> Искусственная последовательность

<220>

<223> Нуклеиновая кислота, кодирующую сигнальный пептид

<400> 17

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagt

57

<210> 18

<211> 57

<212> DNA

<213> Искусственная последовательность

<220>

<223> Нуклеиновая кислота, кодирующую сигнальный пептид

<400> 18

atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttcagc

57

<210> 19

<211> 57

<212> DNA

<213> Искусственная последовательность

<220>

<223> Нуклеиновая кислота, кодирующую сигнальный пептид

<400> 19

atgcagatcg agctgagcac ctgttttttt ctgtgcctgc tgaggttctg cttctcc

57

<210> 20

<211> 57

<212> DNA

<213> Искусственная последовательность

<220>

<223> Нуклеиновая кислота, кодирующую сигнальный пептид

<400> 20

atgcagatcg agctgagcac ctgtttcttc ctgtgcctgc tgaggttctg tttcagc

57

<210> 21

<211> 57

<212> DNA

<213> Искусственная последовательность

<220>

<223> Нуклеиновая кислота, кодирующую сигнальный пептид

<400> 21

atgcagatcg agctgtccac ctgcttcttc ctgtgcctgc tgcgcttctg tttctct

57

<210> 22

<211> 19

<212> PRT

<213> Искусственная последовательность

<220>

<223> сигнальный пептид

<400> 22

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1 5 10 15

Cys Phe Ser

<---

Похожие патенты RU2808564C2

название год авторы номер документа
Выделенная нуклеиновая кислота, которая кодирует слитый белок на основе FVIII-BDD и гетерологичного сигнального пептида, и ее применение 2022
  • Перепелкина Мария Павловна
  • Власова Елена Вениаминовна
  • Фомина Анастасия Владимировна
  • Гершович Павел Михайлович
  • Маркова Виталия Александровна
  • Морозов Дмитрий Валентинович
RU2818229C2
МОЛЕКУЛЫ НУКЛЕИНОВОЙ КИСЛОТЫ И ПУТИ ИХ ПРИМЕНЕНИЯ 2018
  • Серегин, Алексей
  • Лю, Туняо
  • Патарройо-Уайт, Сюзанна
  • Драгер, Дуглас
  • Питерс, Роберт Т.
  • Лю, Цзяюнь
RU2819144C2
ПРИМЕНЕНИЕ ЛЕНТИВИРУСНЫХ ВЕКТОРОВ, ЭКСПРЕССИРУЮЩИХ ФАКТОР VIII 2019
  • Аннони, Андреа
  • Канторе, Алессио
  • Драгер, Дуглас
  • Лю, Туняо
  • Милани, Микела
  • Моффит, Джефф
  • Нальдини, Луиджи
  • Патарройо-Уайт, Сюзанна
  • Питерс, Роберт
  • Серегин, Алексей
RU2803163C2
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 2020
  • Гершович Павел Михайлович
  • Прокофьев Александр Владимирович
  • Стрелкова Анна Николаевна
  • Спирина Наталья Александровна
  • Шугаева Татьяна Евгеньевна
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2760301C1
ГЕННАЯ ТЕРАПИЯ ДЛЯ ЛЕЧЕНИЯ ГЕМОФИЛИИ A 2017
  • Вонг, Лили
  • Вилсон, Джеймс М.
  • Сидрейн, Дженни Агнес
RU2762257C2
Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок SMN1, и ее применение 2020
  • Мадера Дмитрий Александрович
  • Гершович Павел Михайлович
  • Веселова Анна Сергеевна
  • Шугаева Татьяна Евгеньевна
  • Ломунова Мария Андреевна
  • Шкляева Маргарита Александровна
  • Морозов Дмитрий Валентинович
RU2742837C1
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 2020
  • Прокофьев Александр Владимирович
  • Гершович Павел Михайлович
  • Стрелкова Анна Николаевна
  • Спирина Наталья Александровна
  • Кондинская Диана Александровна
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2783313C1
КОДИРУЮЩИЕ ФАКТОР VIII ВАРИАНТЫ С ПОНИЖЕННЫМ СОДЕРЖАНИЕМ CPG, КОМПОЗИЦИИ И СПОСОБЫ И ПРИМЕНЕНИЕ В ЛЕЧЕНИИ НАРУШЕНИЙ ГЕМОСТАЗА 2016
  • Ангела, Хавьер
  • Сен, Сам Хсиен-И
RU2745506C2
СПОСОБЫ ГЕНОТЕРАПИИ С ИСПОЛЬЗОВАНИЕМ ГЕНА ФАКТОРА VIII (FVIII) 2018
  • Ангела, Хавьер
RU2808274C2
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 2021
  • Прокофьев Александр Владимирович
  • Гершович Павел Михайлович
  • Стрелкова Анна Николаевна
  • Спирина Наталья Александровна
  • Кондинская Диана Александровна
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2761879C1

Иллюстрации к изобретению RU 2 808 564 C2

Реферат патента 2023 года Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок фактора свёртывания крови VIII c делетированным B доменом, и ее применение

Изобретение относится к области биотехнологии, конкретно к рекомбинантному получению белка фактора свертывания крови VIII с делетированным В доменом (FVIII-BDD), и может быть использовано в генной терапии гемофилии А для доставки гена FVIII-BDD в целевые клетки. Предложены кодон-оптимизированные варианты кодирующих FVIII-BDD нуклеиновых кислот и экспрессионные конструкции для их доставки в целевые клетки. Изобретение обеспечивает получение препарата, обладающего высоким потенциалом для генной терапии гемофилии А. 6 н. и 3 з.п. ф-лы, 6 ил., 4 пр.

Формула изобретения RU 2 808 564 C2

1. Выделенная кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) с аминокислотной последовательностью SEQ ID NO: 11, которая включает нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 или SEQ ID NO: 5.

2. Экспрессионная кассета, которая включает нуклеиновую кислоту по п. 1.

3. Экспрессионная кассета по п. 2, включающая следующие элементы в направлении от 5'-конца к 3'-концу:

левый (первый) ITR (инвертированные концевые повторы);

промотор;

нуклеиновую кислоту, кодирующую сигнальный пептид;

нуклеиновую кислоту по п. 1;

сигнал полиаденилирования;

правый (второй) ITR.

4. Экспрессионный вектор, который включает нуклеиновую кислоту по п. 1 или экспрессионную кассету по любому из пп. 2, 3.

5. Экспрессионный вектор по п. 4, где экспрессионный вектор представляет собой рекомбинантный аденоассоциированный вирус (AAV).

6. Экспрессионный вектор по п. 5, где AAV выбирают из группы, включающей следующие серотипы AAV: AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 AAV11, AAV12, AAV13, AAV14, AAV15, AAV16, rAAV.rh8, rAAV.rh10, rAAV.rh20, rAAV.rh39, rAAV.Rh74, rAAV.RHM4-1, AAV.hu37, rAAV.Anc80, rAAV.Anc80L65, rAAV.7m8, rAAV.PHP.B, rAAV2.5, rAAV2tYF, rAAV3B, rAAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15 или AAV.HSC16.

7. Фармацевтическая композиция для доставки гена FVIII-BDD в целевые клетки, включающая выделенную кодон-оптимизированную нуклеиновую кислоту по п. 1, экспрессионный вектор по любому из пп. 4-6 или кассету по любому из пп. 2, 3 в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.

8. Применение выделенной кодон-оптимизированной нуклеиновой кислоты по п. 1, экспрессионного вектора по любому из пп. 4-6, кассеты по любому из пп. 2, 3 или композиции по п. 7 для доставки гена FVIII-BDD в целевые клетки.

9. Способ доставки гена FVIII-BDD в целевые клетки, включающий введение выделенной кодон-оптимизированной нуклеиновой кислоты по п. 1, экспрессионного вектора по любому из пп. 4-6, кассеты по любому из пп. 2, 3 или композиции по п. 7 в целевые клетки.

Документы, цитированные в отчете о поиске Патент 2023 года RU2808564C2

Ребристая труба для центрального отопления 1933
  • Блауберг Н.М.
  • Носин Б.А.
SU38288A1
ГЕННАЯ ТЕРАПИЯ ДЛЯ ЛЕЧЕНИЯ ГЕМОФИЛИИ A 2017
  • Вонг, Лили
  • Вилсон, Джеймс М.
  • Сидрейн, Дженни Агнес
RU2762257C2
RU 2020108209 А, 02.09.2021
КОДИРУЮЩИЕ ФАКТОР VIII ВАРИАНТЫ С ПОНИЖЕННЫМ СОДЕРЖАНИЕМ CPG, КОМПОЗИЦИИ И СПОСОБЫ И ПРИМЕНЕНИЕ В ЛЕЧЕНИИ НАРУШЕНИЙ ГЕМОСТАЗА 2016
  • Ангела, Хавьер
  • Сен, Сам Хсиен-И
RU2745506C2
WO 2020041773 A1, 27.02.2020.

RU 2 808 564 C2

Авторы

Шугаева Татьяна Евгеньевна

Власова Елена Вениаминовна

Фомина Анастасия Владимировна

Перепелкина Мария Павловна

Стрелкова Анна Николаевна

Гершович Павел Михайлович

Яковлев Павел Андреевич

Морозов Дмитрий Валентинович

Даты

2023-11-29Публикация

2022-04-28Подача