Содержание поданного в электронном виде списка последовательностей в текстовом ASCII-файле (название: 4349.001PC01_Seqlisting_ST25; размер: 389 120 байт; дата создания: 11 июня 2020 г.), поданном вместе с заявкой, включено сюда путем ссылки во всей полноте.

Уровень техники

Общим для многих заболеваний типа рака, пороков развития и некоторых инфекций являются генетические и эпигенетические аберрации. Генная терапия предназначена для введения генетического материала в клетки для нацеливания и непосредственного редактирования генома затем, чтобы исправить генетически нарушенные клетки и тем самым вылечить связанные с ними заболевания. Цинк-пальцевые нуклеазы (ZFN), технологии редактирования генов Talen и CRISPR-Cas9 представляют некоторые из недавно разработанных инструментов для редактирования ДНК. Для доставки генетического материала в геном применялись такие методы, как электропорация, катионные липиды, микроинъекции или вирусы. Современные стратегии доставки генов обычно основываются на аденовирусах, ретровирусах или “голых” ДНК-плазмидах.

Лентивирусы, в том числе ВИЧ, являются мощным инструментом при использовании в качестве вектора для доставки нуклеиновых кислот. Лентивирусы способны стабильно инфицировать делящиеся и неделящиеся клетки. Лентивирусные векторы склонны к случайной интеграции в геном хозяина и часто могут встраиваться на участке сильно транскрибируемых генов, что повышает риск вставочного мутагенеза.

Интеграза ВИЧ-1 катализирует встраивание вирусной ДНК в геном хозяина. В общем, интеграза ВИЧ-1 состоит из N-концевого домена (NTD), каталитического центрального домена (CCD) и C-концевого домена (CTD). NTD используется для связывания и координации катиона Zn²⁺ в качестве важного кофактора, а CTD используется для связывания ДНК. CCD образует каталитическое ядро, в котором катализируется процесс встраивания. Проблемы с механизмами встраивания у вирусных векторов включают низкую эффективность и отсутствие специфичности, что может привести к непреднамеренному вставочному мутагенезу и генотоксичности.

Сущность изобретения

В некоторых аспектах настоящего изобретения предусмотрены конструкции, плазмиды, векторы, частицы, слитые белки, композиции, способы и наборы, которые применимы для направленного редактирования нуклеиновых кислот, включая редактирование отдельного сайта или участка в геноме субъекта, например, геноме человека.

В приведенных здесь рабочих примерах представлены подробные экспериментальные данные, убедительно свидетельствующие об успешном создании конструкций для слитых белков программируемых транспозаз и интеграз с белками Cas9/цинковый палец. Кроме того, такие конструкции способны вызывать сайт-специфичное встраивание экзогенной последовательности нуклеиновой кислоты в геном трансфицированных клеток. Не придерживаясь какой-либо теории, авторы настоящего изобретения считают, что это первый случай, когда были созданы слитые белки такого типа, обладающие способностью к сайт-специфичному встраиванию экзогенной нуклеиновой кислоты в геном и подходящие для генной терапии, особенно с участием крупных генов. Авторы изобретения также идентифицировали модифицированные гиперактивные транспозазы PiggyBac, которые осуществляют специфичные направленные транспозиции.

Соответственно, в одном аспекте настоящего изобретения предусмотрены конструкции из нуклеиновой кислоты, включающие:

a) последовательность первого полинуклеотида, содержащего нуклеиновую кислоту, кодирующую первый ДНК-связывающий белок, сконструированный для связывания с определенной последовательностью геномной ДНК в геноме; причем первый ДНК-связывающий белок представляет собой цинк-пальцевый белок или белок Cas9;

b) вторую последовательность полинуклеотида, содержащего нуклеиновую кислоту, кодирующую второй ДНК-связывающий белок, который обеспечивает встраивание экзогенной нуклеиновой кислоты в геном, причем второй ДНК-связывающий белок представляет собой:

i. гиперактивную транспозазу PiggyBac или модифицированную гиперактивную PiggyBac с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с гиперактивной PiggyBac либо

ii. интегразу вируса иммунодефицита человека (ВИЧ) или модифицированную интегразу ВИЧ с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с интегразой ВИЧ; и

c) необязательно последовательность полинуклеотида, содержащего нуклеиновую кислоту, кодирующую линкер;

причем конструкция нуклеиновой кислоты кодирует слитый белок, включающий первый ДНК-связывающий белок, второй ДНК-связывающий белок и необязательно линкер между первым ДНК-связывающим белком и вторым ДНК-связывающим белком; и

при этом слитый белок обеспечивает встраивание экзогенной нуклеиновой кислоты в определенное место генома.

Также предусмотрены композиции, включающие конструкцию из нуклеиновой кислоты, вектор или слитый белок, как описано здесь, и последовательность полинуклеотида, кодирующего экзогенную нуклеиновую кислоту для встраивания в геном, причем композиции содержатся в упаковочном векторе или связаны с ним.

Настоящим изобретением также предусмотрен способ контролируемого сайт-специфичного встраивания одной копии или нескольких копий экзогенной последовательности нуклеиновой кислоты в клетки, включающий: (a) введение в клетки конструкции из нуклеиновой кислоты, вектора или слитого белка, описанных здесь, и (b) введение в клетки экзогенной нуклеиновой кислоты; причем связывание слитого белка с определенной последовательностью геномной ДНК в геноме клеток приводит к расщеплению генома и встраиванию одной или нескольких копий экзогенной нуклеиновой кислоты в геном клеток.

В другом аспекте предусмотрено получение модифицированных гиперактивных транспозаз PiggyBac, включающих аминокислотную последовательность SEQ ID NO: 9, где: в положении 245 находится аминокислота A, в положении 275 – аминокислота R или A, в положении 277 – аминокислота R или A, в положении 325 – аминокислота A или G, в положении 347 – аминокислота N или A, в положении 351 – аминокислота E, P или A, в положении 372 – аминокислота R, в положении 375 – аминокислота A, в положении 450 – аминокислота D или N, в положении 465 – аминокислота W или A, в положении 560 – аминокислота T или A, в положении 564 – аминокислота P или S, в положении 573 – аминокислота S или A, в положении 592 – аминокислота G или S, а в положении 594 – аминокислота L или F.

В некоторых воплощениях предусмотрены слитые белки (i) интегразы, модифицированной интегразы, транспозазы или модифицированной транспозазы, слитые с (ii) белком Cas9 или цинк-пальцевым белком; и кодирующие их конструкции из нуклеиновой кислоты.

В некоторых аспектах изобретения предусмотрены конструкции из нуклеиновой кислоты, включающие: (a) последовательность первого полинуклеотида, кодирующего первый ДНК-связывающий белок, сконструированный для связывания с определенной последовательностью геномной ДНК в геноме; (b) последовательность второго полинуклеотида, кодирующего второй ДНК-связывающий белок, который обеспечивает встраивание экзогенной нуклеиновой кислоты в геном, причем второй ДНК-связывающий белок представляет собой (i) интегразу или модифицированную интегразу, которая модифицирована относительно интегразы дикого типа, либо (ii) транспозазу или модифицированную транспозазу, которая модифицирована относительно транспозазы дикого типа; и (c) последовательность третьего полинуклеотида, содержащего нуклеиновую кислоту, кодирующую линкер; причем конструкции из нуклеиновой кислоты кодируют слитые белки, включающие первый ДНК-связывающий белок, второй ДНК-связывающий белок и линкер между первым ДНК-связывающим белком и вторым ДНК-связывающим белком.

В некоторых воплощениях конструкции из нуклеиновой кислоты включают: (a) последовательность первого полинуклеотида, кодирующего белок Cas9; и (b) последовательность второго полинуклеотида, кодирующего транспозазу или модифицированную гиперактивную транспозазу PiggyBac по изобретению либо её функциональный фрагмент.

В некоторых воплощениях конструкции из нуклеиновой кислоты включают: (a) последовательность первого полинуклеотида, кодирующего цинк-пальцевый белок; и (b) последовательность второго полинуклеотида, кодирующего интегразу или модифицированную интегразу по изобретению либо её функциональный фрагмент.

В некоторых воплощениях изобретения предусмотрены плазмиды, векторы или клетки хозяина, содержащие конструкции из нуклеиновой кислоты по изобретению.

В некоторых аспектах изобретения предусмотрены слитые белки, включающие: первый ДНК-связывающий белок, сконструированный для связывания с определенной последовательностью геномной ДНК в геноме; второй ДНК-связывающий белок, который обеспечивает встраивание экзогенной нуклеиновой кислоты в геном, причем второй ДНК-связывающий белок представляет собой интегразу, транспозазу либо модифицированную интегразу или транспозазу; и линкер, соединяющий первый белок и второй белок.

В некоторых воплощениях слитый белок включает: (a) белок Cas9; и (b) гиперактивную транспозазу PiggyBac или модифицированную гиперактивную PiggyBac по изобретению либо её функциональный фрагмент.

В некоторых воплощениях слитый белок включает: (a) цинк-пальцевый белок; и (b) интегразу или модифицированную интегразу по изобретению либо её функциональный фрагмент.

В некоторых аспектах изобретения предусмотрены лентивирусные частицы, содержащие слитые белки по изобретению.

В некоторых аспектах изобретения предусмотрен способ встраивания последовательности экзогенной нуклеиновой кислоты в геномную ДНК организма, включающий: введение в организм лентивирусных частиц, содержащих конструкцию из нуклеиновой кислоты или слитый белок по изобретению с тем, чтобы первый и второй ДНК-связывающие белки связались с определенной последовательностью геномной ДНК и вставили экзогенную нуклеиновую кислоту в геномную ДНК; причем экзогенная нуклеиновая кислота встраивается в определенную последовательность геномной ДНК.

В некоторых аспектах изобретения предусмотрен способ контролируемого сайт-специфичного встраивания одной копии или нескольких копий экзогенной последовательности нуклеиновой кислоты в клетки, включающий: (a) введение в клетки слитого белка по изобретению и (b) введение в клетки экзогенной нуклеиновой кислоты; причем связывание слитого белка с определенной последовательностью геномной ДНК в геноме клеток приводит к расщеплению генома и встраиванию одной или нескольких копий экзогенной нуклеиновой кислоты в геном клеток; при этом слитый белок вводится в клетки при помощи лентивирусных частиц.

По всему описанию и формуле изобретения слово “включает” и его варианты не должны исключать другие технические характеристики, добавки, компоненты или стадии. Другие цели, преимущества и особенности изобретения станут очевидными специалистам в данной области после изучения описания или могут быть изучены при осуществлении изобретения на практике. Кроме того, настоящее изобретение охватывает все возможные комбинации описанных здесь конкретных и предпочтительных воплощений. Следующие ниже примеры и чертежи представлены здесь в целях иллюстрации и не должны ограничивать настоящее изобретение.

Краткое описание фигур

На фиг. 1A и 1B представлен процент клеток, содержащих экзогенную последовательность нуклеиновой кислоты, встроенную в их геном после трансфекции с помощью (фиг. 1A) слитых белков Cas9-PiggyBac (фиг. 1A) (Cas9 человека (hCas9), никазой Cas9 (nCas9) или «мертвым» Cas9 (dCas9) и гиперактивной транспозазой PiggyBac (PB)) и (фиг. 1B) слитыми белками Cas9-SB100 (Cas9 человека (hCas9), никазой Cas9 (nCas9) или «мертвым» Cas9 (dCas9) и гиперактивной транспозазой Sleeping Beauty (SB100)). Создавали векторы, в которых 3′-конец Cas9 соединяется с 5′-концом каждой из транспозаз при помощи линкера GGS (SEQ ID NO: 48, 49) (hCas9PB, nCas9PB, dCas9PB, hCas9SB, nCas9SB и dCas9SB). Создавали и другие векторы, в которых 3′-конец каждой из транспозаз соединяется с 5′-концом Cas9 при помощи линкера GGS (SEQ ID NO: 48, 49) (PBhCas9, PBnCas9, PBdCas9, SBhCas9, SbnCas9 и SBdCas9). В качестве положительного контроля использовали “PiggyBac” (фиг. 1A) и “SB100” (фиг. 1B), а в качестве отрицательных контролей – одни транспозоны, кодирующие RFP (обозначен как “эписомальный RFP” на фиг. 1A) и GFP (обозначен как “ эписомальный GFP”) на фиг.1B). На фиг. 1C приведено другое представление фиг. 1A, представляющее активность транспозиции с PB и Cas9 в различных конфигурациях.

На фиг. 2A представлена конструкция плазмиды, кодирующей слитый белок Cas9/PB.

На фиг. 2B представлен процент клеток, содержащих экзогенную последовательность нуклеиновой кислоты, встроенную в их геном при помощи слитых конструкций, образованных Cas9 человека-PiggyBac (“прицельная hCas9”) или никазой Cas9-PiggyBac (“прицельная nCas9”). 3′-конец Cas9 соединяется с 5′-концом транспозазы при помощи линкера. “Неприцельно” – это контроль на введение вообще (только PiggyBac), а “эписомально” – отрицательный контроль на отсутствие встраивания (только транспозон).

На фиг. 3 представлен типичный слитый белок ZFP-интеграза. ZFP и интеграза соединяются последовательностью GGS. NLS означает последовательность ядерной локализации.

На фиг. 4 представлены титры лентивируса: лентивируса для интегразы дикого типа (LV), пустых вирусных частиц (LVO), невстраивающегося лентивируса (NILV), невстраивающегося лентивируса с интегразой дикого типа (NILV + IN), невстраивающегося лентивируса со слитым белком ZFP-интеграза (NILV + ZP-IN (AAVS1)), невстраивающегося лентивируса со слитым белком Cas9-интеграза (NILV + Cas-IN) и лентивируса дикого типа для интегразы с интегразой дикого типа (LV + IN). ( ' ) означает технический повтор.

На фиг. 5 представлен процент клеток со встроившейся (полное встраивание) в их геном экзогенной последовательностью нуклеиновой кислоты после трансфекции лентивирусом для интегразы дикого типа (LV), пустыми вирусными частицами (LVO), невстраивающимся лентивирусом (NILV), невстраивающимся лентивирусом с интегразой дикого типа (NILV + IN), невстраивающимся лентивирусом со слитым белком ZFP-интеграза (NILV + ZP-IN (AAVS1)), невстраивающимся лентивирусом со слитым белком Cas9-интеграза (NILV + Cas-IN) и лентивирусом для интегразы дикого типа с интегразой дикого типа (LV + IN). Для каждого условия, слева направо: первый столбец – день 3, второй столбец – день 5, третий столбец – день 7, четвертый столбец – день 10 и пятый столбец – день 12.

На фиг. 6 представлено изображение хромосом с репрезентативными сайтами встраивания и не встраивания AAVS1. Звездочкой обозначен сайт для AAVS1 на хромосоме 19, треугольниками – сайты нецелевой вставки, а ромбиками – сайты направленной вставки.

На фиг. 7A представлены титры вируса: лентивируса для интегразы дикого типа (LV), пустых вирусных частиц (LVO), невстраивающегося лентивируса (NILV), невстраивающегося лентивируса с интегразой дикого типа (NILV + IN), невстраивающегося лентивируса со слитым белком ZFP-IN, нацеленным на сайт AAVS1 (NILV + ZP-IN (AAVS1)), и невстраивающегося лентивируса со слитым белком ZFP-IN, нацеленным на сайт CCR5 (NILV + ZP-IN (CCR5)).

На фиг. 7B представлен процент клеток со встроившейся (полное встраивание) в их геном экзогенной последовательностью нуклеиновой кислоты после трансфекции лентивирусом для интегразы дикого типа (LV), невстраивающимся лентивирусом (NILV), невстраивающимся лентивирусом с интегразой дикого типа (NILV + IN), невстраивающимся лентивирусом со слитым белком ZFP-IN, нацеленным на сайт AAVS1 (NILV + ZP-IN (AAVS1)), и невстраивающимся лентивирусом со слитым белком ZFP-IN, нацеленным на сайт CCR5 (NILV + ZP-IN (CCR5)).

На фиг. 7C представлен процент клеток со встроившейся (полное встраивание) в их геном экзогенной последовательностью нуклеиновой кислоты после трансфекции лентивирусом для интегразы дикого типа (LV), пустыми вирусными частицами (LVO), невстраивающимся лентивирусом (NILV), невстраивающимся лентивирусом с интегразой дикого типа (NILV + IN), невстраивающимся лентивирусом со слитым белком ZFP-IN, нацеленным на сайт AAVS1 (NILV + ZP-IN (AAVS1)), и невстраивающимся лентивирусом со слитым белком ZFP-IN, нацеленным на сайт CCR5 (NILV + ZP-IN (CCR5)).

На фиг. 7D представлен процент клеток со встроившейся (полное встраивание) в их геном экзогенной последовательностью нуклеиновой кислоты после трансфекции лентивирусом для интегразы дикого типа (LV), невстраивающимся лентивирусом (NILV), невстраивающимся лентивирусом с интегразой дикого типа (NILV + IN), невстраивающимся лентивирусом со слитым белком ZFP-IN, нацеленным на сайт AAVS1 (NILV + ZP-IN (AAVS1)), и невстраивающимся лентивирусом со слитым белком ZFP-IN, нацеленным на сайт CCR5 (NILV + ZP-IN (CCR5)).

На фиг. 8A-8C представлены титры лентивируса (фиг. 8A) и % экспрессирующих CAR клеток в день 3 и в день 14 (фиг. 8B), а на фиг. 8C представлен % экспрессирующих CD3 клеток. Клетки Jurkat трансфицировали лентивирусом в нескольких состояниях: лентивирусом для интегразы дикого типа (LV), пустыми вирусными частицами (LVO), невстраивающимся лентивирусом (NILV), невстраивающимся лентивирусом с интегразой дикого типа (NILV + IN), невстраивающимся лентивирусом со слитым белком ZFP-интеграза (NILV + ZFP-IN (TRCa-1)), и невстраивающимся лентивирусом со слитым белком Cas9-интеграза (NILV + Cas-IN). NILV проявлял резкое снижение титра, а транскомплементация с экспрессией IN дикого типа или слитого белка ZNF-IN в вырабатывающих вирус клетках не давала восстановления ни титра, ни способности к встраиванию. Кроме того, клетки не теряли экспрессию CD3, когда встраивание было нацелено на локус TCR (экспрессия белка CD3). Это значит, что нужно использовать дополнительные факторы для транскомплементации типа белка VPR, особенно в контексте этой линии клеток.

На фиг. 9A-9B представлены титры лентивируса WT и двух различных вирусных систем, дефектных по интегразе (NILV и TAA, последнее означает то, что был введен стоп-кодон в начало области, кодирующей IN в упаковочной плазмиде для лентивируса), отдельно или с транскомплементацией IN или слитым белком VPR_IN. Титры определяли методом флуоресцентной цитометрии в день 3 после трансфекции (фиг. 9A). На фиг. 9B представлена относительная эффективность встраивания по механизмам встраивания с транскомплементацией, показывающая преимущество слитого с VPR белка перед IN для транскомплементации. WT: лентивирус, полученный с IN дикого типа; NILV: лентивирус, полученный с невстраивающейся IN, несущей две мутации в своем каталитическом центре; TAA: лентивирус, полученный с дефектной IN, у которой не экспрессируется белок; +IN: лентивирус с транскомплементацией IN; +VPR-IN: лентивирус с транскомплементацией IN, слитой с VPR на С-конце.

На фиг. 10A представлена схема конструкции из нуклеиновой кислоты, образованной из домена встраивания с ДНК-связывающим доменом и программируемого домена распознавания ДНК, слитых при помощи линкера. На фиг. 10B представлена схема слияния Cas9 и транспозазы, соединенных линкером в различных конфигурациях.

На фиг. 11 представлены результаты по активности Cas9 у Cas9, связанной с hyPB с помощью линкеров различного размера и состава. Активность Cas9 измеряли путем секвенирования сайта мишени направляющей РНК и анализа частоты инделей с помощью CRISPR-GA. Использовали 2 разные направляющие РНК, нацеленные на сайт AAVS1. Использовали линкеры по SEQ ID NO: 50-63.

На фиг. 12 представлены результаты по эффективности транспозиции программируемой транспозазы Genetrap. Флуоресценцию RFP измеряли методом проточной цитометрии через 10 дней после трансфекции. Использовали различные линкеры, чтобы определить важность длины и состава линкеров для направленного встраивания. Средние значения из 2 независимых экспериментов. Использовали линкеры по SEQ ID NO: 50-63.

На фиг. 13 представлены результаты по направленной транспозиции с линкерами hcas9_PB. Эффективность направленной транспозиции у конструкций с различными линкерами cas9-PB измеряли на клетках линии с расщепленным GFP, используя 2 разные направляющие РНК. Экспрессию GFP измеряли методом проточной цитометрии через 72 ч после трансфекции.

На фиг. 14 представлена схема репортерной линии клеток с расщепленным GFP, созданной для скрининга и высокопроизводительного анализа библиотек различных мутаций hyPB, а также для проверки отдельных мутантов. В геном клеток HEK293T вводили акцептор сплайсинга (SA) вместе с половиной кодирующей последовательности GFP (Ct-GFP) после сайта мишени с помощью системы Sleeping Beauty 100x. Для такого скрининга транспозон PiggyBac, фланкированный инвертированными концевыми повторами (ITR), представлял собой либо полную кассету для экспрессии RPF вместе с промотором, другой половиной GFP (Nt-GFP) и донором сплайсинга (SD); либо только половинку GFP; как показано на рисунке.

На фиг. 15 представлены результаты по направленной транспозиции выбранных мутантов hCas9_PB. Эффективность направленной транспозиции hCas9_PB D450N и hCas9_PB R372A K375A D450. Измеряли экспрессию GFP методом проточной цитометрии через 72 ч после трансфекции. Средние значения из 4 независимых экспериментов.

На фиг. 16 представлены результаты по случайной и направленной транспозиции выбранных мутантов hCas9_PB. Эффективность случайной и прицельной транспозиции hCas9_PB D450N и hCas9_PB R372A K375A D450. Измеряли экспрессию GFP методом проточной цитометрии через 72 ч после трансфекции и экспрессию RFP методом проточной цитометрии через 15 дней после трансфекции и нормировали по флуоресценции RFP через 48 ч после трансфекции, принимая в качестве эффективности трансфекции.

На фиг. 17 представлена схема слияния ZFP и транспозазы, соединенных линкером в различных конфигурациях.

На фиг. 18 представлены результаты по направленной транспозиции слитых белков ZFP-PB. Эффективность направленной транспозиции ZFP_hyPB и ZFP_hyPBD450N в N- и C-концевой конформации. Измеряли экспрессию GFP методом проточной цитометрии через 5 дней после трансфекции. Более 1 независимого повтора. ZFP_PB: слияние ZFP и hyPB в C-концевой конфигурации с помощью линкера XTEN; PB_ZFP: слияние ZFP и hyPB в N-концевой конфигурации с помощью линкера XTEN, ZFP_450: слияние ZFP и hyPB (D450N) в C-концевой конфигурации с помощью линкера XTEN; 450_ZFP: слияние ZFP и hyPB (D450N) в N-концевой конфигурации с помощью линкера XTEN; hyPB: hyPB без модификаций; 1/2 GFP: только контрольный транспозон.

На фиг. 19 представлена схема метода анализа, используемого при скрининге библиотеки мутаций PiggyBac.

На фиг. 20 представлено секвенирование области PiggyBac в 1116 п.н. у всех вариантов из библиотеки по технологии Illumina NGS. Праймер Index I7 заменяли на специальный праймер для полного секвенирования различных вариантов, за исключением вариантов 450 и 465.

На фиг. 21A-21B представлены результаты по созданию библиотеки разнообразия hyPB. На фиг. 21A представлен пример графика сортировки. Положительные результаты направленного встраивания (флуоресценция GFP) отбирали в канале P4, а отрицательные результаты направленного встраивания (отсутствие флуоресценции GFP) отбирали в канале P5. Нежизнеспособные клетки и обломки проходили как отрицательные в других каналах по окрашиванию DAPI. На фиг. 21B представлены результаты по эффективности трансфекции двумя плазмидами. Эффективность трансфекции измеряли при трансфекции плазмидами с GFP и RFP эквимолярно по ½ GFP и трансфекции направляющей РНК в один и тот же день и в тех же условиях. Трансфекция двумя плазмидами проходит по каналу P8. Нежизнеспособные клетки и обломки проходили как отрицательные в других каналах по окрашиванию DAPI.

На фиг. 22A-22K представлены результаты анализа скрининга библиотеки при сравнении положительных результатов с отрицательными. Фиг. 22A-22B: секвенирование массива библиотеки в качестве контроля качества; при этом подавляющее большинство вариантов представлено только один раз. Представлена логограмма массива репрезентативной библиотеки PiggyBac, в которой положения соответствуют положениям аминокислот: 1 - R245; 2 - R275; 3 - R277; 4 - G325; 5 - N347; 6 - S351; 7 - R372; 8 - K375; 9 - R388; 10 - T560; 11 - S564; 12 - S573; 13 - M589; 14 - S592; 15 - F594. Кроме того, представлена логограмма для прошедших отрицательный отбор клеток с таким же профилем, что и для массива библиотеки. Фиг. 22C-22K соответствуют 3 независимым повторам положительных попаданий; варианты для положительных логограмм (внизу), а также самый лучший вариант Лучший 1 после отбора (вверху). Также представлены логограммы для 5 лучших и 10 лучших вариантов. На левых панелях B, C представлено относительное обогащение вариантов PiggyBac в прошедших положительный и отрицательный отбор популяциях по шкале log2.

На фиг. 23A представлены положительные варианты Лучший 1 и Лучший 3 из независимого повтора 3. Имеется отличие только по 1 аминокислоте в положении 254. На фиг. 23B представлены 3 варианта Лучший 1, идентифицированные в 3 независимых повторах. Также представлен hyPB дикого типа для сравнения.

На фиг. 24A представлены наиболее распространенные варианты в GFP-положительных клетках в сравнении с RFP-положительными клетками. Представлена кластеризация: GPF, направленное встраивание; RPF, случайное встраивание; и отрицательная популяция. На фиг. 24B и 24C представлены варианты, обнаруженные среди положительных попаданий более чем в 1 независимом повторе. Rep: независимый повтор эксперимента; Pos: положительные клетки с направленной вставкой; Neg: отрицательные клетки, в которых не произошло направленного встраивания.

На фиг. 25 представлена гистограмма ковариации вариантов. Представлены проценты, когда один вариант отмечен вместе с другим в положительных образцах, деленные на отрицательные образцы. Наряду с вариантами, включенными при разработке библиотеки, анализировали и варианты со случайными вставками, введенными под действием обратной транскриптазы лентивируса при получении вирусной библиотеки. Некоторые из этих новых вариантов связаны с положительными попаданиями и выполняют направленное встраивание при комбинировании. Примеры – D450N и W465A.

На фиг. 26 показано, что модифицированная hyPB проявляет большее повышение направленного встраивания, чем hyPB дикого типа при слиянии с Cas9. Проводили слияние Cas9 с hyPB или с различными комбинациями мутантов hyPB (Unilarge-A: D450N; Unilarge-B: R245A/D450N; Unilarge-C: R245A/G325A/D450N/S573P; Unilarge-D: R245A/G325A/S573P), используя линкер 4GGS и систему репортерных линий клеток.

На фиг. 27 представлены результаты по транскомплементации с дефектной интегразой. Определяли эффективность продукции вируса при измерении на 2-й день и способность к встраиванию при измерении на 7-й день для различных систем в клетках HEK293T. Вестерн-блоттинг показал наличие IN в вирусных частицах in trans. Эффективность продукции вируса и его способность к встраиванию определяли путем трансфекции дефектного по встраиванию вируса и транскомплементированного вируса в HEK293T при различных условиях. Клетки пассировали в течение 7 дней до тех пор, пока не проявлялось отсутствие эписомального сигнала, и анализировали сигналы GFP методом проточной цитометрии на 2-й, 5-й и 7-й день. Проявлялась различная эффективность продукции у различных систем, причем NILV был ближе всего к WT по продукции. Во всех случаях наблюдалось четкое восстановление встраивающей активности при проведении транскомплементации с WT-HIV_IN. Проверку попадания IN в систему транскомплементации проводили методом вестерн-блоттинга. WT: лентивирус, полученный с IN дикого типа; NILV: лентивирус, полученный с невстраивающейся IN, несущей две мутации в своем каталитическом центре; TAA: лентивирус, полученный с дефектной IN, у которой не экспрессируется белок вследствие наличия стоп-кодона в начале кодирующей последовательности IN; TAAx3: лентивирус, полученный с дефектной IN, у которой не экспрессируется белок вследствие наличия 3 последовательных стоп-кодонов в начале кодирующей последовательности IN; Delta-IN: лентивирус, полученный с дефектной IN, у которой была удалена кодирующая последовательность IN; Delta-IN_cPPT: лентивирус, полученный с дефектной IN, у которой кодирующая последовательность IN была заменена на последовательность центрального полипиримидинового тракта (cPPT); +VPR-IN: лентивирус с транскомплементацией IN, слитой с VPR на С-конце.

Раскрытие сущности изобретения

I Определения

В настоящем изобретении формы единственного числа включают значения и единственного, и множественного числа, если из контекста четко не следует иначе. Так, например, ссылка на “средство” включает и одно средство, и несколько таких средств.

Термины “нуклеиновая кислота”, “полинуклеотид” и “олигонуклеотид” применяются взаимозаменяемо и означают дезоксирибонуклеотидный либо рибонуклеотидный полимер в линейной или кольцевой конформации, а также в одноцепочечной или двухцепочечной форме. Для целей настоящего изобретения эти термины не должны рассматриваться как ограничивающие в отношении длины полимера. Эти термины могут охватывать известные аналоги природных нуклеотидов, а также нуклеотиды, модифицированные по группировкам оснований, сахаров и/или фосфата (например, фосфоротиоатным остовам). Обычно аналоги конкретных нуклеотидов имеют такую же специфичность спаривания оснований, т.е. аналог A будет образовывать пару с T.

Термины “полипептид”, “пептид” и “белок” применяются взаимозаменяемо для обозначения полимеров из аминокислотных остатков. Эти термины также применяются к таким аминокислотным полимерам, в которых одна или несколько аминокислот являются химическими аналогами или модифицированными производными соответствующих природных аминокислот.

Термин “связывающий(ся) белок” в настоящем изобретении означает такой белок, который способен нековалентно связываться с другой молекулой. Связывающийся белок может связываться, к примеру, с молекулой ДНК (ДНК-связывающий белок), молекулой РНК (РНК-связывающий белок) и/или с молекулой белка (белок-связывающий белок). В случае белок-связывающих белков они могут связываться сами с собой (образуя гомодимеры, гомотримеры и т.д.) и/или с одной или несколькими молекулами другого белка или белков. Связывающий белок может обладать более чем одним типом связывающей активности. Например, цинк-пальцевые белки обладают ДНК-связывающей, РНК-связывающей и белок-связывающей активностью.

Термин “цинк-пальцевый белок” в настоящем изобретении означает такой белок или домен в более крупном белке, который связывается с ДНК специфичным для последовательности образом посредством одного или нескольких цинковых пальцев, которые представляют собой участки аминокислотной последовательности в связывающем домене цинк-пальцевого белка, структура которых стабилизируется за счет координации иона цинка. Термин “цинк-пальцевый белок” часто сокращается как ZFP.

Термин “цинк-пальцевые нуклеазы” относится к искусственным рестрикционным ферментам, полученным путем слияния ДНК-связывающего домена типа цинкового пальца с ДНК-расщепляющим доменом. Домены типа цинковых пальцев могут быть сконструированы так, чтобы они садились на определенные желательные последовательности ДНК, что позволяет цинк-пальцевым нуклеазам садиться на уникальные последовательности в сложных геномах. Цинк-пальцевые нуклеазы часто сокращаются как ZFN или ZNP.

Термин “последовательность нуклеиновой кислоты” или “последовательность полинуклеотида” или “последовательность гена” в настоящем изобретении означает последовательность нуклеотидов любой длины, которая может представлять собой ДНК или РНК; может быть линейной, кольцевой или разветвленной и может быть одноцепочечной или двухцепочечной.

Термин “аминокислотная последовательность” или “полипептид” или “белок” в настоящем изобретении означает полимер из аминокислотных остатков. Если не указано иначе, полимер из аминокислотных остатков может быть любой длины.

Термин “экзогенные” в настоящем изобретении означает такие молекулы, которые обычно не присутствуют в клетках, но могут быть введены в клетки одним или несколькими генетическими, биохимическими или другими методами. Обычно присутствие в клетках определяется с учетом конкретной стадии развития и окружающей среды клеток. Так, к примеру, молекула, которая присутствует только во время эмбрионального развития мышцы, является экзогенной молекулой по отношению к взрослым мышечным клеткам. Точно так же молекула, индуцированная тепловым шоком, является экзогенной молекулой по отношению к клеткам, не подвергавшимся тепловому шоку. Экзогенные молекулы могут включать, к примеру, функционирующие версии неисправных эндогенных молекул или неисправные версии нормально функционирующих эндогенных молекул.

Напротив, “эндогенные” молекулы – это молекулы, которые обычно присутствуют в определенных клетках на определенной стадии развития при определенных условиях окружающей среды. Например, эндогенная нуклеиновая кислота может включать хромосомы, геном митохондрий, хлоропластов или других органелл либо природную эписомальную нуклеиновую кислоту. Другие эндогенные молекулы могут включать белки, к примеру, факторы транскрипции и ферменты.

“Сайт мишени” или “последовательность мишени” – это такая последовательность, которая определяет ту часть нуклеиновой кислоты или полипептида, с которой будет связываться связывающаяся молекула при наличии достаточных условий для связывания. Например, последовательность 5′-GAATTC-3′ является сайтом мишени для рестрикционной эндонуклеазы EcoRI.

Термин “слитые” в настоящем изобретении означает такие молекулы, в которых соединяются две или несколько молекул субъединиц, предпочтительно ковалентно. Молекулы субъединиц могут быть одного и того же химического типа или же разных химических типов молекул.

Термин “слитый белок” в настоящем изобретении означает гибридный белок, который содержит белковые домены по меньшей мере из двух разных белков. Один из белков может находиться в N-концевой части слитого белка либо в C-концевой части белка, образуя при этом “N-концевой слитый белок” или “C-концевой слитый белок”, соответственно.

Термины “ген” или “геном” в настоящем изобретении включают участки ДНК, кодирующие продукты генов, а также те участки ДНК, которые регулируют вырабатывание продуктов генов, независимо от того, примыкают ли такие регуляторные последовательности к кодирующим и/или транскрибируемым последовательностям. Соответственно, гены включают, необязательно без ограничения, последовательности промоторов, терминаторы, регуляторные последовательности трансляции типа сайтов связывания рибосом и сайтов для входа внутрь рибосом, энхансеры, сайленсеры, инсуляторы, граничные элементы, источники начала репликации, сайты прикрепления к матриксу и участки контроля локусов.

Термин “эукариотические” клетки включает, без ограничения, грибковые клетки (типа дрожжевых), растительные клетки, животные клетки, клетки млекопитающих и клетки человека (например, T-клетки).

Термин “соединяются” в настоящем изобретении означает такое соседство двух и более компонентов (типа элементов последовательности), при котором эти компоненты располагаются так, что оба компонента функционируют нормально и допускают возможность того, что по крайней мере один из компонентов может выполнять функцию, которая оказывает действие хотя бы на один из других компонентов.

“Функциональный фрагмент” белка, полипептида или нуклеиновой кислоты – это такой белок, полипептид или нуклеиновая кислота, соответственно, последовательность которых не идентична полноразмерному белку, полипептиду или нуклеиновой кислоте, но сохраняет ту же функцию, что и полноразмерный белок, полипептид или нуклеиновая кислота. Функциональный фрагмент может содержать больше, меньше или такое же количество остатков, что и соответствующая нативная молекула, и/или может содержать одну или несколько замен аминокислот или нуклеотидов.

Термин “трансфекция” в настоящем изобретении означает введение нуклеиновых кислот (ДНК или РНК) в эукариотические или прокариотические клетки либо организмы.

Термин “расщепление” в настоящем изобретении означает разрыв ковалентного остова молекулы ДНК. Расщепление можно инициировать различными методами, включая, без ограничения, ферментативный или химический гидролиз фосфодиэфирной связи. Возможно как одноцепочечное расщепление, так и двухцепочечное расщепление, причем двухцепочечное расщепление может происходить в результате двух отдельных событий одноцепочечного расщепления. Расщепление ДНК может приводить к образованию тупых концов либо смещенных концов. В некоторых воплощениях для направленного расщепления двухцепочечной ДНК применяются слитые полипептиды.

Термин “интеграза” в настоящем изобретении означает фермент, который вырабатывается вирусом и обеспечивает встраивание генетического материала в ДНК, например, в геномную ДНК инфицированных клеток.

Термин “специфичность” в настоящем изобретении означает способность избирательно связываться с последовательностью, которая имеет некоторую степень идентичности последовательности с выбранной последовательностью.

Термины “вставка” и “встраивание” в настоящем изобретении означают добавление одной последовательности нуклеиновой кислоты во вторую последовательность нуклеиновой кислоты или в геном.

Термины “специфическая”, “сайт-специфичная”, “целевая” и “направленная” в отношении вставки или встраивания применяются здесь взаимозаменяемо для обозначения вставки одной нуклеиновой кислоты в определенный сайт второй нуклеиновой кислоты или генома. Термины “случайная”, “ненаправленная” и “неприцельная” обозначают неспецифические и непреднамеренные генетические вставки. Термины “общее” или “полное” относятся к общему количеству вставок.

Термин “мутация” в настоящем изобретении означает замену одного остатка в последовательности, например, последовательности нуклеиновой кислоты или аминокислотной последовательности, другим остатком, либо делецию или встраивание одного или нескольких остатков в последовательность. Мутации обычно описываются здесь путем идентификации исходного остатка с указанием положения этого остатка в последовательности и идентификации вновь замещенного остатка. В данной области хорошо известны различные методы проведения аминокислотных замен (мутаций), предусмотренных здесь, которые приведены, к примеру, в Green and Sambrook. Molecular Cloning: A Laboratory Manual (4^th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)).

Термин “транспозаза” в настоящем изобретении означает такой фермент, который связывается с концом транспозона и катализирует его перемещение в другую часть генома по механизму вырезания и встраивания или по механизму репликативной транспозиции.

Термин “модифицированная” в настоящем изобретении означает такую последовательность белка или нуклеиновой кислоты, которая отличается от соответствующей немодифицированной последовательности белка или нуклеиновой кислоты.

Термин “линкер” в настоящем изобретении обозначает химическую группу или молекулу, соединяющую две соседние молекулы или группировки.

Термины “вектор” и “плазмида” в настоящем изобретении означают такие полинуклеотиды, которые могут нести, например, второй представляющий интерес полинуклеотид, и могут, например, переносить последовательности генов в клетки мишени. Таким образом, эти термины включают клонирующие и экспрессирующие носители, а также встраивающие векторы. В частности, термин “экспрессирующий вектор” в настоящем изобретении означает любой полинуклеотид, способный управлять экспрессией нуклеиновой кислоты. В некоторых аспектах термины “вектор” и “плазмида” применяются взаимозаменяемо с термином “конструкция из нуклеиновой кислоты”.

Термин “степень идентичности” в настоящем изобретении означает степень идентичности двух последовательностей, будь то последовательностей нуклеиновых кислот или аминокислотных последовательностей, и представляет количество точных совпадений между двумя выровненными последовательностями, деленное на длину более короткой последовательности и умноженное на 100.

Термины “рекомбинантные” или “сконструированные” в настоящем изобретении означают такие последовательности белков или нуклеиновых кислот, которые были созданы искусственно.

Термин “субъект” в настоящем изобретении означает индивидуальный организм, к примеру, индивидуальное млекопитающее. В некоторых воплощениях субъектом является человек. В некоторых воплощениях субъектами являются другие млекопитающие, а не человек. В некоторых воплощениях субъектами являются другие приматы, а не человек. В некоторых воплощениях субъектами являются грызуны. В некоторых воплощениях субъектами являются овцы, козы, крупный рогатый скот, кошки или собаки. В некоторых воплощениях субъектами являются позвоночные, амфибии, рептилии, рыбы, насекомые, мухи или нематоды. В некоторых воплощениях субъектами являются исследовательские животные.

Термины “лечение”, “лечить” и “лечащий” означают клиническое вмешательство, направленное на регрессию, ослабление, замедление возникновения или подавление развития заболевания или расстройства либо одного или нескольких его симптомов, как описано здесь. В настоящем изобретении термины “лечение”, “лечить” и “лечащий” означают клиническое вмешательство, направленное на регрессию, ослабление, замедление возникновения или подавление развития заболевания или расстройства либо одного или нескольких его симптомов, как описано здесь. В некоторых воплощениях лечение может проводиться после появления одного или нескольких симптомов и/или после диагноза заболевания. В других воплощениях лечение может проводиться и при отсутствии симптомов, например, для предотвращения, снижения вероятности возникновения или замедления появления симптомов либо для подавления возникновения или прогрессирования заболевания. Например, лечение может назначаться восприимчивым индивидам еще до появления симптомов (например, с учетом симптомов в анамнезе и/или в свете генетических или других факторов восприимчивости). Лечение может продолжаться и после прохождения симптомов, к примеру, для предотвращения или замедления их рецидива.

II Конструкции из нуклеиновой кислоты

Направленное редактирование последовательностей нуклеиновой кислоты, например, введение определенных модификаций (например, включение экзогенной нуклеиновой кислоты) в геномную ДНК, является перспективным подходом к лечению генетических заболеваний человека. С этой целью авторы изобретения стремились получить усовершенствованные конструкции из нуклеиновой кислоты для применения при редактировании генома, которые будут высокоэффективными при введении требуемых модификаций; обладать минимальной внецелевой активностью; и способными программироваться с тем, чтобы редактировать определенный сайт в геноме человека.

В некоторых аспектах настоящего изобретения предусмотрены конструкции из нуклеиновой кислоты для применения в целях улучшения сайт-специфического встраивания в геном экзогенной нуклеиновой кислоты, например, представляющего интерес гена (GOI). В некоторых воплощениях GOI является терапевтическим геном, например, геном, кодирующим терапевтический белок. Примеры представляющих интерес терапевтических генов включают ген CFTR (регулятора трансмембранной проводимости при кистозном фиброзе) для лечения муковисцидоза; ген SMN1 (ген выживаемости двигательных нейронов-1) для лечения спинальной мышечной атрофии (SMA); вариант G171V гена LRP5 (белка 5, связанного с рецептором LDL) для предотвращения остеопороза и переломов костей; и вариант A673T гена АРР (белка-предшественника бета-амилоида) для снижения предрасположенности к болезни Альцгеймера.

В некоторых воплощениях экзогенная нуклеиновая кислота для вставки (например, GOI) может иметь длину до 10 т.п.н., до 15 т.п.н., до 20 т.п.н., до 25 т.п.н., до 30 т.п.н., до 35 т.п.н. или до 40 т.п.н.

В некоторых воплощениях последовательность полинуклеотида, кодирующего ДНК-связывающий белок, обеспечивающий встраивание экзогенной нуклеиновой кислоты в геном, включает интегразу либо интегразу, модифицированную относительно интегразы дикого типа, а экзогенная нуклеиновая кислота для встраивание может иметь длину до 10 т.п.н., до 15 т.п.н. или до 20 т.п.н., например, от 1 т.п.н. до 20 т.п.н., от 1 т.п.н. до 19 т.п.н., от 1 до 18 т.п.н., от 1 т.п.н. до 17 т.п.н., от 1 т.п.н. до 16 т.п.н. или от 1 т.п.н. до 15 т.п.н.

В некоторых воплощениях последовательность полинуклеотида, кодирующего второй ДНК-связывающий белок, обеспечивающий встраивание экзогенной нуклеиновой кислоты в геном, включает транспозазу или транспозазу, модифицированную относительно транспозазы дикого типа, а экзогенная нуклеиновая кислота для вставки может иметь длину до 10 т.п.н., до 15 т.п.н., до 20 т.п.н., до 25 т.п.н., до 30 т.п.н., до 35 т.п.н. или до 40 т.п.н., например, от 1 т.п.н. до 40 т.п.н., от 1 т.п.н. до 39 т.п.н., от 1 до 38 т.п.н., от 1 т.п.н. до 37 т.п.н., от 1 т.п.н. до 36 т.п.н. или от 1 т.п.н. до 35 т.п.н.

В некоторых воплощениях конструкция из нуклеиновой кислоты включает последовательность полинуклеотида, кодирующего первый ДНК-связывающий белок, например, полипептид для редактирования генов, и последовательность полинуклеотида, кодирующего второй ДНК-связывающий белок, например, интегразу или транспозазу, причем конструкция нуклеиновой кислоты кодирует первый и второй связывающие белки в виде слитого белка. В некоторых воплощениях конструкция из нуклеиновой кислоты также включает последовательность нуклеиновой кислоты, кодирующей линкер между первым и вторым связывающим белком. В некоторых воплощениях конструкция из нуклеиновой кислоты кодирует слитый белок, обеспечивающий и/или способствующий сайт-специфической вставке экзогенной нуклеиновой кислоты в геном. В некоторых воплощениях первый или второй связывающий белок представляет собой интегразу, модифицированную относительно дикого типа. В некоторых воплощениях первый или второй связывающий белок представляет собой транспозазу, модифицированную относительно дикого типа. В некоторых воплощениях предусмотрены векторы или плазмиды, содержащие конструкции из нуклеиновой кислоты по изобретению. В некоторых воплощениях конструкция из нуклеиновой кислоты по изобретению кодирует слитый белок, который улучшает специфичность встраивания нуклеиновой кислоты, например, GOI, в геном. В некоторых воплощениях слитый белок и экзогенная нуклеиновая кислота вводятся в клетки с помощью лентивирусных частиц.

В некоторых воплощениях первый и второй связывающие белки находятся в разных конструкциях из нуклеиновой кислоты, например, транспозаза или интеграза (например, транспозаза и/или интеграза, модифицированная относительно дикого типа) находится в другой конструкции из нуклеиновой кислоты, отдельно от Cas9 или ZFP.

В некоторых аспектах предусмотрены векторы или плазмиды, содержащие приведенные здесь конструкции из нуклеиновых кислот. В некоторых воплощениях плазмиды, содержащие конструкции из нуклеиновой кислоты, являются упаковочными плазмидами. В некоторых воплощениях плазмиды, содержащие конструкции из нуклеиновой кислоты, дополнительно содержат полинуклеотид, кодирующий капсидные белки, например, gag и pol. В некоторых воплощениях (i) плазмиды, содержащие конструкции из нуклеиновой кислоты, комбинируют с (ii) плазмидами, содержащими полинуклеотид, кодирующий белки оболочки вируса (плазмидами для оболочки); и (iii) плазмидами, содержащими последовательность экзогенной нуклеиновой кислоты (например, GOI), причем при введении этой комбинации в клетки продуцирующей линии (например, эукариотические клетки, прокариотические клетки и/или клеточные линии) вырабатываются вирусные частицы, содержащие экзогенную нуклеиновую кислоту, например, GOI, и слитый белок, включающий и первый, и второй связывающий белок.

В некоторых воплощениях (i) плазмиды, содержащие конструкции из нуклеиновой кислоты, комбинируют с (ii) плазмидами, содержащими конструкции нуклеиновой кислоты, дополнительно содержащие полинуклеотид, кодирующий капсидные белки, например, gag и pol (упаковочными плазмидами, лишенными функциональной интегразы); (iii) плазмидами, содержащими полинуклеотид, кодирующий белки оболочки вируса (плазмидами для оболочки); и (iv) плазмидами, содержащими последовательность экзогенной нуклеиновой кислоты (например, GOI), причем при введении этой комбинации в клетки продуцирующей линии (например, эукариотические клетки, прокариотические клетки и/или клеточные линии) вырабатываются вирусные частицы, содержащие экзогенную нуклеиновую кислоту, например, GOI, и слитый белок, включающий и первый, и второй связывающий белок.

Конструкции из нуклеиновой кислоты содержат последовательность первого полинуклеотида, кодирующего первый ДНК-связывающий белок, сконструированный для связывания определенной последовательности ДНК, последовательность второго полинуклеотида, кодирующего второй ДНК-связывающий белок, обеспечивающий встраивание экзогенной нуклеиновой кислоты в геном, причем второй ДНК-связывающий белок представляет собой интегразу или транспозазу (например, транспозазу и/или интегразу, модифицированную относительно дикого типа), и последовательность третьего полинуклеотида, включающего последовательность нуклеиновой кислоты, кодирующей линкер между первым и вторым полинуклеотидом. В некоторых воплощениях первый ДНК-связывающий белок представляет собой цинк-пальцевый белок или белок Cas9.

В некоторых воплощениях конструкция из нуклеиновой кислоты включает линкер, выбранный из группы, состоящей из (GGS)_n, (GGGGS)_n (SEQ ID NO: 133), (G)_n, (EAAAK)_n (SEQ ID NO: 134), линкеров на основе XTEN или мотивов (XP)_n либо их комбинаций, где n независимо означает целое число от 1 до 50. В некоторых воплощениях нуклеиновая кислота кодирует линкер, включающий последовательность XTEN или последовательность GGS. В некоторых воплощениях последовательность нуклеиновой кислоты линкера имеет длину от 3 до 150 нуклеотидов. В некоторых воплощениях линкер имеет длину от 12 до 24 аминокислот либо от 36 до 72 нуклеотидов. В некоторых воплощениях конструкция из нуклеиновой кислоты включает последовательность нуклеиновой кислоты линкера длиной от 6 до 120, от 6 до 90, от 6 до 78, от 6 до 72, от 9 до 120, от 9 до 90, от 9 до 78, от 9 до 72, от 12 до 120, от 12 до 90, от 12 до 78, от 12 до 72, от 15 до 120, от 15 до 90, от 15 до 78, от 15 до 72, от 18 до 120, от 18 до 90, от 18 до 78, от 18 до 72, от 21 до 120, от 21 до 90, от 21 до 78, от 21 до 72, от 24 до 120, от 24 до 90, от 24 до 78, от 24 до 72, от 27 до 120, от 27 до 90, от 27 до 78, от 27 до 72, от 30 до 120, от 30 до 90, от 30 до 78, от 30 до 72, от 33 до 120, от 33 до 90, от 33 до 78, от 33 до 72, от 36 до 120, от 36 до 90, от 36 до 78 или от 36 до 72 нуклеотидов. В некоторых воплощениях нуклеиновая кислота, кодирующая линкер, имеет длину от 9 до 150 нуклеотидов. В некоторых воплощениях цинк-пальцевый белок соединяется с модифицированной интегразой по изобретению с помощью линкера, включающего последовательность GGS. В некоторых воплощениях линкер имеет длину от 1 до 50 аминокислот. В некоторых воплощениях линкер имеет длину от 3 до 40, от 3 до 30, от 3 до 29, от 3 до 24, от 4 до 40, от 4 до 30, от 4 до 29, от 4 до 24, от 5 до 40, от 5 до 30, от 5 до 29, от 5 до 24, от 6 до 40, от 6 до 30, от 6 до 29, от 6 до 24, от 7 до 40, от 7 до 30, от 7 до 29, от 7 до 24, от 8 до 40, от 8 до 30, от 8 до 29, от 8 до 24, от 9 до 40, от 9 до 30, от 9 до 29, от 9 до 24, от 10 до 40, от 10 до 30, от 10 до 29, от 10 до 24, от 11 до 40, от 11 до 30, от 11 до 29, от 11 до 24, от 12 до 40, от 12 до 30, от 12 до 29 или от 12 до 24 аминокислот.

В некоторых воплощениях 3′-конец последовательности первого полинуклеотида соединяется с 5′-концом последовательности второго полинуклеотида нуклеиновой кислотой, кодирующей линкер. В некоторых воплощениях 5′-конец последовательности первого полинуклеотида соединяется с 3′-концом последовательности второго полинуклеотида нуклеиновой кислотой, кодирующей линкер. В некоторых воплощениях 3′-конец белка Cas9 соединяется с 5′-концом транспозазы при помощи линкера. В некоторых воплощениях 5′-конец белка Cas9 соединяется с 3′-концом транспозазы при помощи линкера. В некоторых воплощениях 3′-конец цинк-пальцевого белка соединяется с 5′-концом интегразы при помощи линкера. В некоторых воплощениях 5′-конец цинк-пальцевого белка соединяется с 3′-концом интегразы при помощи линкера.

В некоторых воплощениях линкер не нужен, так как модифицированная интеграза или модифицированная транспозаза экспрессируется из другой плазмиды, отдельно от Cas9 или ZFP.

В некоторых аспектах изобретения предусмотрены векторы или плазмиды (например, экспрессирующие векторы или упаковочные векторы, содержащие конструкции из нуклеиновой кислоты по изобретению, подходящие для экспрессии в клетках хозяина, например, в клетках млекопитающих, дрожжевых клетках, клетках насекомых, растительных клетках, грибковых клетках или клетках водорослей.

В некоторых воплощениях конструкции из нуклеиновой кислоты содержат: (a) последовательность первого полинуклеотида, включающего нуклеиновую кислоту, кодирующую первый ДНК-связывающий белок, сконструированный для связывания с определенной последовательностью геномной ДНК в геноме, причем первый ДНК-связывающий белок представляет собой цинк-пальцевый белок или белок Cas9; (b) последовательность второго полинуклеотида, включающего нуклеиновую кислоту, кодирующую второй ДНК-связывающий белок, который обеспечивает встраивание экзогенной нуклеиновой кислоты в геном, причем второй ДНК-связывающий белок представляет собой (i) гиперактивную транспозазу PiggyBac или модифицированную гиперактивную PiggyBac с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с гиперактивной PiggyBac либо (ii) интегразу вируса иммунодефицита человека (ВИЧ) или модифицированную интегразу ВИЧ с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с интегразой ВИЧ; и (c) необязательно последовательность полинуклеотида, включающего нуклеиновую кислоту, кодирующую линкер; при этом конструкция из нуклеиновой кислоты кодирует слитый белок, включающий первый ДНК-связывающий белок, второй ДНК-связывающий белок и необязательно линкер между первым ДНК-связывающим белком и вторым ДНК-связывающим белком; причем слитый белок обеспечивает встраивание экзогенной нуклеиновой кислоты в определенный сайт генома.

В одном воплощении (a) первый ДНК-связывающий белок представляет собой белок Cas9 или цинк-пальцевый белок; а (b) второй ДНК-связывающий белок представляет собой гиперактивную транспозазу PiggyBac или модифицированную гиперактивную транспозазу PiggyBac с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с гиперактивной транспозазой PiggyBac.

В другом воплощении (a) первый ДНК-связывающий белок представляет собой белок Cas9 или цинк-пальцевый белок; а (b) второй ДНК-связывающий белок представляет собой интегразу ВИЧ или модифицированную интегразу ВИЧ с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с интегразой ВИЧ.

В некоторых воплощениях белок Cas9 является таким, как описано в данном изобретении, в частности, выбранным из группы, состоящей из Cas9 человека, никазы Cas9 и мертвого Cas9, более предпочтительно это Cas9 человека или никаза Cas9.

В одном воплощении при использовании dCas9 второй ДНК-связывающий белок не является каталитическим доменом рекомбиназы Gin, Hin или Tn3 либо расщепляющим ДНК доменом FokI. Таким рекомбиназам и FoKI необходим известный сайт (акцепторная последовательность в геноме), чтобы осуществлять встраивание; поэтому возможности посадки на сайты гораздо более ограничены; к тому же для их функциональности требуется образование димеров, например, Gin.

В другом воплощении цинк-пальцевый белок является таким, как описано
в данном изобретении, предпочтительно это цинк-пальцевый белок C2H2, содержащий 6 связывающих доменов.

В следующем воплощении линкер является таким, как описано в данном изобретении, а предпочтительно линкер включает последовательность XTEN (например, SEQ ID NO: 61, кодируемую по SEQ ID NO: 60) или последовательность GGS, более предпочтительно GGSx3 (SEQ ID NO: 49, кодируется по SEQ ID NO: 48), GGSx4 (SEQ ID NO: 51, кодируется по SEQ ID NO: 50), GGSx5 (SEQ ID NO: 53, кодируется по SEQ ID NO: 52), GGSx6 (SEQ ID NO: 55, кодируется по SEQ ID NO: 54), GGSx7 (SEQ ID NO: 57, кодируется по SEQ ID NO: 56) или GGSx8 (SEQ ID NO: 59, кодируется по SEQ ID NO: 58).

В следующем воплощении 3′-конец последовательности первого полинуклеотида соединяется с 5′-концом второго полинуклеотида.

В некоторых воплощениях модифицированная гиперактивная транспозаза PiggyBac является такой, как описано в данном изобретении. В других воплощениях модифицированная интеграза ВИЧ является такой, как описано в изобретении.

В других воплощениях не используется линкер. Вместо этого, например, последовательности первого и/или второго полинуклеотида содержат нуклеиновые кислоты, кодирующие первый и второй ДНК-связывающий белок, а также дополнительные нуклеиновые кислоты по крайней мере на одном из своих концов, которые выполняют функцию линкера.

В одном воплощении (a) первый ДНК-связывающий белок представляет собой белок Cas9 или цинк-пальцевый белок, а (b) второй ДНК-связывающий белок представляет собой гиперактивную транспозазу PiggyBac или модифицированную гиперактивную PiggyBac с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с гиперактивной PiggyBac, при этом конструкция из нуклеиновой кислоты содержит (c) последовательность полинуклеотида, включающего нуклеиновую кислоту, кодирующую линкер, включающий последовательность XTEN или последовательность GGS, причем 3′-конец последовательности первого полинуклеотида соединяется с 5′-концом второго полинуклеотида.

В одном воплощении (a) первый ДНК-связывающий белок представляет собой белок Cas9, а (b) второй ДНК-связывающий белок представляет собой гиперактивную транспозазу PiggyBac или модифицированную гиперактивную PiggyBac при условии, что, когда Cas9 является неактивным белком (dCas9), то линкером не является KLAGGAP AVGGGPK (SEQ ID NO: 130).

В одном воплощении (a) первый ДНК-связывающий белок представляет собой цинк-пальцевый белок, а (b) второй ДНК-связывающий белок представляет собой гиперактивную транспозазу PiggyBac или модифицированную гиперактивную PiggyBac, причем цинк-пальцевый белок способен распознавать множественные сайты узнавания, поскольку, как изложено в настоящем изобретении, связывающий домен цинк-пальцевого белка может быть сконструирован для связывания с выбранной последовательностью.

В одном воплощении (a) первый ДНК-связывающий белок представляет собой цинк-пальцевый белок, (b) второй ДНК-связывающий белок представляет собой гиперактивную транспозазу PiggyBac или модифицированную гиперактивную PiggyBac, а линкер представляет собой XTEN.

В одном воплощении (a) первый ДНК-связывающий белок представляет собой цинк-пальцевый белок, а (b) второй ДНК-связывающий белок представляет собой гиперактивную транспозазу PiggyBac или модифицированную гиперактивную PiggyBac, причем цинк-пальцевый белок не содержит ДНК-связывающего домена Gal4. Gal4 связывается с CGG-N11-CCG, где N может быть любым основанием. Этот белок является положительным регулятором экспрессии генов, индуцируемых галактозой, типа GAL1, GAL2, GAL7, GAL10 и MEL1, которые кодируют ферменты, используемые для превращения галактозы в глюкозу. Он распознает последовательность из 17 пар оснований (5′-CGGRNNRCYNYNCNCCG-3′) (SEQ ID NO: 135) в вышележащей активирующей последовательности (UAS-G) этих генов. Таким образом, Gal4 распознает короткую и очень частую последовательность в геноме, поэтому он не является сайт-специфичным. В предпочтительном воплощении цинк-связывающий белок содержит ДНК-связывающий домен Gal4, сконструированный так, чтобы он был сайт-специфичным.

В одном воплощении (a) первый ДНК-связывающий белок представляет собой цинк-пальцевый белок, а (b) второй ДНК-связывающий белок представляет собой гиперактивную транспозазу PiggyBac или модифицированную гиперактивную PiggyBac при условии, что линкером не является EFGGGGSGGGGSGGGGSQF (SEQ ID NO: 131).

В одном воплощении (a) первый ДНК-связывающий белок представляет собой белок Cas9 или цинк-пальцевый белок, а (b) второй ДНК-связывающий белок представляет собой интегразу ВИЧ или модифицированную интегразу ВИЧ с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с интегразой ВИЧ, при этом конструкция из нуклеиновой кислоты содержит (c) последовательность полинуклеотида, включающего нуклеиновую кислоту, кодирующую линкер, включающий последовательность XTEN или последовательность GGS, причем 3′-конец последовательности первого полинуклеотида соединяется с 5′-концом второго полинуклеотида.

В некоторых воплощениях конструкция из нуклеиновой кислоты находится в виде ДНК или РНК.

Также предусмотрены векторы, содержащие любые конструкции из нуклеиновой кислоты, предусмотренные в изобретении. В частности, эти векторы подходят для экспрессии в клетках млекопитающих, дрожжевых клетках, клетках насекомых, клетках растений, грибковых клетках или клетках водорослей. Также предусмотрены клетки-хозяева, содержащие любые конструкции из нуклеиновой кислоты или векторы, предусмотренные в изобретении.

III Интеграза и модифицированная интеграза

Интеграза является ключевым ферментом для стабильного встраивания вирусного генома в клетки хозяина, но интеграза также связана со вставочным мутагенезом, так как место встраивания под действием интегразы дикого типа непредсказуемо. Было показано, что предпочтительно встраивание идет в сильно транскрибируемые гены, что повышает риск мутации важных генов и регуляторов. В общем, интеграза ВИЧ-1 состоит из N-концевого домена (NTD), каталитического ядра (CCD) и C-концевого домена (CTD). NTD служит для связывания и координации катиона Zn²⁺ в качестве важного кофактора, тогда как CTD служит для связывания ДНК. Домен CCD образует каталитическое ядро, в котором происходит катализ процесса встраивания. После проникновения в клетки хозяина и обратной транскрипции РНК вирусного генома четыре молекулы интегразы образуют тетрамер и прикрепляются к концам вирусной ДНК, которая после этого именуется интасомой. Преинтеграционный комплекс (PIC) отщепляет 3′-OH-конец ДНК, образуя 5′-OH-выступ, который потребуется позже для нуклеофильной атаки на ДНК хозяина. Во время образования этого комплекса PIC переносится в ядро. После переноса в ядро PIC образует комплекс с ДНК хозяина, именуемый комплексом переноса цепи (STC). При этом оба 3′-OH-выступа вирусной ДНК атакуют два участка каркаса ДНК хозяина с интервалом в 5 нуклеотидов. Это приводит к дупликации мишени из 5 нуклеотидов. После нуклеофильной атаки вирусная ДНК встраивается, а одноцепочечные участки ДНК подвергаются репарации под действием механизмов репарации ДНК в клетках хозяина.

Настоящим изобретением предусмотрены конструкции из нуклеиновой кислоты, содержащие полинуклеотиды, кодирующие интегразы и модифицированные интегразы для встраивания экзогенной нуклеиновой кислоты в определенное место генома. В некоторых воплощениях экзогенная нуклеиновая кислота для встраивания может иметь длину до 10 т.п.н., до 15 т.п.н. или до 20 т.п.н., например, от 1 т.п.н. до 20 т.п.н., от 1 т.п.н. до 19 т.п.н., от 1 т.п.н. до 18 т.п.н., от 1 т.п.н. до 17 т.п.н., от 1 т.п.н. до 16 т.п.н. или от 1 т.п.н. до 15 т.п.н. В некоторых воплощениях последовательность полинуклеотида, кодирующего ДНК-связывающий белок, который обеспечивает встраивание экзогенной нуклеиновой кислоты в геном, включает интегразу, которая может быть модифицированной относительно интегразы дикого типа, а экзогенная нуклеиновая кислота для встраивания может иметь длину до 10 т.п.н. или до 15 т.п.н.

В некоторых аспектах изобретения предусмотрены слитые белки интегразы, разработанные с помощью описанных здесь способов и стратегий. В некоторых воплощениях изобретения предусмотрены нуклеиновые кислоты, кодирующие интегразы или модифицированные интегразы и/или содержащие их слитые белки. В некоторых воплощениях изобретения предусмотрены плазмиды или экспрессирующие векторы, содержащие такие конструкции из нуклеиновой кислоты, кодирующие интегразы или модифицированные интегразы и/или содержащие их слитые белки.

Интегразой или модифицированной интегразой по изобретению может быть любая интеграза, которая может вставить экзогенную нуклеиновую кислоту в определенное место генома. Неограничительные примеры интеграз включают интегразу ВИЧ, лентивирусную интегразу, аденовирусную интегразу, ретровирусную интегразу и интегразу вируса опухолей молочной железы мыши. В некоторых воплощениях интеграза (например, модифицированная интеграза, содержащая одну или несколько модификаций относительно дикого типа) представляет собой интегразу ВИЧ, предпочтительно интегразу ВИЧ с последовательностью, соответствующей NC_001802.1 (SEQ ID NO: 1 и 2, аминокислотная и нуклеотидная последовательность, соответственно). В некоторых воплощениях модифицированная интеграза содержит одну или несколько модификаций относительно интегразы ВИЧ дикого типа (SEQ ID NO: 1 и 2).

В некоторых воплощениях интеграза представляет собой модифицированную интегразу ВИЧ. Модифицированная интеграза ВИЧ может содержать мутации одной или нескольких аминокислот, выбранных из числа аминокислот 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266 или 273 в соответствии с нумерацией аминокислот по SEQ ID NO: 1. Мутации модифицированной интегразы ВИЧ могут включать одну или несколько модификаций аминокислот, приведенных в таблице 8. Мутации модифицированной интегразы ВИЧ могут включать одну или несколько модификаций аминокислот из числа D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R или K273R в соответствии с нумерацией аминокислот по SEQ ID NO: 1 или SEQ ID NO: 3.

В некоторых воплощениях модифицированная интеграза может содержать одну или несколько мутаций относительно дикого типа, нарушающих связывание ДНК, например, по аминокислотам 94, 117, 119, 120, 124 и/или 231 (например, G94D, G94E, G94R, G94K, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, A124D, A124E, A124R, A124K, R231G, R231K, R231D, R231E и/или R231K) в соответствии с нумерацией аминокислот по SEQ ID NO: 1 или SEQ ID NO: 4.

В некоторых воплощениях модифицированная интеграза может содержать одну или несколько мутаций относительно дикого типа, усиливающих связывание ДНК, например, по аминокислотам 94, 117, 119, 120, 122, 124 и/или 231 (например, G94D, G94E, G94R, G94K, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, R231G, R231K, R231D, R231E и/или R231S) в соответствии с нумерацией аминокислот по SEQ ID NO: 1 или SEQ ID NO: 5.

В некоторых воплощениях модифицированная интеграза может содержать одну или несколько мутаций относительно дикого типа по аминокислотам, участвующим в ацетилировании интегразы под действием p300, например, по аминокислотам 264, 266 и/или 273 (например, K264R, K266R и/или K273R) в соответствии с нумерацией аминокислот по SEQ ID NO: 1 или SEQ ID NO: 6.

В некоторых воплощениях модифицированная интеграза может содержать одну или несколько мутаций по сильно консервативным аминокислотам, важным для интегративной рекомбинации ретровирусов, например, по аминокислотам 10, 13, 64, 116, 128, 152, 168 и/или 170 (например, D10K, E13K, D64A, D64E, D116A, D116E, A128T, E152A, E152D, Q168L, Q168A и/или E170G) в соответствии с нумерацией аминокислот по SEQ ID NO: 1 или SEQ ID NO: 7.

В некоторых воплощениях модифицированная интеграза может содержать одну или несколько мутаций, нарушающих взаимодействие с LEDGF/p75 и нарушающих привязку хромосом и репликацию ВИЧ-1, например, по аминокислоте 168 (например, Q168L или Q168A) в соответствии с нумерацией аминокислот по SEQ ID NO: 1 или SEQ ID NO: 8.

В некоторых воплощениях модифицированная интеграза ВИЧ имеет аминокислотную последовательность, которая по меньшей мере на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности, приведенной в SEQ ID NO: 1. В некоторых воплощениях модифицированная интеграза ВИЧ имеет аминокислотную последовательность, содержащую одну или несколько из описанных здесь модификаций относительно SEQ ID NO: 1, 3, 4, 5, 6, 7 или 8, соответственно, и остается по меньшей мере на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98% или на 99% идентичной последовательности, приведенной в SEQ ID NO: 1, 3, 4, 5, 6, 7 или 8, соответственно. В некоторых воплощениях модифицированная интеграза ВИЧ подвергалась отбору на высокую специфичность встраивания ДНК в геном по сравнению с интегразой ВИЧ дикого типа.

В некоторых аспектах изобретения предусмотрены векторы или плазмиды (например, экспрессирующие векторы или упаковочные векторы), содержащие конструкции из нуклеиновой кислоты, включающие интегразу или модифицированную интегразу по изобретению, подходящую для экспрессии в клетках хозяина, например, в клетках млекопитающих, дрожжевых клетках, клетках насекомых, клетках растений, грибковых клетках или клетках водорослей. В некоторых воплощениях интеграза или модифицированная интеграза экспрессируется в виде слитого белка с белком Cas9 или цинк-пальцевым белком. В некоторых воплощениях интеграза или модифицированная интеграза экспрессируется вместе с белком Cas9 или цинк-пальцевым белком из разных векторов, но вводится в одни и те же клетки. В некоторых воплощениях интеграза или модифицированная интеграза либо содержащий её слитый белок упаковывается в лентивирусные частицы для доставки в клетки.

IV Транспозаза и модифицированная транспозаза

Транспозоны – это сегменты хромосом, которые могут подвергаться транспозиции, например, это ДНК, которая может транслоцироваться как одно целое в отсутствие комплементарной последовательности в ДНК хозяина. Транспозоны могут применяться для различного рода инженерии ДНК в клетках человека. Распространенные системы транспозонов, используемые в клетках млекопитающих, включают Sleeping Beauty (SB), который был реконструирован из неактивных транспозонов, и PiggyBac (PB), выделенный из моли Trichoplusia. PiggyBac обладает большей активностью транспозиции, чем SB, и он вырезается без следа.

Транспозоны нативной ДНК обычно содержат единственный ген, кодирующий белок транспозазы, который фланкирован концевыми инвертированными повторами (ITR), несущими сайты связывания транспозазы. Во время транспозиции белок транспозазы распознает эти ITR и катализирует вырезание и последующее встраивание этого элемента в другом месте случайным образом. Более того, некоторые из этих транспозонов можно адаптировать для применения в методиках генной терапии, используя их в качестве двухкомпонентных систем, в которых плазмида содержит экспрессионную кассету, где последовательность ДНК, помещенная между ITR транспозона, может быть введена в геном хозяина под управлением котрансфицируемой плазмиды, содержащей последовательность, кодирующую фермент транспозазу либо её мРНК, синтезированную in vitro. В некоторых аспектах изобретения транспозоны применяются для эффективного обеспечения стабильного встраивания и стойкой экспрессии трансгенов типа терапевтических генов.

Настоящим изобретением предусмотрены конструкции из нуклеиновой кислоты, содержащие полинуклеотиды, кодирующие транспозазы и модифицированные транспозазы для встраивания экзогенной нуклеиновой кислоты в определенное место генома. В некоторых воплощениях экзогенная нуклеиновая кислота для вставки может иметь длину до 20 т.п.н., до 25 т.п.н., до 30 т.п.н. или до 40 т.п.н., например, от 1 т.п.н. до 40 т.п.н., от 1 т.п.н. до 39 т.п.н., от 1 до 38 т.п.н., от 1 т.п.н. до 37 т.п.н., от 1 т.п.н. до 36 т.п.н., от 1 т.п.н. до 35 т.п.н., от 1 т.п.н. до 30 т.п.н. либо от 1 т.п.н. до 25 т.п.н. В некоторых воплощениях последовательность полинуклеотида, кодирующего ДНК-связывающий белок, который обеспечивает встраивание экзогенной нуклеиновой кислоты в геном, включает транспозазу или модифицированную относительно дикого типа транспозазу, а экзогенная нуклеиновая кислота для вставки может иметь длину до 35 т.п.н. или до 40 т.п.н.

Транспозазой или модифицированной транспозазой по изобретению может быть любая транспозаза, которая может вставить экзогенную нуклеиновую кислоту в определенное место генома. В некоторых аспектах изобретения предусмотрены слитые белки транспозазы, разработанные с помощью описанных здесь способов и стратегий. В некоторых воплощениях изобретения предусмотрены нуклеиновые кислоты, кодирующие такие транспозазы или модифицированные транспозазы и/или содержащие их слитые белки. В некоторых воплощениях изобретения предусмотрены плазмиды или экспрессирующие векторы, содержащие такие конструкции из нуклеиновой кислоты, кодирующие транспозазы или модифицированные транспозазы и/или содержащие их слитые белки.

Неограничительные примеры транспозаз включают транспозазу Frog Prince, Sleeping Beauty, гиперактивную Sleeping Beauty, PiggyBac и гиперактивную PiggyBac. В некоторых воплощениях транспозаза представляет собой гиперактивную транспозазу PiggyBac по SEQ ID NO: 9 или 67 (которая в описании также именуется как hyPB или просто как PB). В некоторых воплощениях модифицированная транспозаза содержит одну или несколько модификаций относительно гиперактивной транспозазы PiggyBac (SEQ ID NO: 9).

В некоторых воплощениях транспозаза представляет собой модифицированную гиперактивную транспозазу PiggyBac. Модифицированная гиперактивная транспозаза PiggyBac может содержать мутации одной или нескольких аминокислот из числа аминокислот 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592 и 594 в соответствии с нумерацией аминокислот по SEQ ID NO: 9. Мутации модифицированной гиперактивной PiggyBac могут включать одну или несколько модификаций аминокислот, приведенных в таблице 3. Мутации модифицированной гиперактивной транспозазы PiggyBac могут включать одну или несколько модификаций аминокислот из числа R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G или F594L в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 10.

В некоторых воплощениях модифицированная транспозаза может содержать одну или несколько мутаций относительно hyPB по аминокислотам, участвующим в консервативной каталитической триаде, например, 268 и/или 346 (например, D268N и/или D346N) в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 11.

В некоторых воплощениях модифицированная транспозаза может содержать одну или несколько мутаций относительно hyPB по аминокислотам, важным для вырезания, например, 287, 287/290 и/или 460/461 (например, K287A, K287A/K290A и/или R460A/K461A) в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 12.

В некоторых воплощениях модифицированная транспозаза может содержать одну или несколько мутаций относительно hyPB по аминокислотам, участвующим в посадке на мишень, например, 351, 356 и/или 379 (например, S351E, S351P, S351A и/или K356E) в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 13.

В некоторых воплощениях модифицированная транспозаза может содержать одну или несколько мутаций относительно hyPB по аминокислотам, важным для встраивания, например, 560, 564, 571, 573, 589, 592 и/или 594 (например, T560A, S564P, S571N, S573A, M589V, S592G и/или F594L) в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 14.

В некоторых воплощениях модифицированная транспозаза может содержать одну или несколько мутаций относительно hyPB по аминокислотам, участвующим в выравнивании, например, 325, 347, 350, 357 и/или 465 (например, G325A, N347A, N347S, T350A и/или W465A) в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 15.

В некоторых воплощениях модифицированная транспозаза может содержать одну или несколько мутаций относительно hyPB по аминокислотам, которые весьма консервативны, например, 576 и/или 587 (например, K576A и/или I587A) в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 16.

В некоторых воплощениях модифицированная транспозаза может содержать одну или несколько мутаций относительно hyPB по аминокислотам, участвующим в связывании Zn²⁺, например, 586 (например, H586A) в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 17.

В некоторых воплощениях программируемая транспозаза может содержать одну или несколько мутаций относительно hyPB по аминокислотам, участвующим во встраивании, например, 315, 341, 372 и/или 375 (например, R315A, R341A, R372A и/или K375A) в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 18.

В некоторых воплощениях модифицированная гиперактивная PiggyBac имеет аминокислотную последовательность, которая по меньшей мере на 85%, на 90%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности, приведенной в SEQ ID NO: 9. В некоторых воплощениях модифицированная гиперактивная PiggyBac подвергается отбору на высокую специфичность встраивания ДНК в геном по сравнению с гиперактивной PiggyBac. В некоторых воплощениях модифицированная гиперактивная PiggyBac имеет аминокислотную последовательность, содержащую одну или несколько из описанных здесь модификаций относительно SEQ ID NO: 9, 10, 11, 12, 13, 14, 15, 16, 17 или 18 и остается по меньшей мере на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98% или на 99% идентичной последовательности, приведенной в SEQ ID NO: 9, 10, 11, 12, 13, 14, 15, 16, 17 или 18, соответственно.

В некоторых воплощениях гиперактивная транспозаза PiggyBac кодируется нуклеиновой кислотой, последовательность которой по меньшей мере на 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности SEQ ID. NO: 67. В некоторых воплощениях транспозаза SB100 кодируется нуклеиновой кислотой, последовательность которой по меньшей мере на 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности SEQ ID. NO: 68.

В некоторых воплощениях транспозаза PB имеет аминокислотную последовательность, которая по меньшей мере на 85%, 90%, 95%, 96%, 97%, 98%, 99% или на 100% идентична последовательности SEQ ID NO: 72. В некоторых воплощениях транспозаза SB100 имеет аминокислотную последовательность, которая по меньшей мере на 85%, 90%, 95%, 96%, 97%, 98%, 99% или на 100% идентична последовательности SEQ ID NO: 73.

В некоторых воплощениях модифицированная транспозаза представляет собой модифицированную транспозазу Sleeping Beauty, содержащую одну или несколько мутаций. В некоторых воплощениях одна или несколько мутаций у гиперактивной транспозазы Sleeping Beauty или SB100 соответствует L25F, R36A, I42K, G59D, I212K, N245S, K252A и Q271L по SEQ ID NO: 9 или SEQ ID NO: 73.

В некоторых воплощениях модифицированная транспозаза не является мутантом Himar1C9.

В некоторых аспектах изобретения предусмотрены векторы или плазмиды (например, экспрессирующие векторы или упаковочные векторы), содержащие конструкции из нуклеиновой кислоты, включающие транспозазу или модифицированную транспозазу по изобретению, подходящую для экспрессии в клетках хозяина, например, в клетках млекопитающих, дрожжевых клетках, клетках насекомых, клетках растений, грибковых клетках или клетках водорослей. В некоторых воплощениях транспозаза или модифицированная транспозаза экспрессируется в виде слитого белка с Cas9. В некоторых воплощениях транспозаза или модифицированная транспозаза экспрессируется вместе с белком Cas9 из разных векторов, но вводится в одни и те же клетки. В некоторых воплощениях транспозаза или модифицированная транспозаза либо содержащий её слитый белок упаковывается в лентивирусные частицы для доставки в клетки.

Как показано в Примере 20, недавно разработанная библиотека мутаций гиперактивной транспозазы PiggyBac может использоваться для идентификации такой модифицированной гиперактивной PiggyBac, которая осуществляет специфические направленные транспозиции. С помощью такой библиотеки была идентифицирована модифицированная гиперактивная PiggyBac, положительная по направленной транспозиции.

В некоторых воплощениях модифицированная гиперактивная транспозаза PiggyBac может содержать мутации одной или нескольких аминокислот из числа аминокислот 245, 275, 277, 325, 347, 351, 372, 375, 388, 450, 465, 560, 564, 573, 589, 592, 594 в соответствии с нумерацией аминокислот по SEQ ID NO: 9.

В некоторых воплощениях мутации модифицированной гиперактивной PiggyBac могут включать одну или несколько модификаций аминокислот, приведенных в таблице 11.

В некоторых воплощениях мутации модифицированной гиперактивной транспозазы PiggyBac могут включать одну или несколько модификаций аминокислот из числа R245A, R275A, R277A, R275A/R277A, G325A, N347A, N347S, S351E, S351P, S351A, R372A, K375A, R388A, D450N, W465A, T560A, S564P, S573A, M589V, S592G или F594L в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 119.

В одном воплощении модифицированная гиперактивная транспозаза PiggyBac содержит модификацию аминокислоты D450 в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 119.

В одном воплощении модифицированная гиперактивная транспозаза PiggyBac содержит модификации аминокислот R372A, K375A и D450 в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 119.

В одном воплощении модифицированная гиперактивная транспозаза PiggyBac содержит модификации аминокислот R245A и D450 в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 119.

В одном воплощении модифицированная гиперактивная транспозаза PiggyBac содержит модификации аминокислот R245A, G325A и D450 в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 119.

В одном воплощении модифицированная гиперактивная транспозаза PiggyBac содержит модификации аминокислот R245A, G325A, D450 и S573P в соответствии с нумерацией аминокислот по SEQ ID NO: 9 или SEQ ID NO: 119.

Как уже было сказано, здесь предусмотрены модифицированные гиперактивные транспозазы PiggyBac, которые могут быть слиты с приведенными здесь элементами, но также могут использоваться и сами по себе или в комбинации с другими элементами. Данные транспозазы были созданы авторами изобретения. Итак, предусмотрены модифицированные гиперактивные транспозазы PiggyBac, которые включают аминокислотную последовательность SEQ ID NO: 9, где:

i. в положении 245 находится аминокислота A,

ii. в положении 275 находится аминокислота R или A,

iii. в положении 277 находится аминокислота R или A,

iv. в положении 325 находится аминокислота A или G,

v. в положении 347 находится аминокислота N или A,

vi. в положении 351 находится аминокислота E, P или A,

vii. в положении 372 находится аминокислота R,

viii. в положении 375 находится аминокислота A,

ix. в положении 450 находится аминокислота D или N,

x. в положении 465 находится аминокислота W или A,

xi. в положении 560 находится аминокислота T или A,

xii. в положении 564 находится аминокислота P или S,

xiii. в положении 573 находится аминокислота S или A,

xiv. в положении 592 находится аминокислота G или S и

xv. в положении 594 находится аминокислота L или F.

В некоторых воплощениях модифицированная гиперактивная PiggyBac имеет аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 120, 121, 122, 123, 124, 125, 126, 127, 128 и 129.

В некоторых воплощениях модифицированная гиперактивная PiggyBac имеет аминокислотную последовательность, содержащую одну или несколько из описанных здесь модификаций относительно SEQ ID NO: 119, 120, 121, 122, 123, 124, 125, 126, 127, 128 или 129 и остается по меньшей мере на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98% или на 99% идентичной последовательности, приведенной в SEQ ID NO: 119, 120, 121, 122, 123, 124, 125, 126, 127, 128 или 129, соответственно. В некоторых воплощениях модифицированная гиперактивная PiggyBac подвергается отбору на высокую специфичность встраивания ДНК в геном по сравнению с гиперактивной PiggyBac.

Настоящим изобретением также предусмотрены приведенные здесь модифицированные гиперактивные транспозазы PiggyBac для применения в качестве лекарственных средств, в частности, в генной терапии ex vivo или in vivo.

V Редактирование генов с помощью Cas9 и “цинковых пальцев”

Современные инструменты инженерии генома, включая сконструированные цинк-пальцевые белки (ZFP), эффекторные нуклеазы типа активаторов транскрипции (TALEN), а в последнее время и РНК-управляемая ДНК-эндонуклеаза Cas9, осуществляют специфичное для последовательности расщепление ДНК в геноме. Такое программируемое расщепление может вызывать мутации ДНК по месту расщепления посредством негомологического соединения концов (NHEJ) или замену ДНК, окружающей сайт расщепления, посредством репарации по гомологии (HDR).

В некоторых аспектах изобретения предусмотрены конструкции из нуклеиновой кислоты, содержащие полинуклеотиды, кодирующие ДНК-связывающие белки, например, Cas9 и ZFP, сконструированные для связывания с определенной последовательностью геномной ДНК. В некоторых воплощениях такие ДНК-связывающие белки сливаются с описанной здесь модифицированной интегразой или модифицированной транспозазой для редактирования генов.

Cas9

Система CRISPR-Cas9 является высокоэффективным инструментом для инактивации или модификации генов посредством специфичных для последовательности двухцепочечных разрывов (DSB). Эти DSB распознаются клеточными механизмами ответа на повреждение ДНК и подвергаются репарации эндогенными путями репарации DSB. Преобладающим путем репарации является негомологическое соединение концов (NHEJ), которое часто приводит к небольшим вставкам и/или делециям, которые могут создавать мутации сдвига рамки считывания и нарушать функцию генов. Этот путь можно использовать для получения генетических нокаут-мутаций. С другой стороны, при наличии матрицы для репарации повреждения могут устраняться без следа посредством репарации по гомологии (HDR). Однако, несмотря на заметный прогресс, опосредованное HDR редактирование генома для внесения точных генетических модификаций намного менее эффективно, чем опосредованное NHEJ разрушение генов. Кроме того, большие замены в несколько т.п.н. посредством HDR остаются проблемными и требуют отбора и/или сортировки больших популяций клеток. Поэтому основное применение механизма HDR – локальная замена ключевых участков в генах.

Термины “Cas9” и “нуклеаза Cas9” обозначают РНК-управляемую нуклеазу, содержащую белок Cas9 либо его фрагмент (например, белок, содержащий активный или неактивный ДНК-расщепляющий домен Cas9 и/или домен, связывающий направляющую РНК, Cas9). Нуклеаза Cas9 также иногда именуется нуклеазой casn1 либо нуклеазой, ассоциированной с CRISPR (кластерами коротких палиндромным повторов с регулярными промежутками). CRISPR – это адаптивная иммунная система, обеспечивающая защиту от подвижных генетических элементов (вирусов, перемещающихся элементов и конъюгативных плазмид). Кластеры CRISPR содержат спейсеры, последовательности, комплементарные предшествующим подвижным элементам и проникающим в клетки нуклеиновым кислотам. Кластеры CRISPR подвергаются транскрипции и преобразуются в CRISPR-РНК (crRNA). В системах CRISPR типа II для правильного процессинга пре-crRNA требуется кодируемая in trans короткая РНК (tracrРНК), эндогенная рибонуклеаза 3 (rnc) и белок Cas9. TracrРНК служит проводником для процессинга пре-crRNA с помощью рибонуклеазы 3. Впоследствии Cas9/crRNA/tracrRNA эндонуклеолитически расщепляет линейную или кольцевую мишень дцДНК, комплементарную спейсеру. Нить мишени, не комплементарная crРНК, сначала разрезается эндонуклеолитически, а затем 3′-5′-экзонуклеолитически. В природе для связывания и расщепления ДНК обычно требуется белок и обе РНК. Однако можно сконструировать единую направляющую РНК (“sgRNA” или просто “направляющую РНК”) с тем, чтобы она включала аспекты как crРНК, так и tracrРНК в единый вид РНК.

Cas9 распознает короткий мотив в последовательностях повторов CRISPR (PAM, то есть прилегающий к протоспейсеру мотив), который помогает отличить «свое» от «чужого». Последовательности и структуры нуклеазы Cas9 хорошо известны специалистам в данной области. Были описаны ортологи Cas9 у различных видов, включая, без ограничения, S. pyogenes и S. thermophilus. Специалистам должны быть известны и другие подходящие нуклеазы и последовательности Cas9, исходя из данного описания, причем такие нуклеазы и последовательности Cas9 включают последовательности Cas9 из организмов и локусов, описанных в Chylinski et al., “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737; всё содержание которой включено сюда путем ссылки.

В некоторых воплощениях нуклеаза Cas9 содержит неактивный (например, инактивированный) ДНК-расщепляющий домен. Белок Cas9 с инактивированной нуклеазой может взаимозаменяемо именоваться белком “dCas9” (от Cas9 с “мертвой” (dead) нуклеазой)). Методы получения белка Cas9 (или его фрагментов) с неактивным ДНК-расщепляющим доменом известны (например, см. Jinek et al., Science 337:816-821 (2012); Qi et al., “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell 28, 152(5):1173-83; всё содержание которой включено сюда путем ссылки.

Например, известно, что ДНК-расщепляющий домен Cas9 включает два субдомена: нуклеазный субдомен HNH и субдомен RuvC1. Субдомен HNH расщепляет нить, комплементарную направляющей РНК, а субдомен RuvC1 расщепляет некомплементарную нить. Мутации в этих субдоменах могут заглушать нуклеазную активность Cas9. Например, мутации D10A и H841A полностью инактивируют нуклеазную активность Cas9 S. pyogenes. Никаза Cas9 является вариантом нуклеазы Cas9, отличающимся точечной мутацией (D10A) в нуклеазном домене RuvC, что позволяет ей надрезать, но не расщеплять ДНК.

Термин “Cas9” также включает его варианты и функциональные фрагменты. В некоторых воплощениях предусмотрены белки, содержащие фрагменты Cas9. Например, в некоторых воплощениях белок содержит один из двух доменов Cas9: (1) домен Cas9 связывающий направляющую РНК; или (2) ДНК-расщепляющий домен Cas9. В некоторых воплощениях белок, содержащий Cas9 или его фрагменты, именуется “вариантом Cas9”. Вариант Cas9 имеет гомологию с Cas9 или его фрагментом. Например, вариант Cas9 может быть по меньшей мере на 70%, на 80%, на 90%, на 95%, на 96%, на 97%, на 98%, на 99%, на 99,5% или на 99,9% идентичен Cas9 дикого типа. В некоторых воплощениях вариант Cas9 содержит фрагмент Cas9 (например, домен связывающий направляющую РНК чили ДНК-расщепляющий домен), причем этот фрагмент по меньшей мере на 70%, на 80%, на 90%, на 95%, на 96%, на 97%, на 98%, на 99%, на 99,5% или на 99,9% идентичен соответствующему фрагменту Cas9 дикого типа. В некоторых воплощениях Cas9 означает Cas9 из Corynebacterium ulcerans (№ по NCBI: NC_015683.1, NC_017317.1) (SEQ ID NO: 19); Corynebacterium diphtheria (№ по NCBI: NC_016782.1, NC_016786.1) (SEQ ID NO: 20); Spiroplasma syrphidicola (№ по NCBI: NC_021284.1) (SEQ ID NO: 21); Prevotella intermedia (№ по NCBI: NC_017861.1) (SEQ ID NO: 22); Spiroplasma taiwanense (№ по NCBI: NC_021846.1) (SEQ ID NO: 23); Streptococcus iniae (№ по NCBI: NC_021314.1) (SEQ ID NO: 24); Belliella baltica (№ по NCBI: NC_018010.1) (SEQ ID NO: 25); Psychroflexus torquisi (№ по NCBI: NC_018721.1) (SEQ ID NO: 26); Streptococcus thermophilus (№ по NCBI: YP_820832.1) (SEQ ID NO: 27); Listeria innocua (№ по NCBI: NP_472073.1) (SEQ ID NO: 28); Campylobacter jejuni (№ по NCBI: YP_002344900.1) (SEQ ID NO: 29); или Neisseria meningitidis (№ по NCBI: YP_002342100.1) (SEQ ID NO: 30). В некоторых воплощениях Cas9 дикого типа соответствует Cas9 из Streptococcus pyogenes (№ по NCBI: NC_017053.1) (SEQ ID NO: 31).

Из известных белков Cas9 именно Cas9 S. pyogenes широко применяется в качестве инструмента для инженерии генома. Этот белок Cas9 представляет собой большой мультидоменный белок, содержащий два разных нуклеазных домена. В Cas9 можно вводить точечные мутации для устранения нуклеазной активности, получая “мертвый” Cas9 (dCas9), еще сохраняющий способность к связыванию ДНК запрограммированным sgRNA способом. В принципе, при слиянии с другим белком или доменом dCas9 может направлять этот белок практически на любую последовательность ДНК просто при совместной экспрессии с соответствующей sgRNA.

Настоящим изобретением предусмотрены конструкции из нуклеиновой кислоты, содержащие полинуклеотиды, кодирующие белки Cas9 для встраивания экзогенной нуклеиновой кислоты в определенный сайт генома. В некоторых аспектах изобретения предусмотрены слитые белки, включающие белок Cas9 и модифицированную интегразу либо модифицированную транспозазу по изобретению. В некоторых воплощениях изобретения предусмотрены нуклеиновые кислоты, кодирующие такие белки или слитые белки Cas9. В некоторых воплощениях предусмотрены плазмиды или экспрессирующие векторы, содержащие такие нуклеиновые кислоты.

Cas9, кодируемые приведенными здесь конструкциями из нуклеиновой кислоты, могут быть любые Cas9, которые могут связываться с определенной последовательностью геномной ДНК в геноме. Неограничительные примеры белков Cas9 включают Cas9 человека (hCas9), никазу Cas9 (nCas9), “мертвый” Cas9 (dCas9), Cas9 из Streptococcus pyogenes, Cas9 из Staphylococcus aureus, Cas12a, Cas12b, мертвый Cas9 (dCas9), их варианты и функциональные фрагменты. В некоторых воплощениях Cas9 представляет собой Cas9 человека либо его вариант или функциональный фрагмент.

В некоторых воплощениях hCas9 кодируется последовательностью нуклеиновой кислоты, которая по меньшей мере на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности SEQ ID NO: 64. В некоторых воплощениях nCas9 кодируется последовательностью нуклеиновой кислоты, которая по меньшей мере на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности SEQ ID NO: 65. В некоторых воплощениях dCas9 кодируется последовательностью нуклеиновой кислоты, которая по меньшей мере на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности SEQ ID NO: 66.

В некоторых воплощениях hCas9 имеет аминокислотную последовательность, которая по меньшей мере на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности SEQ ID NO: 69. В некоторых воплощениях nCas9 имеет аминокислотную последовательность, которая по меньшей мере на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности SEQ ID NO: 70. В некоторых воплощениях dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности SEQ ID NO: 71.

В некоторых аспектах изобретения предусмотрены векторы или плазмиды (например, экспрессирующие векторы или упаковочные векторы), содержащие конструкции из нуклеиновой кислоты, включающие Cas9, подходящий для экспрессии в клетках хозяина, например, в клетках млекопитающих, дрожжевых клетках, клетках насекомых, клетках растений, грибковых клетках или клетках водорослей. В некоторых воплощениях конструкция из нуклеиновой кислоты содержит последовательность полинуклеотида, кодирующего Cas9, который экспрессируется в виде слитого белка с модифицированной транспозазой по изобретению.

Цинк-пальцевые белки

Настоящим изобретением также предусмотрены конструкции из нуклеиновой кислоты, содержащие полинуклеотиды, кодирующие цинк-пальцевые белки (ZFP) для встраивания экзогенной нуклеиновой кислоты в определенное место генома. В некоторых аспектах изобретения предусмотрены слитые белки, содержащие ZFP и модифицированную интегразу или модифицированную транспозазу по изобретению. В некоторых воплощениях изобретения предусмотрены нуклеиновые кислоты, кодирующие такие ZFP или слитые белки. В некоторых воплощениях изобретения предусмотрены плазмиды или экспрессирующие векторы, содержащие такие кодирующие нуклеиновые кислоты.

Используемые здесь цинк-пальцевые белки представляют собой белки, которые могут связываться с ДНК специфичным для последовательности образом. ZFP распределены неравномерно у эукариот. Идентифицированы такие ZFP, которые участвуют в распознавании ДНК, связывании РНК и связывании белков. Некоторые классификации цинк-пальцевых белков основываются на “группах складок” с учетом общей формы белкового остова в сложенном домене. Наиболее распространенными группами складок цинковых пальцев являются группы типа C₂H₂ или Cys₂His₂ (“классический цинковый палец”), скрипичного ключа и цинковой ленты. Репрезентативный мотив, характерный для одного класса этих белков (класса C₂H₂): -Cys-(X)_2-4-Cys-(X)₁₂-His-(X)_3-5-His (где X – любая аминокислота).

ZFP по изобретению могут быть любые ZFP, их варианты или функциональные фрагменты, которые могут связываться с определенной последовательностью геномной ДНК в геноме. Неограничительные примеры ZFP включают ZFP, содержащие группы или мотивы складок цинковых пальцев, выбранные из доменов типа C₂H₂, gag-костяшек, скрипичного ключа, цинковой ленты, Zn₂/Cys₆ или TAZ2 и их комбинаций. В некоторых воплощениях ZFP представляют собой цинк-пальцевые белки типа C₂H₂. В некоторых воплощениях ZFP представляют собой сконструированные ZFP.

Для получения цинк-пальцевых нуклеаз можно слить сконструированные комплекты цинковых пальцев с ДНК-расщепляющим доменом (обычно с расщепляющим доменом FokI). Такие слияния цинковых пальцев и FokI стали полезными реагентами для манипулирования геномом.

ZFP по изобретению могут содержать 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 и более доменов “цинковых пальцев”. ZFP могут содержать 2-12, 2-10, 2-8, 3-8, 4-8 или 5-8 доменов “цинковых пальцев”. В некоторых воплощениях ZFP содержат по 6 доменов “цинковых пальцев”.

Обычно процесс модульной сборки включает объединение отдельных цинковых пальцев, каждый из которых может распознавать последовательность ДНК из 3 пар оснований, получая комплекты из 3, 4, 5 или 6 пальцев, которые распознают целевые сайты длиной от 9 пар оснований до 18 пар оснований. В другом методе используют модули из 2 пальцев, получая комплекты цинковых пальцев из вплоть до 6 отдельных цинковых пальцев.

В некоторых воплощениях связывающий домен ZFP можно сконструировать так, чтобы он связывался с выбранной последовательностью. Сконструированный связывающий домен цинк-пальцевого белка может обладать лучшей специфичностью связывания по сравнению с природным ZFP. В некоторых воплощениях последовательность нуклеиновой кислоты, кодирующей ZFP, соответствует SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36 или SEQ ID NO: 38. В некоторых воплощениях аминокислотная последовательность ZFP соответствует к SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37 или SEQ ID NO: 39. В некоторых воплощениях ZFP имеет аминокислотную последовательность, которая по меньшей мере на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности любой из SEQ ID NO: 33, 35, 37 или 39.

В некоторых аспектах изобретения предусмотрены векторы или плазмиды (например, экспрессирующие векторы или упаковочные векторы), содержащие конструкции из нуклеиновой кислоты, включающие ZFP, подходящий для экспрессии в клетках хозяина, например, в клетках млекопитающих, дрожжевых клетках, клетках насекомых, клетках растений, грибковых клетках или клетках водорослей. В некоторых воплощениях конструкция из нуклеиновой кислоты содержит последовательность полинуклеотида, кодирующего ZFP, который экспрессируется в виде слитого белка с модифицированной интегразой или модифицированной транспозазой по изобретению.

VII Слитые белки

Настоящим изобретением предусмотрены слитые белки для сайт-специфического встраивания экзогенных нуклеиновых кислот в геном. В некоторых воплощениях слитый белок включает первый ДНК-связывающий белок, спроектированный для связывания с определенной последовательностью геномной ДНК, второй ДНК-связывающий белок, который обеспечивает встраивание экзогенной нуклеиновой кислоты в геном, причем второй ДНК-связывающий белок представляет собой интегразу или транспозазу по изобретению, и линкер, соединяющий первый и второй белок. В некоторых воплощениях первым ДНК-связывающим белком является белок Cas9 или цинк-пальцевый белок. В некоторых воплощениях первым ДНК-связывающим белком является Cas9, а вторым связывающим белком является описанная здесь модифицированная транспозаза, причем первый и второй связывающий белок могут располагаться в конструкции в любом порядке. В некоторых воплощениях первым ДНК-связывающим белком является цинк-пальцевый белок, а вторым связывающим белком является модифицированная интеграза, причем первый и второй связывающий белок могут располагаться в конструкции в любом порядке.

В некоторых воплощениях слитый белок включает линкер между первым связывающим белком и вторым связывающим белком, причем линкер содержит мотив (GGS)_n, (GGGGS)_n (SEQ ID NO: 133), (G)_n, (EAAAK)_n (SEQ ID NO: 134) или же на основе XTEN или (XP)_n или любую комбинацию из них, где n независимо означает целое число от 1 до 50. В некоторых воплощениях линкер содержит от 12 до 24 аминокислот или же кодируется последовательностью нуклеиновой кислоты длиной от 36 до 72 нуклеотидов. В некоторых воплощениях линкер содержит последовательность XTEN либо последовательность GGS. В некоторых воплощениях слитый белок включает цинк-пальцевый белок, соединенный с модифицированной интегразой по изобретению, а линкер содержит последовательность GGS или последовательность XTEN, причем модифицированная интеграза может находиться с 5′- или 3′-стороны от линкера. В некоторых воплощениях слитый белок включает белок Cas9, соединенный с модифицированной транспозазой по изобретению, а линкер содержит последовательность GGS или же последовательность XTEN, причем модифицированная транспозаза может находиться с 5′- или 3′-стороны от линкера. В некоторых воплощениях линкером служит линкер, приведенный в таблице 1. В некоторых воплощениях линкер включает аминокислотную последовательность по SEQ ID NO: 49. В некоторых воплощениях линкер включает аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63 либо их комбинаций. В некоторых воплощениях линкер кодируется последовательностью нуклеиновой кислоты, включающей SEQ ID NO: 48. В некоторых воплощениях линкер кодируется последовательностью нуклеиновой кислоты, включающей последовательность, выбранную из группы, состоящей из SEQ ID NO: 48, SEQ ID. NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62 либо их комбинаций.

Таблица 1. Линкеры

Линкер Нуклеотидная последовательность
(SEQ ID NO) Аминокислотная последовательность
(SEQ ID NO) GGSx3 ggtggatctggcggtggatctggtggcggt
(SEQ ID NO: 48) GGSGGGSGGG (SEQ ID NO: 49) GGSx4 ggagggagtggtgggtccggtggtagtggcggatcc
(SEQ ID NO: 50) GGSGGSGGSGGS (SEQ ID NO: 51) GGSx5 ggaggctccggtgggtctggtgggagcggtggtagtggcggatcc (SEQ ID NO: 52) GGSGGSGGSGGSGGS (SEQ ID NO: 53) GGSx6 ggaggcagtggtgggagcggtggttccgggggtagtggtggttccgggggatcc (SEQ ID NO: 54) GGSGGSGGSGGSGGSGGS
(SEQ ID NO: 55) GGSx7 ggaggttctggaggctccggtgggtccgggggaagtggggggtcaggcggatcaggaggatcc (SEQ ID NO: 56) GGSGGSGGSGGSGGSGGSGGS
(SEQ ID NO: 57) GGSx8 ggaggtagcggaggttccggagggagcggcgggagtgggggaagcgggggaagtggaggatccgggggaggatcc
(SEQ ID NO: 58) GGSGGSGGSGGSGGSGGSGGS
(SEQ ID NO: 59) Линкер XTEN tccggtagcgaaacaccggggacttcagaatcggccaccccggagtct (SEQ ID NO: 60) SGSETPGTSESATPES (SEQ ID NO: 61) Линкер B ggaagcgccggtagtgcggctgggtctggcgagttc
(SEQ ID NO: 62) GSAGSAAGSGEF (SEQ ID NO: 63)

В некоторых воплощениях 3′-конец первого ДНК-связывающего белка соединяется с 5′-концом второго ДНК-связывающего белка при помощи линкера. В некоторых воплощениях 3′-конец второго ДНК-связывающего белка соединяется с 5′-концом первого ДНК-связывающего белка при помощи линкера. В некоторых воплощениях 3′-конец белка Cas9 соединяется с 5′-концом транспозазы при помощи линкера. В некоторых воплощениях 5′-конец белка Cas9 соединяется с 3′-концом транспозазы при помощи линкера. В некоторых воплощениях 3′-конец цинк-пальцевого белка соединяется с 5′-концом интегразы при помощи линкера. В некоторых воплощениях 5′-конец цинк-пальцевого белка соединяется с 3′-концом интегразы при помощи линкера.

При этом также предусмотрены слитые белки, полученные при экспрессии любых конструкций из нуклеиновой кислоты, предусмотренных в изобретении.

VIII Клетки/организмы хозяева

В некоторых воплощениях конструкции из нуклеиновой кислоты по изобретению экспрессируются в клетках-хозяевах. Подходящие клетки-хозяева включают, без ограничения, эукариотические и прокариотические клетки и/или линии клеток. Неограничительные примеры таких клеток-хозяев или клеточных линий, полученных из таких клеток, включают клетки COS, CHO (например, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (например, HEK293-F, HEK293-H, HEK293-T) и perC6, а также клетки насекомых типа Spodoptera fugiperda (Sf) или грибковые клетки типа Saccharomyces, Pichia и Schizosaccharomyces.

В некоторых воплощениях клетки-хозяева происходят из микроорганизма. Микроорганизмы, которые применимы для некоторых способов, описанных здесь, включают, к примеру, бактерии (например, E. coli), дрожжевые клетки (например, Saccharomyces cerevisiae) и растения. Клетки-хозяева могут быть прокариотическими или эукариотическими. В некоторых воплощениях клетки-хозяева являются эукариотическими. Подходящие эукариотические клетки-хозяева включают, без ограничения, дрожжевые клетки, клетки насекомых, клетки растений, грибковые клетки и клетки водорослей.

В некоторых воплощениях клетками-хозяевами являются компетентные клетки. В некоторых воплощениях клетки-хозяева являются компетентными от природы. В некоторых воплощениях клетки-хозяева делаются компетентными, например, под действием процесса, в котором используется хлорид кальция и тепловой шок. Можно использовать любые компетентные клетки, особенно эукариотические клетки, в частности клетки млекопитающих, например, человека или животных. Это могут быть соматические, эмбриональные или стволовые клетки либо дифференцированные клетки. В некоторых аспектах такие клетки включают клетки 293T, клетки фибробластов, гепатоциты, мышечные клетки (скелетные, сердечные, гладкие, кровеносных сосудов и т.д.), нервные клетки (нейроны, глиальные клетки, астроциты) или эпителиальные клетки, почечные, глазные и т.д. Они также могут включать клетки насекомых, растений, дрожжевые либо прокариотические клетки. Кроме того, можно выделить первичные клетки и использовать их ex vivo для повторного введения подлежащему лечению субъекту после обработки нуклеазой (например, ZFN или TALEN) или системой нуклеаз (например, CRISPR/Cas). Подходящие первичные клетки включают мононуклеарные клетки периферической крови (PBMC) и другие субпопуляции клеток крови, как-то, без ограничения, T-лимфоциты типа T-клеток CD4⁺ или T-клеток CD8⁺. Подходящие клетки также включают и стволовые клетки, такие, к примеру, как эмбриональные стволовые клетки, индуцированные плюрипотентные стволовые клетки, гемопоэтические стволовые клетки (CD34⁺), нейрональные стволовые клетки и мезенхимальные стволовые клетки.

В некоторых воплощениях клетки-хозяева трансфицируют плазмидами, содержащими описанные здесь конструкции из нуклеиновой кислоты. В некоторых воплощениях плазмиды, содержащие конструкции из нуклеиновой кислоты, являются упаковочными плазмидами. В некоторых воплощениях плазмиды, содержащие конструкции из нуклеиновой кислоты, дополнительно содержат полинуклеотиды, кодирующие капсидные белки, например, gag и pol. В некоторых воплощениях клетки-хозяева трансфицируют (i) плазмидой, содержащей конструкцию из нуклеиновой кислоты, в комбинации с (ii) плазмидой, содержащей полинуклеотид, кодирующий белки оболочки вируса (плазмидой для оболочки); и (iii) плазмидой, содержащей последовательность экзогенной нуклеиновой кислоты (например, GOI), при этом вырабатываются вирусные частицы, содержащие экзогенную нуклеиновую кислоту, например, GOI, и слитый белок, включающий и первый, и второй связывающий белок.

В некоторых воплощениях клетки-хозяева трансфицируют (i) плазмидой, содержащей конструкцию из нуклеиновой кислоты, в комбинации с (ii) плазмидой, содержащей конструкцию из нуклеиновой кислоты, которая содержит полинуклеотид, кодирующий капсидные белки, например, gag и pol (это упаковочная плазмида, лишенная функциональной интегразы); (iii) плазмидой, содержащей полинуклеотид, кодирующий белки оболочки вируса (плазмида для оболочки); и (iv) плазмидой, содержащей последовательность экзогенной нуклеиновой кислоты (например, GOI), при этом вырабатываются вирусные частицы, содержащие экзогенную нуклеиновую кислоту, например, GOI, и слитый белок, включающий и первый, и второй связывающий белок.

В других воплощениях можно использовать вектор, например, лентивирусный вектор по изобретению, для доставки слитого белка, кодируемого конструкцией из нуклеиновой кислоты по изобретению, и экзогенной нуклеиновой кислоты в организм, например, млекопитающего, более предпочтительно в представляющие интерес целевые клетки млекопитающего. Лентивирусные векторы, содержащие слитые белки по изобретению, способны трансдуцировать различные типы клеток, как-то, к примеру, клетки печени (например, гепатоциты), мышечные клетки, клетки мозга, клетки почек, клетки сетчатки и гемопоэтические клетки. В некоторых воплощениях целевыми клетками настоящего изобретения являются “неделящиеся” клетки. Такие клетки включают клетки типа нервных клеток, которые обычно не делятся. Однако предполагается, что настоящее изобретение не ограничивается неделящимися клетками (включая, без ограничения, мышечные клетки, лейкоциты, клетки селезенки, клетки печени, глазные клетки, эпителиальные клетки и т.п.).

В некоторых воплощениях в организм вводятся упакованные слитые белки по изобретению, например, для редактирования генов в ДНК данного организма. В некоторых воплощениях таким организмом является человек. В некоторых воплощениях такими организмами являются другие млекопитающие. В некоторых воплощениях такими организмами являются другие приматы. В некоторых воплощениях такими организмами являются грызуны. В некоторых воплощениях такими организмами являются овцы, козы, крупный рогатый скот, кошки или собаки. В некоторых воплощениях такими организмами являются позвоночные, амфибии, рептилии, рыбы, насекомые, мухи или нематоды. В некоторых воплощениях такими организмами являются исследовательские животные. В некоторых воплощениях такие организмы являются генно-инженерными, например, это генно-инженерные субъекты, кроме человека. Такие организмы могут быть любого пола и на любой стадии развития.

IX Способ встраивания в геном

Были описаны методы встраивания экзогенных нуклеиновых кислот в геном. Например, см. Yusa et al., PNAS 4(108):1531-1536 (2011); Feng et al., Nuc. Acids Res. 4(38): 1204-1216 (2009); Kettlun et al., Amer. Soc. Gene and Cell Ther. 9(19):1636-1644 (2011); Skipper et al., 20(92):1-23 (2013); Li et al., PNAS 25: E2279-E2287 (2013); Mátés et al., Nature Genetics 41(6):753-761 (2009); Mali et al., Nat. Methods 10(10):957-963; Vargas et al., J. Trans. Med. 14(288):1-15 (2016); Gersbach et al., Acc. Chem. Res. 47:2309-2318 (2014); Chandrasegaran et al., Cell Gene Ther. Ins. 3(1):33-41 (2017); Wilson et al., 649:353-363 (2010); Zhao Zhang et al., Mol Ther Nucleic Acids 9: 230-241 (2017); Naldini L., EMBO Mol Med. 11(3) (2019); и Naldini L. et al., Hum Gene Ther. 27(10):727-728 (2016); которые все включены сюда путем ссылки.

Настоящим изобретением предусмотрены конструкции из нуклеиновой кислоты, кодирующие слитые белки для встраивания экзогенной нуклеиновой кислоты в определенное место генома. Настоящим изобретением также предусмотрены слитые белки для встраивания экзогенной нуклеиновой кислоты в определенное место генома. В некоторых воплощениях экзогенная нуклеиновая кислота для вставки может иметь длину до 5 т.п.н., до 10 т.п.н., до 15 т.п.н., 20 т.п.н., до 25 т.п.н., до 30 т.п.н., до 35 т.п.н. или до 40 т.п.н.

В другом воплощении предусмотрены способы сайт-специфического встраивания нуклеиновой кислоты в геном. В некоторых воплощениях способы включают контактирование целевой ДНК с каким-либо слитым белком, содержащим Cas9 и транспозазу, описанные здесь. Например, в некоторых воплощениях способ включает контактирование ДНК со слитым белком, содержащим два связанных полипептида: (i) Cas9; и (ii) транспозазу, причем активный Cas9 связывается с направляющей РНК, которая гибридизируется с участком ДНК, например, геномной ДНК.

В некоторых воплощениях способы включают контактирование целевой ДНК с каким-либо слитым белком, содержащим Cas9 и интегразу, описанные здесь. Например, в некоторых воплощениях способ включает контактирование ДНК со слитым белком, содержащим два связанных полипептида: (i) Cas9; и (ii) интегразу, причем активный Cas9 связывается с направляющей РНК, которая гибридизуется с участком ДНК, например, геномной ДНК.

В некоторых воплощениях способы включают контактирование целевой ДНК с каким-либо слитым белком, содержащим ZFP и интегразу, описанные здесь. Например, в некоторых воплощениях способ включает контактирование ДНК со слитым белком, содержащим два связанных полипептида: (i) ZFP; и (ii) интегразу, причем активный ZFP связывается с направляющей РНК, которая гибридизуется с участком ДНК, например, геномной ДНК.

В некоторых воплощениях слитый белок вводится в организм и/или клетки, содержащие целевую ДНК, например, геномную ДНК, с помощью вирусного вектора, например, лентивирусных частиц.

X Лентивирусная упаковка

Были описаны методы упаковки лентивирусов. См. Grandchamp et al., 9(6): 1-13 (2014); Voelkel et al., 107(17): 7805-7810 (2010); Tan et al., 80(4): 1939-1948; Li et al., 9(8):1-9 (2014); Mátés et al., Nature Genetics 41(6): 753-761 (2009); и Robert H Kutner et al., Nature Protocols 4(4): 495 (2009), которые все включены сюда путем ссылки.

Как правило, в лентивирусных системах доставки используется раздельная система с различными генами лентивируса на отдельных плазмидах, которая применяется для получения полного вируса, не содержащего генетических компонентов, необходимых для того, чтобы вызывать вирусные заболевания. Например, одна плазмида (плазмида для оболочки) может кодировать белки оболочки вируса (env); другая плазмида (упаковочная плазмида) может кодировать капсидные белки (например, gag и pol) и ферменты типа обратной транскриптазы и/или интегразы; а еще одна плазмида содержит представляющий интерес ген (GOI), фланкированный длинными концевыми повторами (для встраивания в геном), и последовательность psi (которая служит сигналом для упаковки гена в вирус) (плазмида для переноса). Если эти плазмиды ввести одновременно в клетку, то будут вырабатываться вирусы, содержащие GOI без вирусных генов, необходимых для того, чтобы вызывать заболевания.

В некоторых аспектах изобретения лентивирусные векторы (или частицы) по изобретению получают при помощи раздельной системы, например, системы транскомплементации (системы вектор/упаковка), путем трансфекции in vitro пермиссивных клеток (типа клеток 293T) плазмидой, содержащей определенные компоненты генома лентивирусного вектора, и еще по меньшей мере одной плазмидой, обеспечивающей in trans последовательности gag, pol и env, кодирующие полипептиды GAG, POL и белки оболочки или же часть этих полипептидов, достаточную для образования ретровирусных частиц.

Для примера, клетки хозяина трансфицируют a) упаковочной плазмидой, содержащей последовательность gag и pol лентивируса, b) второй плазмидой (плазмидой для оболочки или плазмидой для псевдотипирования env), содержащей ген, кодирующий белки оболочки (типа VSV-G), c) плазмидным вектором, содержащим последовательности 5′- и 3′-LTR, последовательность инкапсидации psi и трансген, и d) плазмидным вектором, содержащим конструкцию из нуклеиновой кислоты, кодирующую сконструированный слитый белок, описанный здесь. В некоторых воплощениях конструкция из нуклеиновой кислоты, кодирующая описанный здесь сконструированный слитый белок, находится на упаковочной плазмиде вместо отдельной плазмиды. Нуклеиновые кислоты, кодирующие кДНК gag, pol и env, можно легко получить стандартными методами из последовательностей вирусных генов, доступных на предшествующем уровне техники и в базах данных.

В некоторых воплощениях лентивирусный вектор содержит конструкцию из нуклеиновой кислоты, как описано здесь. В некоторых воплощениях лентивирусный вектор содержит слитый белок, как описано здесь.

В плазмидах используются промоторы, которые могут быть одинаковыми или разными. В некоторых воплощениях, в системе транскомплементации плазмид, плазмида для оболочки и плазмидный вектор, соответственно, для стимулирования экспрессии gag и pol или белков оболочки, мРНК из генома вектора и трансген содержат промоторы, которые могут быть одинаковыми или разными. Такие промоторы обычно выбирают из универсальных промоторов или специфичных, к примеру, из вирусных промоторов CMV, TK, LTR RSV и промоторов РНК-полимеразы III типа U6 или H1 или промоторов хелперных вирусов, кодирующих env, gag и pol (т.е. аденовирусных, бакуловирусных, герпесвирусных).

Для получения лентивирусных векторов по изобретению описанные здесь плазмиды можно ввести в клетки хозяина, продуцирующие вирусы, а затем собрать их. Подходящие клетки включают, без ограничения, эукариотические и прокариотические клетки и/или линии клеток. Неограничительные примеры таких клеток или клеточных линий, полученных из таких клеток, включают, например, клетки COS, CHO (например, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (например, HEK293-F, HEK293-H, HEK293-T) и perC6, а также клетки насекомых типа Spodoptera fugiperda (Sf) или грибковые клетки типа Saccharomyces, Pichia и Schizosaccharomyces.

После трансфекции клеток хозяина плазмидами и получения лентивирусных векторов (или частиц) по изобретению можно очистить лентивирусные векторы (или частицы) по изобретению из супернатанта клеток. Очистка лентивирусных векторов для повышения их концентрации может осуществляться любым подходящим способом, как-то очисткой в градиенте плотности (например, хлорида цезия (CsCl)), методами хроматографии (например, колоночной или порционной хроматографии) или ультрацентрифугирования. Например, вектор по изобретению можно подвергнуть двум или трем стадиям очистки в градиенте плотности CsCl. Вектор предпочтительно очищают из трансфицированных клеток таким способом, который включает лизирование клеток, нанесение лизата на хроматографическую смолу, элюирование вируса из хроматографической смолы и сбор фракций, содержащих лентивирусный вектор по изобретению.

XI Способы доставки

Были описаны способы доставки лентивирусных векторов. Например, см. Vargas et al., J. Trans. Med. 14(288):1-15 (2016); Mali et al., Nat. Methods 10(10): 957-963; Mátés et al., Nature Genetics 41(6):753-761 (2009); Skipper et al., 20(92):1-23 (2013).

Лентивирусные векторы, содержащие слитые белки, кодируемые конструкциями из нуклеиновой кислоты по изобретению, можно вводить субъектам любым способом. В некоторых воплощениях лентивирусный вектор по изобретению вводится в клетки субъекта in vivo либо ex vivo.

В некоторых воплощениях лентивирусные векторы, содержащие слитые белки, кодируемые конструкциями из нуклеиновой кислоты по изобретению, применяются для доставки GOI и/или для воздействия на генетические дефекты ДНК у субъектов. В некоторых воплощениях лентивирусные векторы вводятся субъектам парентерально, предпочтительно интраваскулярно (в том числе внутривенно). При парентеральном введении векторы предпочтительно вводятся в фармацевтическом носителе, подходящем для инъекций, типа стерильного водного раствора или дисперсии.

В некоторых воплощениях лентивирусные векторы по изобретению применяются ex vivo.

В некоторых воплощениях лентивирусные векторы, содержащие слитые белки, кодируемые конструкциями из нуклеиновой кислоты по изобретению, применяются для доставки GOI и/или для воздействия на генетические дефекты ДНК у субъектов. В некоторых воплощениях у субъекта извлекают клетки и в них ex vivo вводят лентивирусный вектор, содержащий слитый белок, кодируемый конструкцией из нуклеиновой кислоты по изобретению, чтобы модифицировать ДНК этих клеток. Затем клетки, несущие модифицированную ДНК, размножают и вливают обратно субъекту. В некоторых воплощениях лентивирусные векторы, содержащие слитые белки, кодируемые конструкциями из нуклеиновой кислоты по изобретению, применяются для терапии T-клетками с химерным антигеновым рецептором (CAR), чтобы генетически модифицировать аутологичные T-клетки пациента для экспрессии CAR, специфичного к опухолевому антигену. В другом воплощении T-клетки с модифицированных CAR размножают ex vivo и вливают обратно пациенту. В некоторых воплощениях измененные T-клетки более специфически воздействуют на раковые клетки. В отличие от терапии антителами, T-клетки с CAR способны реплицироваться in vivo, что ведет к долгосрочной персистенции.

После введения лентивирусного вектора по изобретению или клеток, модифицированных ex vivo с помощью лентивирусного вектора по изобретению, за субъектом наблюдают для выявления экспрессии трансгена. Дозы и продолжительность лечения определяются индивидуально в зависимости от подлежащего лечению состояния или заболевания. Можно лечить различные состояния или заболевания, исходя из экспрессии гена, полученной при введения представляющего интерес гена в векторах по настоящему изобретению. Дозировка вектора при введении способом по изобретению будет варьироваться в зависимости от требуемой реакции организма и используемого вектора.

В некоторых применениях генной терапии желательно, чтобы вектор для генной терапии доставлялся с высокой степенью специфичности в определенный тип ткани. Соответственно, вирусный вектор можно модифицировать так, чтобы он обладал специфичностью к данному типу клеток, путем экспрессии лиганда в виде слитого белка с белком вирусной оболочки на внешней поверхности вируса. Лиганд выбирают так, чтобы он обладал сродством к рецептору, который присутствует в представляющем интерес типе клеток.

В некоторых аспектах изобретения предусмотрен способ встраивания последовательности экзогенной нуклеиновой кислоты в геномную ДНК организма, включающий: идентификацию определенной последовательности геномной ДНК в геноме организма; введение в организм лентивирусных частиц, содержащих конструкцию из нуклеиновой кислоты по изобретению, для связывания с определенной последовательностью геномной ДНК и встраивания экзогенной нуклеиновой кислоты в геномную ДНК; при этом экзогенная нуклеиновая кислота встраивается в данную последовательность геномной ДНК.

В некоторых аспектах изобретения предусмотрен способ контролируемого сайт-специфичного встраивания одной или нескольких копий последовательности экзогенной нуклеиновой кислоты в геном клеток, который включает: a) введение в клетки конструкции из нуклеиновой кислоты, вектора или слитого белка по изобретению и b) введение в клетки экзогенной нуклеиновой кислоты; при этом связывание слитого белка с определенной последовательностью геномной ДНК в геноме клеток приводит к расщеплению генома и встраиванию одной или нескольких копий экзогенной нуклеиновой кислоты в геном этих клеток. В некоторых аспектах введение в клетки осуществляется при помощи лентивирусных частиц.

XII Способы применения

Для проверки места встраивания и для отбора наилучших механизмов для направленного встраивания можно использовать несколько стратегий.

Для анализа описанной здесь модифицированной интегразы и транспозазы можно использовать репортерную линию клеток с промотором, половиной кодирующей последовательности GFP и донором сайта сплайсинга позади от сайта направленного встраивания в геном. Например, полезный груз лентивируса может содержать слитый вариант интегразы, за которым следует инвертированный сайт акцептора сплайсинга и другая половина GPF. Экспрессия GFP будет происходить тогда, когда непосредственно случится встраивание и при сплайсинге GFP-содержащей мРНК, образующейся из сайта вставки и встроенного полезного груза, образуется полная CDS GFP.

Для скрининга и сравнения мутантов по встраиванию также можно использовать системы транскомплементации VPR. Система транскомлементации может использоваться для направленного встраивания полезного груза лентивируса, содержащего слитый вариант интегразы, который при экспрессии и загрузке в частицы способствует встраиванию себя самого, будет загружена в вирусные частицы при слиянии с VPR. При этом будет восстанавливаться in trans встраивание дефектной IN, кодируемой в упаковочном векторе, используемом для получения частиц. Другие методы, которые можно использовать для картирования встраивания, включают зонды IC или FISH. Направленное встраивание также можно проверять по направленному разрушению TCRα или RFP либо активации GFP при направленном встраивании сайта сплайсинга.

При подходе FISH к совместному окрашиванию участка вставки и мишени в хроматине проводится флуоресцентная гибридизация in situ для локализации транспозона с GOI в геноме HEK293T. HEK293T можно трансфицировать 1) транспозоном GOI, 2) программируемой транспозазой и 3) направляющей РНК для PPP1R12. Разрабатывают зонды для посадки на ген PPP1R12, ген CD46 (в качестве отрицательного контроля) и GOI, которые можно синтезировать с помощью смеси Nick Translation Mix (Sigma) из ДНК, амплифицированной методом ПЦР.

В некоторых воплощениях слитый белок, содержащий модифицированную транспозазу или модифицированную интегразу, как описано здесь, улучшает специфичность встраивания экзогенной нуклеиновой кислоты в геном по сравнению со слитым белком, содержащим соответствующий белок дикого типа, например, при определении методом Genetrap. В некоторых воплощениях клетки HEK293T или любые другие пермиссивные клетки трансфицируют или трансдуцируют лентивирусными частицами со следующими плазмидами или полезными нагрузками: (i) плазмидой, содержащей направленную РНК, нацеленную на определенный участок ДНК, (ii) плазмидой, содержащей конструкцию из нуклеиновой кислоты по изобретению, кодирующую слитый белок модифицированной транспозазы или слитый белок модифицированной интегразы, и (iii) плазмидой Genetrap, содержащей последовательность нуклеиновой кислоты, кодирующей репортерный белок, например, GFP, лишенной промотора. В некоторых воплощениях плазмида Genetrap дополнительно содержит транспозон с инвертированными повторами.

В некоторых воплощениях можно определить процент клеток, содержащих вставку GFP, методом проточной цитометрии. В некоторых воплощениях слитый белок программируемой транспозазы повышает процент клеток, содержащих вставку GFP, по меньшей мере на 5%, на 10%, на 15%, на 20%, на 25% или на 30% по сравнению с соответствующим белком дикого типа. В некоторых воплощениях слитый белок программируемой транспозазы повышает процент клеток, содержащих вставку GFP, на 15-30%.

В некоторых воплощениях можно определить процент вставок в целевом сайте и степень охвата в целевом сайте (количество прочтений на 1 сайт вставки) путем экстракции геномной ДНК и направленного секвенирования с олигонуклеотидами, специфичными для вирусных LTR. В некоторых воплощениях слитый белок модифицированной транспозазы повышает процент вставок в целевом сайте по меньшей мере в 10 раз, в 20 раз, в 30 раз, в 40 раз, в 50 раз, в 60 раз, в 70 раз, в 80 раз, в 90 раз или в 100 раз по сравнению с соответствующим белком дикого типа. В некоторых воплощениях процент вставок в целевом сайте повышается в 10-100 раз. В некоторых воплощениях слитый белок модифицированной транспозазы повышает степень охвата в целевом сайте (количество прочтений на 1 сайт вставки) по меньшей мере в 10 раз, в 20 раз, в 30 раз, в 40 раз, в 50 раз, в 60 раз, в 70 раз, в 80 раз, в 90 раз, в 100 раз, в 110 раз, в 120 раз, в 130 раз, в 140 раз, в 150 раз, в 160 раз, в 170 раз, в 180 раз, в 190 раз или в 200 раз по сравнению с соответствующим белком дикого типа. В некоторых воплощениях степень охвата в целевом сайте (количество прочтений на 1 сайт вставки) повышается по меньшей мере в 100 раз.

В некоторых воплощениях слитый белок модифицированной интегразы улучшает специфичность встраивания экзогенной нуклеиновой кислоты в геном по сравнению с соответствующим белком дикого типа при определении по встраиванию GFP. В некоторых воплощениях получают лентивирус, содержащий слитый белок модифицированной интегразы, путем трансфекции клеток HEK293T или любых других пермиссивных клеток (i) плазмидой, содержащей последовательность нуклеиновой кислоты, кодирующей GFP, (ii) плазмидой, содержащей упаковочные белки, (iii) плазмидой, содержащей белок оболочки, и (iv) плазмидой, содержащей конструкцию из нуклеиновой кислоты, кодирующую слитый белок модифицированной интегразы. Супернатант, содержащий лентивирус, собирали через 48 ч после трансфекции.

Для направленного встраивания клетки HEK293T трансфицировали лентивирусом, содержащим слитый белок модифицированной интегразы. В некоторых воплощениях определяли процент GFP-положительных клеток методом проточной цитометрии через 3, 5, 7, 10 и 12 дней после трансфекции. В некоторых воплощениях слитый белок модифицированной интегразы повышает процент клеток, содержащих вставку GFP, по меньшей мере на 5%, на 10%, на 15%, на 20%, на 25% или на 30%. по сравнению с соответствующим белком дикого типа.

В некоторых воплощениях можно определить процент вставок в целевом сайте и степень охвата в целевом сайте (количество прочтений на 1 сайт вставки) путем экстракции геномной ДНК и направленного секвенирования с олигонуклеотидами, специфичными для вставленных вирусных LTR. В некоторых воплощениях слитый белок модифицированной интегразы повышает процент вставок в целевом сайте по меньшей мере в 10 раз, в 20 раз, в 30 раз, в 40 раз, в 50 раз, в 60 раз, в 70 раз, в 80 раз, в 90 раз или в 100 раз по сравнению с соответствующим белком дикого типа. В некоторых воплощениях слитый белок модифицированной интегразы повышает степень охвата в целевом сайте (количество прочтений на 1 сайт вставки) по меньшей мере в 10 раз, в 20 раз, в 30 раз, в 40 раз, в 50 раз, в 60 раз, в 70 раз, в 80 раз, в 90 раз, в 100 раз, в 110 раз, в 120 раз, в 130 раз, в 140 раз, в 150 раз, в 160 раз, в 170 раз, в 180 раз, в 190 раз или в 200 раз по сравнению с соответствующим белком дикого типа.

Возможные применения лентивирусных векторов, содержащих слитые белки по изобретению, включают генную терапию, то есть перенос генов в любые клетки млекопитающих, в частности, в клетки человека. Это могут быть делящиеся клетки или покоящиеся клетки, клетки, принадлежащие центральным органам или периферическим органам, таким как печень, поджелудочная железа, мышцы, сердце и т.п. Генная терапия может обеспечить экспрессию белков, например, нейротрофических факторов, ферментов, факторов транскрипции, рецепторов и т.п. Лентивирусные векторы по изобретению также могут особенно подходить для исследовательских целей.

В некоторых воплощениях конструкции из нуклеиновой кислоты, слитые белки и/или лентивирусные векторы по изобретению вводятся субъектам для лечения заболеваний. В некоторых воплощениях заболевания представляют собой генетические заболевания, при которых может принести пользу генная терапия.

В некоторых воплощениях лентивирусные векторы, содержащие слитые белки по изобретению, могут применяться в качестве лекарственных средств. Лентивирусные векторы по изобретению могут особенно подходить для лечения генетических заболеваний у субъектов.

XIII Композиции и наборы

Настоящим изобретением также предусмотрены композиции для осуществления описанных здесь способов на практике. В некоторых воплощениях композиции содержат конструкцию из нуклеиновой кислоты или вектор, как определено в изобретении, и последовательность полинуклеотида, кодирующего экзогенную нуклеиновую кислоту для вставки в геном, которая содержится в упаковочном векторе или связана с ним.

В некоторых воплощениях конструкция из нуклеиновой кислоты находится в виде РНК, ДНК или белка, а последовательность полинуклеотида, кодирующего экзогенную нуклеиновую кислоту, находится в виде РНК или ДНК, в зависимости от способа доставки. Предпочтительно последовательность полинуклеотида, кодирующего экзогенную нуклеиновую кислоту, находится в виде РНК.

В некоторых воплощениях композиции не содержат вирусов, а упаковочный вектор представляет собой наночастицы, например, полимерные или липидные наночастицы. Упаковочным вектором также может быть носитель, связанный с элементами композиции. В некоторых воплощениях композиции содержатся в вирусных векторах, предпочтительно в лентивирусных частицах.

В некоторых воплощениях композиция включает (a) конструкцию из нуклеиновой кислоты, описанную здесь (например, содержащую Cas9 и транспозазу), в виде РНК, (b) направляющую РНК, если она нужна (например, в виде отдельной линейной одноцепочечной молекулы РНК), и (c) полинуклеотид, содержащий экзогенный ген для вставки в виде ДНК (например, в векторе), который содержится в упаковочном векторе или связан с ним.

В некоторых воплощениях композиция включает (a) слитый белок, описанный здесь (например, содержащий Cas9 и транспозазу), в виде белка, (b) направляющую РНК, если она нужна (например, в виде отдельной линейной одноцепочечной молекулы РНК), причем слитый белок и направляющая РНК образуют рибонуклеиново-белковый комплекс (RNP), и (c) полинуклеотид, содержащий экзогенный ген для вставки в виде ДНК (например, в векторе), который содержится в упаковочном векторе или связан с ним.

В некоторых воплощениях композиция включает (a) конструкцию из нуклеиновой кислоты, описанную здесь (например, содержащую Cas9 и транспозазу), в виде ДНК, (b) направляющую РНК, если она нужна (например, в виде отдельной линейной молекулы РНК или в виде ДНК в векторе), и (c) полинуклеотид, содержащий экзогенный ген для вставки в виде ДНК (например, в векторе), который содержится в упаковочном векторе или связан с ним.

В некоторых воплощениях композиция включает (a) слитый белок, описанный здесь (например, содержащий Cas9 и интегразу), в виде белка, (b) направляющую РНК, если она нужна (например, в виде отдельной молекулы РНК, образующей комплекс со слитым белком), и (c) полинуклеотид, содержащий экзогенный ген для вставки, который содержится в упаковочном векторе или связан с ним. В предпочтительном воплощении упаковочный вектор представляет собой лентивирусные частицы. В некоторых воплощениях слитый белок (a) связан с капсидом лентивируса при помощи gag-pol или VPR (вирусного белка R). В некоторых воплощениях полинуклеотид (c) находится в виде РНК в качестве полезного груза интегразы.

В предпочтительном воплощении при использовании ZFP гидовая РНК (b) может не понадобиться.

Настоящим изобретением также предусмотрены наборы для осуществления описанных здесь способов на практике. Наборы могут содержать конструкции из нуклеиновых кислот или слитые белки, как описано здесь. В некоторых аспектах наборы могут содержать лентивирусные частицы, содержащие конструкции из нуклеиновой кислоты или слитые белки, как описано здесь.

Данные наборы также могут содержать инструкции по применению компонентов набора для осуществления данных способов на практике. Инструкции по осуществлению данных способов на практике обычно записываются на подходящий носитель для записи. Например, инструкции могут быть напечатаны на подложке типа бумаги или пластика и т.п. При этом инструкции могут находиться в наборе в виде упаковочного вкладыша, на этикетке контейнера из набора или его компонентов (т.е. связанными с упаковкой или субупаковкой) и т.п. В других воплощениях инструкции находятся в виде файла данных для электронного хранения на подходящем для компьютера носителе данных, например, CD-ROM, дискеты и т.п. Еще в других воплощениях фактически инструкций нет в наборе, но предусмотрены средства для получения инструкций из удаленного источника, например, через Интернет. Примером этого воплощения является набор, содержащий веб-адрес, по которому инструкции можно просмотреть и/или с которого их можно загрузить. Как и сами инструкции, это средство получения инструкций записано на подходящей подложке.

XIV Воплощения

E1. Конструкция из нуклеиновой кислоты, включающая:

a) последовательность первого полинуклеотида, кодирующего первый ДНК-связывающий белок, сконструированный для связывания с определенной последовательностью геномной ДНК в геноме;

b) последовательность второго полинуклеотида, кодирующего второй ДНК-связывающий белок, который обеспечивает встраивание экзогенной нуклеиновой кислоты в геном, причем второй ДНК-связывающий белок представляет собой (i) интегразу, модифицированную относительно интегразы дикого типа, или (ii) транспозазу, модифицированную относительно транспозазы дикого типа; и

c) последовательность третьего полинуклеотида, включающего нуклеиновую кислоту, кодирующую линкер;

причем конструкция из нуклеиновой кислоты кодирует слитый белок, включающий первый ДНК-связывающий белок, второй ДНК-связывающий белок и линкер между первым ДНК-связывающим белком и вторым ДНК-связывающим белком.

E2. Конструкция из нуклеиновой кислоты по воплощению E1, при этом второй ДНК-связывающий белок модифицирован для повышения специфичности встраивания экзогенной нуклеиновой кислоты в геном по сравнению с соответствующим белком дикого типа.

E3. Конструкция из нуклеиновой кислоты по воплощению E1 или E2, при этом экзогенная нуклеиновая кислота для вставки может иметь длину до 20 т.п.н.

E4. Конструкция из нуклеиновой кислоты по любому из воплощений E1-E3, при этом последовательность первого полинуклеотида кодирует белок, выбранный из группы, состоящей из цинк-пальцевых белков, белка Cas9 и их вариантов или функциональных фрагментов.

E5. Конструкция из нуклеиновой кислоты по воплощению E4, при этом белок Cas9 выбран из группы, состоящей из Cas9 человека, никазы Cas9, Cas9 Streptococcus pyogenes, Cas9 Staphylococcus aureus, Cas12a, Cas12b и «мертвого» Cas9.

E6. Конструкция из нуклеиновой кислоты по воплощению E4, при этом цинк-пальцевый белок представляет собой цинк-пальцевый белок типа C₂H₂.

E7. Конструкция из нуклеиновой кислоты по любому из воплощений E1-E6, при этом модифицированная интеграза представляет собой модифицированную интегразу вируса иммунодефицита человека (ВИЧ) или её функциональный фрагмент.

E8. Конструкция из нуклеиновой кислоты по воплощению E7, при этом модифицированная интеграза ВИЧ содержит мутации по одной или нескольким из числа аминокислот 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266 или 273 в соответствии с нумерацией аминокислот в последовательности интегразы ВИЧ дикого типа (SEQ ID NO: 1).

E9. Конструкция из нуклеиновой кислоты по воплощению E8, при этом мутации модифицированной интегразы ВИЧ включают одну или несколько из мутаций D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R или K273R в соответствии с нумерацией аминокислот в последовательности интегразы ВИЧ дикого типа (SEQ ID NO: 1).

E10. Конструкция из нуклеиновой кислоты по любому из воплощений E7-E9, при этом модифицированная интеграза ВИЧ имеет аминокислотную последовательность, которая по меньшей мере на 85%, на 90% или на 95% идентична последовательности, приведенной в SEQ ID NO: 3.

E11. Конструкция из нуклеиновой кислоты по любому из воплощений E1-E6, при этом модифицированная транспозаза выбрана из группы, состоящей из модифицированной Frog Prince, модифицированной Sleeping Beauty, модифицированной гиперактивной Sleeping Beauty (SB100X), модифицированной PiggyBac, модифицированной гиперактивной PiggyBac и их функциональных фрагментов.

E12. Конструкция из нуклеиновой кислоты по воплощению E11, при этом модифицированная транспозаза представляет собой модифицированную гиперактивную PiggyBac или её функциональный фрагмент.

E13. Конструкция из нуклеиновой кислоты по воплощению E12, при этом модифицированная гиперактивная PiggyBac содержит мутации по одной или нескольким из числа аминокислот 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592 и 594 в соответствии с нумерацией аминокислот в последовательности гиперактивной PiggyBac (SEQ ID NO: 9).

E14. Конструкция из нуклеиновой кислоты по воплощению E13, при этом мутации модифицированной гиперактивной PiggyBac включают одну или несколько из мутаций R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G или F594L в соответствии с нумерацией аминокислот в последовательности гиперактивной PiggyBac (SEQ ID NO: 9).

E15. Конструкция из нуклеиновой кислоты по любому из воплощений E12-E14, при этом модифицированная гиперактивная PiggyBac имеет аминокислотную последовательность, которая по меньшей мере на 85%, на 90% или на 95% идентична последовательности, приведенной в SEQ ID NO: 10.

E16. Конструкция из нуклеиновой кислоты по любому из воплощений E1-E15, при этом линкер включает последовательность XTEN или последовательность GGS.

E17. Конструкция из нуклеиновой кислоты по любому из воплощений E1-E16, при этом последовательность, кодирующая линкер, имеет длину от 9 до 150 нуклеотидов.

E18. Конструкция из нуклеиновой кислоты по любому из воплощений E1-E17, при этом 3′-конец последовательности первого полинуклеотида соединяется с 5′-концом второго полинуклеотида линкером из нуклеиновой кислоты.

E19. Конструкция из нуклеиновой кислоты по любому из воплощений E1-E17, при этом 3′-конец последовательности второго полинуклеотида соединяется с 5′-концом последовательности первого полинуклеотида линкером из нуклеиновой кислоты.

E20. Вектор, содержащий конструкцию из нуклеиновой кислоты по любому из воплощений E1-E19, при этом экспрессирующий вектор подходит для экспрессии в клетках млекопитающих, дрожжевых клетках, клетках насекомых, клетках растений, грибковых клетках или клетках водорослей.

E21. Конструкция из нуклеиновой кислоты по воплощению E1, при этом:

a) последовательность первого полинуклеотида кодирует белок Cas9; а

b) последовательность второго полинуклеотида кодирует модифицированную транспозазу, а именно модифицированную гиперактивную PiggyBac или её функциональный фрагмент.

E22. Конструкция из нуклеиновой кислоты по воплощению E21, при этом белок Cas9 выбран из группы, состоящей из Cas9 человека, никазы Cas9, Cas9 Streptococcus pyogenes, Cas9 Staphylococcus aureus, Cas12a, Cas12b и «мертвого» Cas9.

E23. Конструкция из нуклеиновой кислоты по воплощению E21 или E22, при этом модифицированная гиперактивная PiggyBac содержит мутации по одной или нескольким из числа аминокислот 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592 и 594 в соответствии с нумерацией аминокислот в последовательности гиперактивной PiggyBac (SEQ ID NO: 9).

E24. Конструкция из нуклеиновой кислоты по воплощению E23, при этом мутации модифицированной гиперактивной PiggyBac включают одну или несколько из мутаций R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G или F594L в соответствии с нумерацией аминокислот в последовательности гиперактивной PiggyBac (SEQ ID NO: 9).

E25. Конструкция из нуклеиновой кислоты по воплощению E21 или E22, при этом модифицированная гиперактивная PiggyBac имеет аминокислотную последовательность, которая по меньшей мере на 85%, на 90% или на 95% идентична последовательности, приведенной в SEQ ID NO: 10.

E26. Конструкция из нуклеиновой кислоты по любому из воплощений E21-E25, при этом линкер включает последовательность XTEN или последовательность GGS.

E27. Конструкция из нуклеиновой кислоты по любому из воплощений E21-E26, при этом последовательность, кодирующая линкер, имеет длину от 9 до 150 нуклеотидов.

E28. Конструкция из нуклеиновой кислоты по любому из воплощений E22-E27, при этом 3′-конец последовательности второго полинуклеотида соединяется с 5′-концом последовательности первого полинуклеотида при помощи линкера.

E29. Конструкция из нуклеиновой кислоты по воплощению E1, при этом:

a) последовательность первого полинуклеотида кодирует цинк-пальцевый белок; а

b) последовательность второго полинуклеотида кодирует модифицированную интегразу или её функциональный фрагмент.

E30. Конструкция из нуклеиновой кислоты по воплощению E29, при этом цинк-пальцевый белок представляет собой цинк-пальцевый белок типа C₂H₂.

E31. Конструкция из нуклеиновой кислоты по воплощению E29 или E30, при этом модифицированная интеграза представляет собой модифицированную интегразу вируса иммунодефицита человека (ВИЧ) или её функциональный фрагмент.

E32. Конструкция из нуклеиновой кислоты по воплощению E31, при этом модифицированная интеграза ВИЧ содержит мутации по одной или нескольким из числа аминокислот 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266 или 273 в соответствии с нумерацией аминокислот в последовательности интегразы ВИЧ дикого типа (SEQ ID NO: 1).

E33. Конструкция из нуклеиновой кислоты по воплощению E32, при этом мутации модифицированной интегразы ВИЧ включают одну или несколько из мутаций D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R или K273R в соответствии с нумерацией аминокислот в последовательности интегразы ВИЧ дикого типа (SEQ ID NO: 1).

E34. Конструкция из нуклеиновой кислоты по любому из воплощений E31-E33, при этом модифицированная интеграза ВИЧ имеет аминокислотную последовательность, которая по меньшей мере на 85%, на 90% или на 95% идентична последовательности, приведенной в SEQ ID NO: 3.

E35. Конструкция из нуклеиновой кислоты по любому из воплощений E29-E34, при этом включает последовательность XTEN или последовательность GGS.

E36. Конструкция из нуклеиновой кислоты по любому из воплощений E29-E35, при этом последовательность, кодирующая линкер, имеет длину от 9 до 150 нуклеотидов.

E37. Конструкция из нуклеиновой кислоты по любому из воплощений E29-E36, при этом 3′-конец последовательности второго полинуклеотида соединяется с 5′-концом последовательности первого полинуклеотида при помощи линкера.

E38. Вектор, содержащий конструкцию из нуклеиновой кислоты по любому из воплощений E21-E37, при этом экспрессирующий вектор подходит для экспрессии в клетках млекопитающих, дрожжевых клетках, клетках насекомых, клетках растений, грибковых клетках или клетках водорослей.

E39. Клетки-хозяева, содержащие конструкцию из нуклеиновой кислоты или вектор по любому из воплощений E1-E38.

E40. Слитый белок, включающий:

первый ДНК-связывающий белок, сконструированный для связывания с определенной последовательностью геномной ДНК в геноме;

второй ДНК-связывающий белок, который обеспечивает встраивание экзогенной нуклеиновой кислоты в геном, причем второй ДНК-связывающий белок представляет собой интегразу или транспозазу, модифицированную относительно дикого типа; и

линкер, соединяющий первый белок и второй белок.

E41. Слитый белок по воплощению E40, при этом второй ДНК-связывающий белок модифицирован для повышения специфичности встраивания экзогенной нуклеиновой кислоты в геном по сравнению с соответствующим белком дикого типа.

E42. Слитый белок по воплощению E40 или E41, при этом экзогенная нуклеиновая кислота может иметь длину до 20 т.п.н.

E43. Слитый белок по любому из воплощений E40-E42, при этом первый ДНК-связывающий белок выбран из группы, состоящей из цинк-пальцевых белков, белка Cas9 и их вариантов или функциональных фрагментов.

E44. Слитый белок по воплощению E43, при этом белок Cas9 выбран из группы, состоящей из Cas9 человека, никазы Cas9, Cas9 Streptococcus pyogenes, Cas9 Staphylococcus aureus, Cas12a, Cas12b и «мертвого» Cas9.

E45. Слитый белок по воплощению E43, при этом цинк-пальцевый белок представляет собой цинк-пальцевый белок типа C₂H₂.

E46. Слитый белок по любому из воплощений E40-E45, при этом модифицированная интеграза представляет собой модифицированную интегразу вируса иммунодефицита человека (ВИЧ) или её функциональный фрагмент.

E47. Слитый белок по воплощению E46, при этом модифицированная интеграза ВИЧ содержит мутации по одной или нескольким из числа аминокислот 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266 или 273 в соответствии с нумерацией аминокислот в последовательности интегразы ВИЧ дикого типа (SEQ ID NO: 1).

E48. Слитый белок по воплощению E47, при этом мутации модифицированной интегразы ВИЧ включают одну или несколько из мутаций D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R или K273R в соответствии с нумерацией аминокислот в последовательности интегразы ВИЧ дикого типа (SEQ ID NO: 1).

E49. Слитый белок по любому из воплощений E46-E48, при этом модифицированная интеграза ВИЧ имеет аминокислотную последовательность, которая по меньшей мере на 85%, на 90% или на 95% идентична последовательности, приведенной в SEQ ID NO: 3.

E50. Слитый белок по любому из воплощений E40-E45, при этом модифицированная транспозаза выбрана из группы, состоящей из модифицированной Frog Prince, модифицированной Sleeping Beauty, модифицированной гиперактивной Sleeping Beauty (SB100X), модифицированной PiggyBac, модифицированной гиперактивной PiggyBac и их функциональных фрагментов.

E51. Слитый белок по воплощению E50, при этом модифицированная транспозаза представляет собой модифицированную гиперактивную PiggyBac или её функциональный фрагмент.

E52. Слитый белок по воплощению E51, при этом модифицированная гиперактивная PiggyBac содержит мутации по одной или нескольким из числа аминокислот 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592 и 594 в соответствии с нумерацией аминокислот в последовательности гиперактивной PiggyBac (SEQ ID NO: 9).

E53. Слитый белок по воплощению E52, при этом мутации модифицированной гиперактивной PiggyBac включают одну или несколько из мутаций R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G или F594L в соответствии с нумерацией аминокислот в последовательности гиперактивной PiggyBac (SEQ ID NO: 9).

E54. Слитый белок по любому из воплощений E50-E53, при этом модифицированная гиперактивная PiggyBac имеет аминокислотную последовательность, которая по меньшей мере на 85%, на 90% или на 95% идентична последовательности, приведенной в SEQ ID NO: 10.

E55. Слитый белок по любому из воплощений E40-E54, при этом линкер включает последовательность XTEN или последовательность GGS.

E56. Слитый белок по любому из воплощений E40-E55, при этом линкер имеет длину от 3 до 50 аминокислот.

E57. Слитый белок по воплощению E40, при этом:

a) первый ДНК-связывающий белок представляет собой белок Cas9; а

b) второй ДНК-связывающий белок представляет собой модифицированную гиперактивную PiggyBac или её функциональный фрагмент.

E58. Слитый белок по воплощению E57, при этом белок Cas9 выбран из группы, состоящей из Cas9 человека, никазы Cas9, Cas9 Streptococcus pyogenes, Cas9 Staphylococcus aureus, Cas12a, Cas12b и «мертвого» Cas9.

E59. Слитый белок по воплощению E57 или E58, при этом модифицированная гиперактивная PiggyBac содержит мутации по одной или нескольким из числа аминокислот 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592 и 594 в соответствии с нумерацией аминокислот в последовательности гиперактивной PiggyBac (SEQ ID NO: 9).

E60. Слитый белок по воплощению E59, при этом мутации модифицированной гиперактивной PiggyBac включают одну или несколько из мутаций R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G или F594L в соответствии с нумерацией аминокислот в последовательности гиперактивной PiggyBac (SEQ ID NO: 9).

E61. Слитый белок по любому из воплощений E57-E60, при этом модифицированная гиперактивная PiggyBac имеет аминокислотную последовательность, которая по меньшей мере на 85%, на 90% или на 95% идентична последовательности, приведенной в SEQ ID NO: 10.

E62. Слитый белок по воплощению E40, при этом:

a) первый ДНК-связывающий белок представляет собой цинк-пальцевый белок; а

b) второй ДНК-связывающий белок представляет собой модифицированную интегразу или её функциональный фрагмент.

E63. Слитый белок по воплощению E62, при этом цинк-пальцевый белок представляет собой цинк-пальцевый белок типа C₂H₂.

E64. Слитый белок по воплощению E62 или E63, при этом модифицированная интеграза представляет собой модифицированную интегразу вируса иммунодефицита человека (ВИЧ) или её функциональный фрагмент.

E65. Слитый белок по воплощению E64, при этом модифицированная интеграза ВИЧ содержит мутации по одной или нескольким из числа аминокислот 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266 или 273 в соответствии с нумерацией аминокислот в последовательности интегразы ВИЧ дикого типа (SEQ ID NO: 1).

E66. Слитый белок по воплощению E65, при этом мутации модифицированной интегразы ВИЧ включают одну или несколько из мутаций D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R или K273R в соответствии с нумерацией аминокислот в последовательности интегразы ВИЧ дикого типа (SEQ ID NO: 1).

E67. Слитый белок по воплощению E62, при этом модифицированная интеграза ВИЧ имеет аминокислотную последовательность, которая по меньшей мере на 85%, на 90% или на 95% идентична последовательности, приведенной в SEQ ID NO: 3.

E68. Слитый белок по любому из воплощений E57-E67, при этом линкер включает последовательность XTEN или последовательность GGS.

E69. Слитый белок по любому из воплощений E57-E68, при этом линкер имеет длину от 3 до 50 аминокислот.

E70. Слитый белок по любому из воплощений E40-E69, при этом 3′-конец второго ДНК-связывающего белка соединяется с 5′-концом первого ДНК-связывающего белка при помощи линкера.

E71. Лентивирусные частицы, содержащие слитый белок по любому из воплощений E40-E69.

E72. Способ получения лентивирусных частиц для редактирования генов, включающий экспрессирование в клетках хозяина:

a) полинуклеотида, содержащего конструкцию из нуклеиновой кислоты по любому из воплощений E1-E38; и

b) полинуклеотида, кодирующего белки оболочки лентивируса.

E73. Способ по воплощению E72, дополнительно включающий экспрессирование последовательности полинуклеотида c), содержащего экзогенную нуклеиновую кислоту.

E74. Способ по воплощению E72 или E73, при этом полинуклеотид, содержащий конструкцию из нуклеиновой кислоты, дополнительно содержит последовательность нуклеиновой кислоты, кодирующей капсидные белки лентивируса.

E75. Способ по любому из воплощений E72-E74, дополнительно включающий извлечение лентивирусных частиц из клеток хозяина.

E76. Способ по любому из воплощений E72-E75, дополнительно включающий очистку лентивирусных частиц.

E77. Способ встраивания последовательности экзогенной нуклеиновой кислоты в геномную ДНК организма, включающий введение в организм лентивирусных частиц, содержащих конструкцию из нуклеиновой кислоты по любому из воплощений E1-E38 или слитый белок по любому из воплощений E40-E71 с тем, чтобы первый и второй ДНК-связывающие белки связались с определенной последовательностью геномной ДНК и вставили экзогенную нуклеиновую кислоту в геномную ДНК; причем экзогенная нуклеиновая кислота встраивается в определенную последовательность геномной ДНК.

E78. Способ контролируемого сайт-специфичного встраивания одной или нескольких копий последовательности экзогенной нуклеиновой кислоты в геном клеток, который включает:

a) введение в клетки слитого белка по любому из воплощений E40-E71 и

b) введение в клетки экзогенной нуклеиновой кислоты;

при этом связывание слитого белка с определенной последовательностью геномной ДНК в геноме клеток приводит к расщеплению генома и встраиванию одной или нескольких копий экзогенной нуклеиновой кислоты в геном этих клеток; причем слитый белок вводится в клетки при помощи лентивирусных частиц.

E79. Конструкция из нуклеиновой кислоты, включающая:

a) последовательность первого полинуклеотида, содержащего нуклеиновую кислоту, кодирующую первый ДНК-связывающий белок, сконструированный для связывания с определенной последовательностью геномной ДНК в геноме; причем первый ДНК-связывающий белок представляет собой цинк-пальцевый белок или белок Cas9;

b) последовательность второго полинуклеотида, содержащего нуклеиновую кислоту, кодирующую второй ДНК-связывающий белок, который обеспечивает встраивание экзогенной нуклеиновой кислоты в геном, причем второй ДНК-связывающий белок представляет собой:

(i) гиперактивную транспозазу PiggyBac или модифицированную гиперактивную PiggyBac с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с гиперактивной PiggyBac либо

(ii) интегразу вируса иммунодефицита человека (ВИЧ) или модифицированную интегразу ВИЧ с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с интегразой ВИЧ; и

c) необязательно последовательность полинуклеотида, содержащего нуклеиновую кислоту, кодирующую линкер;

причем конструкция из нуклеиновой кислоты кодирует слитый белок, включающий первый ДНК-связывающий белок, второй ДНК-связывающий белок и необязательно линкер между первым ДНК-связывающим белком и вторым ДНК-связывающим белком; а слитый белок обеспечивает встраивание экзогенной нуклеиновой кислоты в определенный сайт генома.

E80. Конструкция из нуклеиновой кислоты по воплощению E79, при этом белок Cas9 выбран из группы, состоящей из Cas9 человека, никазы Cas9 и «мертвого» Cas9.

E81. Конструкция из нуклеиновой кислоты по воплощению E79, при этом цинк-пальцевый белок представляет собой цинк-пальцевый белок типа C₂H₂, содержащий 6 доменов.

E82. Конструкция из нуклеиновой кислоты по любому из воплощений E79-E81, при этом линкер включает последовательность XTEN или последовательность GGS.

E83. Конструкция из нуклеиновой кислоты по любому из воплощений E79-E82, при этом 3′-конец последовательности первого полинуклеотида соединяется с 5′-концом второго полинуклеотида.

E84. Конструкция из нуклеиновой кислоты по любому из воплощений E79-E83, при этом: (a) первый ДНК-связывающий белок представляет собой белок Cas9 или цинк-пальцевый белок, а (b) второй ДНК-связывающий белок представляет собой гиперактивную транспозазу PiggyBac или модифицированную гиперактивную PiggyBac с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с гиперактивной PiggyBac; причем конструкция из нуклеиновой кислоты содержит (c) последовательность полинуклеотида, содержащего нуклеиновую кислоту, кодирующую линкер, включающий последовательность XTEN или последовательность GGS, а 3′-конец последовательности первого полинуклеотида соединяется с 5′-концом второго полинуклеотида.

E85. Конструкция из нуклеиновой кислоты по любому из воплощений E79-E83, при этом: (a) первый ДНК-связывающий белок представляет собой белок Cas9 или цинк-пальцевый белок, а (b) второй ДНК-связывающий белок представляет собой интегразу ВИЧ или модифицированную интегразу ВИЧ с улучшенной специфичностью встраивания экзогенной нуклеиновой кислоты в геном по сравнению с интегразой ВИЧ; причем конструкция из нуклеиновой кислоты содержит (c) последовательность полинуклеотида, содержащего нуклеиновую кислоту, кодирующую линкер, включающий последовательность XTEN или последовательность GGS, а 3′-конец последовательности первого полинуклеотида соединяется с 5′-концом второго полинуклеотида.

E86. Конструкция из нуклеиновой кислоты по любому из воплощений E79-E84, при этом модифицированная гиперактивная транспозаза PiggyBac содержит мутации по одной или нескольким из числа аминокислот 245, 268, 275, 277, 287, 290, 315, 325, 341, 346, 347, 350, 351, 356, 357, 372, 375, 388, 409, 412, 432, 447, 450, 460, 461, 465, 517, 560, 564, 571, 573, 576, 586, 587, 589, 592 и 594 в соответствии с аминокислотной последовательностью гиперактивной PiggyBac по SEQ ID NO: 9.

E87. Конструкция из нуклеиновой кислоты по воплощению E86, при этом мутации модифицированной гиперактивной транспозазы PiggyBac включают одну или несколько модификаций аминокислот из числа R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/K375A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G или F594L в соответствии с аминокислотной последовательностью гиперактивной PiggyBac по SEQ ID NO: 9.

E88. Конструкция из нуклеиновой кислоты по любому из воплощений E79-E84, при этом модифицированная гиперактивная транспозаза PiggyBac содержит мутации по одной или нескольким из числа аминокислот 245, 275, 277, 325, 347, 351, 372, 375, 388, 450, 465, 560, 564, 573, 589, 592, 594 в соответствии с аминокислотной последовательностью гиперактивной PiggyBac по SEQ ID NO: 9.

E89. Конструкция из нуклеиновой кислоты по воплощению E88, при этом мутации модифицированной гиперактивной транспозазы PiggyBac включают одну или несколько модификаций аминокислот из числа R245A, R275A, R277A, R275A/R277A, G325A, N347A, N347S, S351E, S351P, S351A, R372A, K375A, R388A, D450N, W465A, T560A, S564P, S573A, M589V, S592G или F594L в соответствии с аминокислотной последовательностью гиперактивной PiggyBac по SEQ ID NO: 9.

E90. Конструкция из нуклеиновой кислоты по воплощению E88, при этом модифицированная гиперактивная транспозаза PiggyBac имеет аминокислотную последовательность по SEQ ID NO: 9, где в положении 245 находится аминокислота A, в положении 275 – аминокислота R или A, в положении 277 – аминокислота R или A, в положении 325 – аминокислота A или G, в положении 347 – аминокислота N или A, в положении 351 – аминокислота E, P или A, в положении 372 – аминокислота R, в положении 375 – аминокислота A, в положении 450 – аминокислота D или N, в положении 465 – аминокислота W или A, в положении 560 – аминокислота T или A, в положении 564 – аминокислота P или S, в положении 573 – аминокислота S или A, в положении 592 – аминокислота G или S и в положении 594 – аминокислота L или F.

E91. Конструкция из нуклеиновой кислоты по воплощению E88, при этом модифицированная гиперактивная транспозаза PiggyBac имеет аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 120, 121, 122, 123, 124, 125, 126, 127, 128 и 129.

E92. Конструкция из нуклеиновой кислоты по воплощению E88, при этом модифицированная гиперактивная транспозаза PiggyBac имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности, выбранной из группы, состоящей из SEQ ID NO: 119, 120, 121, 122, 123, 124, 125, 126, 127, 128 и 129, причем модифицированная гиперактивная PiggyBac проявляет большую специфичность встраивания ДНК в геном по сравнению с гиперактивной PiggyBac.

E93. Конструкция из нуклеиновой кислоты по любому из воплощений E79-E83 или E85, при этом модифицированная интеграза ВИЧ содержит мутации по одной или нескольким из числа аминокислот 10, 13, 64, 94, 116, 117, 119, 120, 122, 124, 128, 152, 168, 170, 185, 231, 264, 266 или 273 в соответствии с аминокислотной последовательностью интегразы ВИЧ дикого типа по SEQ ID NO: 1.

E94. Конструкция из нуклеиновой кислоты по воплощению E93, при этом мутации модифицированной интегразы ВИЧ включают одну или несколько из мутаций D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R или K273R в соответствии с аминокислотной последовательностью интегразы ВИЧ дикого типа по SEQ ID NO: 1.

E95. Вектор, содержащий конструкцию из нуклеиновой кислоты по любому из воплощений E79-E95, при этом вектор подходит для экспрессии в клетках млекопитающих, дрожжевых клетках, клетках насекомых, клетках растений, грибковых клетках или клетках водорослей.

E96. Клетка-хозяин, содержащая конструкцию из нуклеиновой кислоты или вектор по любому из воплощений E79-E95.

E97. Слитый белок, полученный при экспрессии конструкции из нуклеиновой кислоты по любому из воплощений E79-E94.

E98. Композиция, включающая конструкцию из нуклеиновой кислоты, вектор или слитый белок по любому из воплощений E79-E95 или E97 и последовательность полинуклеотида, кодирующего экзогенную нуклеиновую кислоту для вставки в геном, причем композиция содержится в упаковочном векторе или связана с ним.

E99. Композиция по воплощению E98, при этом конструкция из нуклеиновой кислоты находится в виде РНК, ДНК или белка, а последовательность полинуклеотида, кодирующего экзогенную нуклеиновую кислоту, находится в виде ДНК или РНК.

E100. Композиция по любому из воплощений E98-E99, при этом упаковочный вектор представляет собой наночастицы или лентивирусные частицы.

E101. Способ контролируемого сайт-специфичного встраивания одной или нескольких копий последовательности экзогенной нуклеиновой кислоты в клетки, который включает: (a) введение в клетки конструкции из нуклеиновой кислоты, вектора или слитого белка по любому из воплощений E79-E95 или E97 и (b) введение в клетки экзогенной нуклеиновой кислоты; при этом связывание слитого белка с определенной последовательностью геномной ДНК в геноме клеток приводит к расщеплению генома и встраиванию одной или нескольких копий экзогенной нуклеиновой кислоты в геном этих клеток.

E102. Модифицированная гиперактивная транспозаза PiggyBac, имеющая аминокислотную последовательность по SEQ ID NO: 9, где в положении 245 находится аминокислота A, в положении 275 – аминокислота R или A, в положении 277 – аминокислота R или A, в положении 325 – аминокислота A или G, в положении 347 – аминокислота N или A, в положении 351 – аминокислота E, P или A, в положении 372 – аминокислота R, в положении 375 – аминокислота A, в положении 450 – аминокислота D или N, в положении 465 – аминокислота W или A, в положении 560 – аминокислота T или A, в положении 564 – аминокислота P или S, в положении 573 – аминокислота S или A, в положении 592 – аминокислота G или S и в положении 594 – аминокислота L или F.

E103. Модифицированная гиперактивная транспозаза PiggyBac по воплощению E102, которая имеет аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 120, 121, 122, 123, 124, 125, 126, 127, 128 и 129.

E104. Модифицированная гиперактивная транспозаза PiggyBac по воплощению E102, имеющая аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности, выбранной из группы, состоящей из SEQ ID NO: 119, 120, 121, 122, 123, 124, 125, 126, 127, 128 и 129, причем модифицированная гиперактивная PiggyBac проявляет большую специфичность встраивания ДНК в геном по сравнению с гиперактивной PiggyBac.

Содержание всех цитируемых ссылок (включая ссылки на литературу, патенты, патентные заявки и веб-сайты), которые могут цитироваться в этой заявке, прямо включено сюда путем ссылки во всей полноте для любых целей так же, как и ссылки, приведенные в них. Следующие примеры представлены в качестве иллюстрации, а не для ограничения.

Примеры

“PB” и “hyPB” применяются взаимозаменяемым образом для обозначения гиперактивной транспозазы PiggyBac. Приведенные ниже примеры 1-3 касаются получения и эффективности с точки зрения направленного встраивания конструкций слитых белков программируемых транспозаз и Cas9. В примере 1 были успешно получены различные ДНК конструкции для транспозаз гиперактивной PiggyBac и Sleeping Beauty, слитые с различными вариантами Cas9, вызывающие встраивание транспозона в геном трансфицированных клеток. Примечательно, что конструкции для PiggyBac и Cas9 были способы обеспечить направленное встраивание в представляющий интерес сайт генома (Пример 2). В примере 3 представлены модифицированные транспозазы, созданные для повышения специфичности встраивания последовательности экзогенной нуклеиновой кислоты в геном.

Пример 1. ДНК-векторы для экспрессии слитых белков программируемых транспозаз

Целью данного эксперимента была проверка различных конфигураций слияния гиперактивных транспозаз PiggyBac (обозначены здесь как hyPB или PB) и Sleeping Beauty (обозначены здесь как SB100x) с нуклеазой (h), никазой (n) и «мертвым» (d) Cas9 на эффективность встраивания транспозонов. Получали слитые белки программируемых транспозаз путем включения в экспрессирующий вектор pcDNA3.3-TOPO (остов плазмиды Invitrogen, плазмида Addgene #41815) последовательностей ДНК, кодирующих Cas9 дикого типа человека (hCas9), никазу Cas9 (nCas9) или «мертвый» Cas9 (dCas9) (SEQ ID NO: 64-66, соответственно) и гиперактивную транспозазу PiggyBac (PB) или Sleeping Beauty (SB100) (SEQ ID NO: 67-68, соответственно). Создавали векторы, в которых 3′-конец Cas9 соединяется с 5′-концом каждой из транспозаз линкерной последовательностью нуклеиновой кислоты (SEQ ID NO: 48), кодирующей линкер GGS (hCas9PB, nCas9PB, dCas9PB, hCas9SB, nCas9SB и dCas9SB). Создавали и другие векторы, в которых 3′-конец каждой из транспозаз соединяется с 5′-концом Cas9 линкерной последовательностью нуклеиновой кислоты (SEQ ID NO: 48), кодирующей линкер GGS (PBhCas9, PBnCas9, PBdCas9, SBhCas9, SBnCas9 и SBdCas9). В таблице 2 представлена сводка по слитым конструкциям.

Таблица 2. Список белков программируемых транспозаз, полученных в примере 1

Слитые белки программируемых транспозаз Cas9 Транспозаза Ориентация Линкер Cas9 человека гиперактивная PiggyBac hCas9-PB линкер GGS Никаза Cas9 гиперактивная PiggyBac nCas9-PB линкер GGS «Мертвый» Cas9 гиперактивная PiggyBac dCas9-PB линкер GGS Cas9 человека гиперактивная PiggyBac PB-hCas9 линкер GGS Никаза Cas9 гиперактивная PiggyBac PB-nCas9 линкер GGS «Мертвый» Cas9 гиперактивная PiggyBac PB-dCas9 линкер GGS Cas9 человека гиперактивная Sleeping Beauty hCas9-SB линкер GGS Никаза Cas9 гиперактивная Sleeping Beauty nCas9-SB линкер GGS «Мертвый» Cas9 гиперактивная Sleeping Beauty dCas9-SB линкер GGS Cas9 человека гиперактивная Sleeping Beauty SB-hCas9 линкер GGS Никаза Cas9 гиперактивная Sleeping Beauty SB-nCas9 линкер GGS «Мертвый» Cas9 гиперактивная Sleeping Beauty SB-dCas9 линкер GGS

Перед трансфекцией быстро оттаивали замороженные клетки HEK293T при 37°C, а затем ресуспендировали в 5 мл предварительно нагретой среды и осаждали центрифугированием при 1000 об/мин в течение 4 мин. Осадок ресуспендировали в свежей среде и вносили ~1,6×10⁶клеток в новую колбу T75. Когда клетки достигали конфлюэнтности 95%, их пассировали с помощью трипсина и высеивали при конфлюэнтности 40%. Клетки пассировали дважды перед использованием в экспериментах.

Для экспериментов по трансфекции высеивали по 5×10⁵ клеток HEK293T на лунку в многолуночный планшет с полной средой DMEM (модифицированная Дюльбекко среда Игла (DMEM) с добавлением 10% фетальной телячьей сыворотки, 2 мМ глутамина и 100 ед./мл пенициллина/0,1 мг/мл стрептомицина). Перед трансфекцией среду заменяли на 2,7 мл свежей полной среды DMEM. Смешивали среду Opti-MEM I с пониженным содержанием сыворотки с каждой комбинацией плазмид и с раствором линейного полиэтиленимина (PEI 25K) 1 мг/мл. Использовали соотношение PEI 25K (мкг):общая ДНК (мкг) = 3:1. Оба раствора смешивали и инкубировали при комнатной температуре в течение 15 мин. После инкубации в клетки по каплям вносили 300 мкл смеси. Через 24 ч после трансфекции среду заменяли на свежую полную среду. Клетки после трансфекции собирали для проточной цитометрии или сортировки клеток и экстракции ДНК.

Клетки HEK293T трансфицировали совместно плазмидой, кодирующей слитый белок программируемой транспозазы из таблицы 2, плазмидой, кодирующей нуклеиновую кислоту для встраивания, а именно транспозон с RFP (красный флуоресцентный белок) или GFP (зеленый флуоресцентный белок), и направляющей РНК, нацеленной на сайт AAVS1 (сайт-1 встраивания аденоассоциированного вируса) в геноме человека. В качестве положительного контроля использовали гиперактивные PiggyBac и SB100, а транспозон сам по себе – в качестве отрицательного контроля для выявления эписомальной экспрессии (т.е. экспрессии из невстроившихся плазмид). Анализировали флуоресценцию методом проточной цитометрии вплоть до 14-го дня, после чего эписомальная флуоресценция не обнаруживалась. Затем клетки подвергали сортингу по экспрессии GFP, а через два дня после сортинга определяли встраивание целевой ДНК путем подсчета процента флуоресцентных клеток.

Результаты и выводы. На фиг. 1A и фиг. 1C представлены результаты по слитому Cas9-PB, а на фиг. 1B – результаты по слитому Cas9-SB100. Cas9 человека, слитый с гиперактивной PiggyBac (hCas9PB), и никаза Cas9, слитая с гиперактивной PiggyBac (nCas9PB), повышали процент флуоресцентных клеток примерно на 8% по сравнению с отрицательным контролем – эписомальным RFP через 14 дней (фиг. 1A, 1C). Следовательно, данные слитые белки способны успешно встраивать экзогенную ДНК в геном клетки. А исследованные слитые белки Cas9-Sleeping Beauty давали не больше флуоресцентных клеток, чем отрицательный контроль – эписомальный GFP через 14 дней (фиг. 1B).

Пример 2. Эффективность направленной транспозиции слитых белков программируемых транспозаз

Вслед за предыдущим примером исследовали, будет ли вставка направленной (или не направленной) при тех конфигурациях, которые в целом давали самые лучшие вставки в Примере 1. Для этого клетки HEK293T трансфицировали совместно с помощью липофектамина 3000 плазмидой (pSico), кодирующей hCas9PB или nCas9PB, плазмидой Genetrap, кодирующей транспозон с инвертированными повторами и GFP без промотора, и направляющей РНК, нацеленной на сайт AAVS1 или сайт в гене CD46 после промотора в геноме человека. 3′-Конец Cas9 соединяли с 5′-концом транспозазы при помощи линкера (SEQ ID NO: 48). Пример структуры экспрессирующего Cas9PB вектора представлен на фиг. 2A. Транспозаза содержала акцептор сплайсинга и GFP без промотора между 3′- и 5′-повторами. направляющая РНК и Cas9 направляют транспозазу для встраивания транспозона в район промотора. При таком подходе клетки становятся флуоресцентными, только если транспозон будет вставлен в целевой сайт.

Результаты и выводы. Определение процента экспрессирующих GFP клеток показало, что слитые белки с программируемой транспозазой Cas9-PiggyBac (“прицельный hCas9”) и никазой Cas9-PiggyBac (“прицельный nCas9”) дают лучшую направленную доставку целевой ДНК по сравнению с контролями “неприцельный” (контроль на вставку вообще (только PiggyBac)) и “эписомальный” (отрицательный контроль без встраивания (только транспозон)) (фиг. 2B). При этом повышение сигнала в 3 раза и 4 раза выше фона было значимым, особенно с учетом того, что не все клетки были эффективно трансформированы всеми векторами, необходимыми для встраивания транспозона; а эффективность случайной вставки hyPB в неоптимизированных условиях, которые использовались здесь, составляет 10-15%.

Пример 3. Получение модифицированных гиперактивных транспозаз PiggyBac

Создавали модифицированные гиперактивные транспозазы PiggyBac для повышения специфичности встраивания последовательности экзогенной нуклеиновой кислоты в геном. Список мутаций аминокислот транспозазы приведен в таблице 3.

Таблица 3. Сайты мутаций для гиперактивной PiggyBac относительно последовательности гиперактивной PiggyBac SEQ ID NO: 9

Положение Аминокислота дикого типа Мутация Классификация 245 R A аланиновый скрининг 268 D N консервативная каталитическая триада 275 R A аланиновый скрининг 277 R A аланиновый скрининг 275/277 R/R A/A аланиновый скрининг 287 K A аланиновый скрининг: снижение эксцизии 290 K A аланиновый скрининг 287/290 K/K A/A аланиновый скрининг: снижение эксцизии 315 R A аланиновый скрининг: способна встраиваться 325 G A выравнивание интегразы 341 R A аланиновый скрининг: способна встраиваться 346 D N консервативная каталитическая триада 347 N A, S выравнивание интегразы 350 T A выравнивание интегразы 351 S E, P, A мутации, сравнимые с мутациями интегразы, изменяющими посадку на мишень --> k351 способна встраиваться 357 N A выравнивание интегразы 356 K E мутация, сравнимая с мутациями интегразы, изменяющими посадку на мишень --> k356 способна встраиваться 372 R A аланиновый скрининг: способна встраиваться 375 K A аланиновый скрининг: способна встраиваться 372/375 R/K A/A аланиновый скрининг 388 R A аланиновый скрининг 409 K A аланиновый скрининг 412 K A аланиновый скрининг 409/412 K/K A/A аланиновый скрининг 432 K A аланиновый скрининг 447 D A, N консервативная каталитическая триада 460 R A аланиновый скрининг: снижение эксцизии 461 K A аланиновый скрининг: снижение эксцизии 460/461 R/K A/A аланиновый скрининг: снижение эксцизии 465 W A выравнивание интегразы 517 S N Int⁻/Exc⁺ 560 T A Int⁻/Exc⁺ 564 S P Int⁻/Exc⁺ 571 N S Int⁻/Exc⁺ 573 S A Int⁻/Exc⁺ 576 K A очень консервативные остатки, другие важные функции не связаны с ДНК, так как это гибкий хвост 586 H X C-конец Zn²⁺-лиганда 587 I A очень консервативные остатки, другие важные функции не связаны с ДНК, так как это гибкий хвост 589 M V Int⁻/Exc⁺ 592 S G Int⁻/Exc⁺ 594 F L Int⁻/Exc⁺

Далее в примере 4 создавали несколько конструкций с тем, чтобы цинк-пальцевый белок (ZFP) мог связываться с хромосомным сайтом мишени для вставки представляющего интерес гена. ZFP составляет альтернативу Cas9 в качестве ДНК-связывающего белка. Примеры 5-13 в общем касаются получения и эффективности с точки зрения направленного встраивания конструкций слитых белков интегразы ВИЧ-1 и Cas9/ZFP. В частности, в примере 5 получали слитые белки ZFP и интегразы. В примерах 6-10 представлены различные упаковочные системы, дефектные по интегразе (то есть это невстраивающие векторы), призванные служить в качестве основы для исследований in vitro, свидетельствующих о восстановление функции встраивания со слитыми белками интегразы, созданными в примере 11. В примере 12 отмечается, что направленные слитые белки интегразы повышают процент направленного встраивания.

Пример 4. Получение направленного цинк-пальцевого белка (ZFP)

Целью было создание таких ZFP, которые связываются с сайтом мишенью на хромосоме для вставки представляющего интерес гена. Был получен 6-доменный цинк-пальцевый белок для посадки на сайт AAVS1 (SEQ ID NO: 40) в геноме человека. В таблице 4 представлены последовательности ДНК мишени и соответствующие спирали ZFP. Были получены конструкции, кодирующие сайты мишени и ZFP (AAVS1-6d-ZFP). Последовательности нуклеиновой кислоты, кодирующие ZFP, и аминокислотные последовательности ZFP представлены в SEQ ID NO: 32 и 33, соответственно.

Таблица 4. Список сайтов мишени AAVS1 и соответствующих спиралей ZFP

Палец Триплет Спираль SEQ ID NO: 1 AGC ERSHLRE 41 2 CAG RADNLTE 42 3 CGT SRRTCRA 43 4 CCG RNDTLTE 44 5 CGG RSDKLTE 45 6 AGA QLAHLRA 46

Пример 5. Получение слитых белков ZFP-интеграза

Получали слитые белки интегразы с ZFP, содержащими 6 доменов (эффективно специфичные для последовательности). Для получения сайт-специфичной интегразы клонировали ZFP, полученный в примере 4 (AAVS1-6d-ZFP), в экспрессирующий вектор pcDNA3.1 вместе с интегразой ВИЧ-1 (SEQ ID NO: 1) (pZFP-AAVS1-6d-IN). Последовательность, кодирующая слитый белок, содержит N-концевой сигнал ядерной локализации (SEQ ID NO: 47) и последовательность линкера GGS (SEQ ID NO: 48) между ZFP и интегразой (фиг. 3).

Получали и другие векторы для слияния интегразы, как-то pZFP-TRCa-IN (включающий SEQ ID NO: 38, нацеленную на локус TRCa) и pZFP-AAVs1-TEX-IN (включающий линкер TEX (SEQ ID NO: 61)), которые получали такими же методами.

Пример 6. Получение дефектных по интегразе ДНК-векторов

Создавали дефектные по интегразе упаковочные системы, служащие в качестве основы для исследований in vitro с использованием сконструированной интегразы. Дефектные по интегразе конструкции получали из невстраивающейся упаковочной плазмиды (NILV) psPAX2. Плазмиды psPAX2 содержат одиночную мутацию N64D и двойные мутации N64D/N116D. Создавали и плазмиды с делецией интегразы (ΔIN), лишенные всей кодирующей области интегразы. Создавали некодирующие плазмиды, содержащие стоп-кодон перед кодирующей последовательностью интегразы (пример 8 ниже). Создавали и плазмиды, содержащие укороченные интегразы, включая конструкцию, содержащую С-концевой домен и ДНК-связывающий домен без cPPT/CTS (пример 10 ниже). Следовали общим методикам клонирования, как описано вкратце ниже.

Методика KAPA HiFi HotStart

Для экспериментов по ПЦР с использованием KAPA HiFi HotStart готовили реакционную смесь для ПЦР по методике производителя набора KAPA HiFi PCR Kit. Реакции ПЦР KAPA HiFi проводили на установке MasterCycler Pro.

Выделение плазмидной ДНК

Плазмидную ДНК выделяли с помощью набора QIAprep Spin Miniprep Kit по методике производителя. Собирали бактериальные культуры центрифугированием при 5000 об/мин в течение 3 мин. Осадки клеток ресуспендировали в 250 мкл буфера P1 и смешивали с 250 мкл буфера P2, переворачивая пробирки 4-6 раз. Добавляли 350 мкл буфера N3 и перемешивали, переворачивая пробирки. Пробирки Eppendorf центрифугировали 10 мин при 12000 об/мин для удаления обломков клеток и хромосомной ДНК. Супернатанты переносили в прилагаемые спин-колонки QIAprep и центрифугировали в течение 1 мин (12000 об/мин). Образцы дважды промывали 0,5 мл буфера PB и 0,75 мл буфера PE и каждый раз центрифугировали по 1 мин при 12000 об/мин. Дополнительным центрифугированием в течение 1 мин при 12000 об/мин удаляли остатки буфера из промывочного раствора. Спин-колонки QIAprep переносили в новые микроцентрифужные пробирки на 1,5 мл и добавляли 50 мкл воды для элюирования плазмиды, оставляя пробирки на 1 мин и затем центрифугируя в течение 1 мин при 12000 об/мин. Измеряли концентрации с помощью NanoDrop One.

Выделение и очистка плазмидной ДНК

Штаммы бактерий (DH5α или DH10B), содержащие требуемые плазмиды, культивировали в течение ночи в среде LB, содержащей 100 мкг/мл карбенициллина. Выделяли плазмиды с помощью наборов Mini или Maxi фирмы NZYTech по методике производителя. Плазмиды элюировали в 30 мкл (miniprep) либо 500 мкл (maxiprep) горячей воды при 65°C. Плазмиды хранили при -20°C. Для очистки на ПЦР обрабатывали реакционную смесь с помощью набора для очистки на ПЦР. Элюировали ДНК в 30 мкл горячей воды при 65°C.

Гель-электрофорез ДНК

Растворяли агарозу в 100 мл буфера TAE путем кипячения. В жидкие гели добавляли 4 мкл Greensafe на 100 мл раствора агарозы и заливали в лоток. Для визуализации препаратов ДНК смешивали ДНК с 6-кратным красителем и наносили на 1% агарозный гель. Кроме того, в одну камеру вносили по 1 мкл маркера gene ladder на 1 мм дорожки геля. Гели разгоняли в течение 1,5 ч при 100 В и визуализировали с помощью трансиллюминатора.

Трансформация

Для экспериментов по трансформации с клетками DH5α трансформировали 50 мкл клеток DH5α плазмидами по методике производителя. После восстановления в среде s.o.c. бактерии осаждали при 15000×g в течение 30 сек и ресуспендировали в 50 мкл среды LB. Клетки наносили шпателем на чашки с LB-агаром, содержащим 100 мкг/мл карбенициллина, и инкубировали при 37°C в течение ночи. Отбирали колонии и инокулировали на всю ночь в среду LB, содержащую 100 мкг/мл карбенициллина. Жидкие культуры снова использовали либо для выделения плазмид, либо для хранения в глицерине. Для хранения в глицерине смешивали 500 мкл жидкой культуры с 500 мкл 50% глицерина и хранили при -80°C.

Для экспериментов по трансформации с ультракомпетентными клетками XL-10 Gold клетки сначала оттаивали на льду и вносили по 45 мкл клеток в охлажденные полипропиленовые круглодонные пробирки Falcon на 14 мл. К клеткам добавляли по 2 мкл смеси β-ME, поставляемой с набором. Содержимое пробирок осторожно взбалтывали и инкубировали клетки на льду в течение 10 мин (побалтывая через каждые 2 мин). В каждую порцию клеток добавляли 1,5 мкл обработанной DpnI ДНК, перемешивали и инкубировали на льду в течение 30 мин. Смеси клеток и ДНК в пробирках быстро нагревали до 42°C на 30 сек. Затем пробирки инкубировали на льду в течение 2 мин. В каждую пробирку добавляли 0,5 мл нагретого до 42°C бульона NZY+ и инкубировали 1 час при 37°C со встряхиванием при 225-250 об/мин. Затем смеси высеивали на чашки с агаром, содержащим соответствующие антибиотики для плазмидных векторов. Отбирали 5 колоний для выделения ДНК и проверяли последовательности. Отбирали и сохраняли колонию № 1.

Пример 7. Получение невстраивающихся векторов, содержащих PPT или ZFP-модифицированные слитые белки интегразы

Для получения дефектных по интегразе (IN), но в остальном полностью функциональных плазмид psPAX2 клонировали домен полипиримидинового тракта (PPT) (SEQ ID NO: 74), который важен для последующего образования двухцепочечной кДНК во всех РНК-геномах ретровирусов типа лентивирусов), в вектор psPAX2, не содержащий интегразы (psPAX2-ΔIN). В psPAX2-ΔIN клонировали синтетическую цинк-пальцевую конструкцию, нацеленную на AAVS1, полученную в примере 4 (AAVS1-6d-ZFP-IN). Были составлены два разных прямых праймера и один и тот же обратный праймер (SEQ ID NO: 75-77) для PPT со стоп-кодоном и без него (IN+PPT и IN+PPT(STOP)). Были составлены два разных прямых праймера и один и тот же обратный праймер (SEQ ID NO: 78-80) для AVS1-6d-ZFP-IN с сигналом ядерной локализации и без него (AAVS1-6d-ZFP-IN и AAVS1-6d-ZFP-IN(-NLS)). Вставки амплифицировали по ПЦР при стандартных условиях KAPA, температуре отжига 62°C и времени элонгации 40 сек для PPT и 90 сек для AAVS1-6d-ZFP-IN. Продукты ПЦР разделяли методом гель-электрофореза.

Амплифицированные продукты очищали и проводили сборку по методике при соотношении 1:2,5 остова:вставка и 5 циклах. Трансформировали 50 мкл компетентных клеток продуктами лигирования по 4 мкл и высеивали 60% компетентных клеток на чашки с карбенициллином. Первоначальную проверку колоний проводили методами рестрикционного расщепления и гель-электрофореза ДНК. Были отобраны следующие колонии: колонии 1 и 2 (IN+PPT F1+R, AAVS1-6d-ZFP-IN F1+R, AAVS1-6d-ZFP-IN(-NLS) F2 +R) и колонии 7 и 8 (IN+PPT(STOP) F2+R). Для дальнейшей проверки наличия в колониях правильной вставки проводили ПЦР колоний при 4 мМ Mg, 62-STS со стандартной Taq-полимеразой NEB.

Пример 8. Получение невстраивающихся векторов путем вставки стоп-кодона

Невстраивающиеся векторы получали путем вставки стоп-кодона перед открытой рамкой считывания интегразы (psPAX2-TAA-IN). psPAX2-TAA-IN получали посредством сайт-направленного мутагенеза путем добавления двух стоп-кодонов после сайта расщепления для протеазы в начале интегразы. Для получения psPAX2-TAA-IN использовали условия ПЦР для сайт-направленного мутагенеза.

После реакции ПЦР пробирки ставили на лед на 2 минуты для охлаждения. Затем прямо в каждую реакцию амплификации добавляли 1 мкл DpnI и инкубировали при 37°C в течение 5 мин для расщепления исходной (немутантной) двухцепочечной ДНК.

Для проверки того, что сайт-направленный мутагенез не давал каких-либо нежелательных модификаций, расщепляли плазмидную ДНК. Расщепление psPAX2 и psPAX2-TAA-IN с помощью SacI и AgeI должно давать три полосы в 7500, 1900 и 1300 п.н. Расщепление psPax2-ΔIN с помощью SacI и AgeI должно давать три полосы в 7500, 1300 и 800 п.н. Проводили реакции расщепления, в результате которых получили правильный профиль полос.

Пример 9. Внедрение интегразы дикого типа в дефектный по интегразе вектор

Целью была разработка методологии для проверки того, может ли невстраивающийся вектор восстановить свою встраивающую активность при экспрессии различных форм слитых белков интегразы. Для проверки того, что вектор psPAX2-ΔIN был полностью функциональным, в него вставляли интегразу методом сборки по Гибсону. Кроме того, для проверки того, что сайты сборки подходят для клонирования слитой “IN”, клонировали IN дикого типа с дополнительным N-концом IN, вставленным в остов перед этим сайтом (с Leu, которого там не должно быть). Это также делали с дополнительной последовательностью мишени для протеазы, чтобы избежать этого фальшивого N-концевого домена. Для амплификации фрагментов IN-1, IN-2 и IN-3 проводили реакции ПЦР.

Амплифицированные продукты ПЦР разделяли методом гель-электрофореза ДНК. Выделяли амплифицированные полосы и проводили сборку при соотношении 1:2,5 остова:вставка и 5 циклах при 37°C. Трансформировали 50 мкл компетентных клеток продуктами лигирования по 4 мкл и высеивали их на чашки с карбенициллином.

Для получения конструкции, содержащей IN-3, проводили сборку Гибсона по стандартной методике из набора для 1-стадийной сборки Gibson Assembly HiFi (с использованием CRG MM)(SGI-DNA, Inc., www.sgidna.com/products/gibson-assembly-reagents/). Готовили реакционные смеси и проводили сборку в течение 1 ч при 50°C. Компетентные клетки трансформировали 2 мкл реакционной смеси.

Трансформировали 50 мкл компетентных клеток продуктами лигирования по 2 мкл и высеивали их на чашки с карбенициллином.

Пример 10. Получение невстраивающихся векторов, содержащих интегразу с укороченным C-концевым доменом

В вектор psPAX2 клонировали С-концевой домен (CTD) (нуклеотиды 83-118 по SEQ ID NO: 74) и фрагменты интегразы CppT + CTD (SEQ ID NO: 74).

Амплифицированные продукты ПЦР разделяли методом гель-электрофореза ДНК. Проводили лигирование CppT+CTD в условиях, использовавшихся в примере 9.

Проводили лигирование по 5 циклов при 65°C и трансформацию продуктами лигирования. Колонии не выросли. Снова проводили лигирование и трансформацию, и три колонии проверяли путем секвенирования с праймером IN-fw (SEQ ID NO: 81).

Пример 11. Получение слитых белков интегразы

Создавали направленные слитые белки интегразы путем включения в экспрессирующий вектор pcDNA3.3 интегразы ВИЧ-1 и направленного ZFP либо Cas9 человека. Получили один вектор, в котором 3′-конец ZFP или Cas9 соединяется с 5′-концом интегразы линкером из нуклеиновой кислоты. Получали другой вектор, в котором 3′-конец интегразы соединяется с 5′-концом ZFP или Cas9 линкером из нуклеиновой кислоты. Использовали линкеры XTEN или GGS длиной в 13, 16, 19, 22, 25 или 28 аминокислот. Слитый белок ZFP-интеграза был сконструирован для посадки на сайт AAVS1 или в локус T-клеточного рецептора альфа (TCRα) в геноме человека. Слитый белок Cas9-интеграза использовали в комбинации с направляющими РНК, нацеленными на сайт AAVS1 или на локус TCRα в геноме человека. В таблице 5 представлен список слитых белков модифицированной интегразы.

Таблица 5. Список слитых белков модифицированной интегразы, полученных в примере 11

Интеграза ДНК-связывающий белок Целевой сайт Линкер Ориентация Интеграза ВИЧ-1 цинк-пальцевый белок (ZFP) AAVS1 XTEN или GGS длиной в 12, 16, 19, 22, 25 или 28 аминокислот ZFP-интеграза Интеграза ВИЧ-1 ZFP AAVS1 GGS интеграза-ZFP Интеграза ВИЧ-1 ZFP TCRα XTEN или GGS длиной в 12, 16, 19, 22, 25 или 28 аминокислот ZFP-интеграза Интеграза ВИЧ-1 ZFP TCRα GGS интеграза-ZFP Интеграза ВИЧ-1 ZFP CCR5 GGS ZFP-интеграза Интеграза ВИЧ-1 Cas9 AAVS1 XTEN Cas9-интеграза Интеграза ВИЧ-1 Cas9 AAVS1 GGS интеграза-Cas9 Интеграза ВИЧ-1 Cas9 TCRα XTEN Cas9-интеграза Интеграза ВИЧ-1 Cas9 TCRα XTEN интеграза-Cas9

Пример 12. Цис- и транс-комплементация дефектного по интегразе лентивируса с помощью направленных слитых белков интегразы

Направленные слитые белки интегразы из Примера 11 использовали для комплементации отсутствия способности к встраиванию у невстраивающегося лентивируса, экспрессирующего IN с двумя мутациями в каталитическом домене (D64V/D116N). Для этого эксперимента клонировали направленные слитые белки интегразы в вектор pcDNA3.1. Лентивирус получали при совместной трансфекции клеток с помощью pSICO (со вставкой для экспрессии GFP), pMD2.G (VSVG для экспрессии оболочки), PAX2 (содержащего упаковывающие белки и интегразу) или NILV-PAX2 (содержащего упаковывающие белки) и вектора pcDNA3.1, содержащего либо интегразу дикого типа, либо направленные интегразы (таблица 6).

Таблица 6. Условия для комплементации дефектного по интегразе лентивируса с помощью направленных слитых белков интегразы

Упаковка/
плазмида LV LVO NILV NILV+IN NILV+ZFP_
IN(AAVS1) NILV+Cas9_
IN(AAVS1) pSICO + + + + + psPAX2 + + psPAX2-NILV + + + + pMD2.G + + + + + + pHIV1-IN + pZFP-AAVS1-R + pCas9_IN(AAVS1) +

Высеивали по 6×10⁵ клеток HEK293T (8-й пассаж) на лунку в 6-луночный планшет и инкубировали в течение ночи. За 5 часов до начала продукции вируса среду заменяли на 1,7 мл среды, содержащей 1:1000 хлорохина дифосфата (CD; исходный раствор = 25 мМ). Плазмиды трансфицировали при молярном соотношении 1,6:1,32:0,72:3,32 (pSICO: PAX2:VSVG: wtIN-rescue). В качестве реагента для трансфекции использовали PEI (полиэтиленимин; исходный раствор = 1 мг/мл), по 3 мкл PEI на 1 мкг общей ДНК, используемой для трансфекции. ДНК разводили в 83 мкл Opti-MEM и 83 мкл PEI, перемешивали и инкубировали в течение 15-20 мин при комнатной температуре. Каждую смесь для трансфекции добавляли по каплям к клеткам со средой CD. Клетки инкубировали в течение ночи, а на следующий день среду заменяли на 2,5 мл свежей среды. На следующий день супернатанты клеток центрифугировали 5 мин при 1000 об/мин и пропускали через фильтр на 45 мкм. Супернатанты, содержащие вирус, хранили при -80°C.

Первым шагом была проверка того, что различные упаковки лентивируса сохраняют способность инфицировать клетки независимо от их содержимого. Для определения титра вируса высеивали по 75 000 клеток HEK293T на лунку в 6-луночный планшет. Клетки инфицировали смесью из 1 мл среды, содержащей полибрен 1:100, и 500 мкл полученного ранее супернатанта вируса (1:3). Среду меняли на следующий день. А на следующий день среду отсасывали и отделяли клетки с помощью 200 мкл трипсина. Реакцию останавливали добавлением 800 мкл нормальной среды и анализировали методом проточной цитометрии. Определяли титры вируса для лентивируса интегразы дикого типа (LV), пустых вирусных частиц (LVO), невстраивающегося лентивируса (NILV), невстраивающегося лентивируса с интегразой дикого типа (NILV+IN), невстраивающегося лентивируса со слитым белком ZFP-интеграза (NILV+ZP-IN(AAVS1)), невстраивающегося лентивируса со слитым белком Cas9-интеграза (NILV+Cas-IN) и лентивируса интегразы дикого типа с интегразой дикого типа (LV+IN). В качестве положительного и отрицательного контроля использовали LV и LVO, соответственно. Инфицировали клетки HEK293T и определяли титр вируса путем подсчета числа GFP-положительных клеток (фиг. 4). Результаты. Титр вируса был в пределах одного порядка величины для всех условий.

Затем определяли общую способность к встраиванию у направленных слитых белков интегразы методами проточной цитометрии и секвенирования следующего поколения для целевой вставки. Клетки HEK293T инфицировали при одной и той же множественности заражения для всех условий и измеряли флуоресценцию GFP через 3, 5, 7, 10 и 12 дней после инфицирования. Через 7 дней после инфицирования клетки подвергали сортингу по экспрессии GFP. Результаты. На 12-й день клетки, инфицированные NILV без комплементации, имели меньший процент клеток, экспрессирующих GFP (фиг. 5), что означает снижение способности к продукции вируса.

Для оценки способности к направленному встраиванию у исследуемых слитых белков интегразы выделяли геномную ДНК по методике из набора DNeasy Blood and Tissue Kit (Qiagen) на 12-й день. Культуры клеток собирали центрифугированием при 190 об/мин в течение 5 мин (максимум 5×10⁵). Осадки суспендировали в 200мкл PBS (фосфатно-солевого буфера). Добавляли 20 мкл протеиназы K вместе с 200 мкл буфера AL. После вибромешалки образцы инкубировали при 56°C в течение 10 мин. После добавления 200 мкл этанола (96-100%) и краткого встряхивания смеси переносили в спин-колонки DNeasy Mini, помещали в пробирки для сбора на 3 мл и центрифугировали при 8000 об/мин в течение 1 мин. Спин-колонки переносили в новые пробирка для сбора на 2 мл и добавляли 500 мкл буфера AW1. Пробирки центрифугировали при 8000 об/мин в течение 1 мин. Эту операцию промывки повторяли для буфера AW2 (центрифугирование 3 мин). Затем спин-колонки переносили в новые микроцентрифужные пробирки на 1,5 мл и добавляли 200 мкл буфера AE в центр мембраны спин-колонки для элюирования ДНК, пробирки выдерживали 1 мин, после чего центрифугировали 1 мин при 8000 об/мин. Концентрацию геномной ДНК определяли с помощью NanoDrop One.

Проводили обратное клонирование с олигонуклеотидами, специфичными для вставленных вирусных LTR. Проводили целевое секвенирование следующего поколения и анализировали по следующим параметрам: фильтровать прочтения так, чтобы R1 и R2 содержали соответствующий праймер для секвенирования, ограничить проверку крайними левыми нуклеотидами (столько же п.н., как у праймера), допускается 2 несовпадения, обрезать последовательности праймеров (SEQ ID NO: 82-89), фильтровать прочтения так, чтобы R1 и R2 содержали соответствующие основания LTR, ограничить проверку 5 крайними левыми нуклеотидами прочтения, использовать 5 первых оснований LTR (после праймера для секвенирования) с K = 3 (это значит, что для последовательности ACTGA следует проверять наличие в прочтении одного из следующих k-меров: ACT, CTG, TGA), допуская 2 несовпадения, обрезать соответствующие пары нуклеотидов LTR, картировать прочтения по эталонному геному, получить охват (число прочтений на 1 сайт вставки), делить на 2 те участки, где перекрываются R1 и R2, добавить только один из сайтов вставки, если нет перекрывания R1 и R2, применить порог охвата, рассчитать охват на каждые 10 млн. нуклеотидов эталонного генома и построить графики охвата, рассчитать процент охвата для каждого сайта вставки. Результаты. Направленные слитые белки интегразы повышают охват сайта AAVS1 и процент вставок в цель (таблица 7 и фиг. 6). Как видно из таблицы 7, когда вставка осуществляется слитыми белками интегразы, количество прочтений на целевом сайте больше по сравнению с IN дикого типа, что указывает на направленность вставки. На фиг. 6 представлены наиболее частые целевые сайты в геноме для IN и ZFP_IN (AAVS1), что означает наличие направленной вставки только в слитом состоянии.

Таблица 7. Количество прочтений по AAVS1 и процент вставок в цель у направленных слитых белков интегразы

Образец Число прочтений
по AAVS1 Процент вставок в цель Нативный (LV) 6 0 Невстраивающийся + нативная (NILV + IN) 3 0 Невстраивающийся (NILV) + ZFP-IN(AAVS1) 216 30 Невстраивающийся (NILV) + Cas9-IN(AAVS1) 71 10

Также создавали и второй ZFP для посадки на сегмент нуклеиновой кислоты гена CCR5. Этот цинк-пальцевый белок сливали с интегразой ВИЧ-1, получая интегразу, нацеленную на CCR5. Лентивирус, содержащий эту ZFP-IN, получали, как описано выше, и трансдуцировали им клетки HEK293T (NILV+ZP-IN(CCR5) (таблица 6). Результаты. Титр вируса NILV+ZP-IN(CCR5) был близок к LV и NILV+IN (фиг. 7A). Эта конструкция вырабатывала вирусные частицы с такой же эффективностью, что и другой исследованный слитый белок ZFP_IN (фиг. 7B и C). Его способность к встраиванию в ДНК сайт-специфичным образом не проверяли на CCR5.

В другом эксперименте недавно клонированные экспрессирующие векторы для слитой ZFP-IN с 6d были нацелены на локус TCRα и направляющая РНК нацелена на тот же сайт (см. Пример 11). При анализе проверяли, сможет ли интеграза дикого типа и слитая с ZFP-интеграза комплементировать способность к встраиванию у NILV и способствовать избирательному встраиванию кассеты CAR-T. Клетки Jurkat инфицировали при одной и той же множественности заражения для всех частиц, нацеленных на вставку в TCRα. В этом эксперименте вирусные частицы нагружали кассетой CAR-T CD19, что должно привести к потере экспрессии белка CD3 (кодируемого геном TCRα) после направленной вставки. Отслеживали процент CD19-положительных и CD3-отрицательных клеток по времени. Титр лентивируса представлен на фиг. 8A, а процент клеток, экспрессирующих CAR на 3-й и 14-й день, представлен на фиг. 8B. Процент экспрессирующих CD3 клеток представлен на фиг. 8C. Это означает, что транскомплементация не работает в контексте этой линии клеток в отсутствие VPR, важного фактора для эффективной транскомплементации IN.

Пример 13. Получение модифицированных интеграз при помощи сайт-направленного мутагенеза и насыщающего мутагенеза

Получали модифицированные интегразы при помощи сайт-направленного мутагенеза и насыщающего мутагенеза. При сайт-направленном мутагенезе модифицированные интегразы ВИЧ-1 получали путем мутации аминокислот при помощи сайт-направленного мутагенеза. Использовали набор для направленного мутагенеза QuikChange Lightning Multi Site-Directed Mutagenesis Kit и составляли праймеры в соответствии с рекомендациями производителя (SEQ ID NO: 90-97). Подлежащая мутации плазмида составляет около 7000 п.н. Проверяли примерно 5 колоний на 1 подход путем секвенирования. Колонии, содержащие требуемые плазмиды, хранили в глицерине.

Проводили насыщающий мутагенез интегразы ВИЧ-1, получая большую комбинаторную библиотеку различных молекул интегразы ВИЧ-1. Методика была заимствована из Cornell et al. (Biochemistry, 57(5):604-613, 2018). Использовали несколько прямых праймеров, содержащих вырожденную последовательность NNS в мутационном сайте, и один обратный праймер в одной реакции ПЦР (SEQ ID NO: 90-97). Для получения мутантных молекул интегразы амплифицировали всю плазмиду. Праймеры оптимизировали для температуры плавления 68°C. Во время циклов температура отжига должна повышаться на 0,3°C за цикл. В таблице 8 приведен список аминокислотных мутаций.

Таблица 8. Сайты мутаций интегразы ВИЧ-1 в сравнении с аминокислотной последовательностью интегразы ВИЧ-1 дикого типа NC_001802.1 – NP_705928 (SEQ ID NO: 1)

Положение аминокислоты Аминокислота дикого типа Мутантная
аминокислота Классификация 10 D K остаток, критический для интегративной рекомбинации ретровирусов в сильно консервативном участке 13 E K остаток, критический для интегративной рекомбинации ретровирусов в сильно консервативном участке 64 D A, E остаток, критический для интегративной рекомбинации ретровирусов в сильно консервативном участке 94 G D, E отрицательные аминокислоты, которые могут нарушать связывание ДНК (показано для 231E) 94 G R, K положительные аминокислоты, которые могут усиливать связывание ДНК 116 D A, E остаток, критический для интегративной рекомбинации ретровирусов в сильно консервативном участке 117 N D, E отрицательные аминокислоты, которые могут нарушать связывание ДНК (показано для 231E) 117 N R, K положительные аминокислоты, которые могут усиливать связывание ДНК 119 S A, P, T, G позиции, которые встречаются в других вариантах интегразы (взяты из выравнивания в Gijbers et al., 2014) 119 S D, E отрицательные аминокислоты, которые могут нарушать связывание ДНК (показано для 231E) 119 S R, K положительные аминокислоты, которые могут усиливать связывание ДНК 120 N D, E отрицательные аминокислоты, которые могут нарушать связывание ДНК (показано для 231E) 120 N R, K положительные аминокислоты, которые могут усиливать связывание ДНК 122 T K, I, V, A позиции, которые встречаются в других вариантах интегразы (взяты из выравнивания в Gijbers et al., 2014) 122 T R положительные аминокислоты, которые могут усиливать связывание ДНК 124 A D, E отрицательные аминокислоты, которые могут нарушать связывание ДНК (показано для 231E) 124 A R, K положительные аминокислоты, которые могут усиливать связывание ДНК 128 A T остаток, критический для интегративной рекомбинации ретровирусов в сильно консервативном участке 152 E A, D остаток, критический для интегративной рекомбинации ретровирусов в сильно консервативном участке 168 Q L, A остаток, критический для интегративной рекомбинации ретровирусов в сильно консервативном участке, и мутанты интегразы, дефектные по взаимодействию с LEDGF/p75 с нарушениями в привязке хромосом и репликации ВИЧ-1 170 E G остаток, критический для интегративной рекомбинации ретровирусов в сильно консервативном участке 185 F K 231 R G, K позиции, которые встречаются в других вариантах интегразы (взяты из выравнивания в Gijbers et al., 2014) 231 R D, E положительные аминокислоты, которые могут усиливать связывание ДНК 231 R K отрицательные аминокислоты, которые могут нарушать связывание ДНК (показано для 231E) 231 R S отрицательные аминокислоты, которые могут нарушать связывание ДНК (показано для 231E) 264 K R ацетилирование IN: “Ацетилирование интегразы ВИЧ-1 при помощи p300 регулирует встраивание вируса” 266 K R ацетилирование IN: “Ацетилирование интегразы ВИЧ-1 при помощи p300 регулирует встраивание вируса” 273 K R ацетилирование IN: “Ацетилирование интегразы ВИЧ-1 при помощи p300 регулирует встраивание вируса”

Пример 14. Получение конструкций pRRLVPR для интегразы и проверка эффективности транкомплементации на клетках HEK293T

Создавали векторы pRRLIN, pRRLVPRIN и pRRLINGFP для применения при транскомплементации с VPR (таблица 9).

Таблица 9. Конструкции pRRL

GFP(-) GFP(+) VPR(-) pRRL_IN pRRL_IN_GFP VPR(+) Prrl_VIN pRRL_VIN_GFP

Конструкции тестировали по экспрессии GFP. Клетки HEK293T трансфицировали pSICO MAXI, pSICO MINI и pRRL_INGFP для проверки эписомальной экспрессии pRRLINGFP. Экспрессия конструкции VPRINGFP в вырабатывающих лентивирус клетках оказалась положительной. Затем проверяли эффективность транскомплементации в клетках HEK293T.

Среду с LV ультрацентрифугировали, оставляли для ресуспендирования и засеивали клетки. Проводили инфицирование в объеме 0,6 мл (1,5×0,4). Добавляли полибрен. Определяли титры по цитометрии. Титры (1:100) представлены на фиг. 9.

Для сравнения модифицированных последовательностей интегразы при встраивании использовалась система транскомплементации с VPR.

Далее в примерах 15-19 создавали различные конструкции слитых белков с модифицированной гиперактивной транспозазой PiggyBac. Определяли активность общей и направленной транспозиции этих конструкций, получая соответствующие результаты, особенно для конструкций hCas9_mutated PB. Также получали данные по созданию и определению активности направленной транспозиции у конструкций слитых белков мутантных PB и ZFP. Проверяли различные линкеры, показывая, что XTEN обладает большей эффективностью, чем остальные исследованные линкеры. 5GGS и 7GGS также работали надлежащим образом, свидетельствуя, что длина линкера и его гибкость играют важную роль в его эффективности.

Пример 15. Способы получения слитых белков с модифицированными гиперактивными транспозазами PiggyBac и определение эффективности направленной транспозиции

Трансфекция

Клетки HEK293T высеивали накануне, чтобы достичь конфлюэнтности 70-80% в день трансфекции (обычно по 290 000 клеток в 12-луночном планшете). Трансфекцию проводили с помощью реагента липофектамин 3000 в соответствии с инструкциями производителя или PEI при соотношении ДНК-PEI = 1:3 в OptiMem.

Программируемую транспозазу (PT), направляющую РНК и плазмиды для транспозонов трансфицировали вместе в соотношении 1 PT:2,5 направляющая РНК:2,5 транспозона.

Клетки пассировали и поддерживали до требуемой конечной точки в зависимости от эксперимента.

Получение мутантов PB

Вводили различные мутации в последовательность hyPB, слитую с Cas9 (плазмида hCas9_PB), при помощи сайт-направленного мутагенеза в соответствии с инструкциями из набора для мутагенеза QuickChange Lightning Agilent. Составляли праймеры с помощью QuikChange Primer Design для получения следующих мутаций: PB R245A, PB R275-277A, PB R388A, PB S351A, PB W465A, PB R372A-K375A, PB D450N (SEQ ID NO: 100-106).

Активность Cas9

Плазмиду программируемой транспозазы с нуклеазой Cas9 и плазмиду для направляющей РНК трансфицировали вместе в соотношении 1:2,5. Через 48 ч собирали клетки и выделяли геномную ДНК. Проводили ПЦР с праймерами, нацеленными на 150-200 п.н. вокруг целевого сайта направляющей РНК (NGS-aavs fw и NGS-aavs rv, SEQ ID NO: 98-99). При второй реакции ПЦР вводили адаптеры и баркоды Illumina и проводили секвенирование MiSeq обычно в проточных кюветах 2x250 Nano. Результаты анализировали с помощью веб-инструмента CRISPR-GA.

Метод Genetrap

Получали транспозон RFP без промотора с акцептором сплайсинга перед ним и составляли направляющую РНК, нацеленные на PPR1-α и интрон-1 CD46, которые клонировали под управлением промотора U6. Флуоресценция RFP будет выявляться, только если транспозон случайно встроится в целевой участок или в район другого промотора. Для метода Genetrap клетки HEK293T трансфицировали транспозоном Genetrap, программируемой транспозазой и направляющей РНК, а сигналы RFP анализировали методом проточной цитометрии.

Репортерные линии клеток с расщепленным GFP

Получали репортерные линии клеток 293T для экспериментов по выявлению направленной транспозиции. Вкратце, эти линии клеток содержат целевую область (с разными последовательностями мишеней для направляющей РНК и ZFP) и последовательность акцептора сплайсинга, за которой следует половина кодирующей последовательности GFP. Эти линии клеток получали путем случайного встраивания репортерной кассеты с помощью гиперактивной версии транспозазы Sleeping Beauty, SB100X. При направленном введении транспозона с первой половиной последовательности GFP и с промотором и донором для сплайсинга появляются сигналы GFP, детектируемые методом проточной цитометрии.

Создавали и второй транспозон, содержащий половину последовательности GFP и полную последовательность RFP с конститутивным промотором EF1α перед ней для оценки направленности или случайности вставки. Примерно через 15 дней после трансфекции наблюдалось хорошее затухание эписомального сигнала, что позволяет отличить общую вставку (сигнал RFP) от направленной вставки (сигнал GFP).

Пример 16. Получение плазмидных конструкций для слитых белков с модифицированными гиперактивными транспозазами PiggyBac

Клонировали различные плазмидные конструкции для достижения слияния программируемого элемента, нацеленного на ДНК (Cas9, ZFN), и транспозазы млекопитающих (PiggyBac, SB100). Линкер между двумя модулями был вариабельным в различных конструкциях, его выбирали из библиотеки линкеров по SEQ ID NO: 50-63. Конструкции представлены в таблице 10.

Таблица 10. Список полученных слитых белков

Слияния
Cas9 и hyPB Слияния
Cas9 и SB100 Слияния
ZFN и hyPB Слияния с мутациями hyPB hCas9_hyPB hCas9_SB100 ZFN_hyPB hCas9_hyPB_D450N, линкер 4GGS nCas9_hyPB nCas9_SB100 hyPB_ZFN nCas9_hyPB_D450N, линкер 4GGS dCas9_hyPB dCas9_SB100 dCas9_hyPB_D450N, линкер 4GGS hyPB_hCas9 SB100_hCas9 hCas9_hyPB_D450N-R372-375A, линкер 4GGS hyPB_nCas9 SB100_nCas9 nCas9_hyPB_D450N-R372-375A, линкер 4GGS hyPB_dCas9 SB100_dCas9 dCas9_hyPB_D450N-R372-375A, линкер 4GGS hCas9_hyPB со следующими мутациями: R245A, R275-277A, R388A, S351A, W465A ZFP_hyPB_D450N hyPB_D450N_ZFP ZFP_hyPB_D450N-R372-375A hyPB_D450N-R372-375A_ZFP

hCas9: оптимизированная по кодонам нуклеаза Cas9 человека; nCas9: оптимизированная по кодонам никаза Cas9 человека; dCas9: оптимизированная по кодонам «мертвая» Cas9 человека.

Пример 17. Эффективность транспозиции для различных линкеров

Клетки HEK293T трансфицировали конструкциями hCas9_PB с разными по длине и структуре линкерами (библиотека линкеров) и двумя разными направляющими РНК (AAVS1 № 1 и AAVS1 № 2). Через 48 ч после трансфекции выделяли геномную ДНК, амплифицировали целевую область методом ПЦР и секвенировали по методике секвенирования MiSeq фирмы Illumina.

Результаты. Конструкции с различными по длине и структуре линкерами не препятствуют активности нуклеазы Cas9. Линкер 4GGS дает большую активность Cas9 на сайтах-мишенях обеих направляющей РНК по сравнению с активностью hCas9 (фиг. 11).

Пример 18. Направленная транспозиция слитых белков с модифицированными гиперактивными транспозазами PiggyBac

18.1 GeneTrap

Определяли активность направленной транспозиции конструкции hCas9_PB (hCas9, соединенная с hyPB с помощью различных линкеров, описанных выше) при помощи транспозона Genetrap. Транспозон Genetrap содержит последовательность RFP без промотора с последовательностью акцептора сплайсинга перед ней, которая может экспрессироваться, только если она встроится в область промотора после донора сплайсинга.

Транспозон Genetrap трансфицировали вместе с направляющей РНК для интрона-1 PPR1 и программируемой транспозазой с различными конструкциями линкеров. Через 10 дней после трансфекции анализировали результаты по флуоресценции RFP методом проточной цитометрии.

Результаты. Направленная активность повышалась под действием программируемой транспозазы по сравнению со случайной вставкой hyPB, проявляя большую флуоресценцию при трансфекции программируемой транспозазой, чем при трансфекции hyPB дикого типа. Линкеры 8GGS, XTEN повышали направленную активность Genetrap по сравнению с другими линкерами (фиг. 12).

Репортерная линия клеток с расщепленным GFP

18.2 Направленная транспозиция hCas9_PB с различными линкерами

Определяли активность направленной транспозиции конструкции hCas9_PB при помощи репортерной линии клеток. Конструкции hCas9_PB с различными линкерами трансфецировали вместе с направляющей РНК для AAVS1 № 3 или TCR1α и половиной транспозона GFP. Результаты. Не отмечено больших отличий в отношении транспозиции конструкций с различными линкерами (фиг. 13).

18.3 Направленная транспозиция выбранных мутантов

Для дальнейших экспериментов по направленной транспозиции были выбраны PB 450 и PB 372-375-450 из-за хорошей эффективности их направленной транспозиции. Эксперименты проводили, как изложено выше, с использованием гРНК для AAVS1 № 3 и TCR1. Результаты. Направленная транспозиция hCas9_PB 450 и hCas9_PB 372-374-450 повышалась в 6-10 раз по сравнению с hCas9_PB с последовательностью hyPB дикого типа. При трансфекции hCas9 + hyPB в отдельных плазмидах проявлялась некоторая направленная активность, тогда как у hyPB без hCas9 проявлялась активность 0, свидетельствуя о том, что репортерные линии клеток с расщепленным GFP являются надежным методом направленной вставки для отбора таких вариантов, которые выполняют эту функцию выше уровня шума от других методов, которые недостаточно специфичны (фиг. 15).

18.4 Направленная и случайная транспозиция у выбранных мутантов PB

Направленную и случайную транспозицию оценивали при помощи двойного транспозона RFP-GFP, приведенного ранее для выбранных мутантов в примере 19.4. Красная флуоресценция означает вставку вообще (RFP экспрессируется конститутивно) примерно через 15 дней после трансфекции (что обеспечивает отсутствие эписомальных сигналов), а флуоресценция GFP означает направленную транспозицию. Результаты. Из фиг. 16 видно, что направленная транспозиция повышается по сравнению со случайной транспозицией у выбранных мутантов hCas9_PB D450N и hCas9_PB R372A K375A D450 в сравнении с hCas9_PB с последовательностью hyPB дикого типа. Общая эффективность транспозиции понижена у обоих мутантов, а направленные результаты согласуются с фиг. 15.

18.5 Направленная транспозиция конструкций ZFP-PB

Конструкции для слитых с гиперактивной PiggyBac цинк-пальцевых белков клонировали, используя нацеленную на ZFP последовательность TCR4, которая присутствует в репортерной линии клеток с расщепленным GFP, и hyPB либо hyPB с мутациями D450N. Клетки трансфицировали комбинациями ZFP-PB и ½ транспозона GFP по методике из Примера 15. Через 5 дней после трансфекции анализировали сигналы GFP. Результаты. У всех конструкций наблюдалась направленная транспозиция выше уровня фона (случайной вставки hyPB). Направленная транспозиция была выше у ZFP в N-концевом положении как для hyPB, так и для hyPB D450N (фиг. 18). Последовательность ZFP в этих экспериментах соответствует белку с 6 пальцевыми доменами с нуклеотидной и аминокислотной последовательностью по SEQ ID NO: 117 и 118, соответственно.

Далее в Примере 20 была разработана библиотека мутаций PB, которая была подвернута скринингу для идентификации модифицированной PB, положительной по направленной транспозиции. Были идентифицированы и подтверждены некоторые попадания для модифицированной PB, положительной по направленной транспозиции.

Пример 20. Получение библиотеки мутаций гиперактивной PiggyBac и скрининг на направленную транспозицию

Методы

Библиотека мутаций hyPB была разработана и приобретена у фирмы Twist Biosciences.

Таблица 11. Сайты мутаций для hyPiggyBac

Положение Аминокислота дикого типа Мутация 245 R A 275 R A 277 R A 325 G A 347 N A, S 351 S E, P, A 372 R A 375 K A 388 R A 450 D N 465 W A 560 T A 564 S P 573 S A 589 M V 592 S G 594 F L

Метод скрининга

Разработали метод скрининга для идентификации вариантов PiggyBac из полученной библиотеки мутантов, которые соединяются с целевым ДНК-связывающим белком типа Cas9 и выполняют определенные направленные транспозиции. Схема метода скрининга представлена на фиг. 19. Библиотеку PB клонировали методом сборки Golden Gate с помощью фермента Esp3I в лентивирусную плазмиду SIN для переноса, содержащую hCas9 и линкер XTEN, с последующими сайтами клонирования Esp3I перед NLS, получая слитый белок hCas9_XTEN_PB_NLS под управлением промотора CMV. После электропорации компетентных клеток ElectroMAX™ Stbl4™ фирмы Invitrogen получили около 6 000 000 колоний, из которых выделяли макси-препараты плазмид с помощью набора HiPure Maxiprep kit, LifeTechnologies. Получали лентивирусы (с помощью хелперных плазмид pMD2.G и psPAX2, приобретенных у Addgene) по методике получения лентивирусов фирмы Addgene. Лентивирусы ультрацентрифугировали и титровали методом кПЦР для анализа числа копий (с олигонуклеотидами SEQ ID NO: 107-110). Вкратце, за день до этого высеивали клетки HEK293T в 12-луночные планшеты. Клетки инфицировали лентивирусами с библиотекой и стандартным лентивирусом с GFP в разведениях 1/2, 1/10 для лентивирусов с библиотекой и 1/50, 1/100, 1/1000 для лентивирусов с GFP. Через 3 дня после заражения анализировали сигналы GFP методом проточной цитометрии. Собирали клетки и выделяли геномную ДНК. Проводили кПЦР для оценки числа копий гена WPRE и нормировали по числу копий гена РНКазы.

Репортерные клетки HEK293T инфицировали при MOI = 0,8 в квадратных чашках на 500 см² с помощью полибрена 1:1000, а 10 млн. клеток засеивали накануне. Через 3-4 дня после заражения клетки трансфицировали плазмидой с направляющей РНК для AAVS1 по 8,1 пмоль и транспозоном с ½ GFP с помощью PEI 1:3. Накануне на чашки в 15 см высеивали 9 млн. клеток. Через 3-4 дня после трансфекции проводили сортировку клеток с помощью цитометра FACSAria с насадкой на 0,70 мкм. Контрольную трансфекцию проводили в чашках на 10 см, используя плазмиды для RFP и GFP при одинаковой молярности, и проводили анализ на цитометре Fortessa на наличие GFP-RFP-положительных клеток. После сортировки сразу выделяли геномную ДНК.

Для анализа мутантов PB, положительных по направленной транспозиции, использовали различные методы секвенирования.

Направленное секвенирование области PiggyBac в библиотеке

Область PiggyBac в 1116 п.н. у всех вариантов библиотеки подвергали ПЦР-амплификации с праймерами NGS cluster 1 fw и NGS cluster 2 rv, используя смесь KAPA HiFi Hotstart ReadyMix. При второй реакции ПЦР вводили адаптеры и баркоды Illumina, используя праймер NEBNext 9 и специальные баркоды Illumina (SEQ ID NO: 111-114). Направленное секвенирование проводили в проточных кюветах для MiSeq v2 или v3 фирмы Illumina. Праймер Index I7 заменяли на специальный праймер, обеспечивающий полное секвенирование различных вариантов.

Получение и секвенирование библиотеки последовательностей PiggyBac и Cas9 методом “дробовика”

Проводили ПЦР 6000 п.н. геномной ДНК из полученных при сортинге GFP-положительных клеток с праймерами CMV-F и SV40 pA rv (SEQ ID NO: 115 и 132), амплифицируя последовательность с Cas9 и PB с помощью смеси KAPA HiFi HotStart ReadyMix. Затем очищали ДНК с помощью набора Qiagen для экстракции гелей и фрагментировали до 500 п.н. с помощью Covaris S220 и микропробирок Crimp-Cap с волокном AFA. Библиотеку для “дробовика” готовили с помощью набора KAPA Hyperprep согласно инструкциям производителя.

Результаты

20.1 Получение библиотеки разнообразия hyPB

Репортерную линию клеток с ½ GFP инфицировали при MOI = 0,8 лентивирусами, содержащими hCas9_PB с мутациями в библиотеке PB. Через 3 дня после заражения клетки трансфицировали направляющей РНК для AAVS1 № 3 и ½ транспозона GFP при эффективности трансфекции 75-90%.

В первом эксперименте подвергали сортировке в целом 254 млн. клеток и получили 185 757 положительных клеток, то есть 0,073% положительных по направленной транспозиции вариантов. Во втором эксперименте подвергали сортировке 120 млн. клеток и получили 70 974 положительных клеток, то есть 0,059% положительных по направленной транспозиции вариантов (фиг. 21A и 21B).

Из положительных и отрицательных при сортировке клеток сразу выделяли геномную ДНК. ⅔ полученной ДНК подвергали обработке для направленного секвенирования, а ⅓ подвергали обработке для секвенирования библиотеки методом “дробовика”, как изложено выше в разделе «Методы» этого примера.

20.2 Скрининг библиотеки hyPB путем направленного секвенирования вариабельной области

Анализ положительных и отрицательных клеток с вариантами Cas9-PB проводили следующим образом. Картировали прочтения из направленного секвенирования по эталонной последовательности. Положения всех вариантов библиотеки получали при двух разных подходах: по положению, используя выровненные прочтения, и по последовательности, используя профили совпадения с окружающей последовательностью. Рассчитывали логарифмы кратности изменений подсчета у всех вариантов между положительными (GFP-положительные клетки с направленным встраиванием) и отрицательными образцами (образцы с ненаправленным встраиванием, независимо от того, происходило встраивание или нет) и отбирали лучшие варианты. Кроме того, проводили отбор отрицательных образцов со случайным встраиванием и при положительном отборе по RFP, где транспозон встраивается в геном случайным образом.

Результаты представлены на фиг. 22A-22K. Таким образом, используя самостоятельный высокопроизводительный метод скрининга комбинаторной библиотеки вариантов, была идентифицирована коллекция мутантов PiggyBack, способных выполнять сайт-направленное встраивание с высокой эффективностью, о чем свидетельствует их присутствие в популяции положительных, а не отрицательных клеток.

Далее проводили оценку направленной и случайной транспозиции у лучших положительных попаданий в повторе №1 с помощью двойного транспозона RFP-GFP, указанного ранее. Красная флуоресценция означает встраивание вообще (RFP экспрессируется конститутивно) примерно через 15 дней после трансфекции, а флуоресценция GFP означает направленную транспозицию.

Результаты. У варианта лучший 1 из повтора № 1 отмечалось повышение направленной транспозиции по сравнению с hCas9_PB и с hyPB дикого типа (фиг. 23A-23B). Проводилась независимая проверка направленности встраивания на нашей репортерной линии клеток, и наблюдалась значительная направленная активность по сравнению с версией дикого типа и с мутантом D450N.

20.3 Выявление избыточно представленных положительных попаданий

При скрининге было идентифицировано несколько положительных попаданий, чрезмерно представленных в популяции GPF по сравнению с отобранными отрицательными вариантами. Некоторые из них также не встречались в популяции RFP, представляющей вставки вообще, что означает повышение способности к встраиванию. Более того, RFP включает случайное и направленное встраивание. Таким образом, была идентифицирована коллекция комбинаторных мутантов PiggyBack, способных выполнять сайт-направленное встраивание с высокой эффективностью (фиг. 24A-24C).

20.4 Скрининг библиотеки hyPB путем секвенирования методом “дробовика”

Для секвенирования методом “дробовика” картировали прочтения по эталонной последовательности, проводили запрос вариантов с извлечением всех отклонений от эталона и рассчитывали евклидово и корреляционное расстояние между положительными и отрицательными показаниями аллелей. Наиболее отличающиеся позиции рассматривали как варианты и рассчитывали коэффициенты ассоциации между ними.

Результаты. Наряду с вариантами, включенными при разработке библиотеки, анализировали и варианты, введенные случайным образом под действием обратной транскриптазы лентивируса при создании вирусной библиотеки. Некоторые из этих новых вариантов связаны с положительными попаданиями и вероятно, что они выполняют направленное встраивание при комбинировании, возможно, они должны присутствовать в виде мутантов в версии варианта hyPB для выполнения направленного встраивания. Примеры – D450N и W465A на фиг. 25.

Мутантные последовательности PB, идентифицированные в примере 20, приведены в таблице 12 (SEQ ID NO: 120-129).

20.5 Проверка скрининга библиотеки hyPB

Проводили оценку направленной и случайной транспозиции некоторых комбинаций одиночных мутаций, отмеченных у лучший 1-1, идентифицированных при скрининге положительных попаданий (Unilarge-A, -B, -C и Unilarge-D), с помощью двойного транспозона RFP-GFP, указанного ранее. Красная флуоресценция означает встраивание вообще (RFP экспрессируется конститутивно) примерно через 15 дней после трансфекции, а флуоресценция GFP означает направленную транспозицию.

Результаты. Во всех случаях наблюдалось увеличение направленных вставок в сравнении со встраиванием вообще для Cas9, слитого с различными комбинациями мутантов hyPB с линкером 4GGS (Unilarge-A: D450N; Unilarge-B: R245A/D450N; Unilarge-C: R245A/G325A/D450N/S573P; Unilarge-D: R245A/G325A/S573P), по сравнению со слиянием Cas9 с версией hyPB дикого типа. Некоторые из исследованных комбинаций мутантов (Unilarge C: R245A/G325A/D450N/S573P) давали большое увеличение направленных вставок вплоть до 30% от общего числа случаев встраивания вместо 3% при слиянии с hyPB (фиг. 26).

Далее в Примере 21 представлен обзор по состоянию разработки различных дефектных по встраиванию вирусных векторов, а также по наилучшей системе транскомплементации; и данные по транскомплементации с помощью слитых белков IN.

Пример 21. Транскомплементация различных дефектных по интегразе систем

Для получения эффективной системы транскомлементации для тестирования слитых белков IN определяли эффективность продукции вируса и его способность к встраиванию путем трансфекции дефектного по встраиванию вируса и транскомплементированного вируса в клетки HEK293T и Jurkat при различных условиях. Клетки пассировали в течение 7 дней до тех пор, пока не проявлялось отсутствие эписомального сигнала, и анализировали сигналы GFP методом проточной цитометрии на 2-й, 5-й и 7-й день.

Результаты. Проявлялась различная эффективность продукции у разных систем, причем NILV был ближе всего к WT по продукции. Во всех случаях наблюдалось четкое восстановление встраивающей активности при проведении транскомплементации с помощью WT-HIV_IN (фиг. 27). Проверку попадания IN в систему транскомплементации проводили методом вестерн-блоттинга.

Таблица 12. Последовательности. “Н.к. последовательность” означает нуклеотидную последовательность, а “а.к. последовательность” – аминокислотную последовательность

SEQ ID NO: Название последовательности Последовательность 1 а.к. последовательность интегразы ВИЧ-1 дикого типа NC_001802.1 - NP_705928 FLDGIDKAQDEHEKYHSNWRAMASDFNLPPVVAKEIVASCDKCQLKGEAMHGQVDCSPGIWQLDCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKTIHTDNGSNFTGATVRAACWWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSAGERIVDIIATDIQTKELQKQITKIQNFRVYYRDSRNPLWKGPAKLLWKGEGAVVIQDNSDIKVVPRRKAKIIRDYGKQMAGDDCVASRQDED 2 н.к. последовательность интегразы ВИЧ-1 дикого типа NC_001802.1 tttttagatggaatagataaggcccaagatgaacatgagaaatatcacagtaattggagagcaatggctagtgattttaacctgccacctgtagtagcaaaagaaatagtagccagctgtgataaatgtcagctaaaaggagaagccatgcatggacaagtagactgtagtccaggaatatggcaactagattgtacacatttagaaggaaaagttatcctggtagcagttcatgtagccagtggatatatagaagcagaagttattccagcagaaacagggcaggaaacagcatattttcttttaaaattagcaggaagatggccagtaaaaacaatacatactgacaatggcagcaatttcaccggtgctacggttagggccgcctgttggtgggcgggaatcaagcaggaatttggaattccctacaatccccaaagtcaaggagtagtagaatctatgaataaagaattaaagaaaattataggacaggtaagagatcaggctgaacatcttaagacagcagtacaaatggcagtattcatccacaattttaaaagaaaaggggggattggggggtacagtgcaggggaaagaatagtagacataatagcaacagacatacaaactaaagaattacaaaaacaaattacaaaaattcaaaattttcgggtttattacagggacagcagaaatccactttggaaaggaccagcaaagctcctctggaaaggtgaaggggcagtagtaatacaagataatagtgacataaaagtagtgccaagaagaaaagcaaagatcattagggattatggaaaacagatggcaggtgatgattgtgtggcaagtagacaggatgaggattag

3 а.к. последовательность модифицированной интегразы ВИЧ-1 SEQ ID NO: 1
с заменой D10K, E13K, D64A, D64E, G94D, G94E, G94R, G94K, D116A, D116E, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, A128T, E152A, E152D, Q168L, Q168A, E170G, F185K, R231G, R231K, R231D, R231E, R231S, K264R, K266R, K273R либо их комбинацией 4 а.к. последовательность модифицированной интегразы с нарушением связывания ДНК SEQ ID NO: 1
с заменой G94D, G94E, G94R, G94K, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, A124D, A124E, A124R, A124K , R231G, R231K, R231D, R231E, R231K либо их комбинацией 5 а.к. последовательность модифицированной интегразы с усилением связывания ДНК SEQ ID NO: 1
с заменой G94D, G94E, G94R, G94K, N117D, N117E, N117R, N117K, S119A, S119P, S119T, S119G, S119D, S119E, S119R, S119K, N120D, N120E, N120R, N120K, T122K, T122I, T122V, T122A, T122R, A124D, A124E, A124R, A124K, R231G, R231K, R231D, R231E, R231S либо их комбинацией 6 а.к. последовательность модифицированной интегразы с мутациями по ацетилированию SEQ ID NO: 1
с заменой K264R, K266R, K273R либо их комбинацией 7 а.к. последовательность модифицированной интегразы с мутациями по интегративной рекомбинации ретровируса SEQ ID NO: 1
с заменой D10K, E13K, D64A, D64E, D116A, D116E, A128T, E152A, E152D, Q168L, Q168A, E170G либо их комбинацией 8 а.к. последовательность модифицированной интегразы с мутациями по репликации ВИЧ-1 SEQ ID NO: 1
с заменой Q168L и/или Q168A 9 а.к. последовательность гиперактивной PiggyBac MGSSLDDEHILSALLQSDDELVGEDSDSEVSDHVSEDDVQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLASNRILTLPQRTIRGKNKHCWSTSKPTRRSRVSALNIVRSQRGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLKRRESMTSATFRDTNEDEIYAFFGILVMTAVRKDNHMSTDDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTLRENDVFTPVRKIWDLFIHQCIQNYTPGAHLTIDEQLLGFRGRCPFRVYIPNKPSKYGIKILMMCDSGTKYMINGMPYLGRGTQTNGVPLGEYYVKELSKPVHGSCRNITCDNWFTSIPLAKNLLQEPYKLTIVGTVRSNKREIPEVLKNSRSRPVGTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINESTGKPQMVMYYNQTKGGVDTLDQMCSVMTCSRKTNRWPMALLYGMINIACINSFIIYSHNVSSKGEKVQSRKKFMRNLYMGLTSSFMRKRLEAPTLKRYLRDNISNILPKEVPGTSDDSTEEPVMKKRTYCTYCPSKIRRKASASCKKCKKVICREHNIDMCQSCF

10 а.к. последовательность модифицированной гиперактивной PiggyBac SEQ ID NO: 9
с заменой R245A, D268N, R275A/R277A, K287A, K290A, K287A/K290A, R315A, G325A, R341A, D346N, N347A, N347S, T350A, S351E, S351P, S351A, K356E, N357A, R372A, K375A, R372A/A, R388A, K409A, K412A, K409A/K412A, K432A, D447A, D447N, D450N, R460A, K461A, R460A/K461A, W465A, S517A, T560A, S564P, S571N, S573A, K576A, H586A, I587A, M589V, S592G, F594L либо их комбинацией 11 а.к. последовательность модифицированной гиперактивной PiggyBac с мутациями в каталитической триаде SEQ ID NO: 9
с заменой D268N и/или D346N 12 а.к. последовательность модифицированной гиперактивной PiggyBac с мутациями по аминокислотам, которые важны для эксцизии SEQ ID NO: 9
с заменой K287A, K287A/K290A, R460A/K461A либо их комбинацией 13 а.к. последовательность модифицированной гиперактивной PiggyBac с мутациями, которые связаны с посадкой на мишень SEQ ID NO: 9
с заменой S351E, S351P, S351A, K356E либо их комбинацией 14 а.к. последовательность модифицированной гиперактивной PiggyBac с мутациями, которые важны для встраивания SEQ ID NO: 9
с заменой T560A, S564P, S571N, S573A, M589V, S592G, F594L либо их комбинацией 15 а.к. последовательность модифицированной гиперактивной PiggyBac с мутациями, которые связаны с выравниванием SEQ ID NO: 9
с заменой G325A, N347A, N347S, T350A, W465A либо их комбинацией 16 а.к. последовательность модифицированной гиперактивной PiggyBac с мутациями по весьма консервативным аминокислотам SEQ ID NO: 9
с заменой K576A и/или I587A 17 а.к. последовательность модифицированной гиперактивной PiggyBac с мутациями, связанными со связыванием Zn²⁺ SEQ ID NO: 9
с заменой H586A 18 а.к. последовательность модифицированной гиперактивной PiggyBac с мутациями, связанными со встраиванием SEQ ID NO: 9
с заменой R315A, R341A, R372A, K375A либо их комбинацией

19 а.к. последовательность
Cas9 из Corynebacterium ulcerans MTNAVANHHVLWAKFDNVSEPYPLLAHLLDTATAATCLFNHWLRKGLRDRLSTELGPDAEKILGFVAGIHDLGKANPYFQAQRRNKKEEWITLRDAIQKAGFPLSNGTSALFEETKEKRRHENITLSILGWEITKFLQVKDVWPQLAIIGHHGNFSAPGFLSDEDDLEDIEDIFDDNGWSPTHELLVSSLLQAVGLEKQPEIKHISPASAILISGLVVLADRIASQSEMASDGLQALQKEELFFHQPEKWIANRKAFCREIIENTVGTYHPWESEAAGIRAVLGDYEPRFTQKAALNAGDGLFNVMETTGAGKTEAALLRHVKRKERLLFFLPTQATTNAIMDRIGKIFDGTPNVASLAHGLAVTEDFYAHPILPVQGSSDDANYKDNGGLYPTEFVRSAGTPRLLAPVCVGTIDQALMGALPSKFNHLRLLALANAHVVVDEVHTMDQYQSELMSGLLEWWSATDTPVTLLTATMPAWQREKFHLSYTGKDPHFKGVFPSLEDWSTPSKNTETSQENIPTEAFTIPINIDKIAHNEIVDSHVQWVIEQRKLFPQARIGIICNTVGRAQSIAEALAHESPIVLHSRMTAGHRKEAATKLEQAIGKKGTANATLVIGTQAIEASLDIDLDLLRTELCPAPSLIQRAGRLWRRLDPQREVRVPGMVGKKLTIAVVDSPSTGQTLPYLRSQLYRVESWLKQRDRIEFPADIQDFIDATTPGLQELFQKVSLPEDCGSAEEREALADDYLNEVASWVTKQRQAGTSRIDFAKHGKPRQVLASDCVVEDFLQITSANNLEESATRLIDYPSISAILCDPTGTIPGAWTDSVEKLIAISAKDSESLRRALRASISIPHSKKFLPITSREIPLSEAKTLLSGYSAVHIQPDEYDLQSGLKGPQK 20 а.к. последовательность
Cas9 из Corynebacterium diphtheria MNPHEELWAKQKGLAKPYPLLAHLLDSAAVAGALWDHWLRQDLRQMFIEELGSNAREIIQFVVGSHDIGKATPLFQYQKAQKGEVWDSIRYAIDRTGRYQKPLPSSYLVKKTSGGPNRHEQWSSFASKNEYLKPSAAAKENWIGLAIGGHHGRFEPVGYGRHQRKAAEDLAKSGWSAAQQDLLRALEKASGITRASLPSELSPELTLVLSGLTILADRISSTESFVITGARMIDDGTLHLATPIDWLKTRKLDSEKHVAKTVGIYHGWNNHESAIHSILKGYDPRPLQTIALQNQVGLLNLMAPTGNGKTEAAILRHSLKENDRLIFLLPTQATSNAIMRRVQGIYSDTPNAAALAHSLASVEDFYQTPLSVFDDHYDPSKEQFESSMSGGLYPSSFVCSGAARLLAPICIGTVDQALATALPGKWIHLRILALANAHIVIDEVHTLDHYQTALLENILPILAKLKTKITFLTATMPSWQRTKLLTAYGGEDLQIPPTVFPAAETVLPGQFNRTLIDSDSTTIDFTMEETSYDHLVESHVKWHQTTRLNAPHARIGLICNTVKRAQEIAAALEKTNDRIVLLHSRMTTEHRRRSAELLESLLGPNGNRKTITVVGTQAIEASLDIDLDILRTELCPAPSLVQRAGRVWRRNDPYRSSRITADHKPISVVFIAEAKDWQVLPYLRAETSRTQRWLEKHNQMFLPQMAQEFIDAATVDLDTATSEMDLDALALMGIHLMKADGAKARIQDVLNSDSKVSDFALLTSKNEIDEAQTRLIEEGTHLRIILGDENESIPGGWKHGLSSLLKLKASDRESLRTALLASIPLLVSEKQKQLLYQHNLVPLSSSKTVLAGFYFLPKAQNFYSKNLGFIWPEEKD 21 а.к. последовательность
Cas9 из Spiroplasma syrphidicola MNYKKLILGLDLGIASCGWAVTGQMEDGNWVLDDFGVRLFQTPENSKDGTTNAAARRLKRGARRLIKRRKNRIKDLKNLFEKINFINKASLDKYINEHSATNLVEDFNRHELYNPYFLRSIGITEKLTREELVWSLIHIANRRGYKNKFAFDIEGDGKKRETKLDEAISNALISSNLTISQEIVRNKKFRDAKNKKALLVRNKGGKEGENNFQFLFARDDYKKEVDLLLAKQAKFYPELTEEIRAKAADIIFRQRDFEDGPGPKKQELREIYKKENKQFSKNFTQLEGRCTFLRELSVGYKSSILFDLFHIISEVSKISKYIEENDQLAQDIISSFLYNEAGKKGKTLLKEILKKHHINDDIFDTNAYKNIDFKTNYLNLLKEVFGNDVLKNLSLNRLEDNIYHQLGFIIHTNITPERKEKAINQWLLENNIILAKEKLNILLKPNSSISTTVKTSFKWMSIAISNFLKGIPYGKFQAQFIKEDNFKLPESYAKQYQKYLTGEKTFEMFAPIIDPDLWRNPIVFRAINQARKVIKKLFEKYTFIDQINIELTREMGLSFSDRKKVKERQDDSLKENAKAKEFLMANGIIVNDTNVLKYKLWIQQNKKSLYSGKEITIADLGASNVLQIDHIIPYSKLADDSFNNKVLVFSKENQEKGNQFADQYVKSLGTENYNNYKKRVNYLLFQNQINQKKAEYLLCSNQNEEILNDFVSRNLNDTRYITRYVTNWLKAEFELQSRFGLAKPKIMTLNGAITSRFRRTWLRNSPWGLEKKS

22 а.к. последовательность
Cas9 из Prevotella intermedia MKRILGLDLGTTSIGWALVNEAENNNEASSIVRLGVRVNPLTVDEKSNFEKGKAITTNADRQLRHGARINLQRYKLRRQNLHDCLQKQGWLGTEAMYEEGKASTFETYKLRAKAAEEEISLHEFARVLFMLNKKRGYKSNRKANNKEDGQLFDGMTIAKKLYEEHLTPAEYSLQLLNKGKKFTQGYYRSDLNAELERIWDEQKKYYPEILTDEFKQQLEGKTKTNTSKIFLAKYGIYSADLKGLDRKFQPLKWRVEALQQQVDKEVLAFVISDLKGQIANTSGLLGAISDRSKELYFNKQTVGQYLWASLEENPHISIKNKPFYRQDYLDEFEKIWETQAAFHKQLTPELKQEIRDIIIFYQRPLKSKKSLISVCELEQRKVKATIDGKEKEITIGPKVAPKSSPVFQEFRIWQNLNNVLLIDNDTNEKRPLDEVERNLLYKELSIKAKLSKTEALKILNKKGKQWDLNYRELEGNRTQAILFDCYNRIITLTGHEECDFKKIKASEIRHYVSTIFKNLGFSTEILDFDPSLKKHELEKQPMYQLWHLLYSYESDNSRTGNESLLRKLETTFGFPEEYATVLCDVVFEEDYGNLSVKAMREILPYLQAGNDYSQACAYAGYNHSRHSLTKEELDQKVYKERLELLPKNSLRNPVVEKILNQMINVINAIIDEYGKPDEIRIEMARELKSSAADRKKTTHAISQGNAENQRIREILEKEFSLSYISRNDIIKYKLYEELEPNYYKTLYSDTYITKDKLFSKDFDIEHIIPKARLFDDSFSNKTLEARNINLEKSNKTAFDFIKEKYGEDGAEAYKKKLDMLLENDAISRPKYNNLLRAEADIPSDFINRDLRNTQYIAKKACEILGELVKTVTPTTGKITNRLREDWQLVDVMKELNFEKYEKLGLTEIVEDRDGRKIKRIKDWTKRNDHRHHAMDALAIAFTKPSFIQYLNNLNARSNKGDSIYAIENKELHYEEGKLRFNAPIPVNEFRAEAKRHLSAILVSIKAKNKVMTQNVNKIKTKHGIIKKIQLTPRGPLHNETIYGTKMRPIIKMVKVGAALDEATINKVSSPAIREALLKRLNEYSGNAKKAFTGKNTLEKNPIYLNAGRTKTVPSLVKTVEWESFHPTRKLIDKDLNVDKVVDKGIREILKARLEEFNGDAKKAFSNLEENPIYLDEAKKIALKRVSIEGVLSAIPLHTLKNQAGKPITGKDGKPVLGNYVQTSNNHHIAFYYDEDGNLQDNAVSFFEAAERKSQGIPVIDKDYNRDKGWRFLFTMKQNEYFVFPNEATGFIPSEVDLTDEANYGIISPNLYRVQKVSRIDKGTSASRDYWFRHHLETILNDDAKLKNLAFKRIRGLLELKDIIKVRINSTGKIVAVGEYD

23 а.к. последовательность
Cas9 из Spiroplasma taiwanense MWSRKILKAGSRLFDEANLSDKIASKRREQRGRRRNLRRKITWKQDLINLFVKYNFLQKENDFYELDFNFDLLELRKKAINSKIELEQLLIILFNYIKHRGSFNYREDLSELKNISQEELETSSEFKLPVDIQFELKEENNKFREINNEKSLINHEWYVKEINLILDAQIENKLINLDFKKDYLKLFNRKREYYDGPGPKDKNLLNPSKYGWKNQEEFFDRFAGKDTYDSKEQRAPKHSLTSYLFNILNDLNNLSINGDRNQLTYENKKDLINLTLINQKEKAENITLKKIAKYLKINEKNITGYRLKPNSNESIFTVFESANKMRSILVKNNKSIDFICLENIDKIDKIVDILTKYQSIEDKSLKLEELNFDFFDKETCEKLAVISLTGTHALSKKTMSKLIEEMFHDNLNHMEALAKLKIKPDYKLKVDLTNFKTIPILREKINEMYISPVVKRALIESLKIIKELERHFKDFEIKDIVIEMAKKNSAEKKQFISKIQRQNVDLVKKLSNDYSLDENKLNFKMKEKFLLLSEQ 24 а.к. последовательность
Cas9 из Streptococcus iniae MRKPYSIGLDIGTNSVGWAVITDDYKVPSKKMRIQGTTDRTSIKKNLIGALLFDNGETAEATRLKRTTRRRYTRRKYRIKELQKIFSSEMNELDIAFFPRLSESFLVSDDKEFENHPIFGNLKDEITYHNDYPTIYHLRQTLADSDQKADLRLIYLALAHIIKFRGHFLIEGNLDSENTDVHVLFLNLVNIYNNLFEEDIVETASIDAEKILTSKTSKSRRLENLIAEIPNQKRNMLFGNLVSLALGLTPNFKTNFELLEDAKLQISKDSYEEDLDNLLAQIGDQYADLFIAAKKLSDAILLSDIITVKGASTKAPLSASMVQRYEEHQQDLALLKNLVKKQIPEKYKEIFDNKEKNGYAGYIDGKTSQEEFYKYIKPILLKLDGTEKLISKLEREDFLRKQRTFDNGSIPHQIHLNELKAIIRRQEKFYPFLKENQKKIEKLFTFKIPYYVGPLANGQSSFAWLKRQSNESITPWNFEEVVDQEASARAFIERMTNFDTYLPEEKVLPKHSPLYEMFMVYNELTKVKYQTEGMKRPVFLSSEDKEEIVNLLFKKERKVTVKQLKEEYFSKMKCFHTVTILGVEDRFNASLGTYHDLLKIFKDKAFLDDEANQDILEEIVWTLTLFEDQAMIERRLVKYADVFEKSVLKKLKKRHYTGWGRLSQKLINGIKDKQTGKTILGFLKDDGVANRNFMQLINDSSLDFAKIIKNEQEKTIKNESLEETIANLAGSPAIKKGILQSIKIVDEIVKIMGQNPDNIVIEMARENQSTMQGIKNSRQRLRKLEEVHKNTGSKILKEYNVSNTQLQSDRLYLYLLQDGKDMYTGKELDYDNLSQYDIDHIIPQSFIKDNSIDNTVLTTQASNRGKSDNVPNIETVNKMKSFWYKQLKSGAISQRKFDHLTKAERGALSDFDKAGFIKRQLVETRQITKHVAQILDSRFNSNLTEDSKSNRNVKIITLKSKMVSDFRKDFGFYKLREVNDYHHAQDAYLNAVVGTALLKKYPKLEAEFVYGDYKHYDLAKLMIQPDSSLGKATTRMFFYSNLMNFFKKEIKLADDTIFTRPQIEVNTETGEIVWDKVKDMQTIRKVMSYPQVNIVMKTEVQTGGFSKESIWPKGDSDKLIARKKSWDPKKYGGFDSPIIAYSVLVVAKIAKGKTQKLKTIKELVGIKIMEQDEFEKDPIAFLEKKGYQDIQTSSIIKLPKYSLFELENGRKRLLASAKELQKGNELALPNKYVKFLYLASHYTKFTGKEEDREKKRSYVESHLYYFDVRLSQVFRVTNVEF

25 а.к. последовательность
Cas9 из Belliella baltica MKKILGLDLGTTSIGWAFIKEPEKDVVGSEIVDMGVRIVPLSSDEENDFAKGNTISINADRTLKRGARRNLQRFKQRRNALLEIFKEKKLISTNFKYAEDGPSSTFSTLNLRAKAAKEKIELQDLVKVLLQINKKRGYKSSRKAKSEEDDGSAIDSMGIAKELYENDLTPGQWVYEALQKGRKNVPDFYRSDLQEEFKKIVNYQSEFFPDIFNASFVEDWMGKASTPTKQYFNKKGVQLAENKGKREERRLQEYKWRAEAVNFKIDLSEIALILSQINSQISNSSGYLGAISDRSKELYFKNLTVGQYLYQQIKKNPHTRLKGQVFYRQDYLDEFERIWSVQSSFYPQLNDALKREVRDITIFFQRRLKSQKHLISNCEFEDHHKVVPKSHPVFQEFRIWQNLNNLLLIKKDNLNEKFDLELESKIALANELAFKRELNVKDALKILGLKPNEWEFNFTKIEGNRTNQAFFDAFAKIIELEDGEPIDLGDLKADDILDQFSEAFLRIGIDTELLQVNSDIEGAEYEKQSYIQFWHLLYSSEDDQKLKLNLIRKFGFKPEHAKILASISLQDDHASLSSRAIKKILPHLQSGLIYDKACTYAGYNHSSSFTKDENEKRELRAELELLKKNSLRNPVVEKILNQMINVVNAILKDPELGRPDEIRVEMARELKANAEQRKNMTSNIASATRDHDKYREILKSEFGLKRVTKNDLLRYKLWLETDGISLYTGKPIEASKLFSKEYDIEHIIPKARLFDDSFSNKTICERQLNIDKANVTAFSFLQNKLSADEFEQYQSRVKSLYGKLSKAKIQKLLMANDKIPEDFIARQLQETRYISKKAKEILFEISRRVSVTTGTITDKLREDWGLVEIMKELNWEKYDKLGLTYTIEGKHGERLNKIKDWSKRNDHRHHAMDALTVALTKPAYIQYLNNLNAKGLNNKKGTEVFAIEQKYLKRENGKLCFIPPIENIRSEAKKHLSRILVSYKAKNKVVTINKNKTKSKAGLNEQIALTPRGQLHKETVYGKSFHYSTKFEKIGASFNVQKINTVAKKEEREALLKRLAENGNDPKKAFTGKNTLNKMPIYLDLGKNIKLSEKVKTVVLEQNYTIRKNIDPDLKVDKVIDVGIKRILESRLEEFGGNAKLAFSNLEENPIWLNKEKGISIKRVKISGVSNVESLHVKKDHFGEPILDQEGNEIPVDFVSTGNNHHVAIYEDENGNLQEEVVSFFEAVVRQNQGLPIIKKNHTLGWKFLFTLKQNEYFVFPSDDFVPADVDLMDEQNYHLISPNLFRVQKIARKNYVFNNHLETKAVDNDLLKSKKELSKITYHFYQTPEHLRGIIKIRINHLGKIIQIGEY

26 а.к. последовательность
Cas9 из Psychroflexus torquisi MKRILGLDLGTNSIGWSLIEHDFKNKQGQIEGLGVRIIPMSQEILGKFDAGQSISQTADRTKYRGVRRLYQRDNLRRERLHRVLKILDFLPKHYSESIDFQDKVGQFKPKQEVKLNYRKNEKNKHEFVFMNSFIEMVSEFKNAQPELFYNKGNGEETKIPYDWTLYYLRKKALTQQITKEELAWLILNFNQKRGYYQLRGEDIDEDKNKKYMQLKVNNLIDSGAKVKGKVLYNVIFDNGWKYEKQIVNKDEWEGRTKEFIITTKTLKNGNIKRTYKAVDSEIDWAAIKAKTEQDINKANKTVGEYIYESLLDNPSQKIRGKLVKTIERKFYKEEFEKLLSKQIELQPELFNESLYKACIKELYPRNENHQSNNKKQGFEYLFTEDIIFYQRPLKSQKSNISGCQFEHKIYKQKNKKTGKLELIKEPIKTISRSHPLFQEFRIWQWLQNLKIYNKEKIENGKLEDVTTQLLPNNEAYVTLFDFLNTKKELEQKQFIEYFVKKKLIDKKEKEHFRWNFVEDKKYPFSETRAQFLSRLAKVKGIKNTEDFLNKNTQVGSKENSPFIKRIEQLWHIIYSVSDLKEYEKALEKFAEKHNLEKDSFLKNFKKFPPFVSDYASYSKKAISKLLPIMRMGKYWSESAVPTQVKERSLSIMERVKVLPLKEGYSDKDLADLLSRVSDDDIPKQLIKSFISFKDKNPLKGLNTYQANYLVYGRHSETGDIQHWKTPEDIDRYLNNFKQHSLRNPIVEQVVMETLRVVRDIWEHYGNNEKDFFKEIHVELGREMKSPAGKREKLSQRNTENENTNHRIREVLKELMNDASVEGGVRDYSPSQQEILKLYEEGIYQNPNTNYLKVDEDEILKIRKKNNPTQKEIQRYKLWLEQGYISPYTGKIIPLTKLFTHEYQIEHIIPQSRYYDNSLGNKIICESEVNEDKDNKTAYEYLKVEKGSIVFGHKLLNLDEYEAHVNKYFKKNKTKLKNLLSEDIPEGFINRQLNDSRYISKLVKGLLSNIVRENGEQEATSKNLIPVTGVVTSKLKQDWGLNDKWNEIIAPRFKRLNKLTNSNDFGFWDNDINAFRIQVPDSLIKGFSKKRIDHRHHALDALVVACTSRNHTHYLSALNAENKNYSLRDKLVIKNENGDYTKTFQIPWQGFTIEAKNNLEKTVVSFKKNLRVINKTNNKFWSYKDENGNLNLGKDGKPKKKLRKQTKGYNWAIRKPLHKETVSGIYNINAPKNKIATSVRTLLTEIKNEKHLAKITDLRIRETILPNHLKHYLNNKGEANFSEAFSQGGIEDLNKKITTLNEGKKHQPIYRVKIFEVGSKFSISEDENSAKSKKYVEAAKGTNLFFAIYLDEENKKRNYETIPLNEVITHQKQVAGFPKSERLSVQPDSQKGTFLFTLSPNDLVYVPNNEELENRDLFNLGNLNVEQISRIYKFTDSSDKTCNFIPFQVSKLIFNLKKKEQKKLDVDFIIQNEFGLGSPQSKNQKSIDDVMIKEKCIKLKIDRLGNISKA

27 а.к. последовательность
Cas9 из Streptococcus thermophilus MTKPYSIGLDIGTNSVGWAVTTDNYKVPSKKMKVLGNTSKKYIKKNLLGVLLFDSGITAEGRRLKRTARRRYTRRRNRILYLQEIFSTEMATLDDAFFQRLDDSFLVPDDKRDSKYPIFGNLVEEKAYHDEFPTIYHLRKYLADSTKKADLRLVYLALAHMIKYRGHFLIEGEFNSKNNDIQKNFQDFLDTYNAIFESDLSLENSKQLEEIVKDKISKLEKKDRILKLFPGEKNSGIFSEFLKLIVGNQADFRKCFNLDEKASLHFSKESYDEDLETLLGYIGDDYSDVFLKAKKLYDAILLSGFLTVTDNETEAPLSSAMIKRYNEHKEDLALLKEYIRNISLKTYNEVFKDDTKNGYAGYIDGKTNQEDFYVYLKKLLAEFEGADYFLEKIDREDFLRKQRTFDNGSIPYQIHLQEMRAILDKQAKFYPFLAKNKERIEKILTFRIPYYVGPLARGNSDFAWSIRKRNEKITPWNFEDVIDKESSAEAFINRMTSFDLYLPEEKVLPKHSLLYETFNVYNELTKVRFIAESMRDYQFLDSKQKKDIVRLYFKDKRKVTDKDIIEYLHAIYGYDGIELKGIEKQFNSSLSTYHDLLNIINDKEFLDDSSNEAIIEEIIHTLTIFEDREMIKQRLSKFENIFDKSVLKKLSRRHYTGWGKLSAKLINGIRDEKSGNTILDYLIDDGISNRNFMQLIHDDALSFKKKIQKAQIIGDEDKGNIKEVVKSLPGSPAIKKGILQSIKIVDELVKVMGGRKPESIVVEMARENQYTNQGKSNSQQRLKRLEKSLKELGSKILKENIPAKLSKIDNNALQNDRLYLYYLQNGKDMYTGDDLDIDRLSNYDIDHIIPQAFLKDNSIDNKVLVSSASNRGKSDDVPSLEVVKKRKTFWYQLLKSKLISQRKFDNLTKAERGGLSPEDKAGFIQRQLVETRQITKHVARLLDEKFNNKKDENNRAVRTVKIITLKSTLVSQFRKDFELYKVREINDFHHAHDAYLNAVVASALLKKYPKLEPEFVYGDYPKYNSFRERKSATEKVYFYSNIMNIFKKSISLADGRVIERPLIEVNEETGESVWNKESDLATVRRVLSYPQVNVVKKVEEQNHGLDRGKPKGLFNANLSSKPKPNSNENLVGAKEYLDPKKYGGYAGISNSFTVLVKGTIEKGAKKKITNVLEFQGISILDRINYRKDKLNFLLEKGYKDIELIIELPKYSLFELSDGSRRMLASILSTNNKRGEIHKGNQIFLSQKFVKLLYHAKRISNTINENHRKYVENHKKEFEELFYYILEFNENYVGAKKNGKLLNSAFQSWQNHSIDELCSSFIGPTGSERKGLFELTSRGSAADFEFLGVKIPRYRDYTPSSLLKDATLIHQSVTGLYETRIDLAKLGEG

28 а.к. последовательность
Cas9 из Listeria innocua MKKPYTIGLDIGTNSVGWAVLTDQYDLVKRKMKIAGDSEKKQIKKNFWGVRLFDEGQTAADRRMARTARRRIERRRNRISYLQGIFAEEMSKTDANFFCRLSDSFYVDNEKRNSRHPFFATIEEEVEYHKNYPTIYHLREELVNSSEKADLRLVYLALAHIIKYRGNFLIEGALDTQNTSVDGIYKQFIQTYNQVFASGIEDGSLKKLEDNKDVAKILVEKVTRKEKLERILKLYPGEKSAGMFAQFISLIVGSKGNFQKPFDLIEKSDIECAKDSYEEDLESLLALIGDEYAELFVAAKNAYSAVVLSSIITVAETETNAKLSASMIERFDTHEEDLGELKAFIKLHLPKHYEEIFSNTEKHGYAGYIDGKTKQADFYKYMKMTLENIEGADYFIAKIEKENFLRKQRTFDNGAIPHQLHLEELEAILHQQAKYYPFLKENYDKIKSLVTFRIPYFVGPLANGQSEFAWLTRKADGEIRPWNIEEKVDFGKSAVDFIEKMTNKDTYLPKENVLPKHSLCYQKYLVYNELTKVRYINDQGKTSYFSGQEKEQIFNDLFKQKRKVKKKDLELFLRNMSHVESPTIEGLEDSFNSSYSTYHDLLKVGIKQEILDNPVNTEMLENIVKILTVFEDKRMIKEQLQQFSDVLDGVVLKKLERRHYTGWGRLSAKLLMGIRDKQSHLTILDYLMNDDGLNRNLMQLINDSNLSFKSIIEKEQVTTADKDIQSIVADLAGSPAIKKGILQSLKIVDELVSVMGYPPQTIVVEMARENQTTGKGKNNSRPRYKSLEKAIKEFGSQILKEHPTDNQELRNNRLYLYYLQNGKDMYTGQDLDIHNLSNYDIDHIVPQSFITDNSIDNLVLTSSAGNREKGDDVPPLEIVRKRKVFWEKLYQGNLMSKRKFDYLTKAERGGLTEADKARFIHRQLVETRQITKNVANILHQRFNYEKDDHGNTMKQVRIVTLKSALVSQFRKQFQLYKVRDVNDYHHAHDAYLNGVVANTLLKVYPQLEPEFVYGDYHQFDWFKANKATAKKQFYTNIMLFFAQKDRIIDENGEILWDKKYLDTVKKVMSYRQMNIVKKTEIQKGEFSKATIKPKGNSSKLIPRKTNWDPMKYGGLDSPNMAYAVVIEYAKGKNKLVFEKKIIRVTIMERKAFEKDEKAFLEEQGYRQPKVLAKLPKYTLYECEEGRRRMLASANEAQKGNQQVLPNHLVTLLHHAANCEVSDGKSLDYIESNREMFAELLAHVSEFAKRYTLAEANLNKINQLFEQNKEGDIKAIAQSFVDLMAFNAMGAPASFKFFETTIERKRYNNLKELLNSTIIYQSITGLYESRKRLDD

29 а.к. последовательность
Cas9 из Campylobacter jejuni MARILAFDIGISSIGWAFSENDELKDCGVRIFTKVENPKTGESLALPRRLARSARKRLARRKARLNHLKHLIANEFKLNYEDYQSFDESLAKAYKGSLISPYELRFRALNELLSKQDFARVILHIAKRRGYDDIKNSDDKEKGAILKAIKQNEEKLANYQSVGEYLYKEYFQKFKENSKEFTNVRNKKESYERCIAQSFLKDELKLIFKKQREFGFSFSKKFEEEVLSVAFYKRALKDFSHLVGNCSFFTDEKRAPKNSPLAFMFVALTRIINLLNNLKNTEGILYTKDDLNALLNEVLKNGTLTYKQTKKLLGLSDDYEFKGEKGTYFIEFKKYKEFIKALGEHNLSQDDLNEIAKDITLIKDEIKLKKALAKYDLNQNQIDSLSKLEFKDHLNISFKALKLVTPLMLEGKKYDEACNELNLKVAINEDKKDFLPAFNETYYKDEVTNPVVLRAIKEYRKVLNALLKKYGKVHKINIELAREVGKNHSQRAKIEKEQNENYKAKKDAELECEKLGLKINSKNILKLRLFKEQKEFCAYSGEKIKISDLQDEKMLEIDHIYPYSRSFDDSYMNKVLVFTKQNQEKLNQTPFEAFGNDSAKWQKIEVLAKNLPTKKQKRILDKNYKDKEQKNFKDRNLNDTRYIARLVLNYTKDYLDFLPLSDDENTKLNDTQKGSKVHVEAKSGMLTSALRHTWGFSAKDRNNHLHHAIDAVIIAYANNSIVKAFSDFKKEQESNSAELYAKKISELDYKNKRKFFEPFSGFRQKVLDKIDEIFVSKPERKKPSGALHEETFRKEEEFYQSYGGKEGVLKALELGKIRKVNGKIVKNGDMFRVDIFKHKKTNKFYAVPIYTMDFALKVLPNKAVARSKKGEIKDWILMDENYEFCFSLYKDSLILIQTKDMQEPEFVYYNAFTSSTVSLIVSKHDNKFETLSKNQKILFKNANEKEVIAKSIGIQNLKVFEKYIVSALGEVTKAEFRQREDFKK

30 а.к. последовательность
Cas9 из Neisseria meningitidis MAAFKPNPINYILGLDIGIASVGWAMVEIDEDENPICLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVADNAHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLKDRIQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSAKRLDEGVSVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPAKAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVRNHNGIADNATMVRVDVFEKGDKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWQLIDDSFNFKFSLHPNDLVEVITKKARMFGYFASCHRGTGNINIRIHDLDHKIGKNGILEGIGVKTALSFQKYQIDELGKEIRPCRLKKRPPVR

31 а.к. последовательность
Cas9 из Streptococcus pyogenes MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSLHEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

32 н.к. последовательность цинк-пальцевого белка (ZFP) atggcccaggctgctcttgagcccggagagaaaccctacaagtgcccggagtgcggaaagtccttctctgagcggagtcacctccgagagcaccagcggactcatacgggcgaaaaaccatacaagtgcccagaatgtggtaaatctttttctcgggctgacaacctgactgaacatcagcgcacgcacaccggtgaaaaaccttacaagtgtccagagtgtggcaagagcttttctagtagaaggacctgtcgagcgcatcagcggactcacaccggcgaaaaaccctataagtgtccggaatgtggaaagagctttagccgcaacgacacccttactgaacaccagcgaacacacacgggagaaaaaccatataaatgtccggaatgtggcaaaagttttagtcggagtgataaacttacggagcaccaacggacacacaccggagagaagccatataagtgtcctgaatgtggaaagtccttctcacagcttgctcatctgcgagcacatcagcgcacacacacc 33 а.к. последовательность ZFP MAQAALEPGEKPYKCPECGKSFSERSHLREHQRTHTGEKPYKCPECGKSFSRADNLTEHQRTHTGEKPYKCPECGKSFSSRRTCRAHQRTHTGEKPYKCPECGKSFSRNDTLTEHQRTHTGEKPYKCPECGKSFSRSDKLTEHQRTHTGEKPYKCPECGKSFSQLAHLRAHQRTHT 34 н.к. последовательность ZNF-E2C atggcgcaggcggcgctggaaccgggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagccgcaaagatagcctggtgcgccatcagcgcacccataccggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagccagagcggcgatctgcgccgccatcagcgcacccataccggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagcgattgccgcgatctggcgcgccatcagcgcacccataccggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagccagagcagccatctggtgcgccatcagcgcacccataccggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagcgattgccgcgatctggcgcgccatcagcgcacccataccggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagccgcagcgataaactggtgcgccatcagcgcacccataccggcaaaaaaaccagcggccaggcgggc 35 а.к. последовательность ZNF-E2C MAQAALEPGEKPYKCPECGKSFSRKDSLVRHQRTHTGEKPYKCPECGKSFSQSGDLRRHQRTHTGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPECGKSFSQSSHLVRHQRTHTGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPECGKSFSRSDKLVRHQRTHTGKKTSGQAG 36 н.к. последовательность ZNF-E3 atggcgcaggcggcgctggaaccgggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagcgatccgggcgcgctggtgcgccatcagcgcacccataccggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagccagagcagccatctggtgcgccatcagcgcacccataccggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagcgattgccgcgatctggcgcgccatcagcgcacccataccggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagccagagcagccatctggtgcgccatcagcgcacccataccggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagcgattgccgcgatctggcgcgccatcagcgcacccataccggcgaaaaaccgtataaatgcccggaatgcggcaaaagctttagccagagcagccatctggtgcgccatcagcgcacccataccggcaaaaaaaccagcggccaggcgggc 37 а.к. последовательность ZNF-E3 MAQAALEPGEKPYKCPECGKSFSDPGALVRHQRTHTGEKPYKCPECGKSFSQSSHLVRHQRTHTGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPECGKSFSQSSHLVRHQRTHTGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPECGKSFSQSSHLVRHQRTHTGKKTSGQAG 38 н.к. последовательность ZNF-TRCa atggcgcaggcggctcttgaacccggggagaaaccctataaatgccctgagtgtggcaagagtttttcaaccacaggaaacttgacagtccaccaacggacccacaccggcgagaaaccatacaagtgtccggagtgtggtaagtctttctcaagtcctgccgaccttaccagacatcaacgcacacatacaggtgaaaaaccttacaagtgcccagagtgcggaaaaagtttttcacaatctggcgacctccgcaggcaccagcgcactcacaccggtgaaaaaccatacaagtgtcctgagtgcgggaagagttttagtcaacgagctcatctggagcgacaccaaaggactcatactggggagaaaccgtacaaatgtcccgaatgtgggaagagcttctctaccaagaattcccttacagagcaccagcgcacgcatacgggagagaagccgtataagtgtccggaatgtggcaagagcttttccagaagtgaccaccttacaacccaccagaggacgcacacc

39 а.к. последовательность ZNF-TRCa MAQAALEPGEKPYKCPECGKSFSTTGNLTVHQRTHTGEKPYKCPECGKSFSSPADLTRHQRTHTGEKPYKCPECGKSFSQSGDLRRHQRTHTGEKPYKCPECGKSFSQRAHLERHQRTHTGEKPYKCPECGKSFSTKNSLTEHQRTHTGEKPYKCPECGKSFSRSDHLTTHQRTHT 40 сайт AAVS1 agacggccgcgtcagagc 41 а.к. последовательность
цинк-пальцевого домена 1 ERSHLRE 42 а.к. последовательность
цинк-пальцевого домена 2 RADNLTE 43 а.к. последовательность
цинк-пальцевого домена 3 SRRTCRA 44 а.к. последовательность
цинк-пальцевого домена 4 RNDTLTE 45 а.к. последовательность
цинк-пальцевого домена 5 RSDKLTE 46 а.к. последовательность
цинк-пальцевого домена 6 QLAHLRA 47 сигнал ядерной локализации atggctccaaagaaaaagaggaaagtgggaatccacggagtccccgccgct 48 н.к. последовательность линкера GGSx3 ggtggatctggcggtggatctggtggcggt 49 а.к. последовательность линкера GGSx3 GGSGGGSGGG 50 н.к. последовательность линкера GGSx4 ggagggagtggtgggtccggtggtagtggcggatcc 51 а.к. последовательность линкера GGSx4 GGSGGSGGSGGS 52 н.к. последовательность линкера GGSx5 ggaggctccggtgggtctggtgggagcggtggtagtggcggatcc 53 а.к. последовательность линкера GGSx5 GGSGGSGGSGGSGGS 54 н.к. последовательность линкера GGSx6 ggaggcagtggtgggagcggtggttccgggggtagtggtggttccgggggatcc 55 а.к. последовательность линкера GGSx6 GGSGGSGGSGGSGGSGGS 56 н.к. последовательность линкера GGSx7 ggaggttctggaggctccggtgggtccgggggaagtggggggtcaggcggatcaggaggatcc 57 а.к. последовательность линкера GGSx7 GGSGGSGGSGGSGGSGGSGGS 58 н.к. последовательность линкера GGSx8 ggaggtagcggaggttccggagggagcggcgggagtgggggaagcgggggaagtggaggatccgggggaggatcc 59 а.к. последовательность линкера GGSx8 GGSGGSGGSGGSGGSGGSGGS 60 н.к. последовательность линкера XTEN tccggtagcgaaacaccggggacttcagaatcggccaccccggagtct 61 а.к. последовательность линкера XTEN SGSETPGTSESATPES 62 н.к. последовательность линкера B ggaagcgccggtagtgcggctgggtctggcgagttc 63 а.к. последовательность линкера B GSAGSAAGSGEF

64 н.к. последовательность
Cas9 человека (hCas9) atggacaagaagtactccattgggctcgatatcggcacaaacagcgtcggctgggccgtcattacggacgagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgccacagcataaagaagaacctcattggcgccctcctgttcgactccggggagacggccgaagccacgcggctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgctacctgcaggagatctttagtaatgagatggctaaggtggatgactctttcttccataggctggaggagtcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggcaatatcgtggacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaagaagcttgtagacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcatatgatcaaatttcggggacacttcctcatcgagggggacctgaacccagacaacagcgatgtcgacaaactctttatccaactggttcagacttacaatcagcttttcgaagagaacccgatcaacgcatccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccggcggctcgaaaacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaatcttatcgccctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaagatgccaagcttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcccagatcggcgaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccattctgctgagtgatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagtatgatcaagcgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcagacagcaactgcctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgccggatacattgacggcggagcaagccaggaggaattttacaaatttattaagcccatcttggaaaaaatggacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgcaaacagcgcactttcgacaatggaagcatcccccaccagattcacctgggcgaactgcacgctatcctcaggcggcaagaggatttctacccctttttgaaagataacagggaaaagattgagaaaatcctcacatttcggataccctactatgtaggccccctcgcccggggaaattccagattcgcgtggatgactcgcaaatcagaagagaccatcactccctggaacttcgaggaagtcgtggataagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaaaatctgcctaacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtttataacgagctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctgtctggagagcagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttaccgtgaaacagctcaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatcagcggagtggaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatcattaaagacaaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtcctcacccttacgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgctcatctcttcgacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatgggggcggctgtcaagaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctggattttcttaagtccgatggatttgccaaccggaacttcatgcagttgatccatgatgactctctcacctttaaggaggacatccagaaagcacaagtttctggccagggggacagtcttcacgagcacatcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagaccgttaaggtcgtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgttatcgagatggcccgagagaaccaaactacccagaagggacagaagaacagtagggaaaggatgaagaggattgaagagggtataaaagaactggggtcccaaatccttaaggaacacccagttgaaaacacccagcttcagaatgagaagctctacctgtactacctgcagaacggcagggacatgtacgtggatcaggaactggacatcaatcggctctccgactacgacgtggatcatatcgtgccccagtcttttctcaaagatgattctattgataataaagtgttgacaagatccgataaaaatagagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaaaattattggcggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctgactaaggctgaacgaggtggcctgtctgagttggataaagccggcttcatcaaaaggcagcttgttgagacacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaacaccaagtacgatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtctaagctggtctcagatttcagaaaggactttcagttttataaggtgagagagatcaacaattaccaccatgcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaatatcccaagcttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaaatgatcgcaaagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagcaatattatgaattttttcaagaccgagattacactggccaatggagagattcggaagcgaccacttatcgaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttcgcgacagtccggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagtacagaccggaggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatcgcacgcaaaaaagattgggaccccaagaaatacggcggattcgattctcctacagtcgcttacagtgtactggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtcaaggaactgctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgactttctcgaggcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaagtactctctctttgagcttgaaaacggccggaaacgaatgctcgctagtgcgggcgagctgcagaaaggtaacgagctggcactgccctctaaatacgttaatttcttgtatctggccagccactatgaaaagctcaaagggtctcccgaagataatgagcagaagcagctgttcgtggaacaacacaaacactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtgatcctcgccgacgctaacctcgataaggtgctttctgcttacaataagcacagggataagcccatcagggagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcgcctgcagccttcaagtacttcgacaccaccatagacagaaagcggtacacctctacaaaggaggtcctggacgccacactgattcatcagtcaattacggggctctatgaaacaagaatcgacctctctcagctcggtggagac

65 н.к. последовательность
никазы Cas9 (nCas9) atggacaagaagtactccattgggctcgctatcggcacaaacagcgtcggctgggccgtcattacggacgagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgccacagcataaagaagaacctcattggcgccctcctgttcgactccggggagacggccgaagccacgcggctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgctacctgcaggagatctttagtaatgagatggctaaggtggatgactctttcttccataggctggaggagtcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggcaatatcgtggacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaagaagcttgtagacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcatatgatcaaatttcggggacacttcctcatcgagggggacctgaacccagacaacagcgatgtcgacaaactctttatccaactggttcagacttacaatcagcttttcgaagagaacccgatcaacgcatccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccggcggctcgaaaacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaatcttatcgccctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaagatgccaagcttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcccagatcggcgaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccattctgctgagtgatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagtatgatcaagcgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcagacagcaactgcctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgccggatacattgacggcggagcaagccaggaggaattttacaaatttattaagcccatcttggaaaaaatggacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgcaaacagcgcactttcgacaatggaagcatcccccaccagattcacctgggcgaactgcacgctatcctcaggcggcaagaggatttctacccctttttgaaagataacagggaaaagattgagaaaatcctcacatttcggataccctactatgtaggccccctcgcccggggaaattccagattcgcgtggatgactcgcaaatcagaagagaccatcactccctggaacttcgaggaagtcgtggataagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaaaatctgcctaacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtttataacgagctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctgtctggagagcagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttaccgtgaaacagctcaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatcagcggagtggaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatcattaaagacaaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtcctcacccttacgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgctcatctcttcgacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatgggggcggctgtcaagaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctggattttcttaagtccgatggatttgccaacaggaacttcatgcagttgatccatgatgactctctcacctttaaggaggacatccagaaagcacaagtttctggccagggggacagtcttcacgagcacatcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagaccgttaaggtcgtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgttatcgagatggcccgagagaaccaaactacccagaagggacagaagaacagtagggaaaggatgaagaggattgaagagggtataaaagaactggggtcccaaatccttaaggaacacccagttgaaaacacccagcttcagaatgagaagctctacctgtactacctgcagaacggcagggacatgtacgtggatcaggaactggacatcaatcggctctccgactacgacgtggatcatatcgtgccccagtcttttctcaaagatgattctattgataataaagtgttgacaagatccgataaaaatagagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaaaattattggcggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctgactaaggctgaacgaggtggcctgtctgagttggataaagccggcttcatcaaaaggcagcttgttgagacacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaacaccaagtacgatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtctaagctggtctcagatttcagaaaggactttcagttttataaggtgagagagatcaacaattaccaccatgcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaatatcccaagcttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaaatgatcgcaaagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagcaatattatgaattttttcaagaccgagattacactggccaatggagagattcggaagcgaccacttatcgaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttcgcgacagtccggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagtacagaccggaggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatcgcacgcaaaaaagattgggaccccaagaaatacggcggattcgattctcctacagtcgcttacagtgtactggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtcaaggaactgctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgactttctcgaggcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaagtactctctctttgagcttgaaaacggccggaaacgaatgctcgctagtgcgggcgagctgcagaaaggtaacgagctggcactgccctctaaatacgttaatttcttgtatctggccagccactatgaaaagctcaaagggtctcccgaagataatgagcagaagcagctgttcgtggaacaacacaaacactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtgatcctcgccgacgctaacctcgataaggtgctttctgcttacaataagcacagggataagcccatcagggagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcgcctgcagccttcaagtacttcgacaccaccatagacagaaagcggtacacctctacaaaggaggtcctggacgccacactgattcatcagtcaattacggggctctatgaaacaagaatcgacctctctcagctcggtggagac

66 н.к. последовательность
«мертвой» Cas9 (dCas9) atggacaagaagtactccattgggctcgctatcggcacaaacagcgtcggctgggccgtcattacggacgagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgccacagcataaagaagaacctcattggcgccctcctgttcgactccggggagacggccgaagccacgcggctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgctacctgcaggagatctttagtaatgagatggctaaggtggatgactctttcttccataggctggaggagtcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggcaatatcgtggacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaagaagcttgtagacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcatatgatcaaatttcggggacacttcctcatcgagggggacctgaacccagacaacagcgatgtcgacaaactctttatccaactggttcagacttacaatcagcttttcgaagagaacccgatcaacgcatccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccggcggctcgaaaacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaatcttatcgccctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaagatgccaagcttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcccagatcggcgaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccattctgctgagtgatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagtatgatcaagcgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcagacagcaactgcctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgccggatacattgacggcggagcaagccaggaggaattttacaaatttattaagcccatcttggaaaaaatggacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgcaaacagcgcactttcgacaatggaagcatcccccaccagattcacctgggcgaactgcacgctatcctcaggcggcaagaggatttctacccctttttgaaagataacagggaaaagattgagaaaatcctcacatttcggataccctactatgtaggccccctcgcccggggaaattccagattcgcgtggatgactcgcaaatcagaagagaccatcactccctggaacttcgaggaagtcgtggataagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaaaatctgcctaacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtttataacgagctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctgtctggagagcagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttaccgtgaaacagctcaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatcagcggagtggaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatcattaaagacaaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtcctcacccttacgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgctcatctcttcgacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatgggggcggctgtcaagaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctggattttcttaagtccgatggatttgccaaccggaacttcatgcagttgatccatgatgactctctcacctttaaggaggacatccagaaagcacaagtttctggccagggggacagtcttcacgagcacatcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagaccgttaaggtcgtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgttatcgagatggcccgagagaaccaaactacccagaagggacagaagaacagtagggaaaggatgaagaggattgaagagggtataaaagaactggggtcccaaatccttaaggaacacccagttgaaaacacccagcttcagaatgagaagctctacctgtactacctgcagaacggcagggacatgtacgtggatcaggaactggacatcaatcggctctccgactacgacgtggctgctatcgtgccccagtcttttctcaaagatgattctattgataataaagtgttgacaagatccgataaagctagagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaaaattattggcggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctgactaaggctgaacgaggtggcctgtctgagttggataaagccggcttcatcaaaaggcagcttgttgagacacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaacaccaagtacgatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtctaagctggtctcagatttcagaaaggactttcagttttataaggtgagagagatcaacaattaccaccatgcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaatatcccaagcttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaaatgatcgcaaagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagcaatattatgaattttttcaagaccgagattacactggccaatggagagattcggaagcgaccacttatcgaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttcgcgacagtccggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagtacagaccggaggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatcgcacgcaaaaaagattgggaccccaagaaatacggcggattcgattctcctacagtcgcttacagtgtactggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtcaaggaactgctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgactttctcgaggcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaagtactctctctttgagcttgaaaacggccggaaacgaatgctcgctagtgcgggcgagctgcagaaaggtaacgagctggcactgccctctaaatacgttaatttcttgtatctggccagccactatgaaaagctcaaagggtctcccgaagataatgagcagaagcagctgttcgtggaacaacacaaacactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtgatcctcgccgacgctaacctcgataaggtgctttctgcttacaataagcacagggataagcccatcagggagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcgcctgcagccttcaagtacttcgacaccaccatagacagaaagcggtacacctctacaaaggaggtcctggacgccacactgattcatcagtcaattacggggctctatgaaacaagaatcgacctctctcagctcggtggagac

67 н.к. последовательность
гиперактивной транспозазы PiggyBac (PB) atgggcagcagcctggacgacgagcacatcctgagcgccctgctgcagagcgacgacgagctggtcggcgaggacagcgacagcgaggtgagcgaccacgtgagcgaggacgacgtgcagtccgacaccgaggaggccttcatcgacgaggtgcacgaggtgcagcctaccagcagcggctccgagatcctggacgagcagaacgtgatcgagcagcccggcagctccctggccagcaacaggatcctgaccctgccccagaggaccatcaggggcaagaacaagcactgctggtccacctccaagcccaccaggcggagcagggtgtccgccctgaacatcgtgagaagccagaggggccccaccaggatgtgcaggaacatctacgaccccctgctgtgcttcaagctgttcttcaccgacgagatcatcagcgagatcgtgaagtggaccaacgccgagatcagcctgaagaggcgggagagcatgacctccgccaccttcagggacaccaacgaggacgagatctacgccttcttcggcatcctggtgatgaccgccgtgaggaaggacaaccacatgagcaccgacgacctgttcgacagatccctgagcatggtgtacgtgagcgtgatgagcagggacagattcgacttcctgatcagatgcctgaggatggacgacaagagcatcaggcccaccctgcgggagaacgacgtgttcacccccgtgagaaagatctgggacctgttcatccaccagtgcatccagaactacacccctggcgcccacctgaccatcgacgagcagctgctgggcttcaggggcaggtgccccttcagggtctatatccccaacaagcccagcaagtacggcatcaagatcctgatgatgtgcgacagcggcaccaagtacatgatcaacggcatgccctacctgggcaggggcacccagaccaacggcgtgcccctgggcgagtactacgtgaaggagctgtccaagcccgtccacggcagctgcagaaacatcacctgcgacaactggttcaccagcatccccctggccaagaacctgctgcaggagccctacaagctgaccatcgtgggcaccgtgagaagcaacaagagagagatccccgaggtcctgaagaacagcaggtccaggcccgtgggcaccagcatgttctgcttcgacggccccctgaccctggtgtcctacaagcccaagcccgccaagatggtgtacctgctgtccagctgcgacgaggacgccagcatcaacgagagcaccggcaagccccagatggtgatgtactacaaccagaccaagggcggcgtggacaccctggaccagatgtgcagcgtgatgacctgcagcagaaagaccaacaggtggcccatggccctgctgtacggcatgatcaacatcgcctgcatcaacagcttcatcatctacagccacaacgtgagcagcaagggcgagaaggtgcagagccggaaaaagttcatgcggaacctgtacatgggcctgacctccagcttcatgaggaagaggctggaggcccccaccctgaagagatacctgagggacaacatcagcaacatcctgcccaaagaggtgcccggcaccagcgacgacagcaccgaggagcccgtgatgaagaagaggacctactgcacctactgtcccagcaagatcagaagaaaggccagcgccagctgcaagaagtgtaagaaggtcatctgccgggagcacaacatcgacatgtgccagagctgtttc

68 н.к. последовательность
гиперактивной транспозазы Sleeping Beauty (SB100) atgggaaaatcaaaagaaatcagccaagacctcagaaaaagaattgtagacctccacaagtctggttcatccttgggagcaatttccaaacgcctggcggtaccacgttcatctgtacaaacaatagtacgcaagtataaacaccatgggaccacgcagccgtcataccgctcaggaaggagacgcgttctgtctcctagagatgaacgtactttggtgcgaaaagtgcaaatcaatcccagaacaacagcaaaggaccttgtgaagatgctggaggaaacaggtacaaaagtatctatatccacagtaaaacgagtcctatatcgacataacctgaaaggccactcagcaaggaagaagccactgctccaaaaccgacataagaaagccagactacggtttgcaactgcacatggggacaaagatcgtactttttggagaaatgtcctctggtctgatgaaacaaaaatagaactgtttggccataatgaccatcgttatgtttggaggaagaagggggaggcttgcaagccgaagaacaccatcccaaccgtgaagcacgggggtggcagcatcatgttgtgggggtgctttgctgcaggagggactggtgcacttcacaaaatagatggcatcatggacgccgtgcagtatgtggatatattgaagcaacatctcaagacatcagtcaggaagttaaagcttggtcgcaaatgggtcttccaacacgacaatgaccccaagcatacttccaaagttgtggcaaaatggcttaaggacaacaaagtcaaggtattggagtggccatcacaaagccctgacctcaatcctatagaaaatttgtgggcagaactgaaaaagcgtgtgcgagcaaggaggcctacaaacctgactcagttacaccagctctgtcaggaggaatgggccaaaattcacccaaattattgtgggaagcttgtggaaggctacccgaaacgtttgacccaagttaaacaatttaaaggcaatgctaccaaatac

69 а.к. последовательность
Cas9 человека (hCas9) MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

70 а.к. последовательность
никазы Cas9 (nCas9) MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

71 а.к. последовательность
«мертвой» Cas9 (dCas9) MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVAAIVPQSFLKDDSIDNKVLTRSDKARGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

72 а.к. последовательность
гиперактивной транспозазы PiggyBac (PB) MGSSLDDEHILSALLQSDDELVGEDSDSEVSDHVSEDDVQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLASNRILTLPQRTIRGKNKHCWSTSKPTRRSRVSALNIVRSQRGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLKRRESMTSATFRDTNEDEIYAFFGILVMTAVRKDNHMSTDDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTLRENDVFTPVRKIWDLFIHQCIQNYTPGAHLTIDEQLLGFRGRCPFRVYIPNKPSKYGIKILMMCDSGTKYMINGMPYLGRGTQTNGVPLGEYYVKELSKPVHGSCRNITCDNWFTSIPLAKNLLQEPYKLTIVGTVRSNKREIPEVLKNSRSRPVGTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINESTGKPQMVMYYNQTKGGVDTLDQMCSVMTCSRKTNRWPMALLYGMINIACINSFIIYSHNVSSKGEKVQSRKKFMRNLYMGLTSSFMRKRLEAPTLKRYLRDNISNILPKEVPGTSDDSTEEPVMKKRTYCTYCPSKIRRKASASCKKCKKVICREHNIDMCQSCF 73 а.к. последовательность
гиперактивной транспозазы Sleeping Beauty (SB100) MGKSKEISQDLRKRIVDLHKSGSSLGAISKRLAVPRSSVQTIVRKYKHHGTTQPSYRSGRRRVLSPRDERTLVRKVQINPRTTAKDLVKMLEETGTKVSISTVKRVLYRHNLKGHSARKKPLLQNRHKKARLRFATAHGDKDRTFWRNVLWSDETKIELFGHNDHRYVWRKKGEACKPKNTIPTVKHGGGSIMLWGCFAAGGTGALHKIDGIMDAVQYVDILKQHLKTSVRKLKLGRKWVFQHDNDPKHTSKVVAKWLKDNKVKVLEWPSQSPDLNPIENLWAELKKRVRARRPTNLTQLHQLCQEEWAKIHPNYCGKLVEGYPKRLTQVKQFKGNATKY

74 н.к. последовательность
домена cPPT/CTS IN ttttaaaagaaaaggggggattggggggtacagtgcaggggaaagaatagtagacataatagcaacagacatacaaactaaagaattacaaaaacaaattacaaaaattcaaaatttt 75 праймер GG-cPPT-Fw tcctctcgtctccattattttaaaagaaaaggggggatt 76 праймер GG-cPPT-STOP-Fw tcctctcgtctccattaatttaaaagaaaaggggggatt 77 праймер GG-cPPT-Rv tcctctcgtctccctgaaaaattttgaatttttgtaatttgtttttg 78 праймер GG-AAVS1-6d-Fw tcctctcgtctccattatatggctccaaagaaaaagagg 79 праймер GG-AAVS1-6d-Rv tcctctcgtctccctgatcaatcctcatcctgtctacttgccaca 80 праймер GG-AAVS1-6d (-NLS)-Fw tcctctcgtctccattatatggcccaggctgctct 81 праймер IN-Fw ttttagatggaatagataaggccc 82 праймер XbaI-pSICO_IC-5'Fw1 ctagctctagatggctaactagggaacccact 83 праймер SacI-pSICO_IC-5'Rv1 ctagcgagctcccaggctcagatctggtctaac 84 праймер XbaI-pSICO_IC-5'Fw2 ctagctctagactaactagggaacccactgc 85 праймер SacI-pSICO_IC-5'Rv2 cctctctatgggcagtctagcgagctcctggtctaaccagagagaccc 86 праймер XbaI-pSICO_IC-3'Fw1 ctagctctagatccctcagacccttttagtca 87 праймер SacI-pSICO_IC-3'Rv1 ctagcgagctccaacagacgggcacacacta 88 праймер XbaI-pSICO_IC-3'Fw2 ctagctctagaaaaatctctagcagcccatcc 89 праймер SacI-pSICO_IC-3'Rv2 cctctctatgggcagtctagcgagctcgacgggcacacactacttga 90 праймер CCD1-A128T-F tcaccagtactacagttaagaccgcctgttggtgg 91 праймер CCD1-A128T-R ccaccaacaggcggtcttaactgtagtactggtga 92 праймер CCD2-E170G-F acaggtaagagatcaggctggccatcttaagacagcagtac 93 праймер CCD2-E170G-R gtactgctgtcttaagatggccagcctgatctcttacctgt 94 праймер NTD1-E10/13K-F ggttttttagatggaatagataaggcccaaaaggaacataagaaatatcacagtaattggaga 95 праймер NTD1-E10/13K-R tctccaattactgtgatatttcttatgttccttttgggccttatctattccatctaaaaaacc 96 праймер Solubility-F185K-F aaatggcagtattcatccacaataagaaaagaaaaggggggattggggg 97 праймер Solubility-F185K-R cccccaatccccccttttcttttcttattgtggatgaatactgccattt 98 праймер NGS-aavs fw acactctttccctacacgacgctcttccgatctaggacagcatgtttgctgcct 99 праймер NGS-aavs rv gactggagttcagacgtgtgctcttccgatctgctccaggaaatgggggtg 100 праймер PB R245A cgtgttcacccccgtggcaaagatctgggacctg 101 праймер PB R275-277A agctgctgggcttcgcgggcgcgtgccccttcaggg 102 праймер PB R388A gaacagcaggtccgcgcccgtgggcacc 103 праймер PB S351A gacaactggttcaccgccatccccctggccaa 104 праймер PB W465A gaaagaccaacagggcgcccatggccctgc 105 праймер PB R372A-K375A catcgtgggcaccgtggcaagcaacgcgagagagatccccgag 106 праймер PB D450N gcgtggacaccctgaaccagatgtgcagc 107 праймер SYBR-WPRE-3_Fw acgctatgtggatacgctgct 108 праймер SYBR-WPRE-3_Rv agcaaacacagtgcacaccac 109 праймер SYBR-RNaseP_Fw ggagtgaggagggatgtgaa 110 праймер SYBR-RNaseP_Rv attgagggcactggaaattg 111 праймер Illumina специальный aatgatacggcgaccaccgagatctacacagctagacactctttccctacacgacgctcttccgatct 112 праймер NEBNext Index 9 caagcagaagacggcatacgagatctgatcgtgactggagttcagacgtgtgctcttccgatct 113 праймер NGS cluster 1 fw acactctttccctacacgacgctcttccgatct ctgcgggagaacgacgtgtt 114 праймер NGS cluster 2 rv gactggagttcagacgtgtgctcttccgatct cctcaccttcctcttcttcttgg 115 праймер CMV-F ctgcagcgcggggatctcatgctggagttcttcgcccacccc 116 праймер cas9 rv caccttcctcttcttcttggggtca 117 н.к. последовательность ZFP_TCRa4 atggctcctaagaagaagcggaaagtcggcatacacggagtgcctgctgcaatggcagaaaggccattccaatgcagaatatgcatgaggaacttctcagatcgcagtaacctctcaaggcatatacggacccatacgggggaaaaaccatttgcctgtgatatatgtggccgcaagttcgctcagaaagtgaccttggcagctcacactaagattcacacacatccaagagcccctatccctaagccgttccaatgtaggatatgcatgcgaaacttctctgatcggagtgcactgagtaggcacatcagaacacacacgggagaaaagcctttcgcttgcgatatctgcgggcggaagttcgcaacatccgggaatctcactcgccatacgaaaatacacactggcagccaaaaacctttccaatgccgaatatgtatgagaaattttagctacagaagttcattgaaagaacacattagaacccataccggagaaaagccgttcgcgtgcgatatctgcggtcggaagttcgctacctcaggcaacctgacacgccacacgaaaatccac

118 а.к. последовательность ZFP_TCRa4 MAPKKKRKVGIHGVPAAMAERPFQCRICMRNFSDRSNLSRHIRTHTGEKPFACDICGRKFAQKVTLAAHTKIHTHPRAPIPKPFQCRICMRNFSDRSALSRHIRTHTGEKPFACDICGRKFATSGNLTRHTKIHTGSQKPFQCRICMRNFSYRSSLKEHIRTHTGEKPFACDICGRKFATSGNLTRHTKIH 119 а.к. последовательность модифицированной гиперактивной PiggyBac SEQ ID NO: 9
с заменой R245A, R275A, R277A, R275A/R277A, G325A, N347A, N347S, S351E, S351P, S351A, R372A, K375A, R388A, D450N, W465A, T560A, S564P, S573A, M589V, S592G, F594L либо их комбинацией

120 а.к. последовательность модифицированной гиперактивной PiggyBac Top1 SEQ ID NO: 9
с заменой на A в положении 245,
на R или A в положении 275,
на R или A в положении 277,
на A или G в положении 325,
на N или A в положении 347,
на E, P или A в положении 351,
на R в положении 372,
на A в положении 375,
на D или N в положении 450
на W или A в положении 465
на T или A в положении 560,
на P или S в положении 564,
на S или A в положении 573,
на G или S в положении 592,
на L или F в положении 594 либо их комбинацией 121 а.к. последовательность модифицированной гиперактивной PiggyBac Top1.1 MGSSLDDEHILSALLQSDDELVGEDSDSEVSDHVSEDDVQSDT
EEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLASNRILTLPQR
TIRGKNKHCWSTSKPTRRSRVSALNIVRSQRGPTRMCRNIYDP
LLCFKLFFTDEIISEIVKWTNAEISLKRRESMTSATFRDTNEDEI
YAFFGILVMTAVRKDNHMSTDDLFDRSLSMVYVSVMSRDRF
DFLIRCLRMDDKSIRPTLRENDVFTPVAKIWDLFIHQCIQNYTP
GAHLTIDEQLLGFRGRCPFRVYIPNKPSKYGIKILMMCDSGTK
YMINGMPYLGRGTQTNGVPLAEYYVKELSKPVHGSCRNITCD
NWFTEIPLAKNLLQEPYKLTIVGTVRSNAREIPEVLKNSRSRPV
GTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINESTGKP
QMVMYYNQTKGGVDTL(D/N)QMCSVMTCSRKTNR(W/A)PM
ALLYGMINIACINSFIIYSHNVSSKGEKVQSRKKFMRNLYMGL
TSSFMRKRLEAPTLKRYLRDNISNILPKEVPGTSDDSTEEPVMK
KRTYCTYCPPKIRRKASASCKKCKKVICREHNIDMCQGCL
причем:
в положении 450 может быть D или N
в положении 465 может быть W или A 122 а.к. последовательность модифицированной гиперактивной PiggyBac Top1.2 MGSSLDDEHILSALLQSDDELVGEDSDSEVSDHVSEDD
VQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLA
SNRILTLPQRTIRGKNKHCWSTSKPTRRSRVSALNIVRSQ
RGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLK
RRESMTSATFRDTNEDEIYAFFGILVMTAVRKDNHMST
DDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTL
RENDVFTPVAKIWDLFIHQCIQNYTPGAHLTIDEQLLGF
AGACPFRVYIPNKPSKYGIKILMMCDSGTKYMINGMPY
LGRGTQTNGVPLGEYYVKELSKPVHGSCRNITCDAWFT
PIPLAKNLLQEPYKLTIVGTVRSNAREIPEVLKNSRSRPV
GTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINES
TGKPQMVMYYNQTKGGVDTL(D/N)QMCSVMTCSRKT
NR(W/A)PMALLYGMINIACINSFIIYSHNVSSKGEKVQSR
KKFMRNLYMGLTSSFMRKRLEAPTLKRYLRDNISNILP
KEVPGTSDDSTEEPVMKKRTYCAYCPSKIRRKASASCK
KCKKVICREHNIDMCQSCF
причем:
в положении 450 может быть D или N
в положении 465 может быть W или A 123 а.к. последовательность модифицированной гиперактивной PiggyBac Top1.3 MGSSLDDEHILSALLQSDDELVGEDSDSEVSDHVSEDD
VQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLA
SNRILTLPQRTIRGKNKHCWSTSKPTRRSRVSALNIVRSQ
RGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLK
RRESMTSATFRDTNEDEIYAFFGILVMTAVRKDNHMST
DDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTL
RENDVFTPVAKIWDLFIHQCIQNYTPGAHLTIDEQLLGF
RGRCPFRVYIPNKPSKYGIKILMMCDSGTKYMINGMPY
LGRGTQTNGVPLAEYYVKELSKPVHGSCRNITCDAWFT
AIPLAKNLLQEPYKLTIVGTVRSNAREIPEVLKNSRSRPV
GTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINES
TGKPQMVMYYNQTKGGVDTL(D/N)QMCSVMTCSRKT
NR(W/A)PMALLYGMINIACINSFIIYSHNVSSKGEKVQSR
KKFMRNLYMGLTSSFMRKRLEAPTLKRYLRDNISNILP
KEVPGTSDDSTEEPVMKKRTYCAYCPSKIRRKASAACK
KCKKVICREHNIDMCQSCF
причем:
в положении 450 может быть D или N
в положении 465 может быть W или A 124 а.к. последовательность модифицированной гиперактивной PiggyBac Regular 1 MGSSLDDEHILSALLQSDDELVGEDSDSEVSDHVSEDD
VQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLA
SNRILTLPQRTIRGKNKHCWSTSKPTRRSRVSALNIVRSQ
RGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLK
RRESMTSATFRDTNEDEIYAFFGILVMTAVRKDNHMST
DDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTL
RENDVFTPVRKIWDLFIHQCIQNYTPGAHLTIDEQLLGF
RGRCPFRVYIPNKPSKYGIKILMMCDSGTKYMINGMPY
LGRGTQTNGVPLGEYYVKELSKPVHGSCRNITCDAWFT
SIPLAKNLLQEPYKLTIVGTVASNKREIPEVLKNSRSRPV
GTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINES
TGKPQMVMYYNQTKGGVDTL(D/N)QMCSVMTCSRKT
NR(W/A)PMALLYGMINIACINSFIIYSHNVSSKGEKVQSR
KKFMRNLYMGLTSSFMRKRLEAPTLKRYLRDNISNILP
KEVPGTSDDSTEEPVMKKRTYCTYCPSKIRRKASASCK
KCKKVICREHNIDMCQSCF
причем:
в положении 450 может быть D или N
в положении 465 может быть W или A 125 а.к. последовательность модифицированной гиперактивной PiggyBac Regular 2 MGSSLDDEHILSALLQSDDELVGEDSDSEVSDHVSEDD
VQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLA
SNRILTLPQRTIRGKNKHCWSTSKPTRRSRVSALNIVRSQ
RGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLK
RRESMTSATFRDTNEDEIYAFFGILVMTAVRKDNHMST
DDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTL
RENDVFTPVRKIWDLFIHQCIQNYTPGAHLTIDEQLLGF
RGRCPFRVYIPNKPSKYGIKILMMCDSGTKYMINGMPY
LGRGTQTNGVPLGEYYVKELSKPVHGSCRNITCDNWFT
SIPLAKNLLQEPYKLTIVGTVRSNKREIPEVLKNSRSRPV
GTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINES
TGKPQMVMYYNQTKGGVDTL(D/N)QMCSVMTCSRKT
NR(W/A)PMALLYGMINIACINSFIIYSHNVSSKGEKVQSR
KKFMRNLYMGLTSSFMRKRLEAPTLKRYLRDNISNILP
KEVPGTSDDSTEEPVMKKRTYCTYCPSKIRRKASASCK
KCKKVICREHNIDMCQGCF
причем:
в положении 450 может быть D или N
в положении 465 может быть W или A 126 а.к. последовательность модифицированной гиперактивной PiggyBac Regular 3 MGSSLDDEHILSALLQSDDELVGEDSDSEVSDHVSEDD
VQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLA
SNRILTLPQRTIRGKNKHCWSTSKPTRRSRVSALNIVRSQ
RGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLK
RRESMTSATFRDTNEDEIYAFFGILVMTAVRKDNHMST
DDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTL
RENDVFTPVRKIWDLFIHQCIQNYTPGAHLTIDEQLLGF
RGRCPFRVYIPNKPSKYGIKILMMCDSGTKYMINGMPY
LGRGTQTNGVPLGEYYVKELSKPVHGSCRNITCDNWFT
SIPLAKNLLQEPYKLTIVGTVRSNKREIPEVLKNSRSRPV
GTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINES
TGKPQMVMYYNQTKGGVDTL(D/N)QMCSVMTCSRKT
NR(W/A)PMALLYGMINIACINSFIIYSHNVSSKGEKVQSR
KKFMRNLYMGLTSSFMRKRLEAPTLKRYLRDNISNILP
KEVPGTSDDSTEEPVMKKRTYCTYCPSKIRRKASASCK
KCKKVICREHNIDMCQSCF
причем:
в положении 450 может быть D или N
в положении 465 может быть W или A 127 а.к. последовательность модифицированной гиперактивной PiggyBac Regular 4 MGSSLDDEHILSALLQSDDELVGEDSDSEVSDHVSEDD
VQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLA
SNRILTLPQRTIRGKNKHCWSTSKPTRRSRVSALNIVRSQ
RGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLK
RRESMTSATFRDTNEDEIYAFFGILVMTAVRKDNHMST
DDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTL
RENDVFTPVAKIWDLFIHQCIQNYTPGAHLTIDEQLLGF
AGACPFRVYIPNKPSKYGIKILMMCDSGTKYMINGMPY
LGRGTQTNGVPLGEYYVKELSKPVHGSCRNITCDNWFT
SIPLAKNLLQEPYKLTIVGTVASNAREIPEVLKNSRSRPV
GTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINES
TGKPQMVMYYNQTKGGVDTL(D/N)QMCSVMTCSRKT
NR(W/A)PMALLYGMINIACINSFIIYSHNVSSKGEKVQSR
KKFMRNLYMGLTSSFMRKRLEAPTLKRYLRDNISNILP
KEVPGTSDDSTEEPVMKKRTYCTYCPSKIRRKASASCK
KCKKVICREHNIDMCQSCL
причем:
в положении 450 может быть D или N
в положении 465 может быть W или A 128 а.к. последовательность модифицированной гиперактивной PiggyBac Regular 5 MGSSLDDEHILSALLQSDDELVGEDSDSEVSDHVSEDD
VQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLA
SNRILTLPQRTIRGKNKHCWSTSKPTRRSRVSALNIVRSQ
RGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLK
RRESMTSATFRDTNEDEIYAFFGILVMTAVRKDNHMST
DDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTL
RENDVFTPVRKIWDLFIHQCIQNYTPGAHLTIDEQLLGF
AGRCPFRVYIPNKPSKYGIKILMMCDSGTKYMINGMPY
LGRGTQTNGVPLAEYYVKELSKPVHGSCRNITCDSWFT
AIPLAKNLLQEPYKLTIVGTVASNKREIPEVLKNSRSRPV
GTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINES
TGKPQMVMYYNQTKGGVDTL(D/N)QMCSVMTCSRKT
NR(W/A)PMALLYGMINIACINSFIIYSHNVSSKGEKVQSR
KKFMRNLYMGLTSSFMRKRLEAPTLKRYLRDNISNILP
KEVPGTSDDSTEEPVMKKRTYCAYCPSKIRRKASASCK
KCKKVICREHNIDMCQGCF
причем:
в положении 450 может быть D или N
в положении 465 может быть W или A 129 а.к. последовательность модифицированной гиперактивной PiggyBac Regular 6 MGSSLDDEHILSALLQSDDELVGEDSDSEVSDHVSEDD
VQSDTEEAFIDEVHEVQPTSSGSEILDEQNVIEQPGSSLA
SNRILTLPQRTIRGKNKHCWSTSKPTRRSRVSALNIVRSQ
RGPTRMCRNIYDPLLCFKLFFTDEIISEIVKWTNAEISLK
RRESMTSATFRDTNEDEIYAFFGILVMTAVRKDNHMST
DDLFDRSLSMVYVSVMSRDRFDFLIRCLRMDDKSIRPTL
RENDVFTPVRKIWDLFIHQCIQNYTPGAHLTIDEQLLGF
AGRCPFRVYIPNKPSKYGIKILMMCDSGTKYMINGMPY
LGRGTQTNGVPLGEYYVKELSKPVHGSCRNITCDNWFT
AIPLAKNLLQEPYKLTIVGTVASNAREIPEVLKNSRSRPV
GTSMFCFDGPLTLVSYKPKPAKMVYLLSSCDEDASINES
TGKPQMVMYYNQTKGGVDTL(D/N)QMCSVMTCSRKT
NR(W/A)PMALLYGMINIACINSFIIYSHNVSSKGEKVQSR
KKFMRNLYMGLTSSFMRKRLEAPTLKRYLRDNISNILP
KEVPGTSDDSTEEPVMKKRTYCAYCPSKIRRKASASCK
KCKKVICREHNIDMCQGCF
причем:
в положении 450 может быть D или N
в положении 465 может быть W или A

130 а.к. последовательность линкера KLAGGAPAVGGGPK 131 а.к. последовательность линкера EFGGGGSGGGGSGGGGSQF 132 праймер SV40pA-R gaaatttgtgatgctattgc 133 линкер (GGGGS)n
n – целое число от 1 до 50 134 линкер (EAAAK)n
n – целое число от 1 до 50

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> УНИВЕРСИТАТ ПОМПЕУ ФАБРА

<120> TARGETED GENE EDITING CONSTRUCTS AND METHODS OF USING THE SAME

<130> 4349.001PC01/TJS/JCA/LXR

<150> US 62/860,186

<151> 2019-06-11

<160> 134

<170> PatentIn version 3.5

<210> 1

<211> 288

<212> PRT

<213> Artificial Sequence

<220>

<223> Wildtype HIV-1 integrase amino acid sequence

<400> 1

Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His

1 5 10 15

Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val

20 25 30

Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu

35 40 45

Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp

50 55 60

Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala

65 70 75 80

Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu

85 90 95

Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr

100 105 110

Ile His Thr Asp Asn Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala

115 120 125

Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn

130 135 140

Pro Gln Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys

145 150 155 160

Ile Ile Gly Gln Val Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val

165 170 175

Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly

180 185 190

Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile

195 200 205

Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg

210 215 220

Val Tyr Tyr Arg Asp Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys

225 230 235 240

Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp

245 250 255

Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly

260 265 270

Lys Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp

275 280 285

<210> 2

<211> 867

<212> DNA

<213> Artificial Sequence

<220>

<223> Wildtype HIV-1 integrase nucleic acid sequence

<400> 2

tttttagatg gaatagataa ggcccaagat gaacatgaga aatatcacag taattggaga 60

gcaatggcta gtgattttaa cctgccacct gtagtagcaa aagaaatagt agccagctgt 120

gataaatgtc agctaaaagg agaagccatg catggacaag tagactgtag tccaggaata 180

tggcaactag attgtacaca tttagaagga aaagttatcc tggtagcagt tcatgtagcc 240

agtggatata tagaagcaga agttattcca gcagaaacag ggcaggaaac agcatatttt 300

cttttaaaat tagcaggaag atggccagta aaaacaatac atactgacaa tggcagcaat 360

ttcaccggtg ctacggttag ggccgcctgt tggtgggcgg gaatcaagca ggaatttgga 420

attccctaca atccccaaag tcaaggagta gtagaatcta tgaataaaga attaaagaaa 480

attataggac aggtaagaga tcaggctgaa catcttaaga cagcagtaca aatggcagta 540

ttcatccaca attttaaaag aaaagggggg attggggggt acagtgcagg ggaaagaata 600

gtagacataa tagcaacaga catacaaact aaagaattac aaaaacaaat tacaaaaatt 660

caaaattttc gggtttatta cagggacagc agaaatccac tttggaaagg accagcaaag 720

ctcctctgga aaggtgaagg ggcagtagta atacaagata atagtgacat aaaagtagtg 780

ccaagaagaa aagcaaagat cattagggat tatggaaaac agatggcagg tgatgattgt 840

gtggcaagta gacaggatga ggattag 867

<210> 3

<211> 288

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified HIV-1 integrase

<220>

<221> misc_feature

<222> (10)..(10)

<223> Xaa can be Lys, Asp

<220>

<221> misc_feature

<222> (11)..(11)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (13)..(13)

<223> Xaa can be Glu, Lys

<220>

<221> misc_feature

<222> (64)..(64)

<223> Xaa can be Ala, Glu, Asp

<220>

<221> misc_feature

<222> (94)..(94)

<223> Xaa can be Asp, Glu, Arg, Lys, Gly

<220>

<221> misc_feature

<222> (116)..(116)

<223> Xaa can be Asp, Ala, Glu

<220>

<221> misc_feature

<222> (117)..(117)

<223> Xaa can be Asp, Glu, Arg, Lys, Asn

<220>

<221> misc_feature

<222> (119)..(119)

<223> Xaa can be Ala, Pro, Thr, Gly, Asp, Glu, Arg, Lys, Ser

<220>

<221> misc_feature

<222> (120)..(120)

<223> Xaa can be Asp, Glu, Arg, Lys, Asn

<220>

<221> misc_feature

<222> (122)..(122)

<223> Xaa can be Lys, Ile, Val, Ala, Arg, Thr

<220>

<221> misc_feature

<222> (124)..(124)

<223> Xaa can be Asp, Glu, Arg, Lys, Ala

<220>

<221> misc_feature

<222> (125)..(125)

<223> Xaa can be Asp, Glu, Arg, Lys, Thr

<220>

<221> misc_feature

<222> (128)..(128)

<223> Xaa can be Ala, Thr

<220>

<221> misc_feature

<222> (152)..(152)

<223> Xaa can be Ala, Asp, Glu

<220>

<221> misc_feature

<222> (168)..(168)

<223> Xaa can be Leu, Ala, Gln

<220>

<221> misc_feature

<222> (170)..(170)

<223> Xaa can be Glu, Gly

<220>

<221> misc_feature

<222> (185)..(185)

<223> Xaa can be Phe, Lys

<220>

<221> misc_feature

<222> (231)..(231)

<223> Xaa can be Arg, Gly, Lys, Asp, Glu, Ser

<220>

<221> misc_feature

<222> (264)..(264)

<223> Xaa can be Lys, Arg

<220>

<221> misc_feature

<222> (266)..(266)

<223> Xaa can be Lys, Arg

<220>

<221> misc_feature

<222> (273)..(273)

<223> Xaa can be Lys, Arg

<400> 3

Phe Leu Asp Gly Ile Asp Lys Ala Gln Xaa Xaa His Xaa Lys Tyr His

1 5 10 15

Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val

20 25 30

Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu

35 40 45

Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Xaa

50 55 60

Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala

65 70 75 80

Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Xaa Gln Glu

85 90 95

Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr

100 105 110

Ile His Thr Xaa Xaa Gly Xaa Xaa Phe Xaa Gly Xaa Xaa Val Arg Xaa

115 120 125

Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn

130 135 140

Pro Gln Ser Gln Gly Val Val Xaa Ser Met Asn Lys Glu Leu Lys Lys

145 150 155 160

Ile Ile Gly Gln Val Arg Asp Xaa Ala Glu His Leu Lys Thr Ala Val

165 170 175

Gln Met Ala Val Phe Ile His Asn Xaa Lys Arg Lys Gly Gly Ile Gly

180 185 190

Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile

195 200 205

Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg

210 215 220

Val Tyr Tyr Arg Asp Ser Xaa Asn Pro Leu Trp Lys Gly Pro Ala Lys

225 230 235 240

Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp

245 250 255

Ile Lys Val Val Pro Arg Arg Xaa Ala Xaa Ile Ile Arg Asp Tyr Gly

260 265 270

Xaa Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp

275 280 285

<210> 4

<211> 288

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified integrase with impaired DNA binding

<220>

<221> misc_feature

<222> (94)..(94)

<223> Xaa can be Gly, Asp, Glu, Arg, Lys

<220>

<221> misc_feature

<222> (117)..(117)

<223> Xaa can be Asn, Asp, Glu, Arg, Lys

<220>

<221> misc_feature

<222> (119)..(119)

<223> Xaa can be Ser, Ala, Pro, Thr, Gly, Asp, Glu, Arg, Lys

<220>

<221> misc_feature

<222> (120)..(120)

<223> Xaa can be Asn, Asp, Glu, Arg, Lys

<220>

<221> misc_feature

<222> (124)..(124)

<223> Xaa can be Asp, Glu, Arg, Lys

<220>

<221> misc_feature

<222> (125)..(125)

<223> Xaa can be Asp, Glu, Arg, Lys, Thr

<220>

<221> misc_feature

<222> (231)..(231)

<223> Xaa can be Arg, Gly, Lys, Asp, Glu, Ser

<400> 4

Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His

1 5 10 15

Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val

20 25 30

Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu

35 40 45

Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp

50 55 60

Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala

65 70 75 80

Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Xaa Gln Glu

85 90 95

Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr

100 105 110

Ile His Thr Asp Xaa Gly Xaa Xaa Phe Thr Gly Xaa Xaa Val Arg Ala

115 120 125

Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn

130 135 140

Pro Gln Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys

145 150 155 160

Ile Ile Gly Gln Val Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val

165 170 175

Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly

180 185 190

Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile

195 200 205

Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg

210 215 220

Val Tyr Tyr Arg Asp Ser Xaa Asn Pro Leu Trp Lys Gly Pro Ala Lys

225 230 235 240

Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp

245 250 255

Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly

260 265 270

Lys Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp

275 280 285

<210> 5

<211> 288

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified integrase with enhanced DNA binding

<220>

<221> Misc_feature

<222> (94)..(94)

<223> Xaa can be Gly, Asp, Glu, Arg, Lys

<220>

<221> Misc_feature

<222> (117)..(117)

<223> Xaa can be Asn, Asp, Glu, Arg, Lys

<220>

<221> Misc_feature

<222> (119)..(119)

<223> Xaa can be Ala, Pro, Thr, Gly, Asp, Glu, Arg, Lys, Ser

<220>

<221> Misc_feature

<222> (120)..(120)

<223> Xaa can be Asn, Asp, Glu, Arg, Lys

<220>

<221> Misc_feature

<222> (122)..(122)

<223> Xaa can be Thr, Lys, Ile, Val, Ala, Arg

<220>

<221> Misc_feature

<222> (124)..(124)

<223> Xaa can be Asp, Glu, Arg, Lys, Ala

<220>

<221> Misc_feature

<222> (125)..(125)

<223> Xaa can be Asp, Glu, Arg, Lys, Thr

<220>

<221> Misc_feature

<222> (168)..(168)

<223> Xaa can be Leu, Ala, Gln

<220>

<221> Misc_feature

<222> (231)..(231)

<223> Xaa can be Arg, Gly, Lys, Asp, Glu, Ser

<400> 5

Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His

1 5 10 15

Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val

20 25 30

Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu

35 40 45

Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp

50 55 60

Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala

65 70 75 80

Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Xaa Gln Glu

85 90 95

Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr

100 105 110

Ile His Thr Asp Xaa Gly Xaa Xaa Phe Xaa Gly Xaa Xaa Val Arg Ala

115 120 125

Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn

130 135 140

Pro Gln Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys

145 150 155 160

Ile Ile Gly Gln Val Arg Asp Xaa Ala Glu His Leu Lys Thr Ala Val

165 170 175

Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly

180 185 190

Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile

195 200 205

Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg

210 215 220

Val Tyr Tyr Arg Asp Ser Xaa Asn Pro Leu Trp Lys Gly Pro Ala Lys

225 230 235 240

Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp

245 250 255

Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly

260 265 270

Lys Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp

275 280 285

<210> 6

<211> 288

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified integrase with acetylation mutations

<220>

<221> misc_feature

<222> (264)..(264)

<223> Xaa can be Lys, Arg

<220>

<221> misc_feature

<222> (266)..(266)

<223> Xaa can be Lys, Arg

<220>

<221> misc_feature

<222> (273)..(273)

<223> Xaa can be Lys, Arg

<400> 6

Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His

1 5 10 15

Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val

20 25 30

Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu

35 40 45

Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp

50 55 60

Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala

65 70 75 80

Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu

85 90 95

Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr

100 105 110

Ile His Thr Asp Asn Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala

115 120 125

Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn

130 135 140

Pro Gln Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys

145 150 155 160

Ile Ile Gly Gln Val Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val

165 170 175

Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly

180 185 190

Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile

195 200 205

Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg

210 215 220

Val Tyr Tyr Arg Asp Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys

225 230 235 240

Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp

245 250 255

Ile Lys Val Val Pro Arg Arg Xaa Ala Xaa Ile Ile Arg Asp Tyr Gly

260 265 270

Xaa Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp

275 280 285

<210> 7

<211> 288

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified integrase with mutations in retroviral integrative

recombination

<220>

<221> misc_feature

<222> (10)..(10)

<223> Xaa can be Asp, Lys

<220>

<221> misc_feature

<222> (11)..(11)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (13)..(13)

<223> Xaa can be Glu, Lys

<220>

<221> misc_feature

<222> (64)..(64)

<223> Xaa can be Asp, Ala, Glu

<220>

<221> misc_feature

<222> (116)..(116)

<223> Xaa can be Ala, Glu, Asp

<220>

<221> misc_feature

<222> (128)..(128)

<223> Xaa can be Ala, Thr

<220>

<221> misc_feature

<222> (152)..(152)

<223> Xaa can be Glu, Ala, Asp

<220>

<221> misc_feature

<222> (168)..(168)

<223> Xaa can be Gln, Leu, Ala

<220>

<221> misc_feature

<222> (170)..(170)

<223> Xaa can be Asp, Gly

<400> 7

Phe Leu Asp Gly Ile Asp Lys Ala Gln Xaa Xaa His Xaa Lys Tyr His

1 5 10 15

Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val

20 25 30

Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu

35 40 45

Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Xaa

50 55 60

Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala

65 70 75 80

Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu

85 90 95

Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr

100 105 110

Ile His Thr Xaa Asn Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Xaa

115 120 125

Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn

130 135 140

Pro Gln Ser Gln Gly Val Val Xaa Ser Met Asn Lys Glu Leu Lys Lys

145 150 155 160

Ile Ile Gly Gln Val Arg Asp Xaa Ala Xaa His Leu Lys Thr Ala Val

165 170 175

Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly

180 185 190

Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile

195 200 205

Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg

210 215 220

Val Tyr Tyr Arg Asp Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys

225 230 235 240

Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp

245 250 255

Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly

260 265 270

Lys Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp

275 280 285

<210> 8

<211> 288

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified integrase with mutations in HIV-1 replication

<220>

<221> misc_feature

<222> (168)..(168)

<223> Xaa can be Gln, Leu, Ala

<400> 8

Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His

1 5 10 15

Ser Asn Trp Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val

20 25 30

Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu

35 40 45

Ala Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp

50 55 60

Cys Thr His Leu Glu Gly Lys Val Ile Leu Val Ala Val His Val Ala

65 70 75 80

Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu

85 90 95

Thr Ala Tyr Phe Leu Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr

100 105 110

Ile His Thr Asp Asn Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala

115 120 125

Ala Cys Trp Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn

130 135 140

Pro Gln Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys

145 150 155 160

Ile Ile Gly Gln Val Arg Asp Xaa Ala Glu His Leu Lys Thr Ala Val

165 170 175

Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly

180 185 190

Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile

195 200 205

Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg

210 215 220

Val Tyr Tyr Arg Asp Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys

225 230 235 240

Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp

245 250 255

Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly

260 265 270

Lys Gln Met Ala Gly Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp

275 280 285

<210> 9

<211> 594

<212> PRT

<213> Artificial Sequence

<220>

<223> Hyperactive PiggyBac aa sequence

<400> 9

Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln

1 5 10 15

Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp

20 25 30

His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile

35 40 45

Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu

50 55 60

Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn

65 70 75 80

Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His

85 90 95

Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu

100 105 110

Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile

115 120 125

Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile

130 135 140

Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg

145 150 155 160

Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile

165 170 175

Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn

180 185 190

His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr

195 200 205

Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu

210 215 220

Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val

225 230 235 240

Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile

245 250 255

Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu

260 265 270

Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro

275 280 285

Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys

290 295 300

Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn

305 310 315 320

Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val

325 330 335

His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile

340 345 350

Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val

355 360 365

Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn

370 375 380

Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro

385 390 395 400

Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu

405 410 415

Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys

420 425 430

Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr

435 440 445

Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg

450 455 460

Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn

465 470 475 480

Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val

485 490 495

Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser

500 505 510

Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu

515 520 525

Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser

530 535 540

Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr

545 550 555 560

Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys

565 570 575

Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser

580 585 590

Cys Phe

<210> 10

<211> 594

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified hyperactive PiggyBac

<220>

<221> misc_feature

<222> (245)..(245)

<223> Wherein amino acid can be Arg, Ala

<220>

<221> misc_feature

<222> (268)..(268)

<223> Wherein amino acid can be Asp, Asn

<220>

<221> misc_feature

<222> (275)..(275)

<223> Wherein amino acid can be Arg, Ala

<220>

<221> misc_feature

<222> (277)..(277)

<223> Wherein amino acid can be Arg, Ala

<220>

<221> misc_feature

<222> (287)..(287)

<223> Wherein amino acid can be Ala, Lys

<220>

<221> misc_feature

<222> (290)..(290)

<223> Wherein amino acid can be Ala, Lys

<220>

<221> misc_feature

<222> (315)..(315)

<223> Wherein amino acid can be Arg, Ala

<220>

<221> misc_feature

<222> (325)..(325)

<223> Wherein amino acid can be Gly, Ala

<220>

<221> misc_feature

<222> (341)..(341)

<223> Wherein amino acid can be Arg, Ala

<220>

<221> misc_feature

<222> (346)..(346)

<223> Wherein amino acid can be Asp, Asn

<220>

<221> misc_feature

<222> (347)..(347)

<223> Wherein amino acid can be Asn, Ala, Ser

<220>

<221> misc_feature

<222> (350)..(350)

<223> Wherein amino acid can be Thr, Ala

<220>

<221> misc_feature

<222> (351)..(351)

<223> Xaa can be Ser, Glu, Pro, Ala

<220>

<221> misc_feature

<222> (356)..(356)

<223> Wherein amino acid can be Lys, Glu

<220>

<221> misc_feature

<222> (357)..(357)

<223> Wherein amino acid can be Asn, Ala

<220>

<221> misc_feature

<222> (372)..(372)

<223> Wherein amino acid can be Arg, Ala

<220>

<221> misc_feature

<222> (375)..(375)

<223> Wherein amino acid can be Lys, Ala

<220>

<221> misc_feature

<222> (388)..(388)

<223> Wherein amino acid can be Arg, Ala

<220>

<221> misc_feature

<222> (409)..(409)

<223> Wherein amino acid can be Lys, Ala

<220>

<221> misc_feature

<222> (412)..(412)

<223> Wherein amino acid can be Lys, Ala

<220>

<221> misc_feature

<222> (432)..(432)

<223> Wherein amino acid can be Lys, Ala

<220>

<221> misc_feature

<222> (460)..(460)

<223> Wherein amino acid can be Arg, Ala

<220>

<221> misc_feature

<222> (461)..(461)

<223> Wherein amino acid can be Ala, Lys

<220>

<221> misc_feature

<222> (465)..(465)

<223> Wherein amino acid can be Trp, Ala

<220>

<221> misc_feature

<222> (560)..(560)

<223> Wherein amino acid can be Thr, Ala

<220>

<221> misc_feature

<222> (564)..(564)

<223> Wherein amino acid can be Ser, Pro

<220>

<221> misc_feature

<222> (571)..(571)

<223> Wherein amino acid can be Asn, Ser

<220>

<221> misc_feature

<222> (573)..(573)

<223> Wherein amino acid can be Ser, Ala

<220>

<221> misc_feature

<222> (576)..(576)

<223> Wherein amino acid can be Lys, Ala

<220>

<221> misc_feature

<222> (586)..(586)

<223> Wherein amino acid can be His, any naturally occuring amino acid

<220>

<221> misc_feature

<222> (587)..(587)

<223> Wherein amino acid can be Ile, Ala

<220>

<221> misc_feature

<222> (589)..(589)

<223> Wherein amino acid can be Met, Val

<220>

<221> misc_feature

<222> (592)..(592)

<223> Wherein amino acid can be Ser, Gly

<220>

<221> misc_feature

<222> (594)..(594)

<223> Wherein amino acid can be Phe, Leu

<400> 10

Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln

1 5 10 15

Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp

20 25 30

His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile

35 40 45

Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu

50 55 60

Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn

65 70 75 80

Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His

85 90 95

Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu

100 105 110

Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile

115 120 125

Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile

130 135 140

Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg

145 150 155 160

Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile

165 170 175

Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn

180 185 190

His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr

195 200 205

Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu

210 215 220

Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val

225 230 235 240

Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile

245 250 255

Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu

260 265 270

Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro

275 280 285

Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys

290 295 300

Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn

305 310 315 320

Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val

325 330 335

His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile

340 345 350

Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val

355 360 365

Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn

370 375 380

Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro

385 390 395 400

Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu

405 410 415

Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys

420 425 430

Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr

435 440 445

Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg

450 455 460

Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn

465 470 475 480

Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val

485 490 495

Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser

500 505 510

Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu

515 520 525

Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser

530 535 540

Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr

545 550 555 560

Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys

565 570 575

Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser

580 585 590

Cys Phe

<210> 11

<211> 594

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified hyperactive PiggyBac with mutations in the catalytic

triad

<220>

<221> misc_feature

<222> (268)..(268)

<223> Xaa can be Asp, Asn

<220>

<221> misc_feature

<222> (346)..(346)

<223> Xaa can be Asp, Asn

<400> 11

Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln

1 5 10 15

Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp

20 25 30

His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile

35 40 45

Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu

50 55 60

Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn

65 70 75 80

Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His

85 90 95

Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu

100 105 110

Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile

115 120 125

Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile

130 135 140

Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg

145 150 155 160

Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile

165 170 175

Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn

180 185 190

His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr

195 200 205

Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu

210 215 220

Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val

225 230 235 240

Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile

245 250 255

Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Xaa Glu Gln Leu Leu

260 265 270

Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro

275 280 285

Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys

290 295 300

Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn

305 310 315 320

Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val

325 330 335

His Gly Ser Cys Arg Asn Ile Thr Cys Xaa Asn Trp Phe Thr Ser Ile

340 345 350

Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val

355 360 365

Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn

370 375 380

Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro

385 390 395 400

Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu

405 410 415

Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys

420 425 430

Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr

435 440 445

Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg

450 455 460

Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn

465 470 475 480

Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val

485 490 495

Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser

500 505 510

Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu

515 520 525

Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser

530 535 540

Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr

545 550 555 560

Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys

565 570 575

Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser

580 585 590

Cys Phe

<210> 12

<211> 594

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified hyperactive PiggyBac with mutations in amino acids that

are critical for excision

<220>

<221> misc_feature

<222> (287)..(287)

<223> Xaa can be Lys, Ala

<220>

<221> misc_feature

<222> (290)..(290)

<223> Xaa can be Lys, Ala

<220>

<221> misc_feature

<222> (460)..(460)

<223> Xaa can be Arg, Ala

<220>

<221> misc_feature

<222> (461)..(461)

<223> Xaa can be Lys, Ala

<400> 12

Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln

1 5 10 15

Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp

20 25 30

His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile

35 40 45

Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu

50 55 60

Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn

65 70 75 80

Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His

85 90 95

Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu

100 105 110

Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile

115 120 125

Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile

130 135 140

Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg

145 150 155 160

Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile

165 170 175

Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn

180 185 190

His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr

195 200 205

Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu

210 215 220

Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val

225 230 235 240

Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile

245 250 255

Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu

260 265 270

Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Xaa Pro

275 280 285

Ser Xaa Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys

290 295 300

Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn

305 310 315 320

Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val

325 330 335

His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile

340 345 350

Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val

355 360 365

Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn

370 375 380

Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro

385 390 395 400

Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu

405 410 415

Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys

420 425 430

Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr

435 440 445

Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Xaa Xaa Thr Asn Arg

450 455 460

Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn

465 470 475 480

Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val

485 490 495

Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser

500 505 510

Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu

515 520 525

Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser

530 535 540

Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr

545 550 555 560

Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys

565 570 575

Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser

580 585 590

Cys Phe

<210> 13

<211> 594

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified hyperactive PiggyBac with mutation that are involved in

target joining

<220>

<221> misc_feature

<222> (351)..(351)

<223> Xaa can be Ser, Glu, Pro, Ala

<220>

<221> misc_feature

<222> (356)..(356)

<223> Xaa can be Lys, Glu

<400> 13

Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln

1 5 10 15

Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp

20 25 30

His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile

35 40 45

Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu

50 55 60

Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn

65 70 75 80

Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His

85 90 95

Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu

100 105 110

Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile

115 120 125

Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile

130 135 140

Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg

145 150 155 160

Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile

165 170 175

Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn

180 185 190

His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr

195 200 205

Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu

210 215 220

Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val

225 230 235 240

Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile

245 250 255

Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu

260 265 270

Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro

275 280 285

Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys

290 295 300

Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn

305 310 315 320

Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val

325 330 335

His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Xaa Ile

340 345 350

Pro Leu Ala Xaa Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val

355 360 365

Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn

370 375 380

Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro

385 390 395 400

Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu

405 410 415

Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys

420 425 430

Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr

435 440 445

Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg

450 455 460

Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn

465 470 475 480

Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val

485 490 495

Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser

500 505 510

Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu

515 520 525

Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser

530 535 540

Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr

545 550 555 560

Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys

565 570 575

Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser

580 585 590

Cys Phe

<210> 14

<211> 594

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified hyperactive PiggyBac with mutations that are critical

for integration

<220>

<221> misc_feature

<222> (560)..(560)

<223> Wherein amino acid can be Thr, Ala,

<220>

<221> misc_feature

<222> (564)..(564)

<223> Wherein amino acid can be Ser, Pro

<220>

<221> misc_feature

<222> (571)..(571)

<223> Wherein amino acid can be Asn, Ser

<220>

<221> misc_feature

<222> (573)..(573)

<223> Wherein amino acid can be Ser, Ala

<220>

<221> misc_feature

<222> (589)..(589)

<223> Wherein amino acid can be Met, Val

<220>

<221> misc_feature

<222> (592)..(592)

<223> Wherein amino acid can be Ser, Gly

<220>

<221> misc_feature

<222> (594)..(594)

<223> Wherein amino acid can be Phe, Leu

<400> 14

Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln

1 5 10 15

Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp

20 25 30

His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile

35 40 45

Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu

50 55 60

Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn

65 70 75 80

Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His

85 90 95

Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu

100 105 110

Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile

115 120 125

Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile

130 135 140

Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg

145 150 155 160

Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile

165 170 175

Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn

180 185 190

His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr

195 200 205

Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu

210 215 220

Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val

225 230 235 240

Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile

245 250 255

Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu

260 265 270

Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro

275 280 285

Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys

290 295 300

Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn

305 310 315 320

Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val

325 330 335

His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile

340 345 350

Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val

355 360 365

Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn

370 375 380

Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro

385 390 395 400

Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu

405 410 415

Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys

420 425 430

Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr

435 440 445

Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg

450 455 460

Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn

465 470 475 480

Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val

485 490 495

Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser

500 505 510

Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu

515 520 525

Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser

530 535 540

Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr

545 550 555 560

Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys

565 570 575

Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser

580 585 590

Cys Phe

<210> 15

<211> 594

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified hyperactive PiggyBac with mutations that are involved in

alignment

<220>

<221> misc_feature

<222> (325)..(325)

<223> Xaa can be Gly, Ala

<220>

<221> misc_feature

<222> (347)..(347)

<223> Xaa can be Asn, Ala, Ser

<220>

<221> misc_feature

<222> (350)..(350)

<223> Xaa can be Thr, Ala

<220>

<221> misc_feature

<222> (465)..(465)

<223> Xaa can be Trp, Ala

<400> 15

Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln

1 5 10 15

Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp

20 25 30

His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile

35 40 45

Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu

50 55 60

Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn

65 70 75 80

Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His

85 90 95

Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu

100 105 110

Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile

115 120 125

Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile

130 135 140

Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg

145 150 155 160

Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile

165 170 175

Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn

180 185 190

His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr

195 200 205

Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu

210 215 220

Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val

225 230 235 240

Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile

245 250 255

Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu

260 265 270

Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro

275 280 285

Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys

290 295 300

Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn

305 310 315 320

Gly Val Pro Leu Xaa Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val

325 330 335

His Gly Ser Cys Arg Asn Ile Thr Cys Asp Xaa Trp Phe Xaa Ser Ile

340 345 350

Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val

355 360 365

Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn

370 375 380

Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro

385 390 395 400

Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu

405 410 415

Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys

420 425 430

Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr

435 440 445

Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg

450 455 460

Xaa Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn

465 470 475 480

Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val

485 490 495

Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser

500 505 510

Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu

515 520 525

Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser

530 535 540

Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr

545 550 555 560

Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys

565 570 575

Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser

580 585 590

Cys Phe

<210> 16

<211> 594

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified hyperactive PiggyBac with mutations at well conserved

amino acids

<220>

<221> misc_feature

<222> (576)..(576)

<223> Xaa can be lys, Ala

<220>

<221> misc_feature

<222> (587)..(587)

<223> Xaa can be Ile, Ala

<400> 16

Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln

1 5 10 15

Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp

20 25 30

His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile

35 40 45

Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu

50 55 60

Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn

65 70 75 80

Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His

85 90 95

Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu

100 105 110

Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile

115 120 125

Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile

130 135 140

Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg

145 150 155 160

Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile

165 170 175

Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn

180 185 190

His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr

195 200 205

Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu

210 215 220

Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val

225 230 235 240

Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile

245 250 255

Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu

260 265 270

Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro

275 280 285

Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys

290 295 300

Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn

305 310 315 320

Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val

325 330 335

His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile

340 345 350

Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val

355 360 365

Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn

370 375 380

Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro

385 390 395 400

Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu

405 410 415

Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys

420 425 430

Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr

435 440 445

Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg

450 455 460

Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn

465 470 475 480

Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val

485 490 495

Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser

500 505 510

Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu

515 520 525

Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser

530 535 540

Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr

545 550 555 560

Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Xaa

565 570 575

Cys Lys Lys Val Ile Cys Arg Glu His Asn Xaa Asp Met Cys Gln Ser

580 585 590

Cys Phe

<210> 17

<211> 594

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified hyperactive PiggyBac with mutations involved in Zn2+

binding

<220>

<221> misc_feature

<222> (586)..(586)

<223> Wherein amino acid can be His, any naturally occuring amino acid

<400> 17

Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln

1 5 10 15

Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp

20 25 30

His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile

35 40 45

Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu

50 55 60

Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn

65 70 75 80

Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His

85 90 95

Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu

100 105 110

Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile

115 120 125

Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile

130 135 140

Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg

145 150 155 160

Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile

165 170 175

Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn

180 185 190

His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr

195 200 205

Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu

210 215 220

Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val

225 230 235 240

Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile

245 250 255

Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu

260 265 270

Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro

275 280 285

Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys

290 295 300

Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn

305 310 315 320

Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val

325 330 335

His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile

340 345 350

Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val

355 360 365

Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn

370 375 380

Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro

385 390 395 400

Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu

405 410 415

Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys

420 425 430

Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr

435 440 445

Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg

450 455 460

Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn

465 470 475 480

Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val

485 490 495

Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser

500 505 510

Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu

515 520 525

Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser

530 535 540

Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr

545 550 555 560

Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys

565 570 575

Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser

580 585 590

Cys Phe

<210> 18

<211> 594

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified hyperactive PiggyBac with mutations that are involved in

integration

<220>

<221> MISC_FEATURE

<222> (315)..(315)

<223> Wherein amino acid can be Arg, Ala

<220>

<221> MISC_FEATURE

<222> (341)..(341)

<223> Wherein amino acid can be Arg, Ala

<220>

<221> MISC_FEATURE

<222> (372)..(372)

<223> Wherein amino acid can be Arg, Ala

<220>

<221> MISC_FEATURE

<222> (375)..(372)

<223> Wherein amino acid can be Lys, Ala

<400> 18

Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln

1 5 10 15

Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp

20 25 30

His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile

35 40 45

Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu

50 55 60

Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn

65 70 75 80

Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His

85 90 95

Cys Trp Ser Thr Ser Lys Pro Thr Arg Arg Ser Arg Val Ser Ala Leu

100 105 110

Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile

115 120 125

Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile

130 135 140

Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg

145 150 155 160

Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile

165 170 175

Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn

180 185 190

His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr

195 200 205

Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu

210 215 220

Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val

225 230 235 240

Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile

245 250 255

Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu

260 265 270

Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro

275 280 285

Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys

290 295 300

Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn

305 310 315 320

Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val

325 330 335

His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile

340 345 350

Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val

355 360 365

Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn

370 375 380

Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro

385 390 395 400

Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu

405 410 415

Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys

420 425 430

Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr

435 440 445

Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg

450 455 460

Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn

465 470 475 480

Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val

485 490 495

Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Gly Leu Thr Ser

500 505 510

Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu

515 520 525

Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser

530 535 540

Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr

545 550 555 560

Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Ser Ala Ser Cys Lys Lys

565 570 575

Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser

580 585 590

Cys Phe

<210> 19

<211> 897

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Corynebacterium ulcerans

<400> 19

Met Thr Asn Ala Val Ala Asn His His Val Leu Trp Ala Lys Phe Asp

1 5 10 15

Asn Val Ser Glu Pro Tyr Pro Leu Leu Ala His Leu Leu Asp Thr Ala

20 25 30

Thr Ala Ala Thr Cys Leu Phe Asn His Trp Leu Arg Lys Gly Leu Arg

35 40 45

Asp Arg Leu Ser Thr Glu Leu Gly Pro Asp Ala Glu Lys Ile Leu Gly

50 55 60

Phe Val Ala Gly Ile His Asp Leu Gly Lys Ala Asn Pro Tyr Phe Gln

65 70 75 80

Ala Gln Arg Arg Asn Lys Lys Glu Glu Trp Ile Thr Leu Arg Asp Ala

85 90 95

Ile Gln Lys Ala Gly Phe Pro Leu Ser Asn Gly Thr Ser Ala Leu Phe

100 105 110

Glu Glu Thr Lys Glu Lys Arg Arg His Glu Asn Ile Thr Leu Ser Ile

115 120 125

Leu Gly Trp Glu Ile Thr Lys Phe Leu Gln Val Lys Asp Val Trp Pro

130 135 140

Gln Leu Ala Ile Ile Gly His His Gly Asn Phe Ser Ala Pro Gly Phe

145 150 155 160

Leu Ser Asp Glu Asp Asp Leu Glu Asp Ile Glu Asp Ile Phe Asp Asp

165 170 175

Asn Gly Trp Ser Pro Thr His Glu Leu Leu Val Ser Ser Leu Leu Gln

180 185 190

Ala Val Gly Leu Glu Lys Gln Pro Glu Ile Lys His Ile Ser Pro Ala

195 200 205

Ser Ala Ile Leu Ile Ser Gly Leu Val Val Leu Ala Asp Arg Ile Ala

210 215 220

Ser Gln Ser Glu Met Ala Ser Asp Gly Leu Gln Ala Leu Gln Lys Glu

225 230 235 240

Glu Leu Phe Phe His Gln Pro Glu Lys Trp Ile Ala Asn Arg Lys Ala

245 250 255

Phe Cys Arg Glu Ile Ile Glu Asn Thr Val Gly Thr Tyr His Pro Trp

260 265 270

Glu Ser Glu Ala Ala Gly Ile Arg Ala Val Leu Gly Asp Tyr Glu Pro

275 280 285

Arg Phe Thr Gln Lys Ala Ala Leu Asn Ala Gly Asp Gly Leu Phe Asn

290 295 300

Val Met Glu Thr Thr Gly Ala Gly Lys Thr Glu Ala Ala Leu Leu Arg

305 310 315 320

His Val Lys Arg Lys Glu Arg Leu Leu Phe Phe Leu Pro Thr Gln Ala

325 330 335

Thr Thr Asn Ala Ile Met Asp Arg Ile Gly Lys Ile Phe Asp Gly Thr

340 345 350

Pro Asn Val Ala Ser Leu Ala His Gly Leu Ala Val Thr Glu Asp Phe

355 360 365

Tyr Ala His Pro Ile Leu Pro Val Gln Gly Ser Ser Asp Asp Ala Asn

370 375 380

Tyr Lys Asp Asn Gly Gly Leu Tyr Pro Thr Glu Phe Val Arg Ser Ala

385 390 395 400

Gly Thr Pro Arg Leu Leu Ala Pro Val Cys Val Gly Thr Ile Asp Gln

405 410 415

Ala Leu Met Gly Ala Leu Pro Ser Lys Phe Asn His Leu Arg Leu Leu

420 425 430

Ala Leu Ala Asn Ala His Val Val Val Asp Glu Val His Thr Met Asp

435 440 445

Gln Tyr Gln Ser Glu Leu Met Ser Gly Leu Leu Glu Trp Trp Ser Ala

450 455 460

Thr Asp Thr Pro Val Thr Leu Leu Thr Ala Thr Met Pro Ala Trp Gln

465 470 475 480

Arg Glu Lys Phe His Leu Ser Tyr Thr Gly Lys Asp Pro His Phe Lys

485 490 495

Gly Val Phe Pro Ser Leu Glu Asp Trp Ser Thr Pro Ser Lys Asn Thr

500 505 510

Glu Thr Ser Gln Glu Asn Ile Pro Thr Glu Ala Phe Thr Ile Pro Ile

515 520 525

Asn Ile Asp Lys Ile Ala His Asn Glu Ile Val Asp Ser His Val Gln

530 535 540

Trp Val Ile Glu Gln Arg Lys Leu Phe Pro Gln Ala Arg Ile Gly Ile

545 550 555 560

Ile Cys Asn Thr Val Gly Arg Ala Gln Ser Ile Ala Glu Ala Leu Ala

565 570 575

His Glu Ser Pro Ile Val Leu His Ser Arg Met Thr Ala Gly His Arg

580 585 590

Lys Glu Ala Ala Thr Lys Leu Glu Gln Ala Ile Gly Lys Lys Gly Thr

595 600 605

Ala Asn Ala Thr Leu Val Ile Gly Thr Gln Ala Ile Glu Ala Ser Leu

610 615 620

Asp Ile Asp Leu Asp Leu Leu Arg Thr Glu Leu Cys Pro Ala Pro Ser

625 630 635 640

Leu Ile Gln Arg Ala Gly Arg Leu Trp Arg Arg Leu Asp Pro Gln Arg

645 650 655

Glu Val Arg Val Pro Gly Met Val Gly Lys Lys Leu Thr Ile Ala Val

660 665 670

Val Asp Ser Pro Ser Thr Gly Gln Thr Leu Pro Tyr Leu Arg Ser Gln

675 680 685

Leu Tyr Arg Val Glu Ser Trp Leu Lys Gln Arg Asp Arg Ile Glu Phe

690 695 700

Pro Ala Asp Ile Gln Asp Phe Ile Asp Ala Thr Thr Pro Gly Leu Gln

705 710 715 720

Glu Leu Phe Gln Lys Val Ser Leu Pro Glu Asp Cys Gly Ser Ala Glu

725 730 735

Glu Arg Glu Ala Leu Ala Asp Asp Tyr Leu Asn Glu Val Ala Ser Trp

740 745 750

Val Thr Lys Gln Arg Gln Ala Gly Thr Ser Arg Ile Asp Phe Ala Lys

755 760 765

His Gly Lys Pro Arg Gln Val Leu Ala Ser Asp Cys Val Val Glu Asp

770 775 780

Phe Leu Gln Ile Thr Ser Ala Asn Asn Leu Glu Glu Ser Ala Thr Arg

785 790 795 800

Leu Ile Asp Tyr Pro Ser Ile Ser Ala Ile Leu Cys Asp Pro Thr Gly

805 810 815

Thr Ile Pro Gly Ala Trp Thr Asp Ser Val Glu Lys Leu Ile Ala Ile

820 825 830

Ser Ala Lys Asp Ser Glu Ser Leu Arg Arg Ala Leu Arg Ala Ser Ile

835 840 845

Ser Ile Pro His Ser Lys Lys Phe Leu Pro Ile Thr Ser Arg Glu Ile

850 855 860

Pro Leu Ser Glu Ala Lys Thr Leu Leu Ser Gly Tyr Ser Ala Val His

865 870 875 880

Ile Gln Pro Asp Glu Tyr Asp Leu Gln Ser Gly Leu Lys Gly Pro Gln

885 890 895

Lys

<210> 20

<211> 876

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Corynebacterium diphtheria

<400> 20

Met Asn Pro His Glu Glu Leu Trp Ala Lys Gln Lys Gly Leu Ala Lys

1 5 10 15

Pro Tyr Pro Leu Leu Ala His Leu Leu Asp Ser Ala Ala Val Ala Gly

20 25 30

Ala Leu Trp Asp His Trp Leu Arg Gln Asp Leu Arg Gln Met Phe Ile

35 40 45

Glu Glu Leu Gly Ser Asn Ala Arg Glu Ile Ile Gln Phe Val Val Gly

50 55 60

Ser His Asp Ile Gly Lys Ala Thr Pro Leu Phe Gln Tyr Gln Lys Ala

65 70 75 80

Gln Lys Gly Glu Val Trp Asp Ser Ile Arg Tyr Ala Ile Asp Arg Thr

85 90 95

Gly Arg Tyr Gln Lys Pro Leu Pro Ser Ser Tyr Leu Val Lys Lys Thr

100 105 110

Ser Gly Gly Pro Asn Arg His Glu Gln Trp Ser Ser Phe Ala Ser Lys

115 120 125

Asn Glu Tyr Leu Lys Pro Ser Ala Ala Ala Lys Glu Asn Trp Ile Gly

130 135 140

Leu Ala Ile Gly Gly His His Gly Arg Phe Glu Pro Val Gly Tyr Gly

145 150 155 160

Arg His Gln Arg Lys Ala Ala Glu Asp Leu Ala Lys Ser Gly Trp Ser

165 170 175

Ala Ala Gln Gln Asp Leu Leu Arg Ala Leu Glu Lys Ala Ser Gly Ile

180 185 190

Thr Arg Ala Ser Leu Pro Ser Glu Leu Ser Pro Glu Leu Thr Leu Val

195 200 205

Leu Ser Gly Leu Thr Ile Leu Ala Asp Arg Ile Ser Ser Thr Glu Ser

210 215 220

Phe Val Ile Thr Gly Ala Arg Met Ile Asp Asp Gly Thr Leu His Leu

225 230 235 240

Ala Thr Pro Ile Asp Trp Leu Lys Thr Arg Lys Leu Asp Ser Glu Lys

245 250 255

His Val Ala Lys Thr Val Gly Ile Tyr His Gly Trp Asn Asn His Glu

260 265 270

Ser Ala Ile His Ser Ile Leu Lys Gly Tyr Asp Pro Arg Pro Leu Gln

275 280 285

Thr Ile Ala Leu Gln Asn Gln Val Gly Leu Leu Asn Leu Met Ala Pro

290 295 300

Thr Gly Asn Gly Lys Thr Glu Ala Ala Ile Leu Arg His Ser Leu Lys

305 310 315 320

Glu Asn Asp Arg Leu Ile Phe Leu Leu Pro Thr Gln Ala Thr Ser Asn

325 330 335

Ala Ile Met Arg Arg Val Gln Gly Ile Tyr Ser Asp Thr Pro Asn Ala

340 345 350

Ala Ala Leu Ala His Ser Leu Ala Ser Val Glu Asp Phe Tyr Gln Thr

355 360 365

Pro Leu Ser Val Phe Asp Asp His Tyr Asp Pro Ser Lys Glu Gln Phe

370 375 380

Glu Ser Ser Met Ser Gly Gly Leu Tyr Pro Ser Ser Phe Val Cys Ser

385 390 395 400

Gly Ala Ala Arg Leu Leu Ala Pro Ile Cys Ile Gly Thr Val Asp Gln

405 410 415

Ala Leu Ala Thr Ala Leu Pro Gly Lys Trp Ile His Leu Arg Ile Leu

420 425 430

Ala Leu Ala Asn Ala His Ile Val Ile Asp Glu Val His Thr Leu Asp

435 440 445

His Tyr Gln Thr Ala Leu Leu Glu Asn Ile Leu Pro Ile Leu Ala Lys

450 455 460

Leu Lys Thr Lys Ile Thr Phe Leu Thr Ala Thr Met Pro Ser Trp Gln

465 470 475 480

Arg Thr Lys Leu Leu Thr Ala Tyr Gly Gly Glu Asp Leu Gln Ile Pro

485 490 495

Pro Thr Val Phe Pro Ala Ala Glu Thr Val Leu Pro Gly Gln Phe Asn

500 505 510

Arg Thr Leu Ile Asp Ser Asp Ser Thr Thr Ile Asp Phe Thr Met Glu

515 520 525

Glu Thr Ser Tyr Asp His Leu Val Glu Ser His Val Lys Trp His Gln

530 535 540

Thr Thr Arg Leu Asn Ala Pro His Ala Arg Ile Gly Leu Ile Cys Asn

545 550 555 560

Thr Val Lys Arg Ala Gln Glu Ile Ala Ala Ala Leu Glu Lys Thr Asn

565 570 575

Asp Arg Ile Val Leu Leu His Ser Arg Met Thr Thr Glu His Arg Arg

580 585 590

Arg Ser Ala Glu Leu Leu Glu Ser Leu Leu Gly Pro Asn Gly Asn Arg

595 600 605

Lys Thr Ile Thr Val Val Gly Thr Gln Ala Ile Glu Ala Ser Leu Asp

610 615 620

Ile Asp Leu Asp Ile Leu Arg Thr Glu Leu Cys Pro Ala Pro Ser Leu

625 630 635 640

Val Gln Arg Ala Gly Arg Val Trp Arg Arg Asn Asp Pro Tyr Arg Ser

645 650 655

Ser Arg Ile Thr Ala Asp His Lys Pro Ile Ser Val Val Phe Ile Ala

660 665 670

Glu Ala Lys Asp Trp Gln Val Leu Pro Tyr Leu Arg Ala Glu Thr Ser

675 680 685

Arg Thr Gln Arg Trp Leu Glu Lys His Asn Gln Met Phe Leu Pro Gln

690 695 700

Met Ala Gln Glu Phe Ile Asp Ala Ala Thr Val Asp Leu Asp Thr Ala

705 710 715 720

Thr Ser Glu Met Asp Leu Asp Ala Leu Ala Leu Met Gly Ile His Leu

725 730 735

Met Lys Ala Asp Gly Ala Lys Ala Arg Ile Gln Asp Val Leu Asn Ser

740 745 750

Asp Ser Lys Val Ser Asp Phe Ala Leu Leu Thr Ser Lys Asn Glu Ile

755 760 765

Asp Glu Ala Gln Thr Arg Leu Ile Glu Glu Gly Thr His Leu Arg Ile

770 775 780

Ile Leu Gly Asp Glu Asn Glu Ser Ile Pro Gly Gly Trp Lys His Gly

785 790 795 800

Leu Ser Ser Leu Leu Lys Leu Lys Ala Ser Asp Arg Glu Ser Leu Arg

805 810 815

Thr Ala Leu Leu Ala Ser Ile Pro Leu Leu Val Ser Glu Lys Gln Lys

820 825 830

Gln Leu Leu Tyr Gln His Asn Leu Val Pro Leu Ser Ser Ser Lys Thr

835 840 845

Val Leu Ala Gly Phe Tyr Phe Leu Pro Lys Ala Gln Asn Phe Tyr Ser

850 855 860

Lys Asn Leu Gly Phe Ile Trp Pro Glu Glu Lys Asp

865 870 875

<210> 21

<211> 773

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Spiroplasma syrphidicola

<400> 21

Met Asn Tyr Lys Lys Leu Ile Leu Gly Leu Asp Leu Gly Ile Ala Ser

1 5 10 15

Cys Gly Trp Ala Val Thr Gly Gln Met Glu Asp Gly Asn Trp Val Leu

20 25 30

Asp Asp Phe Gly Val Arg Leu Phe Gln Thr Pro Glu Asn Ser Lys Asp

35 40 45

Gly Thr Thr Asn Ala Ala Ala Arg Arg Leu Lys Arg Gly Ala Arg Arg

50 55 60

Leu Ile Lys Arg Arg Lys Asn Arg Ile Lys Asp Leu Lys Asn Leu Phe

65 70 75 80

Glu Lys Ile Asn Phe Ile Asn Lys Ala Ser Leu Asp Lys Tyr Ile Asn

85 90 95

Glu His Ser Ala Thr Asn Leu Val Glu Asp Phe Asn Arg His Glu Leu

100 105 110

Tyr Asn Pro Tyr Phe Leu Arg Ser Ile Gly Ile Thr Glu Lys Leu Thr

115 120 125

Arg Glu Glu Leu Val Trp Ser Leu Ile His Ile Ala Asn Arg Arg Gly

130 135 140

Tyr Lys Asn Lys Phe Ala Phe Asp Ile Glu Gly Asp Gly Lys Lys Arg

145 150 155 160

Glu Thr Lys Leu Asp Glu Ala Ile Ser Asn Ala Leu Ile Ser Ser Asn

165 170 175

Leu Thr Ile Ser Gln Glu Ile Val Arg Asn Lys Lys Phe Arg Asp Ala

180 185 190

Lys Asn Lys Lys Ala Leu Leu Val Arg Asn Lys Gly Gly Lys Glu Gly

195 200 205

Glu Asn Asn Phe Gln Phe Leu Phe Ala Arg Asp Asp Tyr Lys Lys Glu

210 215 220

Val Asp Leu Leu Leu Ala Lys Gln Ala Lys Phe Tyr Pro Glu Leu Thr

225 230 235 240

Glu Glu Ile Arg Ala Lys Ala Ala Asp Ile Ile Phe Arg Gln Arg Asp

245 250 255

Phe Glu Asp Gly Pro Gly Pro Lys Lys Gln Glu Leu Arg Glu Ile Tyr

260 265 270

Lys Lys Glu Asn Lys Gln Phe Ser Lys Asn Phe Thr Gln Leu Glu Gly

275 280 285

Arg Cys Thr Phe Leu Arg Glu Leu Ser Val Gly Tyr Lys Ser Ser Ile

290 295 300

Leu Phe Asp Leu Phe His Ile Ile Ser Glu Val Ser Lys Ile Ser Lys

305 310 315 320

Tyr Ile Glu Glu Asn Asp Gln Leu Ala Gln Asp Ile Ile Ser Ser Phe

325 330 335

Leu Tyr Asn Glu Ala Gly Lys Lys Gly Lys Thr Leu Leu Lys Glu Ile

340 345 350

Leu Lys Lys His His Ile Asn Asp Asp Ile Phe Asp Thr Asn Ala Tyr

355 360 365

Lys Asn Ile Asp Phe Lys Thr Asn Tyr Leu Asn Leu Leu Lys Glu Val

370 375 380

Phe Gly Asn Asp Val Leu Lys Asn Leu Ser Leu Asn Arg Leu Glu Asp

385 390 395 400

Asn Ile Tyr His Gln Leu Gly Phe Ile Ile His Thr Asn Ile Thr Pro

405 410 415

Glu Arg Lys Glu Lys Ala Ile Asn Gln Trp Leu Leu Glu Asn Asn Ile

420 425 430

Ile Leu Ala Lys Glu Lys Leu Asn Ile Leu Leu Lys Pro Asn Ser Ser

435 440 445

Ile Ser Thr Thr Val Lys Thr Ser Phe Lys Trp Met Ser Ile Ala Ile

450 455 460

Ser Asn Phe Leu Lys Gly Ile Pro Tyr Gly Lys Phe Gln Ala Gln Phe

465 470 475 480

Ile Lys Glu Asp Asn Phe Lys Leu Pro Glu Ser Tyr Ala Lys Gln Tyr

485 490 495

Gln Lys Tyr Leu Thr Gly Glu Lys Thr Phe Glu Met Phe Ala Pro Ile

500 505 510

Ile Asp Pro Asp Leu Trp Arg Asn Pro Ile Val Phe Arg Ala Ile Asn

515 520 525

Gln Ala Arg Lys Val Ile Lys Lys Leu Phe Glu Lys Tyr Thr Phe Ile

530 535 540

Asp Gln Ile Asn Ile Glu Leu Thr Arg Glu Met Gly Leu Ser Phe Ser

545 550 555 560

Asp Arg Lys Lys Val Lys Glu Arg Gln Asp Asp Ser Leu Lys Glu Asn

565 570 575

Ala Lys Ala Lys Glu Phe Leu Met Ala Asn Gly Ile Ile Val Asn Asp

580 585 590

Thr Asn Val Leu Lys Tyr Lys Leu Trp Ile Gln Gln Asn Lys Lys Ser

595 600 605

Leu Tyr Ser Gly Lys Glu Ile Thr Ile Ala Asp Leu Gly Ala Ser Asn

610 615 620

Val Leu Gln Ile Asp His Ile Ile Pro Tyr Ser Lys Leu Ala Asp Asp

625 630 635 640

Ser Phe Asn Asn Lys Val Leu Val Phe Ser Lys Glu Asn Gln Glu Lys

645 650 655

Gly Asn Gln Phe Ala Asp Gln Tyr Val Lys Ser Leu Gly Thr Glu Asn

660 665 670

Tyr Asn Asn Tyr Lys Lys Arg Val Asn Tyr Leu Leu Phe Gln Asn Gln

675 680 685

Ile Asn Gln Lys Lys Ala Glu Tyr Leu Leu Cys Ser Asn Gln Asn Glu

690 695 700

Glu Ile Leu Asn Asp Phe Val Ser Arg Asn Leu Asn Asp Thr Arg Tyr

705 710 715 720

Ile Thr Arg Tyr Val Thr Asn Trp Leu Lys Ala Glu Phe Glu Leu Gln

725 730 735

Ser Arg Phe Gly Leu Ala Lys Pro Lys Ile Met Thr Leu Asn Gly Ala

740 745 750

Ile Thr Ser Arg Phe Arg Arg Thr Trp Leu Arg Asn Ser Pro Trp Gly

755 760 765

Leu Glu Lys Lys Ser

770

<210> 22

<211> 1380

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Prevotella intermedia

<400> 22

Met Lys Arg Ile Leu Gly Leu Asp Leu Gly Thr Thr Ser Ile Gly Trp

1 5 10 15

Ala Leu Val Asn Glu Ala Glu Asn Asn Asn Glu Ala Ser Ser Ile Val

20 25 30

Arg Leu Gly Val Arg Val Asn Pro Leu Thr Val Asp Glu Lys Ser Asn

35 40 45

Phe Glu Lys Gly Lys Ala Ile Thr Thr Asn Ala Asp Arg Gln Leu Arg

50 55 60

His Gly Ala Arg Ile Asn Leu Gln Arg Tyr Lys Leu Arg Arg Gln Asn

65 70 75 80

Leu His Asp Cys Leu Gln Lys Gln Gly Trp Leu Gly Thr Glu Ala Met

85 90 95

Tyr Glu Glu Gly Lys Ala Ser Thr Phe Glu Thr Tyr Lys Leu Arg Ala

100 105 110

Lys Ala Ala Glu Glu Glu Ile Ser Leu His Glu Phe Ala Arg Val Leu

115 120 125

Phe Met Leu Asn Lys Lys Arg Gly Tyr Lys Ser Asn Arg Lys Ala Asn

130 135 140

Asn Lys Glu Asp Gly Gln Leu Phe Asp Gly Met Thr Ile Ala Lys Lys

145 150 155 160

Leu Tyr Glu Glu His Leu Thr Pro Ala Glu Tyr Ser Leu Gln Leu Leu

165 170 175

Asn Lys Gly Lys Lys Phe Thr Gln Gly Tyr Tyr Arg Ser Asp Leu Asn

180 185 190

Ala Glu Leu Glu Arg Ile Trp Asp Glu Gln Lys Lys Tyr Tyr Pro Glu

195 200 205

Ile Leu Thr Asp Glu Phe Lys Gln Gln Leu Glu Gly Lys Thr Lys Thr

210 215 220

Asn Thr Ser Lys Ile Phe Leu Ala Lys Tyr Gly Ile Tyr Ser Ala Asp

225 230 235 240

Leu Lys Gly Leu Asp Arg Lys Phe Gln Pro Leu Lys Trp Arg Val Glu

245 250 255

Ala Leu Gln Gln Gln Val Asp Lys Glu Val Leu Ala Phe Val Ile Ser

260 265 270

Asp Leu Lys Gly Gln Ile Ala Asn Thr Ser Gly Leu Leu Gly Ala Ile

275 280 285

Ser Asp Arg Ser Lys Glu Leu Tyr Phe Asn Lys Gln Thr Val Gly Gln

290 295 300

Tyr Leu Trp Ala Ser Leu Glu Glu Asn Pro His Ile Ser Ile Lys Asn

305 310 315 320

Lys Pro Phe Tyr Arg Gln Asp Tyr Leu Asp Glu Phe Glu Lys Ile Trp

325 330 335

Glu Thr Gln Ala Ala Phe His Lys Gln Leu Thr Pro Glu Leu Lys Gln

340 345 350

Glu Ile Arg Asp Ile Ile Ile Phe Tyr Gln Arg Pro Leu Lys Ser Lys

355 360 365

Lys Ser Leu Ile Ser Val Cys Glu Leu Glu Gln Arg Lys Val Lys Ala

370 375 380

Thr Ile Asp Gly Lys Glu Lys Glu Ile Thr Ile Gly Pro Lys Val Ala

385 390 395 400

Pro Lys Ser Ser Pro Val Phe Gln Glu Phe Arg Ile Trp Gln Asn Leu

405 410 415

Asn Asn Val Leu Leu Ile Asp Asn Asp Thr Asn Glu Lys Arg Pro Leu

420 425 430

Asp Glu Val Glu Arg Asn Leu Leu Tyr Lys Glu Leu Ser Ile Lys Ala

435 440 445

Lys Leu Ser Lys Thr Glu Ala Leu Lys Ile Leu Asn Lys Lys Gly Lys

450 455 460

Gln Trp Asp Leu Asn Tyr Arg Glu Leu Glu Gly Asn Arg Thr Gln Ala

465 470 475 480

Ile Leu Phe Asp Cys Tyr Asn Arg Ile Ile Thr Leu Thr Gly His Glu

485 490 495

Glu Cys Asp Phe Lys Lys Ile Lys Ala Ser Glu Ile Arg His Tyr Val

500 505 510

Ser Thr Ile Phe Lys Asn Leu Gly Phe Ser Thr Glu Ile Leu Asp Phe

515 520 525

Asp Pro Ser Leu Lys Lys His Glu Leu Glu Lys Gln Pro Met Tyr Gln

530 535 540

Leu Trp His Leu Leu Tyr Ser Tyr Glu Ser Asp Asn Ser Arg Thr Gly

545 550 555 560

Asn Glu Ser Leu Leu Arg Lys Leu Glu Thr Thr Phe Gly Phe Pro Glu

565 570 575

Glu Tyr Ala Thr Val Leu Cys Asp Val Val Phe Glu Glu Asp Tyr Gly

580 585 590

Asn Leu Ser Val Lys Ala Met Arg Glu Ile Leu Pro Tyr Leu Gln Ala

595 600 605

Gly Asn Asp Tyr Ser Gln Ala Cys Ala Tyr Ala Gly Tyr Asn His Ser

610 615 620

Arg His Ser Leu Thr Lys Glu Glu Leu Asp Gln Lys Val Tyr Lys Glu

625 630 635 640

Arg Leu Glu Leu Leu Pro Lys Asn Ser Leu Arg Asn Pro Val Val Glu

645 650 655

Lys Ile Leu Asn Gln Met Ile Asn Val Ile Asn Ala Ile Ile Asp Glu

660 665 670

Tyr Gly Lys Pro Asp Glu Ile Arg Ile Glu Met Ala Arg Glu Leu Lys

675 680 685

Ser Ser Ala Ala Asp Arg Lys Lys Thr Thr His Ala Ile Ser Gln Gly

690 695 700

Asn Ala Glu Asn Gln Arg Ile Arg Glu Ile Leu Glu Lys Glu Phe Ser

705 710 715 720

Leu Ser Tyr Ile Ser Arg Asn Asp Ile Ile Lys Tyr Lys Leu Tyr Glu

725 730 735

Glu Leu Glu Pro Asn Tyr Tyr Lys Thr Leu Tyr Ser Asp Thr Tyr Ile

740 745 750

Thr Lys Asp Lys Leu Phe Ser Lys Asp Phe Asp Ile Glu His Ile Ile

755 760 765

Pro Lys Ala Arg Leu Phe Asp Asp Ser Phe Ser Asn Lys Thr Leu Glu

770 775 780

Ala Arg Asn Ile Asn Leu Glu Lys Ser Asn Lys Thr Ala Phe Asp Phe

785 790 795 800

Ile Lys Glu Lys Tyr Gly Glu Asp Gly Ala Glu Ala Tyr Lys Lys Lys

805 810 815

Leu Asp Met Leu Leu Glu Asn Asp Ala Ile Ser Arg Pro Lys Tyr Asn

820 825 830

Asn Leu Leu Arg Ala Glu Ala Asp Ile Pro Ser Asp Phe Ile Asn Arg

835 840 845

Asp Leu Arg Asn Thr Gln Tyr Ile Ala Lys Lys Ala Cys Glu Ile Leu

850 855 860

Gly Glu Leu Val Lys Thr Val Thr Pro Thr Thr Gly Lys Ile Thr Asn

865 870 875 880

Arg Leu Arg Glu Asp Trp Gln Leu Val Asp Val Met Lys Glu Leu Asn

885 890 895

Phe Glu Lys Tyr Glu Lys Leu Gly Leu Thr Glu Ile Val Glu Asp Arg

900 905 910

Asp Gly Arg Lys Ile Lys Arg Ile Lys Asp Trp Thr Lys Arg Asn Asp

915 920 925

His Arg His His Ala Met Asp Ala Leu Ala Ile Ala Phe Thr Lys Pro

930 935 940

Ser Phe Ile Gln Tyr Leu Asn Asn Leu Asn Ala Arg Ser Asn Lys Gly

945 950 955 960

Asp Ser Ile Tyr Ala Ile Glu Asn Lys Glu Leu His Tyr Glu Glu Gly

965 970 975

Lys Leu Arg Phe Asn Ala Pro Ile Pro Val Asn Glu Phe Arg Ala Glu

980 985 990

Ala Lys Arg His Leu Ser Ala Ile Leu Val Ser Ile Lys Ala Lys Asn

995 1000 1005

Lys Val Met Thr Gln Asn Val Asn Lys Ile Lys Thr Lys His Gly

1010 1015 1020

Ile Ile Lys Lys Ile Gln Leu Thr Pro Arg Gly Pro Leu His Asn

1025 1030 1035

Glu Thr Ile Tyr Gly Thr Lys Met Arg Pro Ile Ile Lys Met Val

1040 1045 1050

Lys Val Gly Ala Ala Leu Asp Glu Ala Thr Ile Asn Lys Val Ser

1055 1060 1065

Ser Pro Ala Ile Arg Glu Ala Leu Leu Lys Arg Leu Asn Glu Tyr

1070 1075 1080

Ser Gly Asn Ala Lys Lys Ala Phe Thr Gly Lys Asn Thr Leu Glu

1085 1090 1095

Lys Asn Pro Ile Tyr Leu Asn Ala Gly Arg Thr Lys Thr Val Pro

1100 1105 1110

Ser Leu Val Lys Thr Val Glu Trp Glu Ser Phe His Pro Thr Arg

1115 1120 1125

Lys Leu Ile Asp Lys Asp Leu Asn Val Asp Lys Val Val Asp Lys

1130 1135 1140

Gly Ile Arg Glu Ile Leu Lys Ala Arg Leu Glu Glu Phe Asn Gly

1145 1150 1155

Asp Ala Lys Lys Ala Phe Ser Asn Leu Glu Glu Asn Pro Ile Tyr

1160 1165 1170

Leu Asp Glu Ala Lys Lys Ile Ala Leu Lys Arg Val Ser Ile Glu

1175 1180 1185

Gly Val Leu Ser Ala Ile Pro Leu His Thr Leu Lys Asn Gln Ala

1190 1195 1200

Gly Lys Pro Ile Thr Gly Lys Asp Gly Lys Pro Val Leu Gly Asn

1205 1210 1215

Tyr Val Gln Thr Ser Asn Asn His His Ile Ala Phe Tyr Tyr Asp

1220 1225 1230

Glu Asp Gly Asn Leu Gln Asp Asn Ala Val Ser Phe Phe Glu Ala

1235 1240 1245

Ala Glu Arg Lys Ser Gln Gly Ile Pro Val Ile Asp Lys Asp Tyr

1250 1255 1260

Asn Arg Asp Lys Gly Trp Arg Phe Leu Phe Thr Met Lys Gln Asn

1265 1270 1275

Glu Tyr Phe Val Phe Pro Asn Glu Ala Thr Gly Phe Ile Pro Ser

1280 1285 1290

Glu Val Asp Leu Thr Asp Glu Ala Asn Tyr Gly Ile Ile Ser Pro

1295 1300 1305

Asn Leu Tyr Arg Val Gln Lys Val Ser Arg Ile Asp Lys Gly Thr

1310 1315 1320

Ser Ala Ser Arg Asp Tyr Trp Phe Arg His His Leu Glu Thr Ile

1325 1330 1335

Leu Asn Asp Asp Ala Lys Leu Lys Asn Leu Ala Phe Lys Arg Ile

1340 1345 1350

Arg Gly Leu Leu Glu Leu Lys Asp Ile Ile Lys Val Arg Ile Asn

1355 1360 1365

Ser Thr Gly Lys Ile Val Ala Val Gly Glu Tyr Asp

1370 1375 1380

<210> 23

<211> 535

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Spiroplasma taiwanense

<400> 23

Met Trp Ser Arg Lys Ile Leu Lys Ala Gly Ser Arg Leu Phe Asp Glu

1 5 10 15

Ala Asn Leu Ser Asp Lys Ile Ala Ser Lys Arg Arg Glu Gln Arg Gly

20 25 30

Arg Arg Arg Asn Leu Arg Arg Lys Ile Thr Trp Lys Gln Asp Leu Ile

35 40 45

Asn Leu Phe Val Lys Tyr Asn Phe Leu Gln Lys Glu Asn Asp Phe Tyr

50 55 60

Glu Leu Asp Phe Asn Phe Asp Leu Leu Glu Leu Arg Lys Lys Ala Ile

65 70 75 80

Asn Ser Lys Ile Glu Leu Glu Gln Leu Leu Ile Ile Leu Phe Asn Tyr

85 90 95

Ile Lys His Arg Gly Ser Phe Asn Tyr Arg Glu Asp Leu Ser Glu Leu

100 105 110

Lys Asn Ile Ser Gln Glu Glu Leu Glu Thr Ser Ser Glu Phe Lys Leu

115 120 125

Pro Val Asp Ile Gln Phe Glu Leu Lys Glu Glu Asn Asn Lys Phe Arg

130 135 140

Glu Ile Asn Asn Glu Lys Ser Leu Ile Asn His Glu Trp Tyr Val Lys

145 150 155 160

Glu Ile Asn Leu Ile Leu Asp Ala Gln Ile Glu Asn Lys Leu Ile Asn

165 170 175

Leu Asp Phe Lys Lys Asp Tyr Leu Lys Leu Phe Asn Arg Lys Arg Glu

180 185 190

Tyr Tyr Asp Gly Pro Gly Pro Lys Asp Lys Asn Leu Leu Asn Pro Ser

195 200 205

Lys Tyr Gly Trp Lys Asn Gln Glu Glu Phe Phe Asp Arg Phe Ala Gly

210 215 220

Lys Asp Thr Tyr Asp Ser Lys Glu Gln Arg Ala Pro Lys His Ser Leu

225 230 235 240

Thr Ser Tyr Leu Phe Asn Ile Leu Asn Asp Leu Asn Asn Leu Ser Ile

245 250 255

Asn Gly Asp Arg Asn Gln Leu Thr Tyr Glu Asn Lys Lys Asp Leu Ile

260 265 270

Asn Leu Thr Leu Ile Asn Gln Lys Glu Lys Ala Glu Asn Ile Thr Leu

275 280 285

Lys Lys Ile Ala Lys Tyr Leu Lys Ile Asn Glu Lys Asn Ile Thr Gly

290 295 300

Tyr Arg Leu Lys Pro Asn Ser Asn Glu Ser Ile Phe Thr Val Phe Glu

305 310 315 320

Ser Ala Asn Lys Met Arg Ser Ile Leu Val Lys Asn Asn Lys Ser Ile

325 330 335

Asp Phe Ile Cys Leu Glu Asn Ile Asp Lys Ile Asp Lys Ile Val Asp

340 345 350

Ile Leu Thr Lys Tyr Gln Ser Ile Glu Asp Lys Ser Leu Lys Leu Glu

355 360 365

Glu Leu Asn Phe Asp Phe Phe Asp Lys Glu Thr Cys Glu Lys Leu Ala

370 375 380

Val Ile Ser Leu Thr Gly Thr His Ala Leu Ser Lys Lys Thr Met Ser

385 390 395 400

Lys Leu Ile Glu Glu Met Phe His Asp Asn Leu Asn His Met Glu Ala

405 410 415

Leu Ala Lys Leu Lys Ile Lys Pro Asp Tyr Lys Leu Lys Val Asp Leu

420 425 430

Thr Asn Phe Lys Thr Ile Pro Ile Leu Arg Glu Lys Ile Asn Glu Met

435 440 445

Tyr Ile Ser Pro Val Val Lys Arg Ala Leu Ile Glu Ser Leu Lys Ile

450 455 460

Ile Lys Glu Leu Glu Arg His Phe Lys Asp Phe Glu Ile Lys Asp Ile

465 470 475 480

Val Ile Glu Met Ala Lys Lys Asn Ser Ala Glu Lys Lys Gln Phe Ile

485 490 495

Ser Lys Ile Gln Arg Gln Asn Val Asp Leu Val Lys Lys Leu Ser Asn

500 505 510

Asp Tyr Ser Leu Asp Glu Asn Lys Leu Asn Phe Lys Met Lys Glu Lys

515 520 525

Phe Leu Leu Leu Ser Glu Gln

530 535

<210> 24

<211> 1281

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Streptococcus iniae

<400> 24

Met Arg Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Met

20 25 30

Arg Ile Gln Gly Thr Thr Asp Arg Thr Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Asn Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Thr Arg Arg Arg Tyr Thr Arg Arg Lys Tyr Arg Ile Lys

65 70 75 80

Glu Leu Gln Lys Ile Phe Ser Ser Glu Met Asn Glu Leu Asp Ile Ala

85 90 95

Phe Phe Pro Arg Leu Ser Glu Ser Phe Leu Val Ser Asp Asp Lys Glu

100 105 110

Phe Glu Asn His Pro Ile Phe Gly Asn Leu Lys Asp Glu Ile Thr Tyr

115 120 125

His Asn Asp Tyr Pro Thr Ile Tyr His Leu Arg Gln Thr Leu Ala Asp

130 135 140

Ser Asp Gln Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Ile Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asn Leu Asp Ser

165 170 175

Glu Asn Thr Asp Val His Val Leu Phe Leu Asn Leu Val Asn Ile Tyr

180 185 190

Asn Asn Leu Phe Glu Glu Asp Ile Val Glu Thr Ala Ser Ile Asp Ala

195 200 205

Glu Lys Ile Leu Thr Ser Lys Thr Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Glu Ile Pro Asn Gln Lys Arg Asn Met Leu Phe Gly Asn

225 230 235 240

Leu Val Ser Leu Ala Leu Gly Leu Thr Pro Asn Phe Lys Thr Asn Phe

245 250 255

Glu Leu Leu Glu Asp Ala Lys Leu Gln Ile Ser Lys Asp Ser Tyr Glu

260 265 270

Glu Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Ile Ala Ala Lys Lys Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Ile Thr Val Lys Gly Ala Ser Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Val Gln Arg Tyr Glu Glu His Gln Gln Asp Leu Ala Leu Leu Lys

325 330 335

Asn Leu Val Lys Lys Gln Ile Pro Glu Lys Tyr Lys Glu Ile Phe Asp

340 345 350

Asn Lys Glu Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Tyr Ile Lys Pro Ile Leu Leu Lys Leu Asp

370 375 380

Gly Thr Glu Lys Leu Ile Ser Lys Leu Glu Arg Glu Asp Phe Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Asn Glu Leu Lys Ala Ile Ile Arg Arg Gln Glu Lys Phe Tyr Pro Phe

420 425 430

Leu Lys Glu Asn Gln Lys Lys Ile Glu Lys Leu Phe Thr Phe Lys Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Asn Gly Gln Ser Ser Phe Ala Trp

450 455 460

Leu Lys Arg Gln Ser Asn Glu Ser Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Gln Glu Ala Ser Ala Arg Ala Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Thr Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser

500 505 510

Pro Leu Tyr Glu Met Phe Met Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Gln Thr Glu Gly Met Lys Arg Pro Val Phe Leu Ser Ser Glu Asp

530 535 540

Lys Glu Glu Ile Val Asn Leu Leu Phe Lys Lys Glu Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Glu Tyr Phe Ser Lys Met Lys Cys Phe His

565 570 575

Thr Val Thr Ile Leu Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Phe Lys Asp Lys Ala Phe Leu Asp

595 600 605

Asp Glu Ala Asn Gln Asp Ile Leu Glu Glu Ile Val Trp Thr Leu Thr

610 615 620

Leu Phe Glu Asp Gln Ala Met Ile Glu Arg Arg Leu Val Lys Tyr Ala

625 630 635 640

Asp Val Phe Glu Lys Ser Val Leu Lys Lys Leu Lys Lys Arg His Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Gln Lys Leu Ile Asn Gly Ile Lys Asp

660 665 670

Lys Gln Thr Gly Lys Thr Ile Leu Gly Phe Leu Lys Asp Asp Gly Val

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Ser Ser Leu Asp Phe

690 695 700

Ala Lys Ile Ile Lys Asn Glu Gln Glu Lys Thr Ile Lys Asn Glu Ser

705 710 715 720

Leu Glu Glu Thr Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys

725 730 735

Gly Ile Leu Gln Ser Ile Lys Ile Val Asp Glu Ile Val Lys Ile Met

740 745 750

Gly Gln Asn Pro Asp Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Ser Thr Met Gln Gly Ile Lys Asn Ser Arg Gln Arg Leu Arg Lys Leu

770 775 780

Glu Glu Val His Lys Asn Thr Gly Ser Lys Ile Leu Lys Glu Tyr Asn

785 790 795 800

Val Ser Asn Thr Gln Leu Gln Ser Asp Arg Leu Tyr Leu Tyr Leu Leu

805 810 815

Gln Asp Gly Lys Asp Met Tyr Thr Gly Lys Glu Leu Asp Tyr Asp Asn

820 825 830

Leu Ser Gln Tyr Asp Ile Asp His Ile Ile Pro Gln Ser Phe Ile Lys

835 840 845

Asp Asn Ser Ile Asp Asn Thr Val Leu Thr Thr Gln Ala Ser Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Asn Ile Glu Thr Val Asn Lys Met Lys

865 870 875 880

Ser Phe Trp Tyr Lys Gln Leu Lys Ser Gly Ala Ile Ser Gln Arg Lys

885 890 895

Phe Asp His Leu Thr Lys Ala Glu Arg Gly Ala Leu Ser Asp Phe Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Phe Asn Ser Asn Leu Thr

930 935 940

Glu Asp Ser Lys Ser Asn Arg Asn Val Lys Ile Ile Thr Leu Lys Ser

945 950 955 960

Lys Met Val Ser Asp Phe Arg Lys Asp Phe Gly Phe Tyr Lys Leu Arg

965 970 975

Glu Val Asn Asp Tyr His His Ala Gln Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Leu Lys Lys Tyr Pro Lys Leu Glu Ala Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys His Tyr Asp Leu Ala Lys Leu Met Ile

1010 1015 1020

Gln Pro Asp Ser Ser Leu Gly Lys Ala Thr Thr Arg Met Phe Phe

1025 1030 1035

Tyr Ser Asn Leu Met Asn Phe Phe Lys Lys Glu Ile Lys Leu Ala

1040 1045 1050

Asp Asp Thr Ile Phe Thr Arg Pro Gln Ile Glu Val Asn Thr Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Val Lys Asp Met Gln Thr Ile

1070 1075 1080

Arg Lys Val Met Ser Tyr Pro Gln Val Asn Ile Val Met Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Trp Pro Lys

1100 1105 1110

Gly Asp Ser Asp Lys Leu Ile Ala Arg Lys Lys Ser Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Ile Ile Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Ile Ala Lys Gly Lys Thr Gln Lys Leu Lys

1145 1150 1155

Thr Ile Lys Glu Leu Val Gly Ile Lys Ile Met Glu Gln Asp Glu

1160 1165 1170

Phe Glu Lys Asp Pro Ile Ala Phe Leu Glu Lys Lys Gly Tyr Gln

1175 1180 1185

Asp Ile Gln Thr Ser Ser Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Leu Leu Ala Ser Ala Lys

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Asn Lys Tyr Val

1220 1225 1230

Lys Phe Leu Tyr Leu Ala Ser His Tyr Thr Lys Phe Thr Gly Lys

1235 1240 1245

Glu Glu Asp Arg Glu Lys Lys Arg Ser Tyr Val Glu Ser His Leu

1250 1255 1260

Tyr Tyr Phe Asp Val Arg Leu Ser Gln Val Phe Arg Val Thr Asn

1265 1270 1275

Val Glu Phe

1280

<210> 25

<211> 1352

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Belliella baltica

<400> 25

Met Lys Lys Ile Leu Gly Leu Asp Leu Gly Thr Thr Ser Ile Gly Trp

1 5 10 15

Ala Phe Ile Lys Glu Pro Glu Lys Asp Val Val Gly Ser Glu Ile Val

20 25 30

Asp Met Gly Val Arg Ile Val Pro Leu Ser Ser Asp Glu Glu Asn Asp

35 40 45

Phe Ala Lys Gly Asn Thr Ile Ser Ile Asn Ala Asp Arg Thr Leu Lys

50 55 60

Arg Gly Ala Arg Arg Asn Leu Gln Arg Phe Lys Gln Arg Arg Asn Ala

65 70 75 80

Leu Leu Glu Ile Phe Lys Glu Lys Lys Leu Ile Ser Thr Asn Phe Lys

85 90 95

Tyr Ala Glu Asp Gly Pro Ser Ser Thr Phe Ser Thr Leu Asn Leu Arg

100 105 110

Ala Lys Ala Ala Lys Glu Lys Ile Glu Leu Gln Asp Leu Val Lys Val

115 120 125

Leu Leu Gln Ile Asn Lys Lys Arg Gly Tyr Lys Ser Ser Arg Lys Ala

130 135 140

Lys Ser Glu Glu Asp Asp Gly Ser Ala Ile Asp Ser Met Gly Ile Ala

145 150 155 160

Lys Glu Leu Tyr Glu Asn Asp Leu Thr Pro Gly Gln Trp Val Tyr Glu

165 170 175

Ala Leu Gln Lys Gly Arg Lys Asn Val Pro Asp Phe Tyr Arg Ser Asp

180 185 190

Leu Gln Glu Glu Phe Lys Lys Ile Val Asn Tyr Gln Ser Glu Phe Phe

195 200 205

Pro Asp Ile Phe Asn Ala Ser Phe Val Glu Asp Trp Met Gly Lys Ala

210 215 220

Ser Thr Pro Thr Lys Gln Tyr Phe Asn Lys Lys Gly Val Gln Leu Ala

225 230 235 240

Glu Asn Lys Gly Lys Arg Glu Glu Arg Arg Leu Gln Glu Tyr Lys Trp

245 250 255

Arg Ala Glu Ala Val Asn Phe Lys Ile Asp Leu Ser Glu Ile Ala Leu

260 265 270

Ile Leu Ser Gln Ile Asn Ser Gln Ile Ser Asn Ser Ser Gly Tyr Leu

275 280 285

Gly Ala Ile Ser Asp Arg Ser Lys Glu Leu Tyr Phe Lys Asn Leu Thr

290 295 300

Val Gly Gln Tyr Leu Tyr Gln Gln Ile Lys Lys Asn Pro His Thr Arg

305 310 315 320

Leu Lys Gly Gln Val Phe Tyr Arg Gln Asp Tyr Leu Asp Glu Phe Glu

325 330 335

Arg Ile Trp Ser Val Gln Ser Ser Phe Tyr Pro Gln Leu Asn Asp Ala

340 345 350

Leu Lys Arg Glu Val Arg Asp Ile Thr Ile Phe Phe Gln Arg Arg Leu

355 360 365

Lys Ser Gln Lys His Leu Ile Ser Asn Cys Glu Phe Glu Asp His His

370 375 380

Lys Val Val Pro Lys Ser His Pro Val Phe Gln Glu Phe Arg Ile Trp

385 390 395 400

Gln Asn Leu Asn Asn Leu Leu Leu Ile Lys Lys Asp Asn Leu Asn Glu

405 410 415

Lys Phe Asp Leu Glu Leu Glu Ser Lys Ile Ala Leu Ala Asn Glu Leu

420 425 430

Ala Phe Lys Arg Glu Leu Asn Val Lys Asp Ala Leu Lys Ile Leu Gly

435 440 445

Leu Lys Pro Asn Glu Trp Glu Phe Asn Phe Thr Lys Ile Glu Gly Asn

450 455 460

Arg Thr Asn Gln Ala Phe Phe Asp Ala Phe Ala Lys Ile Ile Glu Leu

465 470 475 480

Glu Asp Gly Glu Pro Ile Asp Leu Gly Asp Leu Lys Ala Asp Asp Ile

485 490 495

Leu Asp Gln Phe Ser Glu Ala Phe Leu Arg Ile Gly Ile Asp Thr Glu

500 505 510

Leu Leu Gln Val Asn Ser Asp Ile Glu Gly Ala Glu Tyr Glu Lys Gln

515 520 525

Ser Tyr Ile Gln Phe Trp His Leu Leu Tyr Ser Ser Glu Asp Asp Gln

530 535 540

Lys Leu Lys Leu Asn Leu Ile Arg Lys Phe Gly Phe Lys Pro Glu His

545 550 555 560

Ala Lys Ile Leu Ala Ser Ile Ser Leu Gln Asp Asp His Ala Ser Leu

565 570 575

Ser Ser Arg Ala Ile Lys Lys Ile Leu Pro His Leu Gln Ser Gly Leu

580 585 590

Ile Tyr Asp Lys Ala Cys Thr Tyr Ala Gly Tyr Asn His Ser Ser Ser

595 600 605

Phe Thr Lys Asp Glu Asn Glu Lys Arg Glu Leu Arg Ala Glu Leu Glu

610 615 620

Leu Leu Lys Lys Asn Ser Leu Arg Asn Pro Val Val Glu Lys Ile Leu

625 630 635 640

Asn Gln Met Ile Asn Val Val Asn Ala Ile Leu Lys Asp Pro Glu Leu

645 650 655

Gly Arg Pro Asp Glu Ile Arg Val Glu Met Ala Arg Glu Leu Lys Ala

660 665 670

Asn Ala Glu Gln Arg Lys Asn Met Thr Ser Asn Ile Ala Ser Ala Thr

675 680 685

Arg Asp His Asp Lys Tyr Arg Glu Ile Leu Lys Ser Glu Phe Gly Leu

690 695 700

Lys Arg Val Thr Lys Asn Asp Leu Leu Arg Tyr Lys Leu Trp Leu Glu

705 710 715 720

Thr Asp Gly Ile Ser Leu Tyr Thr Gly Lys Pro Ile Glu Ala Ser Lys

725 730 735

Leu Phe Ser Lys Glu Tyr Asp Ile Glu His Ile Ile Pro Lys Ala Arg

740 745 750

Leu Phe Asp Asp Ser Phe Ser Asn Lys Thr Ile Cys Glu Arg Gln Leu

755 760 765

Asn Ile Asp Lys Ala Asn Val Thr Ala Phe Ser Phe Leu Gln Asn Lys

770 775 780

Leu Ser Ala Asp Glu Phe Glu Gln Tyr Gln Ser Arg Val Lys Ser Leu

785 790 795 800

Tyr Gly Lys Leu Ser Lys Ala Lys Ile Gln Lys Leu Leu Met Ala Asn

805 810 815

Asp Lys Ile Pro Glu Asp Phe Ile Ala Arg Gln Leu Gln Glu Thr Arg

820 825 830

Tyr Ile Ser Lys Lys Ala Lys Glu Ile Leu Phe Glu Ile Ser Arg Arg

835 840 845

Val Ser Val Thr Thr Gly Thr Ile Thr Asp Lys Leu Arg Glu Asp Trp

850 855 860

Gly Leu Val Glu Ile Met Lys Glu Leu Asn Trp Glu Lys Tyr Asp Lys

865 870 875 880

Leu Gly Leu Thr Tyr Thr Ile Glu Gly Lys His Gly Glu Arg Leu Asn

885 890 895

Lys Ile Lys Asp Trp Ser Lys Arg Asn Asp His Arg His His Ala Met

900 905 910

Asp Ala Leu Thr Val Ala Leu Thr Lys Pro Ala Tyr Ile Gln Tyr Leu

915 920 925

Asn Asn Leu Asn Ala Lys Gly Leu Asn Asn Lys Lys Gly Thr Glu Val

930 935 940

Phe Ala Ile Glu Gln Lys Tyr Leu Lys Arg Glu Asn Gly Lys Leu Cys

945 950 955 960

Phe Ile Pro Pro Ile Glu Asn Ile Arg Ser Glu Ala Lys Lys His Leu

965 970 975

Ser Arg Ile Leu Val Ser Tyr Lys Ala Lys Asn Lys Val Val Thr Ile

980 985 990

Asn Lys Asn Lys Thr Lys Ser Lys Ala Gly Leu Asn Glu Gln Ile Ala

995 1000 1005

Leu Thr Pro Arg Gly Gln Leu His Lys Glu Thr Val Tyr Gly Lys

1010 1015 1020

Ser Phe His Tyr Ser Thr Lys Phe Glu Lys Ile Gly Ala Ser Phe

1025 1030 1035

Asn Val Gln Lys Ile Asn Thr Val Ala Lys Lys Glu Glu Arg Glu

1040 1045 1050

Ala Leu Leu Lys Arg Leu Ala Glu Asn Gly Asn Asp Pro Lys Lys

1055 1060 1065

Ala Phe Thr Gly Lys Asn Thr Leu Asn Lys Met Pro Ile Tyr Leu

1070 1075 1080

Asp Leu Gly Lys Asn Ile Lys Leu Ser Glu Lys Val Lys Thr Val

1085 1090 1095

Val Leu Glu Gln Asn Tyr Thr Ile Arg Lys Asn Ile Asp Pro Asp

1100 1105 1110

Leu Lys Val Asp Lys Val Ile Asp Val Gly Ile Lys Arg Ile Leu

1115 1120 1125

Glu Ser Arg Leu Glu Glu Phe Gly Gly Asn Ala Lys Leu Ala Phe

1130 1135 1140

Ser Asn Leu Glu Glu Asn Pro Ile Trp Leu Asn Lys Glu Lys Gly

1145 1150 1155

Ile Ser Ile Lys Arg Val Lys Ile Ser Gly Val Ser Asn Val Glu

1160 1165 1170

Ser Leu His Val Lys Lys Asp His Phe Gly Glu Pro Ile Leu Asp

1175 1180 1185

Gln Glu Gly Asn Glu Ile Pro Val Asp Phe Val Ser Thr Gly Asn

1190 1195 1200

Asn His His Val Ala Ile Tyr Glu Asp Glu Asn Gly Asn Leu Gln

1205 1210 1215

Glu Glu Val Val Ser Phe Phe Glu Ala Val Val Arg Gln Asn Gln

1220 1225 1230

Gly Leu Pro Ile Ile Lys Lys Asn His Thr Leu Gly Trp Lys Phe

1235 1240 1245

Leu Phe Thr Leu Lys Gln Asn Glu Tyr Phe Val Phe Pro Ser Asp

1250 1255 1260

Asp Phe Val Pro Ala Asp Val Asp Leu Met Asp Glu Gln Asn Tyr

1265 1270 1275

His Leu Ile Ser Pro Asn Leu Phe Arg Val Gln Lys Ile Ala Arg

1280 1285 1290

Lys Asn Tyr Val Phe Asn Asn His Leu Glu Thr Lys Ala Val Asp

1295 1300 1305

Asn Asp Leu Leu Lys Ser Lys Lys Glu Leu Ser Lys Ile Thr Tyr

1310 1315 1320

His Phe Tyr Gln Thr Pro Glu His Leu Arg Gly Ile Ile Lys Ile

1325 1330 1335

Arg Ile Asn His Leu Gly Lys Ile Ile Gln Ile Gly Glu Tyr

1340 1345 1350

<210> 26

<211> 1509

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Psychroflexus torquisI

<400> 26

Met Lys Arg Ile Leu Gly Leu Asp Leu Gly Thr Asn Ser Ile Gly Trp

1 5 10 15

Ser Leu Ile Glu His Asp Phe Lys Asn Lys Gln Gly Gln Ile Glu Gly

20 25 30

Leu Gly Val Arg Ile Ile Pro Met Ser Gln Glu Ile Leu Gly Lys Phe

35 40 45

Asp Ala Gly Gln Ser Ile Ser Gln Thr Ala Asp Arg Thr Lys Tyr Arg

50 55 60

Gly Val Arg Arg Leu Tyr Gln Arg Asp Asn Leu Arg Arg Glu Arg Leu

65 70 75 80

His Arg Val Leu Lys Ile Leu Asp Phe Leu Pro Lys His Tyr Ser Glu

85 90 95

Ser Ile Asp Phe Gln Asp Lys Val Gly Gln Phe Lys Pro Lys Gln Glu

100 105 110

Val Lys Leu Asn Tyr Arg Lys Asn Glu Lys Asn Lys His Glu Phe Val

115 120 125

Phe Met Asn Ser Phe Ile Glu Met Val Ser Glu Phe Lys Asn Ala Gln

130 135 140

Pro Glu Leu Phe Tyr Asn Lys Gly Asn Gly Glu Glu Thr Lys Ile Pro

145 150 155 160

Tyr Asp Trp Thr Leu Tyr Tyr Leu Arg Lys Lys Ala Leu Thr Gln Gln

165 170 175

Ile Thr Lys Glu Glu Leu Ala Trp Leu Ile Leu Asn Phe Asn Gln Lys

180 185 190

Arg Gly Tyr Tyr Gln Leu Arg Gly Glu Asp Ile Asp Glu Asp Lys Asn

195 200 205

Lys Lys Tyr Met Gln Leu Lys Val Asn Asn Leu Ile Asp Ser Gly Ala

210 215 220

Lys Val Lys Gly Lys Val Leu Tyr Asn Val Ile Phe Asp Asn Gly Trp

225 230 235 240

Lys Tyr Glu Lys Gln Ile Val Asn Lys Asp Glu Trp Glu Gly Arg Thr

245 250 255

Lys Glu Phe Ile Ile Thr Thr Lys Thr Leu Lys Asn Gly Asn Ile Lys

260 265 270

Arg Thr Tyr Lys Ala Val Asp Ser Glu Ile Asp Trp Ala Ala Ile Lys

275 280 285

Ala Lys Thr Glu Gln Asp Ile Asn Lys Ala Asn Lys Thr Val Gly Glu

290 295 300

Tyr Ile Tyr Glu Ser Leu Leu Asp Asn Pro Ser Gln Lys Ile Arg Gly

305 310 315 320

Lys Leu Val Lys Thr Ile Glu Arg Lys Phe Tyr Lys Glu Glu Phe Glu

325 330 335

Lys Leu Leu Ser Lys Gln Ile Glu Leu Gln Pro Glu Leu Phe Asn Glu

340 345 350

Ser Leu Tyr Lys Ala Cys Ile Lys Glu Leu Tyr Pro Arg Asn Glu Asn

355 360 365

His Gln Ser Asn Asn Lys Lys Gln Gly Phe Glu Tyr Leu Phe Thr Glu

370 375 380

Asp Ile Ile Phe Tyr Gln Arg Pro Leu Lys Ser Gln Lys Ser Asn Ile

385 390 395 400

Ser Gly Cys Gln Phe Glu His Lys Ile Tyr Lys Gln Lys Asn Lys Lys

405 410 415

Thr Gly Lys Leu Glu Leu Ile Lys Glu Pro Ile Lys Thr Ile Ser Arg

420 425 430

Ser His Pro Leu Phe Gln Glu Phe Arg Ile Trp Gln Trp Leu Gln Asn

435 440 445

Leu Lys Ile Tyr Asn Lys Glu Lys Ile Glu Asn Gly Lys Leu Glu Asp

450 455 460

Val Thr Thr Gln Leu Leu Pro Asn Asn Glu Ala Tyr Val Thr Leu Phe

465 470 475 480

Asp Phe Leu Asn Thr Lys Lys Glu Leu Glu Gln Lys Gln Phe Ile Glu

485 490 495

Tyr Phe Val Lys Lys Lys Leu Ile Asp Lys Lys Glu Lys Glu His Phe

500 505 510

Arg Trp Asn Phe Val Glu Asp Lys Lys Tyr Pro Phe Ser Glu Thr Arg

515 520 525

Ala Gln Phe Leu Ser Arg Leu Ala Lys Val Lys Gly Ile Lys Asn Thr

530 535 540

Glu Asp Phe Leu Asn Lys Asn Thr Gln Val Gly Ser Lys Glu Asn Ser

545 550 555 560

Pro Phe Ile Lys Arg Ile Glu Gln Leu Trp His Ile Ile Tyr Ser Val

565 570 575

Ser Asp Leu Lys Glu Tyr Glu Lys Ala Leu Glu Lys Phe Ala Glu Lys

580 585 590

His Asn Leu Glu Lys Asp Ser Phe Leu Lys Asn Phe Lys Lys Phe Pro

595 600 605

Pro Phe Val Ser Asp Tyr Ala Ser Tyr Ser Lys Lys Ala Ile Ser Lys

610 615 620

Leu Leu Pro Ile Met Arg Met Gly Lys Tyr Trp Ser Glu Ser Ala Val

625 630 635 640

Pro Thr Gln Val Lys Glu Arg Ser Leu Ser Ile Met Glu Arg Val Lys

645 650 655

Val Leu Pro Leu Lys Glu Gly Tyr Ser Asp Lys Asp Leu Ala Asp Leu

660 665 670

Leu Ser Arg Val Ser Asp Asp Asp Ile Pro Lys Gln Leu Ile Lys Ser

675 680 685

Phe Ile Ser Phe Lys Asp Lys Asn Pro Leu Lys Gly Leu Asn Thr Tyr

690 695 700

Gln Ala Asn Tyr Leu Val Tyr Gly Arg His Ser Glu Thr Gly Asp Ile

705 710 715 720

Gln His Trp Lys Thr Pro Glu Asp Ile Asp Arg Tyr Leu Asn Asn Phe

725 730 735

Lys Gln His Ser Leu Arg Asn Pro Ile Val Glu Gln Val Val Met Glu

740 745 750

Thr Leu Arg Val Val Arg Asp Ile Trp Glu His Tyr Gly Asn Asn Glu

755 760 765

Lys Asp Phe Phe Lys Glu Ile His Val Glu Leu Gly Arg Glu Met Lys

770 775 780

Ser Pro Ala Gly Lys Arg Glu Lys Leu Ser Gln Arg Asn Thr Glu Asn

785 790 795 800

Glu Asn Thr Asn His Arg Ile Arg Glu Val Leu Lys Glu Leu Met Asn

805 810 815

Asp Ala Ser Val Glu Gly Gly Val Arg Asp Tyr Ser Pro Ser Gln Gln

820 825 830

Glu Ile Leu Lys Leu Tyr Glu Glu Gly Ile Tyr Gln Asn Pro Asn Thr

835 840 845

Asn Tyr Leu Lys Val Asp Glu Asp Glu Ile Leu Lys Ile Arg Lys Lys

850 855 860

Asn Asn Pro Thr Gln Lys Glu Ile Gln Arg Tyr Lys Leu Trp Leu Glu

865 870 875 880

Gln Gly Tyr Ile Ser Pro Tyr Thr Gly Lys Ile Ile Pro Leu Thr Lys

885 890 895

Leu Phe Thr His Glu Tyr Gln Ile Glu His Ile Ile Pro Gln Ser Arg

900 905 910

Tyr Tyr Asp Asn Ser Leu Gly Asn Lys Ile Ile Cys Glu Ser Glu Val

915 920 925

Asn Glu Asp Lys Asp Asn Lys Thr Ala Tyr Glu Tyr Leu Lys Val Glu

930 935 940

Lys Gly Ser Ile Val Phe Gly His Lys Leu Leu Asn Leu Asp Glu Tyr

945 950 955 960

Glu Ala His Val Asn Lys Tyr Phe Lys Lys Asn Lys Thr Lys Leu Lys

965 970 975

Asn Leu Leu Ser Glu Asp Ile Pro Glu Gly Phe Ile Asn Arg Gln Leu

980 985 990

Asn Asp Ser Arg Tyr Ile Ser Lys Leu Val Lys Gly Leu Leu Ser Asn

995 1000 1005

Ile Val Arg Glu Asn Gly Glu Gln Glu Ala Thr Ser Lys Asn Leu

1010 1015 1020

Ile Pro Val Thr Gly Val Val Thr Ser Lys Leu Lys Gln Asp Trp

1025 1030 1035

Gly Leu Asn Asp Lys Trp Asn Glu Ile Ile Ala Pro Arg Phe Lys

1040 1045 1050

Arg Leu Asn Lys Leu Thr Asn Ser Asn Asp Phe Gly Phe Trp Asp

1055 1060 1065

Asn Asp Ile Asn Ala Phe Arg Ile Gln Val Pro Asp Ser Leu Ile

1070 1075 1080

Lys Gly Phe Ser Lys Lys Arg Ile Asp His Arg His His Ala Leu

1085 1090 1095

Asp Ala Leu Val Val Ala Cys Thr Ser Arg Asn His Thr His Tyr

1100 1105 1110

Leu Ser Ala Leu Asn Ala Glu Asn Lys Asn Tyr Ser Leu Arg Asp

1115 1120 1125

Lys Leu Val Ile Lys Asn Glu Asn Gly Asp Tyr Thr Lys Thr Phe

1130 1135 1140

Gln Ile Pro Trp Gln Gly Phe Thr Ile Glu Ala Lys Asn Asn Leu

1145 1150 1155

Glu Lys Thr Val Val Ser Phe Lys Lys Asn Leu Arg Val Ile Asn

1160 1165 1170

Lys Thr Asn Asn Lys Phe Trp Ser Tyr Lys Asp Glu Asn Gly Asn

1175 1180 1185

Leu Asn Leu Gly Lys Asp Gly Lys Pro Lys Lys Lys Leu Arg Lys

1190 1195 1200

Gln Thr Lys Gly Tyr Asn Trp Ala Ile Arg Lys Pro Leu His Lys

1205 1210 1215

Glu Thr Val Ser Gly Ile Tyr Asn Ile Asn Ala Pro Lys Asn Lys

1220 1225 1230

Ile Ala Thr Ser Val Arg Thr Leu Leu Thr Glu Ile Lys Asn Glu

1235 1240 1245

Lys His Leu Ala Lys Ile Thr Asp Leu Arg Ile Arg Glu Thr Ile

1250 1255 1260

Leu Pro Asn His Leu Lys His Tyr Leu Asn Asn Lys Gly Glu Ala

1265 1270 1275

Asn Phe Ser Glu Ala Phe Ser Gln Gly Gly Ile Glu Asp Leu Asn

1280 1285 1290

Lys Lys Ile Thr Thr Leu Asn Glu Gly Lys Lys His Gln Pro Ile

1295 1300 1305

Tyr Arg Val Lys Ile Phe Glu Val Gly Ser Lys Phe Ser Ile Ser

1310 1315 1320

Glu Asp Glu Asn Ser Ala Lys Ser Lys Lys Tyr Val Glu Ala Ala

1325 1330 1335

Lys Gly Thr Asn Leu Phe Phe Ala Ile Tyr Leu Asp Glu Glu Asn

1340 1345 1350

Lys Lys Arg Asn Tyr Glu Thr Ile Pro Leu Asn Glu Val Ile Thr

1355 1360 1365

His Gln Lys Gln Val Ala Gly Phe Pro Lys Ser Glu Arg Leu Ser

1370 1375 1380

Val Gln Pro Asp Ser Gln Lys Gly Thr Phe Leu Phe Thr Leu Ser

1385 1390 1395

Pro Asn Asp Leu Val Tyr Val Pro Asn Asn Glu Glu Leu Glu Asn

1400 1405 1410

Arg Asp Leu Phe Asn Leu Gly Asn Leu Asn Val Glu Gln Ile Ser

1415 1420 1425

Arg Ile Tyr Lys Phe Thr Asp Ser Ser Asp Lys Thr Cys Asn Phe

1430 1435 1440

Ile Pro Phe Gln Val Ser Lys Leu Ile Phe Asn Leu Lys Lys Lys

1445 1450 1455

Glu Gln Lys Lys Leu Asp Val Asp Phe Ile Ile Gln Asn Glu Phe

1460 1465 1470

Gly Leu Gly Ser Pro Gln Ser Lys Asn Gln Lys Ser Ile Asp Asp

1475 1480 1485

Val Met Ile Lys Glu Lys Cys Ile Lys Leu Lys Ile Asp Arg Leu

1490 1495 1500

Gly Asn Ile Ser Lys Ala

1505

<210> 27

<211> 1388

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Streptococcus thermophilus

<400> 27

Met Thr Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Thr Thr Asp Asn Tyr Lys Val Pro Ser Lys Lys Met

20 25 30

Lys Val Leu Gly Asn Thr Ser Lys Lys Tyr Ile Lys Lys Asn Leu Leu

35 40 45

Gly Val Leu Leu Phe Asp Ser Gly Ile Thr Ala Glu Gly Arg Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Thr Glu Met Ala Thr Leu Asp Asp Ala

85 90 95

Phe Phe Gln Arg Leu Asp Asp Ser Phe Leu Val Pro Asp Asp Lys Arg

100 105 110

Asp Ser Lys Tyr Pro Ile Phe Gly Asn Leu Val Glu Glu Lys Ala Tyr

115 120 125

His Asp Glu Phe Pro Thr Ile Tyr His Leu Arg Lys Tyr Leu Ala Asp

130 135 140

Ser Thr Lys Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Glu Phe Asn Ser

165 170 175

Lys Asn Asn Asp Ile Gln Lys Asn Phe Gln Asp Phe Leu Asp Thr Tyr

180 185 190

Asn Ala Ile Phe Glu Ser Asp Leu Ser Leu Glu Asn Ser Lys Gln Leu

195 200 205

Glu Glu Ile Val Lys Asp Lys Ile Ser Lys Leu Glu Lys Lys Asp Arg

210 215 220

Ile Leu Lys Leu Phe Pro Gly Glu Lys Asn Ser Gly Ile Phe Ser Glu

225 230 235 240

Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Arg Lys Cys Phe

245 250 255

Asn Leu Asp Glu Lys Ala Ser Leu His Phe Ser Lys Glu Ser Tyr Asp

260 265 270

Glu Asp Leu Glu Thr Leu Leu Gly Tyr Ile Gly Asp Asp Tyr Ser Asp

275 280 285

Val Phe Leu Lys Ala Lys Lys Leu Tyr Asp Ala Ile Leu Leu Ser Gly

290 295 300

Phe Leu Thr Val Thr Asp Asn Glu Thr Glu Ala Pro Leu Ser Ser Ala

305 310 315 320

Met Ile Lys Arg Tyr Asn Glu His Lys Glu Asp Leu Ala Leu Leu Lys

325 330 335

Glu Tyr Ile Arg Asn Ile Ser Leu Lys Thr Tyr Asn Glu Val Phe Lys

340 345 350

Asp Asp Thr Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn

355 360 365

Gln Glu Asp Phe Tyr Val Tyr Leu Lys Lys Leu Leu Ala Glu Phe Glu

370 375 380

Gly Ala Asp Tyr Phe Leu Glu Lys Ile Asp Arg Glu Asp Phe Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro Tyr Gln Ile His Leu

405 410 415

Gln Glu Met Arg Ala Ile Leu Asp Lys Gln Ala Lys Phe Tyr Pro Phe

420 425 430

Leu Ala Lys Asn Lys Glu Arg Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Asp Phe Ala Trp

450 455 460

Ser Ile Arg Lys Arg Asn Glu Lys Ile Thr Pro Trp Asn Phe Glu Asp

465 470 475 480

Val Ile Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr

485 490 495

Ser Phe Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Thr Phe Asn Val Tyr Asn Glu Leu Thr Lys Val Arg

515 520 525

Phe Ile Ala Glu Ser Met Arg Asp Tyr Gln Phe Leu Asp Ser Lys Gln

530 535 540

Lys Lys Asp Ile Val Arg Leu Tyr Phe Lys Asp Lys Arg Lys Val Thr

545 550 555 560

Asp Lys Asp Ile Ile Glu Tyr Leu His Ala Ile Tyr Gly Tyr Asp Gly

565 570 575

Ile Glu Leu Lys Gly Ile Glu Lys Gln Phe Asn Ser Ser Leu Ser Thr

580 585 590

Tyr His Asp Leu Leu Asn Ile Ile Asn Asp Lys Glu Phe Leu Asp Asp

595 600 605

Ser Ser Asn Glu Ala Ile Ile Glu Glu Ile Ile His Thr Leu Thr Ile

610 615 620

Phe Glu Asp Arg Glu Met Ile Lys Gln Arg Leu Ser Lys Phe Glu Asn

625 630 635 640

Ile Phe Asp Lys Ser Val Leu Lys Lys Leu Ser Arg Arg His Tyr Thr

645 650 655

Gly Trp Gly Lys Leu Ser Ala Lys Leu Ile Asn Gly Ile Arg Asp Glu

660 665 670

Lys Ser Gly Asn Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Ile Ser

675 680 685

Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ala Leu Ser Phe Lys

690 695 700

Lys Lys Ile Gln Lys Ala Gln Ile Ile Gly Asp Glu Asp Lys Gly Asn

705 710 715 720

Ile Lys Glu Val Val Lys Ser Leu Pro Gly Ser Pro Ala Ile Lys Lys

725 730 735

Gly Ile Leu Gln Ser Ile Lys Ile Val Asp Glu Leu Val Lys Val Met

740 745 750

Gly Gly Arg Lys Pro Glu Ser Ile Val Val Glu Met Ala Arg Glu Asn

755 760 765

Gln Tyr Thr Asn Gln Gly Lys Ser Asn Ser Gln Gln Arg Leu Lys Arg

770 775 780

Leu Glu Lys Ser Leu Lys Glu Leu Gly Ser Lys Ile Leu Lys Glu Asn

785 790 795 800

Ile Pro Ala Lys Leu Ser Lys Ile Asp Asn Asn Ala Leu Gln Asn Asp

805 810 815

Arg Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly

820 825 830

Asp Asp Leu Asp Ile Asp Arg Leu Ser Asn Tyr Asp Ile Asp His Ile

835 840 845

Ile Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile Asp Asn Lys Val Leu

850 855 860

Val Ser Ser Ala Ser Asn Arg Gly Lys Ser Asp Asp Val Pro Ser Leu

865 870 875 880

Glu Val Val Lys Lys Arg Lys Thr Phe Trp Tyr Gln Leu Leu Lys Ser

885 890 895

Lys Leu Ile Ser Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

900 905 910

Gly Gly Leu Ser Pro Glu Asp Lys Ala Gly Phe Ile Gln Arg Gln Leu

915 920 925

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Arg Leu Leu Asp Glu

930 935 940

Lys Phe Asn Asn Lys Lys Asp Glu Asn Asn Arg Ala Val Arg Thr Val

945 950 955 960

Lys Ile Ile Thr Leu Lys Ser Thr Leu Val Ser Gln Phe Arg Lys Asp

965 970 975

Phe Glu Leu Tyr Lys Val Arg Glu Ile Asn Asp Phe His His Ala His

980 985 990

Asp Ala Tyr Leu Asn Ala Val Val Ala Ser Ala Leu Leu Lys Lys Tyr

995 1000 1005

Pro Lys Leu Glu Pro Glu Phe Val Tyr Gly Asp Tyr Pro Lys Tyr

1010 1015 1020

Asn Ser Phe Arg Glu Arg Lys Ser Ala Thr Glu Lys Val Tyr Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Ile Phe Lys Lys Ser Ile Ser Leu Ala

1040 1045 1050

Asp Gly Arg Val Ile Glu Arg Pro Leu Ile Glu Val Asn Glu Glu

1055 1060 1065

Thr Gly Glu Ser Val Trp Asn Lys Glu Ser Asp Leu Ala Thr Val

1070 1075 1080

Arg Arg Val Leu Ser Tyr Pro Gln Val Asn Val Val Lys Lys Val

1085 1090 1095

Glu Glu Gln Asn His Gly Leu Asp Arg Gly Lys Pro Lys Gly Leu

1100 1105 1110

Phe Asn Ala Asn Leu Ser Ser Lys Pro Lys Pro Asn Ser Asn Glu

1115 1120 1125

Asn Leu Val Gly Ala Lys Glu Tyr Leu Asp Pro Lys Lys Tyr Gly

1130 1135 1140

Gly Tyr Ala Gly Ile Ser Asn Ser Phe Thr Val Leu Val Lys Gly

1145 1150 1155

Thr Ile Glu Lys Gly Ala Lys Lys Lys Ile Thr Asn Val Leu Glu

1160 1165 1170

Phe Gln Gly Ile Ser Ile Leu Asp Arg Ile Asn Tyr Arg Lys Asp

1175 1180 1185

Lys Leu Asn Phe Leu Leu Glu Lys Gly Tyr Lys Asp Ile Glu Leu

1190 1195 1200

Ile Ile Glu Leu Pro Lys Tyr Ser Leu Phe Glu Leu Ser Asp Gly

1205 1210 1215

Ser Arg Arg Met Leu Ala Ser Ile Leu Ser Thr Asn Asn Lys Arg

1220 1225 1230

Gly Glu Ile His Lys Gly Asn Gln Ile Phe Leu Ser Gln Lys Phe

1235 1240 1245

Val Lys Leu Leu Tyr His Ala Lys Arg Ile Ser Asn Thr Ile Asn

1250 1255 1260

Glu Asn His Arg Lys Tyr Val Glu Asn His Lys Lys Glu Phe Glu

1265 1270 1275

Glu Leu Phe Tyr Tyr Ile Leu Glu Phe Asn Glu Asn Tyr Val Gly

1280 1285 1290

Ala Lys Lys Asn Gly Lys Leu Leu Asn Ser Ala Phe Gln Ser Trp

1295 1300 1305

Gln Asn His Ser Ile Asp Glu Leu Cys Ser Ser Phe Ile Gly Pro

1310 1315 1320

Thr Gly Ser Glu Arg Lys Gly Leu Phe Glu Leu Thr Ser Arg Gly

1325 1330 1335

Ser Ala Ala Asp Phe Glu Phe Leu Gly Val Lys Ile Pro Arg Tyr

1340 1345 1350

Arg Asp Tyr Thr Pro Ser Ser Leu Leu Lys Asp Ala Thr Leu Ile

1355 1360 1365

His Gln Ser Val Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ala

1370 1375 1380

Lys Leu Gly Glu Gly

1385

<210> 28

<211> 1334

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Listeria innocua

<400> 28

Met Lys Lys Pro Tyr Thr Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Leu Thr Asp Gln Tyr Asp Leu Val Lys Arg Lys Met

20 25 30

Lys Ile Ala Gly Asp Ser Glu Lys Lys Gln Ile Lys Lys Asn Phe Trp

35 40 45

Gly Val Arg Leu Phe Asp Glu Gly Gln Thr Ala Ala Asp Arg Arg Met

50 55 60

Ala Arg Thr Ala Arg Arg Arg Ile Glu Arg Arg Arg Asn Arg Ile Ser

65 70 75 80

Tyr Leu Gln Gly Ile Phe Ala Glu Glu Met Ser Lys Thr Asp Ala Asn

85 90 95

Phe Phe Cys Arg Leu Ser Asp Ser Phe Tyr Val Asp Asn Glu Lys Arg

100 105 110

Asn Ser Arg His Pro Phe Phe Ala Thr Ile Glu Glu Glu Val Glu Tyr

115 120 125

His Lys Asn Tyr Pro Thr Ile Tyr His Leu Arg Glu Glu Leu Val Asn

130 135 140

Ser Ser Glu Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His

145 150 155 160

Ile Ile Lys Tyr Arg Gly Asn Phe Leu Ile Glu Gly Ala Leu Asp Thr

165 170 175

Gln Asn Thr Ser Val Asp Gly Ile Tyr Lys Gln Phe Ile Gln Thr Tyr

180 185 190

Asn Gln Val Phe Ala Ser Gly Ile Glu Asp Gly Ser Leu Lys Lys Leu

195 200 205

Glu Asp Asn Lys Asp Val Ala Lys Ile Leu Val Glu Lys Val Thr Arg

210 215 220

Lys Glu Lys Leu Glu Arg Ile Leu Lys Leu Tyr Pro Gly Glu Lys Ser

225 230 235 240

Ala Gly Met Phe Ala Gln Phe Ile Ser Leu Ile Val Gly Ser Lys Gly

245 250 255

Asn Phe Gln Lys Pro Phe Asp Leu Ile Glu Lys Ser Asp Ile Glu Cys

260 265 270

Ala Lys Asp Ser Tyr Glu Glu Asp Leu Glu Ser Leu Leu Ala Leu Ile

275 280 285

Gly Asp Glu Tyr Ala Glu Leu Phe Val Ala Ala Lys Asn Ala Tyr Ser

290 295 300

Ala Val Val Leu Ser Ser Ile Ile Thr Val Ala Glu Thr Glu Thr Asn

305 310 315 320

Ala Lys Leu Ser Ala Ser Met Ile Glu Arg Phe Asp Thr His Glu Glu

325 330 335

Asp Leu Gly Glu Leu Lys Ala Phe Ile Lys Leu His Leu Pro Lys His

340 345 350

Tyr Glu Glu Ile Phe Ser Asn Thr Glu Lys His Gly Tyr Ala Gly Tyr

355 360 365

Ile Asp Gly Lys Thr Lys Gln Ala Asp Phe Tyr Lys Tyr Met Lys Met

370 375 380

Thr Leu Glu Asn Ile Glu Gly Ala Asp Tyr Phe Ile Ala Lys Ile Glu

385 390 395 400

Lys Glu Asn Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ala Ile

405 410 415

Pro His Gln Leu His Leu Glu Glu Leu Glu Ala Ile Leu His Gln Gln

420 425 430

Ala Lys Tyr Tyr Pro Phe Leu Lys Glu Asn Tyr Asp Lys Ile Lys Ser

435 440 445

Leu Val Thr Phe Arg Ile Pro Tyr Phe Val Gly Pro Leu Ala Asn Gly

450 455 460

Gln Ser Glu Phe Ala Trp Leu Thr Arg Lys Ala Asp Gly Glu Ile Arg

465 470 475 480

Pro Trp Asn Ile Glu Glu Lys Val Asp Phe Gly Lys Ser Ala Val Asp

485 490 495

Phe Ile Glu Lys Met Thr Asn Lys Asp Thr Tyr Leu Pro Lys Glu Asn

500 505 510

Val Leu Pro Lys His Ser Leu Cys Tyr Gln Lys Tyr Leu Val Tyr Asn

515 520 525

Glu Leu Thr Lys Val Arg Tyr Ile Asn Asp Gln Gly Lys Thr Ser Tyr

530 535 540

Phe Ser Gly Gln Glu Lys Glu Gln Ile Phe Asn Asp Leu Phe Lys Gln

545 550 555 560

Lys Arg Lys Val Lys Lys Lys Asp Leu Glu Leu Phe Leu Arg Asn Met

565 570 575

Ser His Val Glu Ser Pro Thr Ile Glu Gly Leu Glu Asp Ser Phe Asn

580 585 590

Ser Ser Tyr Ser Thr Tyr His Asp Leu Leu Lys Val Gly Ile Lys Gln

595 600 605

Glu Ile Leu Asp Asn Pro Val Asn Thr Glu Met Leu Glu Asn Ile Val

610 615 620

Lys Ile Leu Thr Val Phe Glu Asp Lys Arg Met Ile Lys Glu Gln Leu

625 630 635 640

Gln Gln Phe Ser Asp Val Leu Asp Gly Val Val Leu Lys Lys Leu Glu

645 650 655

Arg Arg His Tyr Thr Gly Trp Gly Arg Leu Ser Ala Lys Leu Leu Met

660 665 670

Gly Ile Arg Asp Lys Gln Ser His Leu Thr Ile Leu Asp Tyr Leu Met

675 680 685

Asn Asp Asp Gly Leu Asn Arg Asn Leu Met Gln Leu Ile Asn Asp Ser

690 695 700

Asn Leu Ser Phe Lys Ser Ile Ile Glu Lys Glu Gln Val Thr Thr Ala

705 710 715 720

Asp Lys Asp Ile Gln Ser Ile Val Ala Asp Leu Ala Gly Ser Pro Ala

725 730 735

Ile Lys Lys Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val

740 745 750

Ser Val Met Gly Tyr Pro Pro Gln Thr Ile Val Val Glu Met Ala Arg

755 760 765

Glu Asn Gln Thr Thr Gly Lys Gly Lys Asn Asn Ser Arg Pro Arg Tyr

770 775 780

Lys Ser Leu Glu Lys Ala Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys

785 790 795 800

Glu His Pro Thr Asp Asn Gln Glu Leu Arg Asn Asn Arg Leu Tyr Leu

805 810 815

Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly Gln Asp Leu Asp

820 825 830

Ile His Asn Leu Ser Asn Tyr Asp Ile Asp His Ile Val Pro Gln Ser

835 840 845

Phe Ile Thr Asp Asn Ser Ile Asp Asn Leu Val Leu Thr Ser Ser Ala

850 855 860

Gly Asn Arg Glu Lys Gly Asp Asp Val Pro Pro Leu Glu Ile Val Arg

865 870 875 880

Lys Arg Lys Val Phe Trp Glu Lys Leu Tyr Gln Gly Asn Leu Met Ser

885 890 895

Lys Arg Lys Phe Asp Tyr Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr

900 905 910

Glu Ala Asp Lys Ala Arg Phe Ile His Arg Gln Leu Val Glu Thr Arg

915 920 925

Gln Ile Thr Lys Asn Val Ala Asn Ile Leu His Gln Arg Phe Asn Tyr

930 935 940

Glu Lys Asp Asp His Gly Asn Thr Met Lys Gln Val Arg Ile Val Thr

945 950 955 960

Leu Lys Ser Ala Leu Val Ser Gln Phe Arg Lys Gln Phe Gln Leu Tyr

965 970 975

Lys Val Arg Asp Val Asn Asp Tyr His His Ala His Asp Ala Tyr Leu

980 985 990

Asn Gly Val Val Ala Asn Thr Leu Leu Lys Val Tyr Pro Gln Leu Glu

995 1000 1005

Pro Glu Phe Val Tyr Gly Asp Tyr His Gln Phe Asp Trp Phe Lys

1010 1015 1020

Ala Asn Lys Ala Thr Ala Lys Lys Gln Phe Tyr Thr Asn Ile Met

1025 1030 1035

Leu Phe Phe Ala Gln Lys Asp Arg Ile Ile Asp Glu Asn Gly Glu

1040 1045 1050

Ile Leu Trp Asp Lys Lys Tyr Leu Asp Thr Val Lys Lys Val Met

1055 1060 1065

Ser Tyr Arg Gln Met Asn Ile Val Lys Lys Thr Glu Ile Gln Lys

1070 1075 1080

Gly Glu Phe Ser Lys Ala Thr Ile Lys Pro Lys Gly Asn Ser Ser

1085 1090 1095

Lys Leu Ile Pro Arg Lys Thr Asn Trp Asp Pro Met Lys Tyr Gly

1100 1105 1110

Gly Leu Asp Ser Pro Asn Met Ala Tyr Ala Val Val Ile Glu Tyr

1115 1120 1125

Ala Lys Gly Lys Asn Lys Leu Val Phe Glu Lys Lys Ile Ile Arg

1130 1135 1140

Val Thr Ile Met Glu Arg Lys Ala Phe Glu Lys Asp Glu Lys Ala

1145 1150 1155

Phe Leu Glu Glu Gln Gly Tyr Arg Gln Pro Lys Val Leu Ala Lys

1160 1165 1170

Leu Pro Lys Tyr Thr Leu Tyr Glu Cys Glu Glu Gly Arg Arg Arg

1175 1180 1185

Met Leu Ala Ser Ala Asn Glu Ala Gln Lys Gly Asn Gln Gln Val

1190 1195 1200

Leu Pro Asn His Leu Val Thr Leu Leu His His Ala Ala Asn Cys

1205 1210 1215

Glu Val Ser Asp Gly Lys Ser Leu Asp Tyr Ile Glu Ser Asn Arg

1220 1225 1230

Glu Met Phe Ala Glu Leu Leu Ala His Val Ser Glu Phe Ala Lys

1235 1240 1245

Arg Tyr Thr Leu Ala Glu Ala Asn Leu Asn Lys Ile Asn Gln Leu

1250 1255 1260

Phe Glu Gln Asn Lys Glu Gly Asp Ile Lys Ala Ile Ala Gln Ser

1265 1270 1275

Phe Val Asp Leu Met Ala Phe Asn Ala Met Gly Ala Pro Ala Ser

1280 1285 1290

Phe Lys Phe Phe Glu Thr Thr Ile Glu Arg Lys Arg Tyr Asn Asn

1295 1300 1305

Leu Lys Glu Leu Leu Asn Ser Thr Ile Ile Tyr Gln Ser Ile Thr

1310 1315 1320

Gly Leu Tyr Glu Ser Arg Lys Arg Leu Asp Asp

1325 1330

<210> 29

<211> 984

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Campylobacter jejuni

<400> 29

Met Ala Arg Ile Leu Ala Phe Asp Ile Gly Ile Ser Ser Ile Gly Trp

1 5 10 15

Ala Phe Ser Glu Asn Asp Glu Leu Lys Asp Cys Gly Val Arg Ile Phe

20 25 30

Thr Lys Val Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu Pro Arg

35 40 45

Arg Leu Ala Arg Ser Ala Arg Lys Arg Leu Ala Arg Arg Lys Ala Arg

50 55 60

Leu Asn His Leu Lys His Leu Ile Ala Asn Glu Phe Lys Leu Asn Tyr

65 70 75 80

Glu Asp Tyr Gln Ser Phe Asp Glu Ser Leu Ala Lys Ala Tyr Lys Gly

85 90 95

Ser Leu Ile Ser Pro Tyr Glu Leu Arg Phe Arg Ala Leu Asn Glu Leu

100 105 110

Leu Ser Lys Gln Asp Phe Ala Arg Val Ile Leu His Ile Ala Lys Arg

115 120 125

Arg Gly Tyr Asp Asp Ile Lys Asn Ser Asp Asp Lys Glu Lys Gly Ala

130 135 140

Ile Leu Lys Ala Ile Lys Gln Asn Glu Glu Lys Leu Ala Asn Tyr Gln

145 150 155 160

Ser Val Gly Glu Tyr Leu Tyr Lys Glu Tyr Phe Gln Lys Phe Lys Glu

165 170 175

Asn Ser Lys Glu Phe Thr Asn Val Arg Asn Lys Lys Glu Ser Tyr Glu

180 185 190

Arg Cys Ile Ala Gln Ser Phe Leu Lys Asp Glu Leu Lys Leu Ile Phe

195 200 205

Lys Lys Gln Arg Glu Phe Gly Phe Ser Phe Ser Lys Lys Phe Glu Glu

210 215 220

Glu Val Leu Ser Val Ala Phe Tyr Lys Arg Ala Leu Lys Asp Phe Ser

225 230 235 240

His Leu Val Gly Asn Cys Ser Phe Phe Thr Asp Glu Lys Arg Ala Pro

245 250 255

Lys Asn Ser Pro Leu Ala Phe Met Phe Val Ala Leu Thr Arg Ile Ile

260 265 270

Asn Leu Leu Asn Asn Leu Lys Asn Thr Glu Gly Ile Leu Tyr Thr Lys

275 280 285

Asp Asp Leu Asn Ala Leu Leu Asn Glu Val Leu Lys Asn Gly Thr Leu

290 295 300

Thr Tyr Lys Gln Thr Lys Lys Leu Leu Gly Leu Ser Asp Asp Tyr Glu

305 310 315 320

Phe Lys Gly Glu Lys Gly Thr Tyr Phe Ile Glu Phe Lys Lys Tyr Lys

325 330 335

Glu Phe Ile Lys Ala Leu Gly Glu His Asn Leu Ser Gln Asp Asp Leu

340 345 350

Asn Glu Ile Ala Lys Asp Ile Thr Leu Ile Lys Asp Glu Ile Lys Leu

355 360 365

Lys Lys Ala Leu Ala Lys Tyr Asp Leu Asn Gln Asn Gln Ile Asp Ser

370 375 380

Leu Ser Lys Leu Glu Phe Lys Asp His Leu Asn Ile Ser Phe Lys Ala

385 390 395 400

Leu Lys Leu Val Thr Pro Leu Met Leu Glu Gly Lys Lys Tyr Asp Glu

405 410 415

Ala Cys Asn Glu Leu Asn Leu Lys Val Ala Ile Asn Glu Asp Lys Lys

420 425 430

Asp Phe Leu Pro Ala Phe Asn Glu Thr Tyr Tyr Lys Asp Glu Val Thr

435 440 445

Asn Pro Val Val Leu Arg Ala Ile Lys Glu Tyr Arg Lys Val Leu Asn

450 455 460

Ala Leu Leu Lys Lys Tyr Gly Lys Val His Lys Ile Asn Ile Glu Leu

465 470 475 480

Ala Arg Glu Val Gly Lys Asn His Ser Gln Arg Ala Lys Ile Glu Lys

485 490 495

Glu Gln Asn Glu Asn Tyr Lys Ala Lys Lys Asp Ala Glu Leu Glu Cys

500 505 510

Glu Lys Leu Gly Leu Lys Ile Asn Ser Lys Asn Ile Leu Lys Leu Arg

515 520 525

Leu Phe Lys Glu Gln Lys Glu Phe Cys Ala Tyr Ser Gly Glu Lys Ile

530 535 540

Lys Ile Ser Asp Leu Gln Asp Glu Lys Met Leu Glu Ile Asp His Ile

545 550 555 560

Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr Met Asn Lys Val Leu

565 570 575

Val Phe Thr Lys Gln Asn Gln Glu Lys Leu Asn Gln Thr Pro Phe Glu

580 585 590

Ala Phe Gly Asn Asp Ser Ala Lys Trp Gln Lys Ile Glu Val Leu Ala

595 600 605

Lys Asn Leu Pro Thr Lys Lys Gln Lys Arg Ile Leu Asp Lys Asn Tyr

610 615 620

Lys Asp Lys Glu Gln Lys Asn Phe Lys Asp Arg Asn Leu Asn Asp Thr

625 630 635 640

Arg Tyr Ile Ala Arg Leu Val Leu Asn Tyr Thr Lys Asp Tyr Leu Asp

645 650 655

Phe Leu Pro Leu Ser Asp Asp Glu Asn Thr Lys Leu Asn Asp Thr Gln

660 665 670

Lys Gly Ser Lys Val His Val Glu Ala Lys Ser Gly Met Leu Thr Ser

675 680 685

Ala Leu Arg His Thr Trp Gly Phe Ser Ala Lys Asp Arg Asn Asn His

690 695 700

Leu His His Ala Ile Asp Ala Val Ile Ile Ala Tyr Ala Asn Asn Ser

705 710 715 720

Ile Val Lys Ala Phe Ser Asp Phe Lys Lys Glu Gln Glu Ser Asn Ser

725 730 735

Ala Glu Leu Tyr Ala Lys Lys Ile Ser Glu Leu Asp Tyr Lys Asn Lys

740 745 750

Arg Lys Phe Phe Glu Pro Phe Ser Gly Phe Arg Gln Lys Val Leu Asp

755 760 765

Lys Ile Asp Glu Ile Phe Val Ser Lys Pro Glu Arg Lys Lys Pro Ser

770 775 780

Gly Ala Leu His Glu Glu Thr Phe Arg Lys Glu Glu Glu Phe Tyr Gln

785 790 795 800

Ser Tyr Gly Gly Lys Glu Gly Val Leu Lys Ala Leu Glu Leu Gly Lys

805 810 815

Ile Arg Lys Val Asn Gly Lys Ile Val Lys Asn Gly Asp Met Phe Arg

820 825 830

Val Asp Ile Phe Lys His Lys Lys Thr Asn Lys Phe Tyr Ala Val Pro

835 840 845

Ile Tyr Thr Met Asp Phe Ala Leu Lys Val Leu Pro Asn Lys Ala Val

850 855 860

Ala Arg Ser Lys Lys Gly Glu Ile Lys Asp Trp Ile Leu Met Asp Glu

865 870 875 880

Asn Tyr Glu Phe Cys Phe Ser Leu Tyr Lys Asp Ser Leu Ile Leu Ile

885 890 895

Gln Thr Lys Asp Met Gln Glu Pro Glu Phe Val Tyr Tyr Asn Ala Phe

900 905 910

Thr Ser Ser Thr Val Ser Leu Ile Val Ser Lys His Asp Asn Lys Phe

915 920 925

Glu Thr Leu Ser Lys Asn Gln Lys Ile Leu Phe Lys Asn Ala Asn Glu

930 935 940

Lys Glu Val Ile Ala Lys Ser Ile Gly Ile Gln Asn Leu Lys Val Phe

945 950 955 960

Glu Lys Tyr Ile Val Ser Ala Leu Gly Glu Val Thr Lys Ala Glu Phe

965 970 975

Arg Gln Arg Glu Asp Phe Lys Lys

980

<210> 30

<211> 1082

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Neisseria. meningitidis

<400> 30

Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp

1 5 10 15

Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp

20 25 30

Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg

35 40 45

Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu

50 55 60

Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu

65 70 75 80

Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp

85 90 95

Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln

100 105 110

Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser

115 120 125

Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg

130 135 140

Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys

145 150 155 160

Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr

165 170 175

Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile

180 185 190

Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu

195 200 205

Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn

210 215 220

Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met

225 230 235 240

Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly

245 250 255

His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr

260 265 270

Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile

275 280 285

Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr

290 295 300

Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala

305 310 315 320

Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg

325 330 335

Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala

340 345 350

Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys

355 360 365

Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr

370 375 380

Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys

385 390 395 400

Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser

405 410 415

Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val

420 425 430

Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile

435 440 445

Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu

450 455 460

Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala

465 470 475 480

Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly

485 490 495

Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser

500 505 510

Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys

515 520 525

Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe

530 535 540

Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu

545 550 555 560

Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly

565 570 575

Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe

580 585 590

Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly

595 600 605

Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn

610 615 620

Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu

625 630 635 640

Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys

645 650 655

Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr

660 665 670

Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr

675 680 685

Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn

690 695 700

Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp

705 710 715 720

Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala

725 730 735

Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala

740 745 750

Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln

755 760 765

Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met

770 775 780

Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala

785 790 795 800

Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser

805 810 815

Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg

820 825 830

Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys

835 840 845

Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu

850 855 860

Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg

865 870 875 880

Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys

885 890 895

Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys

900 905 910

Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val

915 920 925

Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn

930 935 940

Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr

945 950 955 960

Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp

965 970 975

Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp

980 985 990

Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu

995 1000 1005

Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys

1010 1015 1020

His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp

1025 1030 1035

His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys

1040 1045 1050

Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys

1055 1060 1065

Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg

1070 1075 1080

<210> 31

<211> 1367

<212> PRT

<213> Artificial Sequence

<220>

<223> Cas9 from Streptococcus pyogenes

<400> 31

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Gly Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Ile Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Arg Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Arg Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Ser Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Ala Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Gly Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly His Ser Leu

705 710 715 720

His Glu Gln Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr

755 760 765

Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu

770 775 780

Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val

785 790 795 800

Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln

805 810 815

Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu

820 825 830

Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Ile Lys Asp

835 840 845

Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly

850 855 860

Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn

865 870 875 880

Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe

885 890 895

Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys

900 905 910

Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys

915 920 925

His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

930 935 940

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys

945 950 955 960

Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu

965 970 975

Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val

980 985 990

Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val

995 1000 1005

Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys

1010 1015 1020

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr

1025 1030 1035

Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn

1040 1045 1050

Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr

1055 1060 1065

Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg

1070 1075 1080

Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu

1085 1090 1095

Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg

1100 1105 1110

Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys

1115 1120 1125

Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu

1130 1135 1140

Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser

1145 1150 1155

Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe

1160 1165 1170

Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu

1175 1180 1185

Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe

1190 1195 1200

Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu

1205 1210 1215

Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn

1220 1225 1230

Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro

1235 1240 1245

Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1250 1255 1260

Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg

1265 1270 1275

Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr

1280 1285 1290

Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile

1295 1300 1305

Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe

1310 1315 1320

Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr

1325 1330 1335

Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly

1340 1345 1350

Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 32

<211> 528

<212> PRT

<213> Artificial Sequence

<220>

<223> ZFP nucleic acid sequence

<400> 32

Ala Thr Gly Gly Cys Cys Cys Ala Gly Gly Cys Thr Gly Cys Thr Cys

1 5 10 15

Thr Thr Gly Ala Gly Cys Cys Cys Gly Gly Ala Gly Ala Gly Ala Ala

20 25 30

Ala Cys Cys Cys Thr Ala Cys Ala Ala Gly Thr Gly Cys Cys Cys Gly

35 40 45

Gly Ala Gly Thr Gly Cys Gly Gly Ala Ala Ala Gly Thr Cys Cys Thr

50 55 60

Thr Cys Thr Cys Thr Gly Ala Gly Cys Gly Gly Ala Gly Thr Cys Ala

65 70 75 80

Cys Cys Thr Cys Cys Gly Ala Gly Ala Gly Cys Ala Cys Cys Ala Gly

85 90 95

Cys Gly Gly Ala Cys Thr Cys Ala Thr Ala Cys Gly Gly Gly Cys Gly

100 105 110

Ala Ala Ala Ala Ala Cys Cys Ala Thr Ala Cys Ala Ala Gly Thr Gly

115 120 125

Cys Cys Cys Ala Gly Ala Ala Thr Gly Thr Gly Gly Thr Ala Ala Ala

130 135 140

Thr Cys Thr Thr Thr Thr Thr Cys Thr Cys Gly Gly Gly Cys Thr Gly

145 150 155 160

Ala Cys Ala Ala Cys Cys Thr Gly Ala Cys Thr Gly Ala Ala Cys Ala

165 170 175

Thr Cys Ala Gly Cys Gly Cys Ala Cys Gly Cys Ala Cys Ala Cys Cys

180 185 190

Gly Gly Thr Gly Ala Ala Ala Ala Ala Cys Cys Thr Thr Ala Cys Ala

195 200 205

Ala Gly Thr Gly Thr Cys Cys Ala Gly Ala Gly Thr Gly Thr Gly Gly

210 215 220

Cys Ala Ala Gly Ala Gly Cys Thr Thr Thr Thr Cys Thr Ala Gly Thr

225 230 235 240

Ala Gly Ala Ala Gly Gly Ala Cys Cys Thr Gly Thr Cys Gly Ala Gly

245 250 255

Cys Gly Cys Ala Thr Cys Ala Gly Cys Gly Gly Ala Cys Thr Cys Ala

260 265 270

Cys Ala Cys Cys Gly Gly Cys Gly Ala Ala Ala Ala Ala Cys Cys Cys

275 280 285

Thr Ala Thr Ala Ala Gly Thr Gly Thr Cys Cys Gly Gly Ala Ala Thr

290 295 300

Gly Thr Gly Gly Ala Ala Ala Gly Ala Gly Cys Thr Thr Thr Ala Gly

305 310 315 320

Cys Cys Gly Cys Ala Ala Cys Gly Ala Cys Ala Cys Cys Cys Thr Thr

325 330 335

Ala Cys Thr Gly Ala Ala Cys Ala Cys Cys Ala Gly Cys Gly Ala Ala

340 345 350

Cys Ala Cys Ala Cys Ala Cys Gly Gly Gly Ala Gly Ala Ala Ala Ala

355 360 365

Ala Cys Cys Ala Thr Ala Thr Ala Ala Ala Thr Gly Thr Cys Cys Gly

370 375 380

Gly Ala Ala Thr Gly Thr Gly Gly Cys Ala Ala Ala Ala Gly Thr Thr

385 390 395 400

Thr Thr Ala Gly Thr Cys Gly Gly Ala Gly Thr Gly Ala Thr Ala Ala

405 410 415

Ala Cys Thr Thr Ala Cys Gly Gly Ala Gly Cys Ala Cys Cys Ala Ala

420 425 430

Cys Gly Gly Ala Cys Ala Cys Ala Cys Ala Cys Cys Gly Gly Ala Gly

435 440 445

Ala Gly Ala Ala Gly Cys Cys Ala Thr Ala Thr Ala Ala Gly Thr Gly

450 455 460

Thr Cys Cys Thr Gly Ala Ala Thr Gly Thr Gly Gly Ala Ala Ala Gly

465 470 475 480

Thr Cys Cys Thr Thr Cys Thr Cys Ala Cys Ala Gly Cys Thr Thr Gly

485 490 495

Cys Thr Cys Ala Thr Cys Thr Gly Cys Gly Ala Gly Cys Ala Cys Ala

500 505 510

Thr Cys Ala Gly Cys Gly Cys Ala Cys Ala Cys Ala Cys Ala Cys Cys

515 520 525

<210> 33

<211> 176

<212> PRT

<213> Artificial Sequence

<220>

<223> ZFP amino acid sequence

<400> 33

Met Ala Gln Ala Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro

1 5 10 15

Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln

20 25 30

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys

35 40 45

Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His Thr

50 55 60

Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser

65 70 75 80

Arg Arg Thr Cys Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro

85 90 95

Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Thr Leu

100 105 110

Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro

115 120 125

Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His Gln

130 135 140

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys

145 150 155 160

Ser Phe Ser Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr

165 170 175

<210> 34

<211> 555

<212> DNA

<213> Artificial Sequence

<220>

<223> ZNF-E2C Nucleotide

<400> 34

atggcgcagg cggcgctgga accgggcgaa aaaccgtata aatgcccgga atgcggcaaa 60

agctttagcc gcaaagatag cctggtgcgc catcagcgca cccataccgg cgaaaaaccg 120

tataaatgcc cggaatgcgg caaaagcttt agccagagcg gcgatctgcg ccgccatcag 180

cgcacccata ccggcgaaaa accgtataaa tgcccggaat gcggcaaaag ctttagcgat 240

tgccgcgatc tggcgcgcca tcagcgcacc cataccggcg aaaaaccgta taaatgcccg 300

gaatgcggca aaagctttag ccagagcagc catctggtgc gccatcagcg cacccatacc 360

ggcgaaaaac cgtataaatg cccggaatgc ggcaaaagct ttagcgattg ccgcgatctg 420

gcgcgccatc agcgcaccca taccggcgaa aaaccgtata aatgcccgga atgcggcaaa 480

agctttagcc gcagcgataa actggtgcgc catcagcgca cccataccgg caaaaaaacc 540

agcggccagg cgggc 555

<210> 35

<211> 185

<212> PRT

<213> Artificial Sequence

<220>

<223> ZNF-E2C Aminoacid

<400> 35

Met Ala Gln Ala Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro

1 5 10 15

Glu Cys Gly Lys Ser Phe Ser Arg Lys Asp Ser Leu Val Arg His Gln

20 25 30

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys

35 40 45

Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr

50 55 60

Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp

65 70 75 80

Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro

85 90 95

Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu

100 105 110

Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro

115 120 125

Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln

130 135 140

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys

145 150 155 160

Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr

165 170 175

Gly Lys Lys Thr Ser Gly Gln Ala Gly

180 185

<210> 36

<211> 555

<212> DNA

<213> Artificial Sequence

<220>

<223> ZNF-E3 Nucleotide

<400> 36

atggcgcagg cggcgctgga accgggcgaa aaaccgtata aatgcccgga atgcggcaaa 60

agctttagcg atccgggcgc gctggtgcgc catcagcgca cccataccgg cgaaaaaccg 120

tataaatgcc cggaatgcgg caaaagcttt agccagagca gccatctggt gcgccatcag 180

cgcacccata ccggcgaaaa accgtataaa tgcccggaat gcggcaaaag ctttagcgat 240

tgccgcgatc tggcgcgcca tcagcgcacc cataccggcg aaaaaccgta taaatgcccg 300

gaatgcggca aaagctttag ccagagcagc catctggtgc gccatcagcg cacccatacc 360

ggcgaaaaac cgtataaatg cccggaatgc ggcaaaagct ttagcgattg ccgcgatctg 420

gcgcgccatc agcgcaccca taccggcgaa aaaccgtata aatgcccgga atgcggcaaa 480

agctttagcc agagcagcca tctggtgcgc catcagcgca cccataccgg caaaaaaacc 540

agcggccagg cgggc 555

<210> 37

<211> 185

<212> PRT

<213> Artificial Sequence

<220>

<223> ZNF-E3 Amino acid

<400> 37

Met Ala Gln Ala Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro

1 5 10 15

Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly Ala Leu Val Arg His Gln

20 25 30

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys

35 40 45

Ser Phe Ser Gln Ser Ser His Leu Val Arg His Gln Arg Thr His Thr

50 55 60

Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp

65 70 75 80

Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro

85 90 95

Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu

100 105 110

Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro

115 120 125

Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln

130 135 140

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys

145 150 155 160

Ser Phe Ser Gln Ser Ser His Leu Val Arg His Gln Arg Thr His Thr

165 170 175

Gly Lys Lys Thr Ser Gly Gln Ala Gly

180 185

<210> 38

<211> 528

<212> PRT

<213> Artificial Sequence

<220>

<223> ZNF-TRCa Nucleotide

<400> 38

Ala Thr Gly Gly Cys Gly Cys Ala Gly Gly Cys Gly Gly Cys Thr Cys

1 5 10 15

Thr Thr Gly Ala Ala Cys Cys Cys Gly Gly Gly Gly Ala Gly Ala Ala

20 25 30

Ala Cys Cys Cys Thr Ala Thr Ala Ala Ala Thr Gly Cys Cys Cys Thr

35 40 45

Gly Ala Gly Thr Gly Thr Gly Gly Cys Ala Ala Gly Ala Gly Thr Thr

50 55 60

Thr Thr Thr Cys Ala Ala Cys Cys Ala Cys Ala Gly Gly Ala Ala Ala

65 70 75 80

Cys Thr Thr Gly Ala Cys Ala Gly Thr Cys Cys Ala Cys Cys Ala Ala

85 90 95

Cys Gly Gly Ala Cys Cys Cys Ala Cys Ala Cys Cys Gly Gly Cys Gly

100 105 110

Ala Gly Ala Ala Ala Cys Cys Ala Thr Ala Cys Ala Ala Gly Thr Gly

115 120 125

Thr Cys Cys Gly Gly Ala Gly Thr Gly Thr Gly Gly Thr Ala Ala Gly

130 135 140

Thr Cys Thr Thr Thr Cys Thr Cys Ala Ala Gly Thr Cys Cys Thr Gly

145 150 155 160

Cys Cys Gly Ala Cys Cys Thr Thr Ala Cys Cys Ala Gly Ala Cys Ala

165 170 175

Thr Cys Ala Ala Cys Gly Cys Ala Cys Ala Cys Ala Thr Ala Cys Ala

180 185 190

Gly Gly Thr Gly Ala Ala Ala Ala Ala Cys Cys Thr Thr Ala Cys Ala

195 200 205

Ala Gly Thr Gly Cys Cys Cys Ala Gly Ala Gly Thr Gly Cys Gly Gly

210 215 220

Ala Ala Ala Ala Ala Gly Thr Thr Thr Thr Thr Cys Ala Cys Ala Ala

225 230 235 240

Thr Cys Thr Gly Gly Cys Gly Ala Cys Cys Thr Cys Cys Gly Cys Ala

245 250 255

Gly Gly Cys Ala Cys Cys Ala Gly Cys Gly Cys Ala Cys Thr Cys Ala

260 265 270

Cys Ala Cys Cys Gly Gly Thr Gly Ala Ala Ala Ala Ala Cys Cys Ala

275 280 285

Thr Ala Cys Ala Ala Gly Thr Gly Thr Cys Cys Thr Gly Ala Gly Thr

290 295 300

Gly Cys Gly Gly Gly Ala Ala Gly Ala Gly Thr Thr Thr Thr Ala Gly

305 310 315 320

Thr Cys Ala Ala Cys Gly Ala Gly Cys Thr Cys Ala Thr Cys Thr Gly

325 330 335

Gly Ala Gly Cys Gly Ala Cys Ala Cys Cys Ala Ala Ala Gly Gly Ala

340 345 350

Cys Thr Cys Ala Thr Ala Cys Thr Gly Gly Gly Gly Ala Gly Ala Ala

355 360 365

Ala Cys Cys Gly Thr Ala Cys Ala Ala Ala Thr Gly Thr Cys Cys Cys

370 375 380

Gly Ala Ala Thr Gly Thr Gly Gly Gly Ala Ala Gly Ala Gly Cys Thr

385 390 395 400

Thr Cys Thr Cys Thr Ala Cys Cys Ala Ala Gly Ala Ala Thr Thr Cys

405 410 415

Cys Cys Thr Thr Ala Cys Ala Gly Ala Gly Cys Ala Cys Cys Ala Gly

420 425 430

Cys Gly Cys Ala Cys Gly Cys Ala Thr Ala Cys Gly Gly Gly Ala Gly

435 440 445

Ala Gly Ala Ala Gly Cys Cys Gly Thr Ala Thr Ala Ala Gly Thr Gly

450 455 460

Thr Cys Cys Gly Gly Ala Ala Thr Gly Thr Gly Gly Cys Ala Ala Gly

465 470 475 480

Ala Gly Cys Thr Thr Thr Thr Cys Cys Ala Gly Ala Ala Gly Thr Gly

485 490 495

Ala Cys Cys Ala Cys Cys Thr Thr Ala Cys Ala Ala Cys Cys Cys Ala

500 505 510

Cys Cys Ala Gly Ala Gly Gly Ala Cys Gly Cys Ala Cys Ala Cys Cys

515 520 525

<210> 39

<211> 176

<212> PRT

<213> Artificial Sequence

<220>

<223> ZNF-TRCa Aminoacid

<400> 39

Met Ala Gln Ala Ala Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro

1 5 10 15

Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln

20 25 30

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys

35 40 45

Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His Thr

50 55 60

Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln

65 70 75 80

Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro

85 90 95

Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu

100 105 110

Glu Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro

115 120 125

Glu Cys Gly Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln

130 135 140

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys

145 150 155 160

Ser Phe Ser Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr

165 170 175

<210> 40

<211> 18

<212> PRT

<213> Artificial Sequence

<220>

<223> AAVS1 site

<400> 40

Ala Gly Ala Cys Gly Gly Cys Cys Gly Cys Gly Thr Cys Ala Gly Ala

1 5 10 15

Gly Cys

<210> 41

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<223> Zinc Finger 1

<400> 41

Glu Arg Ser His Leu Arg Glu

1 5

<210> 42

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<223> Zinc Finger 2

<400> 42

Arg Ala Asp Asn Leu Thr Glu

1 5

<210> 43

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<223> Zinc Finger 3

<400> 43

Ser Arg Arg Thr Cys Arg Ala

1 5

<210> 44

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<223> Zinc Finger 4

<400> 44

Arg Asn Asp Thr Leu Thr Glu

1 5

<210> 45

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<223> Zinc Finger 5

<400> 45

Arg Ser Asp Lys Leu Thr Glu

1 5

<210> 46

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<223> Zinc Finger 6

<400> 46

Gln Leu Ala His Leu Arg Ala

1 5

<210> 47

<211> 51

<212> DNA

<213> Artificial Sequence

<220>

<223> Nuclear Localization Signal

<400> 47

atggctccaa agaaaaagag gaaagtggga atccacggag tccccgccgc t 51

<210> 48

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> GGS linker Nucleic Acid

<400> 48

ggtggatctg gcggtggatc tggtggcggt 30

<210> 49

<211> 10

<212> PRT

<213> Artificial Sequence

<220>

<223> GGS linker Amino Acid

<400> 49

Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly

1 5 10

<210> 50

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> GGS4x Linker Nucleic Acid

<400> 50

ggagggagtg gtgggtccgg tggtagtggc ggatcc 36

<210> 51

<211> 12

<212> PRT

<213> Artificial Sequence

<220>

<223> GGS4x Linker Amino Acid

<400> 51

Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser

1 5 10

<210> 52

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> GGS5x Linker Nucleic Acid

<400> 52

ggaggctccg gtgggtctgg tgggagcggt ggtagtggcg gatcc 45

<210> 53

<211> 15

<212> PRT

<213> Artificial Sequence

<220>

<223> GGS5x Linker Amino Acid

<400> 53

Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser

1 5 10 15

<210> 54

<211> 54

<212> DNA

<213> Artificial Sequence

<220>

<223> GGS6x Linker Nucleic Acid

<400> 54

ggaggcagtg gtgggagcgg tggttccggg ggtagtggtg gttccggggg atcc 54

<210> 55

<211> 18

<212> PRT

<213> Artificial Sequence

<220>

<223> GGS6x Linker Amino Acid

<400> 55

Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly

1 5 10 15

Gly Ser

<210> 56

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> GGS7x Linker Nucleic Acid

<400> 56

ggaggttctg gaggctccgg tgggtccggg ggaagtgggg ggtcaggcgg atcaggagga 60

tcc 63

<210> 57

<211> 21

<212> PRT

<213> Artificial Sequence

<220>

<223> GGS7x Linker Amino Acid

<400> 57

Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly

1 5 10 15

Gly Ser Gly Gly Ser

20

<210> 58

<211> 75

<212> DNA

<213> Artificial Sequence

<220>

<223> GGS8x Linker Nucleic Acid

<400> 58

ggaggtagcg gaggttccgg agggagcggc gggagtgggg gaagcggggg aagtggagga 60

tccgggggag gatcc 75

<210> 59

<211> 21

<212> PRT

<213> Artificial Sequence

<220>

<223> GGS8x Linker Amino Acid

<400> 59

Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly

1 5 10 15

Gly Ser Gly Gly Ser

20

<210> 60

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<223> Linker XTEN Nucleic Acid

<400> 60

tccggtagcg aaacaccggg gacttcagaa tcggccaccc cggagtct 48

<210> 61

<211> 16

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker XTEN Amino Acid

<400> 61

Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser

1 5 10 15

<210> 62

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Linker B Nucleic Acid

<400> 62

ggaagcgccg gtagtgcggc tgggtctggc gagttc 36

<210> 63

<211> 12

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker B Amino Acid

<400> 63

Gly Ser Ala Gly Ser Ala Ala Gly Ser Gly Glu Phe

1 5 10

<210> 64

<211> 4104

<212> DNA

<213> Artificial Sequence

<220>

<223> human Cas9 (hCas9) nucleic acid

<400> 64

atggacaaga agtactccat tgggctcgat atcggcacaa acagcgtcgg ctgggccgtc 60

attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 120

cacagcataa agaagaacct cattggcgcc ctcctgttcg actccgggga gacggccgaa 180

gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 240

tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 300

ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 360

aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 420

aagcttgtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcat 480

atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 540

gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga agagaacccg 600

atcaacgcat ccggagttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 660

cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 720

cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 780

gatgccaagc ttcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 840

cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 900

ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 960

atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1020

cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1080

ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1140

gaaaaaatgg acggcaccga ggagctgctg gtaaagctta acagagaaga tctgttgcgc 1200

aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 1260

gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 1320

gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgcccg gggaaattcc 1380

agattcgcgt ggatgactcg caaatcagaa gagaccatca ctccctggaa cttcgaggaa 1440

gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 1500

aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 1560

tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 1620

tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 1680

gtgaaacagc tcaaagaaga ctatttcaaa aagattgaat gtttcgactc tgttgaaatc 1740

agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 1800

attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 1860

ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 1920

catctcttcg acgacaaagt catgaaacag ctcaagaggc gccgatatac aggatggggg 1980

cggctgtcaa gaaaactgat caatgggatc cgagacaagc agagtggaaa gacaatcctg 2040

gattttctta agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac 2100

tctctcacct ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctt 2160

cacgagcaca tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc 2220

gttaaggtcg tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt 2280

atcgagatgg cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg 2340

atgaagagga ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca 2400

gttgaaaaca cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg 2460

gacatgtacg tggatcagga actggacatc aatcggctct ccgactacga cgtggatcat 2520

atcgtgcccc agtcttttct caaagatgat tctattgata ataaagtgtt gacaagatcc 2580

gataaaaata gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa 2640

aattattggc ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg 2700

actaaggctg aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag 2760

cttgttgaga cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac 2820

accaagtacg atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct 2880

aagctggtct cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat 2940

taccaccatg cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa 3000

tatcccaagc ttgaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa 3060

atgatcgcaa agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc 3120

aatattatga attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga 3180

ccacttatcg aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc 3240

gcgacagtcc ggaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta 3300

cagaccggag gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc 3360

gcacgcaaaa aagattggga ccccaagaaa tacggcggat tcgattctcc tacagtcgct 3420

tacagtgtac tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc 3480

aaggaactgc tgggcatcac aatcatggag cgatcaagct tcgaaaaaaa ccccatcgac 3540

tttctcgagg cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gcttcccaag 3600

tactctctct ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg 3660

cagaaaggta acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc 3720

cactatgaaa agctcaaagg gtctcccgaa gataatgagc agaagcagct gttcgtggaa 3780

caacacaaac actaccttga tgagatcatc gagcaaataa gcgaattctc caaaagagtg 3840

atcctcgccg acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag 3900

cccatcaggg agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg 3960

cctgcagcct tcaagtactt cgacaccacc atagacagaa agcggtacac ctctacaaag 4020

gaggtcctgg acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc 4080

gacctctctc agctcggtgg agac 4104

<210> 65

<211> 4104

<212> DNA

<213> Artificial Sequence

<220>

<223> nickase Cas9 (nCas9) nucleic acid

<400> 65

atggacaaga agtactccat tgggctcgct atcggcacaa acagcgtcgg ctgggccgtc 60