КОМПОЗИЦИИ И СПОСОБЫ РЕДАКТИРОВАНИЯ ГЕНОВ Российский патент 2023 года по МПК C12N9/10 C12N9/22 C12N15/62 C12N15/63 C12N15/90 

Описание патента на изобретение RU2804665C2

Перекрестная ссылка на связанные приложения

[0001] Данная заявка испрашивает приоритет по отношению к патентной заявке США № 62/660023, поданной 19 апреля 2018 г., раскрытие которой включено в данный документ посредством ссылки в полном объеме.

ЗАЯВЛЕНИЕ ОТНОСИТЕЛЬНО ПРАВ НА ИЗОБРЕТЕНИЯ, СОЗДАННЫЕ НА ОСНОВЕ ФЕДЕРАЛЬНО СПОНСИРОВАННОЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЫ

[0002] Данное изобретение создано при поддержке Правительства США согласно гранту № HR0011-17-2-0043, присужденному Министерством обороны, Агентством перспективных исследовательских проектов Министерства обороны США, и согласно гранту № R01 DA036858, присужденному Национальным институтом здравоохранения. Правительство США имеет определенные права на данное изобретение.

УРОВЕНЬ ТЕХНИКИ

[0003] Несмотря на то, что редактирование генома считается многообещающим терапевтическим подходом к лечению заболеваний, оно сопряжено с неотъемлемыми рисками из-за потенциальной генотоксичности, связанной с двухцепочечными разрывами (ДЦР). Кроме того, редактирование генома часто связано с эффектом «все или ничего» для целевого гена (т.е. оно вызывает полный нокаут). В отличие от этого целенаправленная инженерия эпигенома не несет риска генотоксичности, вызванной ДЦР; кроме того, она дает возможность создать более дифференцированный эффект на экспрессию генов и, таким образом, обеспечить функционирование от полного сайленсинга до менее выраженного эффекта.

[0004] В данном документе представлены решения для этих и других потребностей в данной области техники.

КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

[0005] В одном аспекте данного изобретения представлен слитый белок, включающий в себя фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, домен, связанный с боксом (домен KRAB), и домен метилтрансферазы ДНК. В одном аспекте данного изобретения представлен слитый белок любой из последовательностей SEQ ID NO: 1-15.

[0006] В одном аспекте данного изобретения представлена последовательность нуклеиновой кислоты, кодирующая слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами.

[0007] В одном аспекте данного изобретения представлен комплекс, включающий в себя слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, и полинуклеотид, включающий в себя (1) нацеленную на ДНК последовательность, которая комплементарна целевой полинуклеотидной последовательности, и (2) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, при этом фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК связан с полинуклеотидом через связывающую последовательность.

[0008] В одном аспекте данного изобретения представлен вектор, включающий в себя последовательность нуклеиновой кислоты слитого белка, как описано в данном документе, включительно с его вариантами реализации и аспектами.

[0009] В одном аспекте данного изобретения представлена клетка, включающая в себя слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, нуклеиновую кислоту, как описано в данном документе, включительно с ее вариантами реализации и аспектами, комплекс, как описано в данном документе, включительно с его вариантами реализации и аспектами, или вектор, как описано в данном документе, включительно с его вариантами реализации и аспектами.

[0010] В одном аспекте данного изобретения представлен способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включая доставку первого полинуклеотида, кодирующего слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, в клетку, содержащую целевую нуклеиновую кислоту, и доставку в клетку второго полинуклеотида, который включает в себя (i) нацеленную на ДНК последовательность, которая комплементарна последовательности целевой нуклеиновой кислоты, и (ii) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК. Без намерения быть связанными какой-либо теорией, считается, что указанный слитый белок вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. Таким образом, в аспектах данного изобретения указанный слитый белок вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты.

[0011] В одном аспекте данного изобретения представлен способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включая доставку комплекса, как описано в данном документе, включительно с его вариантами реализации и аспектами, в клетку, содержащую целевую нуклеиновую кислоту, при этом указанный комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке. Без намерения быть связанными какой-либо теорией, считается, что указанный комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. Таким образом, в аспектах данного изобретения указанный комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

[0012] На Фиг. 1A-1F описано конструирование белка «все в одном» для длительного генного сайленсинга. На Фиг. 1A представлено схематическое изображение белка «все в одном» (SEQ ID NO: 1) согласно данному изобретению, который содержит домен KRAB, слитый с -N-концом dCas9 (SEQ ID NO: 23), отделенный с помощью линкера GGSGGGS (SEQ ID NO: 17), и Dnmt3A - Dnmt3L на С-конце dCas9 (отделенный с помощью линкера EASGSGRASPGIPGSTR (SEQ ID NO: 19)). На Фиг. 1В представлены схематические изображения слитых с dCas9 эпигенетических модуляторов, протестированных на постоянный генный сайленсинг. Белок dCas9 - KRAB адаптирован из Gilbert et al., Cell 2013 для применения с технологией интерференции CRISPR (CRISPRi). Слитый белок dCas9 - Dnmt3A - Dnmt3L адаптирован из Stepper et al., Nucleic Acids Research, 2016. Авторы данного изобретения сконструировали новый белок «все в одном», который объединяет домен KRAB (SEQ ID NO: 16), dCas9 (D10A, H208A), Dnmt3A - Dnmt3L (SEQ ID NO: 33; где Dnmt3A представляет собой SEQ ID NO: 26 и Dnmt3L представляет собой SEQ ID NO: 28) в один полипептид. На Фиг. 1C представлены схематические изображения чувствительного к метилированию репортера GFP (адаптировано из Stelzer et al., Cell 2015), который был использован для оценки длительного сайленсинга, вызванного с помощью белка «все в одном». На Фиг. 1D-1E представлена диаграмма и результаты экспериментального рабочего процесса по технологии мутагенеза «hit-and-run» в клетках HEK293T, экспрессирующих репортер GFP, представленный на Фиг. 3. На Фиг. 1D показано, что в клетки были котрансфицированы плазмиды, одна из которых кодировала белок «hit-and-run», а другая плазмида кодировала егРНК. На Фиг. 1E показаны результаты анализа по технологии мутагенеза «hit-and-run», с сортировкой клеток, которые были котрансфицированы одновременно плазмидой «все в одном» и плазмидой егРНК. На Фиг. 1F показано, что результаты сайленсинга репортера GFP зависят от последовательности егРНК.

[0013] На Фиг. 2A-2F описан длительный сайленсинг эндогенных генов. На Фиг. 2A-2C представлены репрезентативные данные проточной цитометрии, полученные через 22 суток после трансфекции с последующим воздействием на гены (CD29, CD81, CD151), направленным на долгосрочный сайленсинг с использованием белка «все в одном». В квадранте IV представлены клетки, которые отключили соответствующий ген, на что указывает процент клеток с отключенным геном (т.е. 45%, 66% и 53%, соответственно). На Фиг. 2D представлена количественная оценка сайленсинга генов CD29, CD81 и CD151 с помощью трех различных егРНК. На Фиг. 2E представлена количественная оценка сайленсинга двух или трех генов одновременно, чтобы показать, что белок «все в одном» может быть мультиплексирован путем совместной доставки молекул егРНК, нацеленных на разные гены. На Фиг. 2F представлен график, который описывает момент времени, взятый через 9 месяцев после трансфекции белка «все в одном» и егРНК, нацеленной на ген CLTA, и который означает, что большинство клеток стабильно отключили ген CLTA.

[0014] На Фиг. 3A-3I описан долгосрочный сайленсинг эндогенных генов. На Фиг. 3A-3C показано, что собранные клетки утратили экспрессию CD29 (Фиг. 3A), CD81 (Фиг. 3B) и CD151 (Фиг. 3C) через тридцать шесть суток после трансфекции, как определено по их профилям экспрессии РНК. Фиг. 3D-3F представляют собой вулканные диаграммы, показывающие, что целевые гены CD29 (Фиг. 3D), CD81 (Фиг. 3E) и CD151 (Фиг. 3F) являются единственным значимым генным нокдауном для каждого эксперимента, что свидетельствует о высокой специфичности генного сайленсинга. На Фиг. 3G-3I представлена количественная оценка уровней транскриптов CD151 (Фиг. 3G), CD81 (Фиг. 3H) и CD29 (Фиг. 3I), демонстрирующая нокдаун более 96% каждого из целевых генов.

[0015] На Фиг. 4A-4H описан долгосрочный сайленсинг генов в различных линиях клеток млекопитающих. Фиг. 4A - 4F представляют собой графики проточной цитометрии, показывающие экспрессию синего флуоресцентного белка (СФБ, англ. «BFP») (который слит с белком «все в одном») в HeLa (цервикальные клетки) (Фиг. 4A), U2OS (клетки костной ткани) (Фиг. 4B) и в индуцированных плюрипотентных стволовых клетках человека (иПСК) (Фиг. 4С). Фиг. 4D-4F представляют собой нетрансфицированные контроли для Фиг. 4A-4C, соответственно. На Фиг. 4G показано, что был достигнут стабильный сайленсинг эндогенных генов в клетках HeLa и U2OS, измеренный через 18 суток после трансфекции белком «все в одном». На Фиг. 4A-4F по оси x отложен СФБ (слитый с белком «все в одном»), а по оси y - mCherry. На Фиг. 4H показано, что сайленсинг генов был обнаружен через 14 суток после трансфекции с помощью метода кПЦР в линиях клеток гепатоцитов AML12 мыши при нацеливании на Pcsk9, Npc1, Spcs1 и Cd81.

[0016] На Фиг. 5 представлены схемы слитых белков p76, p90 - p102 и p112, которые соответствуют последовательностям SEQ ID NO: 1-15, соответственно.

[0017] На Фиг. 6A-6E описаны действия по генному сайленсингу вариантов белка «все в одном». На Фиг. 6A-6B показаны результаты генного сайленсинга через 18 суток после трансфекции слитых белков последовательностей SEQ ID NO: 1-15, трансфицированных в клетки HEK293T для целенаправленного подавления гена CLTA. Форматы dCas9 - KRAB и dCas9 - Dnmt3A - Dnmt3L продемонстрировали кратковременную и более низкую эффективность длительного сайленсинга. На Фиг. 6C-6D представлено сравнение последовательностей SEQ ID NO: 1 (p76) и SEQ ID NO: 15 (p112) в сайленсинге эндогенного гена HIST2H2BE (H2B) (Фиг. 6C) и синтетического репортерного гена Snrpn-GFP (Фиг. 6D), стабильно экспрессируемых в клетках HEK293T. На Фиг. 6E представлен график экспрессии белков (пунктирные линии) p76 и p112 в течение периода времени в 50 суток для выключения гена HIST2H2BE (H2B). Уровни белка измеряли с помощью метода проточной цитометрии для детектирования СФБ, который экспрессируется совместно с белком «все в одном».

[0018] На Фиг. 7A-7B представлены вестерн-блоты вариантов белка «все в одном». На Фиг. 7А представлен анализ по методу вестерн-блоттинг вариантов белка «все в одном» p76 и p90 - p102 с использованием антитела против Steptococcus pyogenes Cas9. Верхняя полоса соответствует полноразмерному белку, а полосы меньшего размера отображают продукты протеолиза белков «все в одном». На Фиг. 7В представлен анализ по методу вестерн-блоттинг вариантов белка «все в одном» с целью обнаружения свободного Dnmt3A, который отщепляется от слитого белка.

[0019] На Фиг. 8A-8E описан объединенный скрининг для определения оптимальных егРНК. На Фиг. 8A представлена схема объединенного скрининга для определения оптимальных егРНК, которые приводят к долгосрочному сайленсингу генов. На Фиг. 8B-8E представлены гистограммы проточной цитометрии, показывающие процент клеток, подвергающихся сайленсингу генов через четыре недели после трансфекции. Были использованы четыре клеточные линии HEK293T, каждая с различным геном с меткой GFP, включительно с CLTA (Фиг. 8B), VIM (Фиг. 8C), HIST2H2BE (H2B) (Фиг. 8D) и RAB11A (Фиг. 8E).

[0020] На Фиг. 9A-9D представлены карты функциональности егРНК в сайте начала транскрипции целевого гена, включительно с CLTA (Фиг. 9A), H2B (Фиг. 9B), RAB11 (Фиг. 9C) и VIM (Фиг. 9D). Сайт начала транскрипции (СНТ, англ. «TSS») и островок CpG аннотированы над каждым графиком. Каждая точка отображает собой одну егРНК, а ее эффективность в долгосрочном генном сайленсинге отображено как изменение в log2-кратном содержании егРНК. Степень заполнения нуклеосом (нижний график) нанесена на графики по сигналу от МНазы (микрококковая нуклеаза, англ. «MNase»).

[0021] На Фиг. 10A-10E описаны функциональные егРНК для длительного сайленсинга генов. На Фиг. 10А представлен рабочий процесс объединенного скрининга в клетках HEK293T для определения оптимальных положений нацеливания егРНК для белка «все в одном», адаптированный из предыдущего рицинового скрининга на биочипах высокой плотности в клетках K562 для определения оптимальных егРНК для dCas9 - KRAB (Gilbert, Horlbeck et al., Cell 2014). На Фиг. 10B-10E представлены репрезентативные графики, показывающие фенотипы роста для четырех генов, включительно с ARL1 (Фиг. 10B), EIF6 (Фиг. 10C), SMC3 (Фиг. 10D), HEATR1 (Фиг. 10E), из существующих наборов данных для dCas9 - KRAB/ CRISPRi в клетках K562 (Gilbert, Horlbeck et al., 2014), и с белком «все в одном» (нижний график). Каждая точка отображает собой егРНК. СНТ и аннотированный островок CpG показаны для каждого гена.

[0022] На Фиг. 11A-11B представлено сравнение фенотипов роста и позиционирования нуклеосом (по сигналу от МНазы) для VPS53 (Фиг. 11A) и VPS54 (Фиг. 11B), которое показывает расположение функциональных егРНК в областях, лишенных нуклеосом.

[0023] На Фиг. 12A-12C показана доставка белка «все в одном» посредством экспрессии мРНК. На Фиг. 12A показана транскрипция in vitro двух вариантов белка «все в одном» (p102 и p112), а также показан полноразмерный синтез каждой конструкции. На Фиг. 12B представлен график проточной цитометрии, показывающий экспрессию p102 и p112 через одни сутки после трансфекции мРНК в клетки HEK293T. На Фиг. 12С представлена динамика сайленсинга эндогенного гена CLTA в клетках HEK293T после трансфекции мРНК, экспрессирующей варианты p102 и p112 белка «все в одном».

[0024] На Фиг. 13A-13G описана контролируемая экспрессия белка «все в одном» с помощью доксициклиновой индукции. На Фиг. 13A представлены графики проточной цитометрии, показывающие индуцированную экспрессию белка «все в одном» путем добавления доксициклина в клетки K562, которые стабильно кодируют белок «все в одном» под действием промотора, индуцируемого доксициклином. Пунктирная линия отображает базовую медианную флуоресценцию СФБ без введения доксициклина. На Фиг. 13B представлены вестерн-блоты клеток, направленные на детекцию экспрессии белка «все в одном» до и после обработки доксициклином. На Фиг. 13C-13F представлены графики проточной цитометрии для нокдауна генов CD81 (Фиг. 13C- 13D) и CD151 (Фиг. 13E-13F) через 14 суток после обработки доксициклином клеток K562. На Фиг. 13G представлена количественная оценка нокдауна генов CD81 и CD151 через 14 суток после обработки доксициклином или без обработки доксициклином.

ПОДРОБНОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

[0025] Описанная в данном документе технология позволяет, среди прочего, обеспечить постоянный сайленсинг генов в клетках млекопитающих без образования двухцепочечных разрывов ДНК в геноме хозяина. В вариантах реализации данного изобретения центральный компонент представляет собой одиночную полипептидную цепь, состоящую из каталитически неактивного Cas9 (dCas9), слитого с Dnmt3A, Dnmt3L, и доменом KRAB (в данном документе указанный центральный компонент именуется как «белок «все в одном»»). Указанный слитый белок, представленный в данном документе, может быть направлен на конкретный сайт в геноме млекопитающего с использованием единой гидовой РНК (егРНК), и может приводить к метилированию ДНК и (или) вносить репрессивные хроматиновые маркеры в этот сайт. В вариантах реализации данного изобретения результатом является сайленсинг гена, который наследуется при последующих делениях клеток. В вариантах реализации данного изобретения слитый белок, представленный в данном документе (и егРНК), экспрессируются только кратковременно, минуя использование способов вирусной доставки для индукции постоянного сайленсинга.

[0026] В вариантах реализации данного изобретения слитые белки, представленные в данном документе, обеспечивают надежный долгосрочный или постоянный сайленсинг экспрессии эндогенных генов посредством редактирования эпигенома, а не генома. Возможно как нацеливание на оба аллеля гена, так и селективное нацеливание на один патогенный аллель. В вариантах реализации данного изобретения преимущество слитого белка, представленного в данном документе, состоит в том, что эпигенетическое редактирование является обратимым и, следовательно, по своей природе более безопасным, чем редактирование генома. Таким образом, в вариантах реализации данного изобретения слитый белок, представленный в данном документе, полезен в профилактических целях. Например, сайленсинг гена может обеспечить острую защиту от инфекции/ биологического токсина, а затем сайленсинг может быть обращен вспять после отсутствия риска инфекции или интоксикации. Таким образом, в вариантах реализации данного изобретения слитый белок, представленный в данном документе, обладает полезными свойствами в ситуации, при которой вирус или токсин проникает в клетку посредством взаимодействия с белком, который требуется для долговременной функции органа или для гомеостаза. В вариантах реализации данного изобретения слитый белок, представленный в данном документе, полезен в терапевтических средствах, основанных на редактировании генома.

[0027] В вариантах реализации данного изобретения постоянный сайленсинг гена в клетках млекопитающих может быть достигнут с помощью двух компонентов: одной полипептидной цепи, состоящей из dCas9, слитого с тремя эпигенетическими модуляторами, и единой гидовой РНК, которая направляет белок в конкретный сайт в геноме хозяина. В вариантах реализации данного изобретения компоненты экспрессируются в клетке-хозяине только кратковременно, что снижает токсичность и нецелевые явления.

[0028] В вариантах реализации данного изобретения слитый белок, представленный в данном документе, не вызывает разрывов ДНК в клетке-хозяине для обеспечения постоянного генного сайленсинга. В вариантах реализации данного изобретения эпигенетические метки, которые добавляются к представляющему интерес геномному сайту, являются обратимыми, что позволяет удалять любые нецелевые явления, которые могут произойти.

[0029] Определения

[0030] Несмотря на то, что в данном документе показаны и описаны различные варианты реализации и аспекты данного изобретения, для специалистов в данной области техники будет очевидно, что такие варианты реализации и аспекты представлены только в качестве примера. Многочисленные вариации, изменения и замены теперь будут очевидны специалистам в данной области техники без отклонения от данного изобретения. Следует понимать, что при практическом применении изобретения могут использоваться различные альтернативы описанным в данном документе вариантам реализации данного изобретения.

[0031] Заголовки разделов, используемые в данном документе, предназначены только для организационных целей и не должны толковаться как ограничивающие описанный объект данного изобретения. Все документы или части документов, процитированные в данной заявке, включая, помимо прочего, патенты, заявки на патенты, статьи, книги, руководства и научные трактаты, настоящим полностью включены в данное описание посредством ссылки в полном объеме для любых целей.

[0032] Если не указано иное, все технические и научные термины, употребляемые в данном документе, имеют значение, обычно понятное специалисту в области техники, к которой принадлежит данное изобретение. Следующие ссылки предоставляют специалисту общее определение многих терминов, употребляемых в данном изобретении: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); и Hale & Marham, The Harper Collins Dictionary of Biology (1991). В контексте данного документа нижеследующие термины имеют приписываемые им значения, если не указано иное.

[0033] Использование единственного или множественного числа в данном описании и в последующей формуле изобретения следует традиционному подходу в патентах, означающему «по меньшей мере один», за исключением ситуации, когда в конкретном случае из контекста ясно, что термин предназначен в этом конкретном случае для обозначения конкретно одного и только одного. Аналогичным образом, термин «содержащий» является неограничивающим, и не исключает дополнительных элементов, функций, компонентов и т.д. Литературные источники, указанные в данном документе, прямо включены в данный документ посредством ссылки во всем их объеме, если не указано иное.

[0034] Термины «содержать», «включать» и «иметь», а также их производные употребляются в контексте данного документа взаимозаменяемо как широкие неограничивающие термины. Например, при употреблении терминов «содержащий», «включающий» или «имеющий» подразумевается, что какой бы элемент ни содержался, был включен или имелся, это не единственный элемент, охватываемый подлежащим предложения, содержащим соответствующий указанный выше глагол.

[0035] Термин «нуклеиновая кислота» относится к нуклеотидам (например, дезоксирибонуклеотидам или рибонуклеотидам) и их полимерам в одноцепочечной, двухцепочечной или многоцепочечной форме, или к их комплементам. Термины «полинуклеотид», «олигонуклеотид», «олиго» и тому подобное относятся в обычном и общепринятом смысле к линейной последовательности нуклеотидов. Термин «нуклеотид» относится в обычном и общепринятом смысле к отдельной единице полинуклеотида, то есть к мономеру. Нуклеотиды могут быть рибонуклеотидами, дезоксирибонуклеотидами или их модифицированными версиями. Примеры полинуклеотидов, предусмотренных в данном документе, включают одно- и двухцепочечную ДНК, одно- и двухцепочечную РНК, и гибридные молекулы, содержащие смеси одно- и двухцепочечных ДНК и РНК. Примеры нуклеиновых кислот, например полинуклеотидов, предусмотренных в данном документе, включают, но не ограничиваются ими, любой тип РНК, например мРНК, миРНК, микроРНК, егРНК и гидовую РНК, а также любой тип ДНК, например геномную ДНК, плазмидную ДНК и миникольцевую ДНК, и любые их фрагменты. В аспектах данного изобретения нуклеиновая кислота представляет собой информационную РНК. В некоторых аспектах данного изобретения информационная РНК представляет собой информационный рибонуклеопротеин (РНП). Термин «дуплекс», используемый в данном документе в контексте полинуклеотидов, относится, в обычном и общепринятом смысле, к двухцепочечности. Нуклеиновые кислоты могут быть линейными или разветвленными. Например, нуклеиновые кислоты могут представлять собой линейную цепь нуклеотидов или нуклеиновые кислоты могут быть разветвленными, например, так, что нуклеиновые кислоты содержат одно или несколько плеч или разветвлений нуклеотидов. Необязательно, разветвленные нуклеиновые кислоты многократно разветвлены с образованием структур более высокого порядка, таких как дендримеры и тому подобное.

[0036] В контексте данного документа термины «нуклеиновая кислота», «молекула нуклеиновой кислоты», «олигомер нуклеиновой кислоты», «олигонуклеотид», «последовательность нуклеиновой кислоты», «фрагмент нуклеиновой кислоты» и «полинуклеотид» употребляются взаимозаменяемо и предназначены для включения, но не ограничиваясь ими, полимерной формы нуклеотидов, ковалентно связанных вместе, которые могут иметь различную длину, либо дезоксирибонуклеотидов, либо рибонуклеотидов, или их аналогов, производных или модификаций. Различные полинуклеотиды могут иметь разные трехмерные структуры и могут выполнять разнообразные функции, известные или неизвестные. Неограничивающие примеры полинуклеотидов включают в себя ген, фрагмент гена, экзон, интрон, межгенную ДНК (включая, без ограничения, гетерохроматическую ДНК), информационную РНК (иРНК), транспортную РНК, рибосомную РНК, рибозим, кДНК, рекомбинантный полинуклеотид, разветвленный полинуклеотид, плазмиду, вектор, выделенную ДНК последовательности, выделенную РНК последовательности, егРНК, гидовую РНК, зонд нуклеиновой кислоты и праймер. Полинуклеотиды, используемые в способах согласно данному изобретению, могут содержать природные последовательности нуклеиновых кислот и их варианты, искусственные последовательности нуклеиновых кислот, или комбинацию таких последовательностей.

[0037] Полинуклеотид обычно состоит из определенной последовательности четырех нуклеотидных оснований: аденина (А); цитозина (С); гуанина (G); и тимина (T) (урацила (U) вместо тимина (T), когда полинуклеотид представляет собой РНК). Таким образом, термин «полинуклеотидная последовательность» представляет собой алфавитное представление полинуклеотидной молекулы; альтернативно, этот термин может применяться к самой молекуле полинуклеотида. Такое алфавитное представление может вводиться в базы данных на компьютере, имеющем центральный процессор, и иметь биоинформационное применение, такое как использование в функциональной геномике и поиск гомологий. Полинуклеотиды могут необязательно включать в себя один или несколько нестандартных нуклеотидов, нуклеотидных аналогов и (или) модифицированных нуклеотидов.

[0038] Нуклеиновые кислоты, включая, например, нуклеиновые кислоты с фосфотиоатным остовом, могут включать в себя один или несколько реактивных фрагментов. Употребляемый в контексте данного документа термин «реактивный фрагмент» охватывает собой любую группу, способную реагировать с другой молекулой, например, нуклеиновой кислотой или полипептидом, посредством ковалентных, нековалентных или других взаимодействий. В качестве примера нуклеиновая кислота может включать в себя фрагмент, реакционноспособный по отношению к аминокислоте, который вступает в реакцию с аминокислотой на белке или полипептиде посредством ковалентного, нековалентного или другого взаимодействия.

[0039] Термины также охватывают нуклеиновые кислоты, содержащие известные аналоги нуклеотидов или модифицированные остатки или связи основной цепи, которые являются синтетическими, встречающимися в природе и не встречающимися в природе, которые имеют такие же связывающие свойства, что и референсная нуклеиновая кислота, и которые метаболизируются аналогично референсным нуклеотидам. Примеры таких аналогов включают, но не ограничиваются ими, производные фосфодиэфиров, включая, например, фосфорамидат, фосфородиамидат, фосфоротиоат (также известный как фосфотиоат, содержащий посредством двойной связи серу, которая заместила кислород в фосфате), фосфородитиоат, фосфонокарбоновые кислоты, фосфонокарбоксилаты, фосфоноуксусные кислоты, фосфоноформовую кислоту, метилфосфонатные, борфосфонатные или O-метилфосфорамидитные связи (см. Eckstein, Oligonucleotides and Analogues: A Practical Approach, Oxford University Press), а также модификации нуклеотидных оснований, такие как 5-метилцитидин или псевдоуридин; и остовы и связи пептидных нуклеиновых кислот. Другие аналоги нуклеиновых кислот включают в себя нуклеиновые кислоты с положительным остовом; неионные остовы, модифицированные сахара и не рибозные остовы (например, фосфородиамидатные морфолиновые олигонукледотиды или закрытые нуклеиновые кислоты (ЗНК, англ. «LNA»), как известно в данной области техники), включая те, что описаны в патентах США № 5235033 и № 5034506, а также в Главах 6 и 7 из ASC Symposium Series 580, Carbohydrate Modifications in Antisense Research, Sanghui & Cook, eds. Нуклеиновые кислоты, содержащие один или несколько карбоциклических сахаров, также включены в одно определение нуклеиновых кислот. Модификации рибозофосфатного остова могут осуществляться по разным причинам, например, для повышения стабильности и периода полужизни таких молекул в физиологической среде или в качестве зондов на биочипе. Могут быть приготовлены смеси встречающихся в природе нуклеиновых кислот и аналогов; альтернативно могут быть приготовлены смеси различных аналогов нуклеиновых кислот и смеси встречающихся в природе нуклеиновых кислот и аналогов. В аспектах данного изобретения межнуклеотидные связи в ДНК представляют собой фосфодиэфирные связи, производные фосфодиэфирных связей, или их комбинацию.

[0040] Нуклеиновые кислоты могут включать в себя неспецифические последовательности. Употребляемый в контексте данного документа термин «неспецифическая последовательность» относится к последовательности нуклеиновой кислоты, которая содержит серию остатков, не предназначенных для комплементарности любой другой последовательности нуклеиновой кислоты, или только частично комплементарных ей. В качестве примера, неспецифическая последовательность нуклеиновой кислоты представляет собой последовательность остатков нуклеиновой кислоты, которая не функционирует как ингибирующая нуклеиновая кислота при контакте с клеткой или организмом.

[0041] Термин «комплементарный» или «комплементарность» относится к способности нуклеиновой кислоты образовывать с другой последовательностью нуклеиновой кислоты водородную связь (водородные связи) либо традиционного типа по Уотсону-Крику, либо других нетрадиционных типов. Например, последовательность A - G - T комплементарна последовательности T - C - A. Процент комплементарности указывает процент остатков в молекуле нуклеиновой кислоты, которые могут образовывать водородные связи (например, спаривание оснований по Уотсону-Крику) со второй последовательностью нуклеиновой кислоты (например, 5, 6, 7, 8, 9, 10 из 10 являются комплементарными на 50%, 60%, 70%, 80%, 90% и 100%, соответственно). Термин «совершенно комплементарный» означает, что все смежные остатки последовательности нуклеиновой кислоты будут связываться водородными связями с тем же числом смежных остатков во второй последовательности нуклеиновой кислоты. Употребляемый в контексте данного документа термин «по существу комплементарный» относится к степени комплементарности, которая составляет по меньшей мере 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% или 100% в участке из 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 или более нуклеотидов, или относится к двум нуклеиновым кислотам, которые гибридизуются в жестких условиях (т.е. в жестких условиях гибридизации).

[0042] Фраза «жесткие условия гибридизации» относится к условиям, при которых зонд будет гибридизоваться со своей целевой подпоследовательностью, обычно в сложной смеси нуклеиновых кислот, но не с другими последовательностями. Жесткие условия зависят от последовательности и будут разными в разных обстоятельствах. Более длинные последовательности специфически гибридизуются при более высоких температурах. Подробное руководство по гибридизации нуклеиновых кислот можно найти в Tijssen, Techniques in Biochemistry and Molecular Biology - Hybridization with Nucleic Probes, “Overview of principles of hybridization and the strategy of nucleic acid assays” (1993). Обычно выбираются жесткие условия, которые примерно на 5-10°C ниже, чем температура точки плавления (Tпл) для конкретной последовательности при определенной ионной силе и pH. Tпл представляет собой такую температуру (при определенной ионной силе, pH и концентрации нуклеиновых кислот), при которой 50% зондов, комплементарных мишени, гибридизуются с последовательностью-мишенью при равновесном состоянии (так как последовательности-мишени присутствуют в избытке, то при Tпл 50% зондов заняты при равновесном состоянии). Жесткие условия также могут быть достигнуты путем добавления дестабилизирующих агентов, таких как формамид. Для селективной или специфической гибридизации положительный сигнал должен по крайней мере в два раза превышать фон, предпочтительно - в 10 раз выше фоновой гибридизации. Примеры жестких условий гибридизации могут быть следующими: 50% формамид, 5x ССР (стандартный солевой раствор, англ. «SSC») и 1% ДСН, инкубирование при температуре 42°C, или 5x ССР, 1% ДСН, инкубирование при температуре 65°C, с промывкой в 0,2x ССР и 0,1% ДСН при температуре 65°C.

[0043] Нуклеиновые кислоты, которые не гибридизуются друг с другом в жестких условиях, все же по существу идентичны, если полипептиды, которые кодируются ими, по существу идентичны. Это происходит, например, когда создается копия нуклеиновой кислоты с использованием максимальной вырожденности кодонов, разрешенной генетическим кодом. В таких случаях нуклеиновые кислоты обычно гибридизуются в умеренно жестких условиях гибридизации. Примеры «умеренно жестких условий гибридизации» включают в себя гибридизацию в буфере, содержащем 40% формамида, 1 М NaCl, 1% ДСН при температуре 37°C и промывку в 1X ССР при температуре 45°C. Положительная гибридизация представляет собой такую, которая по меньшей мере вдвое превышает фоновую гибридизацию. Рядовой специалист в данной области техники легко поймет, что можно использовать альтернативные условия гибридизации и промывки для обеспечения условий похожей жесткости. Дополнительные рекомендации по определению параметров гибридизации представлены в многочисленных ссылках, например, Current Protocols in Molecular Biology, ed. Ausubel, et al., см. выше.

[0044] Термин «ген» означает сегмент ДНК, участвующий в производстве белка; он включает в себя области, предшествующие и следующие за кодирующей областью (лидирующую и отстающую), а также промежуточные последовательности (интроны) между отдельными кодирующими сегментами (экзонами). Лидирующая и отстающая области, так же как и интроны, включают в себя регуляторные элементы, которые необходимы во время транскрипции и трансляции гена. Кроме того, «белковый генный продукт» представляет собой белок, экспрессируемый конкретным геном.

[0045] Слово «экспрессия» или «экспрессируемый», используемое в контексте данного документа по отношению к гену, означает продукт транскрипции и (или) трансляции этого гена. Уровень экспрессии молекулы ДНК в клетке может быть определен либо на основании количества соответствующей иРНК, которая присутствует в клетке, либо на основании количества белка, кодируемого этой ДНК, продуцируемого клеткой. Уровень экспрессии некодирующих молекул нуклеиновых кислот (например, егРНК) может быть определен стандартными методами ПЦР или нозерн-блоттингом, хорошо известными в данной области техники. См. Sambrook et al., 1989 Molecular Cloning: A Laboratory Manual, 18.1-18.88.

[0046] Термин «регуляторная последовательность транскрипции», употребляемый в контексте данного документа, относится к сегменту ДНК, который способен повышать или понижать транскрипцию (например, экспрессию) конкретного гена в организме. Неограничивающие примеры регуляторных последовательностей транскрипции включают в себя промоторы, энхансеры и сайленсеры.

[0047] Термины «сайт начала транскрипции» и «сайт инициации транскрипции» могут употребляться взаимозаменяемо для обозначения в контексте данного документа 5'-конца последовательности гена (например, последовательности ДНК), где РНК-полимераза (например, ДНК-направленная РНК-полимераза) начинает синтез транскрипта РНК. Сайт начала транскрипции может быть первым нуклеотидом транскрибируемой последовательности ДНК, где РНК-полимераза начинает синтезировать транскрипт РНК. Квалифицированный специалист в данной области техники может определить сайт начала транскрипции с помощью рутинных экспериментов и анализа, например, путем выполнения анализа по «прерванной транскрипции», или с помощью определений в соответствии с базой данных FANTOM5.

[0048] Термин «промотор», употребляемый в контексте данного документа, относится к области ДНК, которая инициирует транскрипцию конкретного гена. Промоторы обычно расположены рядом с сайтом начала транскрипции гена, выше гена и на одной и той же цепи ДНК (т.е. в положении 5' на смысловой цепи ДНК). Промоторы могут иметь длину от около 100 до около 1000 пар оснований.

[0049] Термин «энхансер», употребляемый в контексте данного документа, относится к области ДНК, которая может быть связана белками (например, факторами транскрипции) для увеличения вероятности того, что произойдет транскрипция гена. Энхансеры могут иметь длину от около 50 до около 1500 пар оснований. Энхансеры могут быть расположены ниже или выше сайта инициации транскрипции, который они регулируют, и могут находиться на расстоянии нескольких сотен пар оснований от сайта инициации транскрипции.

[0050] Термин «сайленсер», употребляемый в контексте данного документа, относится к последовательности ДНК, которая способна связывать факторы регуляции транскрипции, известные как репрессоры, тем самым отрицательно влияя на транскрипцию гена. Последовательности сайленсеров ДНК могут быть обнаружены во многих различных положениях по всей длине ДНК, включая, но не ограничиваясь этим, перед целевым геном, в отношении которого они действуют путем подавления транскрипции гена (например, вызывая сайленсинг экспрессии гена).

[0051] Термин «гидовая РНК» или «гРНК», употребляемый в контексте данного документа, относится к любой полинуклеотидной последовательности, имеющей достаточную комплементарность с целевой полинуклеотидной последовательностью для гибридизации с целевой последовательностью и прямого последовательность-специфичного связывания комплекса CRISPR с целевой последовательностью. В аспектах данного изобретения степень комплементарности между гидовой последовательностью и соответствующей ей целевой последовательностью при оптимальном выравнивании с использованием подходящего алгоритма выравнивания составляет около или более чем около 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99%, или более.

[0052] В вариантах реализации данного изобретения полинуклеотид (например, гРНК) представляет собой одноцепочечную рибонуклеиновую кислоту. В аспектах данного изобретения полинуклеотид (например, гРНК) имеет длину 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 или более остатков нуклеиновой кислоты. В аспектах данного изобретения полинуклеотид (например, гРНК) имеет длину от 10 до 30 остатков нуклеиновой кислоты. В аспектах данного изобретения полинуклеотид (например, гРНК) имеет длину 20 остатков нуклеиновой кислоты. В аспектах данного изобретения длина полинуклеотида (например, гРНК) может составлять по меньшей мере 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 или более остатков нуклеиновой кислоты или остатков сахара в длину. В аспектах данного изобретения полинуклеотид (например, гРНК) имеет длину от 5 до 50, от 10 до 50, от 15 до 50, от 20 до 50, от 25 до 50, от 30 до 50, от 35 до 50, от 40 до 50, от 45 до 50, от 5 до 75, от 10 до 75, от 15 до 75, 20 до 75, от 25 до 75, от 30 до 75, от 35 до 75, от 40 до 75, от 45 до 75, от 50 до 75, от 55 до 75, от 60 до 75, от 65 до 75, от 70 до 75, от 5 до 100, от 10 до 100, От 15 до 100, от 20 до 100, от 25 до 100, от 30 до 100, от 35 до 100, от 40 до 100, от 45 до 100, от 50 до 100, от 55 до 100, от 60 до 100, от 65 до 100, от 70 до 100, 75 до 100, от 80 до 100, от 85 до 100, от 90 до 100, от 95 до 100 или более остатков. В аспектах данного изобретения полинуклеотид (например, гРНК) имеет длину от 10 до 15, от 10 до 20, от 10 до 30, от 10 до 40 или от 10 до 50 остатков.

[0053] Термин «аминокислота» относится к встречающимся в природе и синтетическим аминокислотам, а также к аналогам аминокислот и миметикам аминокислот, которые действуют аналогично встречающимся в природе аминокислотам. Встречающиеся в природе аминокислоты представляют собой такие аминокислоты, которые кодируются генетическим кодом, а также те аминокислоты, которые позже модифицируются, например, гидроксипролин, γ-карбоксиглутамат и О-фосфосерин. Аналоги аминокислот относятся к соединениям, которые имеют ту же базовую химическую структуру, что и встречающиеся в природе аминокислоты, то есть α-углерод, связанный с водородом, карбоксильную группу, аминогруппу и группу R, например, гомосерин, норлейцин, сульфоксид метионина, метилсульфоний метионина. Такие аналоги имеют модифицированные группы R (например, норлейцин) или модифицированные пептидные остовы, но сохраняют ту же базовую химическую структуру, что и встречающаяся в природе аминокислота. Миметики аминокислот относятся к химическим соединениям, которые имеют структуру, отличную от общей химической структуры аминокислоты, но которые действуют путем, похожим на таковой для встречающихся в природе аминокислот. Термины «не встречающаяся в природе аминокислота» и «неприродная аминокислота» относятся к аналогам аминокислот, синтетическим аминокислотам и миметикам аминокислот, которые не встречаются в природе.

[0054] Аминокислоты могут обозначаться в данном документе либо их общеизвестными трехбуквенными символами, либо однобуквенными символами, рекомендованными Комиссией по биохимической номенклатуре IUPAC-IUB. Нуклеотиды также могут обозначаться их общепринятыми однобуквенными кодами.

[0055] Термины «полипептид», «пептид» и «белок» употребляются в контексте данного документа взаимозаменяемо для обозначения полимера из аминокислотных остатков, при этом полимер, в аспектах данного изобретения, может быть конъюгирован с фрагментом, который не состоит из аминокислот. Данные термины применяются к аминокислотным полимерам, в которых один или несколько аминокислотных остатков являются искусственным химическим миметиком соответствующей встречающейся в природе аминокислоты, а также к встречающимся в природе аминокислотным полимерам и не встречающимся в природе аминокислотным полимерам. Термин «слитый белок» относится к химерному белку, кодирующему две или более отдельных белковых последовательностей, которые рекомбинантно экспрессируются как единый фрагмент.

[0056] Термин «консервативно модифицированные варианты» применяется к последовательностям как аминокислот, так и нуклеиновых кислот. Что касается конкретных последовательностей нуклеиновых кислот, «консервативно модифицированные варианты» относятся к тем нуклеиновым кислотам, которые кодируют идентичные или практически идентичные аминокислотные последовательности. Из-за вырожденности генетического кода любой данный белок будет кодироваться рядом последовательностей нуклеиновых кислот. Например, все кодоны GCA, GCC, GCG и GCU кодируют аминокислоту аланин. Таким образом, в каждом положении, в котором аланин определяется кодоном, этот кодон может быть изменен на любой из соответствующих описанных кодонов без изменения кодируемого полипептида. Такие вариации нуклеиновой кислоты представляют собой «молчащие вариации», которые представляют собой один из видов консервативно модифицированных вариаций. Каждая последовательность нуклеиновой кислоты в данном документе, которая кодирует полипептид, также описывает все возможные молчащие вариации нуклеиновой кислоты. Специалист поймет, что каждый кодон в нуклеиновой кислоте (за исключением AUG, который обычно является единственным кодоном для метионина, и TGG, который обычно является единственным кодоном для триптофана) может быть модифицирован с образованием функционально идентичной молекулы. Соответственно, присутствие каждой молчащей вариации нуклеиновой кислоты, кодирующей полипептид, подразумевается в каждой описанной последовательности.

[0057] Что касается аминокислотных последовательностей, специалист в данной области техники поймет, что отдельные замены, делеции или добавления к последовательности нуклеиновой кислоты, пептида, полипептида или белка, которые изменяют, добавляют или удаляют одну аминокислоту или небольшой процент аминокислот в кодируемой последовательность, создают тем самым «консервативно модифицированный вариант», в котором изменение приводит к замене аминокислоты на химически подобную аминокислоту. Таблицы консервативных замен, содержащие функционально похожие аминокислоты, хорошо известны в данной области техники. Такие консервативно модифицированные варианты дополняют и не исключают полиморфные варианты, межвидовые гомологи и аллели из данного описания. Каждая из следующих восьми групп содержит аминокислоты, которые являются консервативными заменами друг друга: (1) аланин (A), глицин (G); (2) аспарагиновая кислота (D), глутаминовая кислота (E); (3) аспарагин (N), глутамин (Q); (4) аргинин (R), лизин (K); (5) изолейцин (I), лейцин (L), метионин (M), валин (V); (6) фенилаланин (F), тирозин (Y), триптофан (W); (7) серин (S), треонин (T); и (8) цистеин (C), метионин (M) (см., например, Creighton, Proteins (1984)).

[0058] «Процент идентичности последовательностей» определяется путем сравнения двух оптимально выровненных последовательностей в окне сравнения, при этом часть полинуклеотидной или полипептидной последовательности в окне сравнения может включать в себя добавления или делеции (т.е. гэпы) по сравнению с референсной последовательностью (которая не содержит добавлений или делеций) для оптимального выравнивания двух последовательностей. Указанный процент рассчитывается путем определения количества положений, в которых идентичное основание нуклеиновой кислоты или аминокислотный остаток встречается в обеих последовательностях, чтобы получить количество совпадающих положений, путем деления количества совпадающих положений на общее количество положений в окне сравнения и умножением результата на 100, чтобы получить процент идентичности последовательностей.

[0059] Термины «идентичный» или процент «идентичности» в контексте двух или более нуклеиновых кислот или полипептидных последовательностей относятся к двум или более последовательностям или подпоследовательностям, которые являются одинаковыми или имеют определенный процент аминокислотных остатков или нуклеотидов, которые являются одинаковыми (т.е. идентичность составляет около 60%, предпочтительно 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более высокая идентичность в указанной области при сравнении и выравнивании для максимального соответствия в окне сравнения или в назначенной области) при измерении с использованием алгоритмов сравнения последовательностей BLAST или BLAST 2.0 с параметрами по умолчанию, которые описаны ниже, или путем ручного выравнивания и визуального осмотра (см., например, веб-сайт NCBI ncbi.nlm.nih.gov/BLAST/ или ему подобные). Такие последовательности далее именуются «по существу идентичными». Данное определение также относится или может применяться к комплементу тестовой последовательности. Данное определение также включает последовательности с делециями и (или) добавлениями, а также последовательности с заменами. Как описано ниже, предпочтительные алгоритмы могут учитывать гэпы и тому подобное. Предпочтительно, идентичность существует в области, длина которой составляет, по меньшей мере, около 25 аминокислот или нуклеотидов, или, более предпочтительно, в области, длина которой составляет 50-100 аминокислот или нуклеотидов.

[0060] «Положение» аминокислоты или нуклеотидного основания обозначается числом, которое последовательно идентифицирует каждую аминокислоту (или нуклеотидное основание) в референсной последовательности на основе ее положения относительно N-конца (или 5'-конца). Из-за делеций, вставок, усечений, слияний и тому подобного, которые необходимо учитывать при определении оптимального выравнивания, в целом номер аминокислотного остатка в тестовой последовательности, определяемый простым подсчетом от N-конца, не обязательно будет тем же, что и номер соответствующего положения в референсной последовательности. Например, в случае, когда вариант имеет делецию относительно выровненной референсной последовательности, в этом варианте в сайте делеции не будет аминокислоты, которая соответствует положению в референсной последовательности. Если имеется вставка в выровненной референсной последовательности, эта вставка не будет соответствовать нумерованному положению аминокислоты в референсной последовательности. В случае усечения или слияния могут быть отрезки аминокислот либо в референсной, либо в выровненной последовательности, которые не соответствуют какой-либо аминокислоте в соответствующей последовательности.

[0061] Термины «пронумерованная со ссылкой на» или «соответствующая» при использовании в контексте нумерации конкретной аминокислотной или полинуклеотидной последовательности относятся к нумерации остатков указанной референсной последовательности, когда данная аминокислотная или полинуклеотидная последовательность сравнивается с референсной последовательностью.

[0062] Для конкретных белков, описанных в данном документе (например, KRAB, dCas9, Dnmt3A, Dnmt3L), названный белок включает в себя любую из встречающихся в природе форм белка, либо варианты или гомологи, которые сохраняют активность названного белка (например, в пределах по меньшей мере 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или 100% активности по сравнению с нативным белком). В аспектах данного изобретения варианты или гомологи по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентичны аминокислотной последовательности по всей длине последовательности, или на участке последовательности (например, на непрерывном участке длиной 50, 100, 150 или 200 аминокислот) по сравнению с формой, встречающейся в природе. В аспектах данного изобретения белок представляет собой белок, идентифицированный с помощью ссылки на его последовательность в NCBI. В аспектах данного изобретения белок представляет собой белок, идентифицированный с помощью ссылки на его последовательность в NCBI, или по функциональному фрагменту такой последовательности, или по ее гомологу.

[0063] Термин «домен, связанный с боксом » или «домен KRAB», употребляемый в контексте данного документа, относится к категории доменов, репрессирующих транскрипцию, которые присутствуют примерно в 400 человеческих факторах транскрипции, основанных на белке «цинковые пальцы». Домены KRAB обычно включают в себя от около 45 до около 75 аминокислотных остатков. Описание доменов KRAB, включительно с их функцией и применением, можно найти, например, в Ecco, G., Imbeault, M., Trono, D., KRAB zinc finger proteins, Development 144, 2017; Lambert et al. The human transcription factors, Cell 172, 2018; Gilbert et al., Cell (2013); и Gilbert et al., Cell (2014), все из которых включены в данный документ посредством ссылки в полном объеме. В аспектах данного изобретения домен KRAB представляет собой домен KRAB Kox 1. В аспектах данного изобретения домен KRAB включает в себя последовательность, изложенную в SEQ ID NO: 16. В аспектах данного изобретения домен KRAB представляет собой последовательность с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 16.

[0064] Термин «метилтрансфераза ДНК», употребляемый в контексте данного документа, относится к ферменту, который катализирует перенос метильной группы на ДНК. Неограничивающие примеры метилтрансфераз ДНК включают в себя Dnmt1, Dnmt3A, Dnmt3B и Dnmt3L. В аспектах данного изобретения метилтрансфераза ДНК представляет собой бактериальную цитозин-метилтрансферазу и (или) бактериальную нецитозин-метилтрансферазу. В зависимости от конкретной метилтрансферазы ДНК метилируются разные участки ДНК. Например, Dnmt3A для метилирования обычно нацелен на динуклеотиды CpG. Посредством метилирования ДНК метилтрансферазы ДНК могут изменять активность сегмента ДНК (например, экспрессию гена) без изменения последовательности ДНК. В аспектах данного изобретения метилирование ДНК приводит к репрессии транскрипции гена и (или) модуляции факторов транскрипции, чувствительных к метилированию, или CTCF. Как описано в данном документе, слитые белки могут включать в себя одну или несколько (например, две) метилтрансфераз ДНК. Когда метилтрансфераза ДНК включена как часть слитого белка, метилтрансфераза ДНК может называться «доменом метилтрансферазы ДНК». В аспектах данного изобретения домен метилтрансферазы ДНК включает в себя одну или несколько метилтрансфераз ДНК. В аспектах данного изобретения домен метилтрансферазы ДНК включает в себя две метилтрансферазы ДНК. В аспектах данного изобретения домен метилтрансферазы ДНК представляет собой Dnmt3A. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК представляет собой Dnmt3L. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК включает в себя Dnmt3A и Dnmt3L. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 33. Описание структуры домена Dnmt3A-3L и его применения можно найти, например, в Siddique et al, Targeted methylation and gene silencing of VEGF-A in human cells by using a designed Dnmt3a-Dnmt3L single-chain fusion protein with increased DNA methylation activity, J. Mol. Biol. 425, 2013, и в Stepper et al, Efficient targeted DNA methylation with chimeric dCas9-Dnmt3a-Dnmt3L methyltransferase, Nucleic Acids Res. 45, 2017, которые полностью и для всех целей включены в данный документ посредством ссылки.

[0065] Белки «Dnmt3A», «Dnmt3a», «ДНК (цитозин-5)-метилтрансфераза 3A» или «метилтрансфераза ДНК 3a», указанные в данном документе, включают в себя любую из рекомбинантных или встречающихся в природе форм фермента Dnmt3A, либо его варианты или гомологи, которые сохраняют активность фермента Dnmt3A (например, в пределах по меньшей мере 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% активности по сравнению с Dnmt3A). В аспектах данного изобретения варианты или гомологи по меньшей мере на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентичны аминокислотной последовательности по всей длине последовательности, или на участке последовательности (например, на непрерывном участке длиной 50, 100, 150 или 200 аминокислот) по сравнению с белком Dnmt3A, встречающимся в природе. В аспектах данного изобретения белок Dnmt3A по существу идентичен белку, идентифицированному по регистрационному номеру UniProt Q9Y6K1, либо варианту или гомологу, по существу идентичному белку с данным регистрационным номером. В аспектах данного изобретения полипептид Dnmt3A кодируется последовательностью нуклеиновой кислоты, идентифицированной по референсной последовательности NCBI с номером доступа NM_022552, по гомологам или по функциональным фрагментам последовательности с данным номером доступа. В аспектах данного изобретения Dnmt3A включает в себя последовательность, изложенную в SEQ ID NO: 26. В аспектах данного изобретения Dnmt3A представляет собой последовательность, изложенную в SEQ ID NO: 26. В аспектах данного изобретения Dnmt3A имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения Dnmt3A имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения Dnmt3A имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 26.

[0066] Белок «Dnmt3L», «ДНК (цитозин-5)-метилтрансфераза 3L» или «метилтрансфераза ДНК 3L», указанный в данном документе, включает в себя любую из рекомбинантных или встречающихся в природе форм фермента Dnmt3L, либо варианты или гомологи, которые сохраняют активность фермента Dnmt3L (например, в пределах по меньшей мере 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% активности по сравнению с Dnmt3L). В аспектах данного изобретения варианты или гомологи по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентичны аминокислотной последовательности по всей длине последовательности, или на участке последовательности (например, на непрерывном участке длиной 50, 100, 150 или 200 аминокислот) по сравнению с белком Dnmt3L, встречающимся в природе. В аспектах данного изобретения белок Dnmt3L по существу идентичен белку, идентифицированному по регистрационному номеру UniProt Q9CWR8, либо варианту или гомологу, по существу идентичному белку с данным регистрационным номером. В аспектах данного изобретения белок Dnmt3L идентичен белку, идентифицированному по регистрационному номеру UniProt Q9CWR8. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 75% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9CWR8. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 80% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9CWR8. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 85% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9CWR8. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 95% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9CWR8.

[0067] В аспектах данного изобретения белок Dnmt3L по существу идентичен белку, идентифицированному по регистрационному номеру UniProt Q9UJW, либо варианту или гомологу, по существу идентичному белку с данным регистрационным номером. В аспектах данного изобретения белок Dnmt3L идентичен белку, идентифицированному по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 50% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 55% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 60% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 65% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 70% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 75% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 80% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 85% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 90% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 95% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения полипептид Dnmt3L кодируется последовательностью нуклеиновой кислоты, идентифицированной по референсной последовательности NCBI с номером доступа NM_001081695, либо по гомологам или по функциональным фрагментам последовательности с данным номером доступа. В аспектах данного изобретения Dnmt3L включает в себя последовательность, изложенную в SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L представляет собой последовательность, изложенную в SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 50% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 55% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 60% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 65% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 97% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 28.

[0068] Термин «РНК-направляемая эндонуклеаза ДНК» и ему подобные термины относятся в обычном и общепринятом смысле к ферменту, который расщепляет фосфодиэфирную связь в полинуклеотидной цепи ДНК, при этом распознаванию фосфодиэфирной связи способствует отдельная последовательность РНК (например, единая гидовая РНК).

[0069] Термин «эндонуклеаза CRISPR класса II» относится к эндонуклеазам, которые обладают такой же эндонуклеазной активностью, как Cas9, и участвуют в системе CRISPR класса II. Примером системы CRISPR класса II является локус CRISPR типа II из Streptococcus pyogenes SF370, который содержит кластер из четырех генов - Cas9, Cas1, Cas2 и Csn1, а также два некодирующих элемента РНК - tracrРНК и характерный массив повторяющихся последовательностей (прямые повторы), разделенных короткими отрезками неповторяющихся последовательностей (спейсеры, около 30 п.о. каждый). Фермент Cpf1 относится к предполагаемой системе CRISPR-Cas типа V. Системы как типа II, так и типа V включены в класс II системы CRISPR-Cas.

[0070] «Последовательность ядерной локализации», или «сигнал ядерной локализации», или «СЯЛ» (англ. «NLS») представляет собой пептид, который направляет белки в ядро. В аспектах данного изобретения СЯЛ включает в себя пять основных положительно заряженных аминокислот. СЯЛ может располагаться в любом месте пептидной цепи. В аспектах данного изобретения СЯЛ представляет собой СЯЛ, полученный от SV40. В аспектах данного изобретения СЯЛ включает в себя последовательность, изложенную в SEQ ID NO: 25. В аспектах данного изобретения СЯЛ представляет собой последовательность, изложенную в SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность с SEQ ID NO: 25.

[0071] Термин «клетка», употребляемый в контексте данного документа, относится к клетке, выполняющей метаболическую или другую функцию, достаточную для сохранения или репликации ее геномной ДНК. Клетка может быть идентифицирована с помощью методов, которые хорошо известны в данной области техники, включая, например, наличие неповрежденной мембраны, окрашивание определенным красителем, способность производить потомство или, в случае гаметы, способность объединяться со второй гаметой для производства жизнеспособного потомства. Клетки могут включать в себя прокариотические и эукариотические клетки. Прокариотические клетки включают в себя, но не ограничиваются ими, бактерии. Эукариотические клетки включают в себя, но не ограничиваются ими, дрожжевые клетки и клетки, полученные из растений и животных, например, клетки млекопитающих, насекомых (например, Spodoptera) и человека. Клетки могут быть применимы, когда они от природы являются неприлипающими, или были обработаны так, чтобы не прилипать к поверхностям, например, путем трипсинизации.

[0072] Термин «вектор», употребляемый в контексте данного документа, относится к молекуле нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она была связана. Одним из типов вектора является «плазмида», которая относится к линейной или кольцевой двухцепочечной петле ДНК, в которую могут быть лигированы дополнительные сегменты ДНК. Другой тип вектора представляет собой вирусный вектор, в котором дополнительные сегменты ДНК могут быть лигированы в вирусный геном. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, имеющие бактериальную точку начала репликации, и эписомальные векторы млекопитающих). Другие векторы (например, неэписомные векторы млекопитающих) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы именуются в данном документе «векторами экспрессии». В общем, векторы экспрессии, используемые в технологиях рекомбинантных ДНК, часто находятся в форме плазмид. В данном документе термины «плазмида» и «вектор» могут употребляться взаимозаменяемо, поскольку плазмида является наиболее часто используемой формой вектора. Тем не менее, данное изобретение предназначено для включения других форм векторов экспрессии, таких как вирусные векторы (например, ретровирусы с дефектом репликации, аденовирусы и аденоассоциированные вирусы), которые выполняют эквивалентные функции. Кроме того, некоторые вирусные векторы способны нацеливаться на конкретный тип клеток либо специфично, либо неспецифично. Неспособные к репликации вирусные векторы, или вирусные векторы с дефектом репликации, относятся к вирусным векторам, которые способны инфицировать свои клетки-мишени и доставлять свою вирусную нагрузку, но затем не могут продолжить типичный литический путь, который приводит к лизису и гибели клеток.

[0073] Термины «трансфекция», «трансдукция», «трансфицировать» или «трансдуцировать» могут употребляться взаимозаменяемо, и определяются как процесс введения молекулы нуклеиновой кислоты и (или) белка в клетку. Нуклеиновые кислоты могут быть введены в клетку с использованием невирусных методов или методов, основанных на вирусах. Молекула нуклеиновой кислоты может представлять собой последовательность, кодирующую полные белки или их функциональные части. Обычно вектор нуклеиновой кислоты содержит элементы, необходимые для экспрессии белка (например, промотор, сайт начала транскрипции и т. д.). Невирусные методы трансфекции включают в себя любой подходящий метод, в котором не используется вирусная ДНК или вирусные частицы в качестве системы доставки для введения молекулы нуклеиновой кислоты в клетку. Типичные методы невирусной трансфекции включают в себя инкапсуляцию наночастиц нуклеиновых кислот, которые кодируют слитый белок (например, липидные наночастицы, наночастицы золота и тому подобное), трансфекцию фосфатом кальция, липосомную трансфекцию, нуклеофекцию, сонопорацию, трансфекцию посредством теплового шока, трансфекцию посредством намагничивания и электропорацию. Что касается методов, основанных на вирусах, то любой пригодный вирусный вектор может быть использован в способах, описанных в данном документе. Примеры вирусных векторов включают, но не ограничиваются ими, ретровирусные, аденовирусные, лентивирусные и аденоассоциированные вирусные векторы. В аспектах данного изобретения молекулы нуклеиновой кислоты вводятся в клетку с использованием ретровирусного вектора в соответствии со стандартными процедурами, хорошо известными в данной области техники. Термины «трансфекция» или «трансдукция» также относятся к введению белков в клетку из внешней среды. Обычно трансдукция или трансфекция белка основывается на присоединении пептида или белка, способного пересекать клеточную мембрану, к представляющему интерес белку. См., например, Ford et al. (2001) Gene Therapy 8: 1-4, и Prochiantz (2007) Nat. Methods 4: 119-20.

[0074] Термин «пептидный линкер», употребляемый в контексте данного документа, представляет собой линкер, включающий в себя пептидный фрагмент. В вариантах реализации данного изобретения пептидный линкер представляет собой двухвалентный пептид, такой как аминокислотная последовательность, присоединенная на N-конце и C-конце к остатку соединения (например, слитый белок, представленный в данном документе). Пептидный линкер может быть пептидным фрагментом (двухвалентным пептидным фрагментом), который можно расщепить (например, полипептидом, расщепляемым P2A). Пептидный линкер в контексте данного документа также может взаимозаменяемо именоваться аминокислотным линкером. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 80 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 70 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 60 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 50 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 40 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 30 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 25 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 20 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 20 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 19 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 18 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 17 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 16 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 15 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 14 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 13 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 12 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 11 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 10 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 9 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 8 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 7 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 6 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 5 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 4 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 3 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 19 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 18 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 17 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 16 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 15 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 14 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 13 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 12 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 11 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 10 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 9 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 8 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 7 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 6 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 5 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 4 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 10 до около 20 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 15 до около 20 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 2 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 3 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 4 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 5 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 6 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 7 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 8 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 9 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 10 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 11 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 12 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 13 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 14 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 15 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 16 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 17 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 18 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 19 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 20 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 21 аминокислотного остатка. В аспектах данного изобретения пептидный линкер включает в себя около 22 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 23 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 24 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 25 аминокислотных остатков.

[0075] В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 17. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 17. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 18. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 18. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 19. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 19. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 20. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 20. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 21. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 21. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 22. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 22. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 24. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 24. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 29. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 29. В аспектах данного изобретения пептидный линкер представляет собой полипептид XTEN. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 17, 18, 19, 20, 21, 22, 24, 27 или 29. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 17, 18, 19, 20, 21, 22, 24, 27 или 29.

[0076] В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности SEQ ID NO: 17. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 18. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 19. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 20. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 21. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 22. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 29. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 17, 18, 19, 20, 21, 22, 24, 27 или 29. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 17. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 18. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 19. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 20. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 21. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 22. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 29.

[0077] Термины «XTEN», «линкер XTEN» или «полипептид XTEN» в контексте данного документа относятся к рекомбинантному полипептиду (например, неструктурированному рекомбинантному пептиду), не имеющему гидрофобных аминокислотных остатков. О разработке и использовании XTEN можно найти, например, в публикации Schellenberger et al., Nature Biotechnology 27, 1186-1190 (2009), которая полностью и для всех целей включена в данный документ посредством ссылки. В аспектах данного изобретения линкер XTEN включает в себя последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN включает в себя последовательность, изложенную SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 32.

[0078] «Детектируемый агент» или «детектируемый фрагмент» представляет собой композицию, которую можно детектировать соответствующими средствами, такими как спектроскопические, фотохимические, биохимические, иммунохимические, химические средства, магнитно-резонансная томография или другие физические средства. Например, пригодные реагенты для детекции включают в себя 18F, 32P, 33P, 45Ti, 47Sc, 52Fe, 59Fe, 62Cu, 64Cu, 67Cu, 67Ga, 68Ga, 77As, 86Y, 90Y. 89Sr, 89Zr, 94Tc, 94Tc, 99mTc, 99Mo, 105Pd, 105Rh, 111Ag, 111In, 123I, 124I, 125I, 131I, 142Pr, 143Pr, 149Pm, 153Sm, 154-1581Gd, 161Tb, 166Dy, 166Ho, 169Er, 175Lu, 177Lu, 186Re, 188Re, 189Re, 194Ir, 198Au, 199Au, 211At, 211Pb, 212Bi, 212Pb, 213Bi, 223Ra, 225Ac, Cr, V, Mn, Fe, Co, Ni, Cu, La, Ce, Pr, Nd, Pm, Sm, Eu, Gd, Tb, Dy, Ho, Er, Tm, Yb, Lu, 32P, флуорофор (например, флуоресцентные красители), электронно-плотные реагенты, ферменты (например, широко используемые в твердофазном ИФА), биотин, дигоксигенин, парамагнитные молекулы, парамагнитные наночастицы, сверхмалые суперпарамагнитные наночастицы оксида железа (англ. «USPIO»), агрегаты наночастиц USPIO, суперпарамагнитные наночастицы оксида железа (англ. «SPIO»), агрегаты наночастиц SPIO, монокристаллические наночастицы оксида железа, монокристаллический оксид железа, контрастные вещества на основе наночастиц, липосомы или другие средства доставки, содержащие молекулы хелата гадолиния («хелат Gd») молекулы, гадолиний, радиоизотопы, радионуклиды (например, углерод-11, азот-13, кислород-15, фтор-18, рубидий-82), фтордезоксиглюкоза (например, меченная фтором-18), любые излучающие гамма-лучи радионуклиды, излучающие позитроны радионуклиды, радиоактивно меченая глюкоза, радиоактивно меченная вода, радиоактивно меченый аммиак, биоколлоиды, микропузырьки (например, включительно с оболочками микропузырьков, содержащими альбумин, галактозу, липиды и (или) полимеры; включительно с газовым ядром микропузырьков, содержащим воздух, тяжелый газ (тяжелые газы), перфторуглерод, азот, октафторпропан, перфлексановые липидные микросферы, перфлутрен и т. д.), йодированные контрастные вещества (например, иогексол, йодиксанол, иоверсол, иопамидол, иоксилан, иопромид, диатризоат, метризоат, иоксаглат), сульфат бария, диоксид тория, золото, золотые наночастицы, агрегаты золотых наночастиц, флуорофоры, двухфотонные флуорофоры или гаптены и белки, или другие объекты, которые могут быть детектированы, например, путем включения радиоактивной метки в пептид или антитело, специфически реагирующие с целевым пептидом.

[0079] Детектируемый фрагмент представляет собой одновалентный детектируемый агент или детектируемый агент, способный образовывать связь с другой композицией. В аспектах данного изобретения детектируемый агент представляет собой метку HA. В аспектах данного изобретения метка HA включает в себя последовательность, изложенную в SEQ ID NO: 24. В аспектах данного изобретения метка НА представляет собой последовательность, изложенную в SEQ ID NO: 24. В аспектах данного изобретения метка НА имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения метка НА имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения метка НА имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения метка НА имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения детектируемый агент представляет собой синий флуоресцентный белок (СФБ, англ. «BFP»). В аспектах данного изобретения СФБ включает в себя последовательность, изложенную в SEQ ID NO: 30. В аспектах данного изобретения СФБ представляет собой последовательность, изложенную в SEQ ID NO: 30. В аспектах данного изобретения СФБ имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 30. В аспектах данного изобретения СФБ имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 30. В аспектах данного изобретения СФБ имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 30. В аспектах данного изобретения СФБ имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 30.

[0080] Радиоактивные вещества (например, радиоизотопы), которые можно использовать в качестве агентов для визуализации и (или) маркировки в соответствии с аспектами данного изобретения, включают в себя, но не ограничиваются ими, 18F, 32P, 33P, 45Ti, 47Sc, 52Fe, 59Fe, 62Cu, 64Cu, 67Cu, 67Ga, 68Ga, 77As, 86Y, 90Y, 89Sr, 89Zr, 94Tc, 94Tc, 99mTc, 99Mo, 105Pd, 105Rh, 111Ag, 111In, 123I, 124I, 125I, 131I, 142Pr, 143Pr, 149Pm, 153Sm, 154-1581Gd, 161Tb, 166Dy, 166Ho, 169Er, 175Lu, 177Lu, 186Re, 188Re, 189Re, 194Ir, 198Au, 199Au, 211At, 211Pb, 212Bi, 212Pb, 213Bi, 223Ra и 225Ac. Парамагнитные ионы, которые могут использоваться в качестве дополнительных агентов для визуализации в соответствии с аспектами данного изобретения, включают в себя, но не ограничиваются ими, ионы переходных металлов и лантаноидных металлов (например, металлы с атомными номерами 21-29, 42, 43, 44 или 57-71). Эти металлы включают в себя ионы Cr, V, Mn, Fe, Co, Ni, Cu, La, Ce, Pr, Nd, Pm, Sm, Eu, Gd, Tb, Dy, Ho, Er, Tm, Yb и Lu.

[0081] Термин «контактирование» употребляется в его простом, обычном значении и относится к процессу, позволяющему по крайней мере двум различным молекулам приблизиться друг к другу на достаточно близкое расстояние, чтобы реагировать, взаимодействовать или физически соприкасаться. Однако следует понимать, что конечный продукт реакции может быть получен непосредственно в результате реакции между добавленными реагентами, или из промежуточного продукта из одного или нескольких добавленных реагентов, которые могут быть получены в реакционной смеси.

[0082] Термин «контактирование» может включать в себя предоставление возможности двум молекулам реагировать, взаимодействовать или физически соприкасаться, где две молекулы могут представлять собой, например, слитый белок, как предусмотрено в данном документе, и последовательность нуклеиновой кислоты (например, последовательность целевой ДНК).

[0083] Как определено в данном документе, термин «ингибирование», «ингибирует», «ингибирующий», «репрессия», «репрессирует», «сайленсинг», «вызывать сайленсинг» и тому подобное при употреблении в отношении композиции, представленной в данном документе (например, слитого белка, комплекса, нуклеиновой кислоты, вектора), относятся к отрицательному влиянию (например, снижению) активности (например, транскрипции) последовательности нуклеиновой кислоты (например, снижению транскрипции гена) относительно активности последовательности нуклеиновой кислоты (например, транскрипции гена) в отсутствие композиции (например, слитого белка, комплекса, нуклеиновой кислоты, вектора). В аспектах данного изобретения ингибирование относится к ослаблению заболевания или симптомов заболевания (например, онкологического заболевания). Таким образом, ингибирование включает, по крайней мере частично, частичное или полное блокирование активности (например, транскрипции) или уменьшение, предотвращение или задержку активности (например, транскрипции) последовательности нуклеиновой кислоты. Ингибированная активность (например, транскрипция) может составлять 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 10% или меньше, чем активность в контроле. В аспектах данного изобретения ингибирование является 1,5-кратным, 2-кратным, 3-кратным, 4-кратным, 5-кратным, 10-кратным или более по сравнению с контролем.

[0084] «Контрольный» образец или значение относится к образцу, который служит референсом, обычно известным референсом, для сравнения с исследуемым образцом. Например, исследуемый образец может быть отобран из исследуемого условия, например, в присутствии исследуемого соединения, и сравнен с образцами из известных условий, например, в отсутствие исследуемого соединения (отрицательный контроль) или в присутствии известного соединения (положительный контроль). Контроль также может представлять собой среднее значение, полученное из ряда исследований или результатов. Специалист в данной области техники поймет, что контроли могут быть разработаны для оценки любого количества параметров. Например, можно разработать контроль для сравнения терапевтического эффекта на основе фармакологических данных (например, период полужизни) или терапевтических мер (например, сравнение побочных эффектов). Специалист в данной области техники поймет, какие контроли важны в определенной ситуации, и сможет анализировать данные на основе сравнений с контрольными значениями. Контроли также важны для определения значимости данных. Например, если значения для определенного параметра сильно различаются в контроле, то вариация в исследуемых образцах не будет считаться значимой.

[0085] Слитые белки

[0086] В данном документе представлены, среди прочего, слитые белки, которые могут отключать гены навсегда (например, необратимо) и обратимо в клетках млекопитающих с использованием редактирования эпигенома на основе CRISPR. В вариантах реализации данного изобретения слитый белок включает в себя один полипептид, слитый из четырех белков (например, каталитически неактивного Cas9 (например, dCas9), домена KRAB, Dnmt3A и Dnmt3L), которые могут кратковременно экспрессироваться в клетках. Слитый белок может быть направлен в конкретный сайт в геноме млекопитающего с использованием полинуклеотида, комплементарного целевой последовательности нуклеиновой кислоты (например, последовательности ДНК), и который дополнительно включает в себя последовательность (т. е. связывающую последовательность), способную к связыванию со слитым белком. После правильного позиционирования, и без намерения быть связанным теорией, слитый белок добавляет маркеры метилирования ДНК и (или) репрессивные хроматиновые маркеры к целевой нуклеиновой кислоте, что приводит к сайленсингу гена, который наследуется при последующих делениях клеток. Таким образом, слитый белок может выполнять редактирование эпигенома, которое позволяет обойтись без создания двухцепочечных разрывов ДНК в геноме хозяина, что делает его безопасным и обратимым способом манипулирования геномом живого организма.

[0087] В вариантах реализации данного изобретения слитый белок содержит фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; домен KRAB и домен метилтрансферазы ДНК. В аспектах данного изобретения слитый белок содержит, в направлении от N-конца до C-конца, домен метилтрансферазы ДНК, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, и домен KRAB. В аспектах данного изобретения слитый белок содержит, в направлении от N-конца до C-конца, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, и домен метилтрансферазы ДНК. В вариантах реализации данного изобретения слитый белок дополнительно содержит один или несколько пептидных линкеров. В аспектах данного изобретения слитый белок дополнительно содержит одну или несколько детектируемых меток. В аспектах данного изобретения слитый белок дополнительно содержит одну или несколько последовательностей ядерной локализации. В аспектах данного изобретения слитый белок дополнительно содержит один или несколько пептидных линкеров, одну или несколько детектируемых меток, одну или несколько последовательностей ядерной локализации, или комбинацию двух или более из вышеперечисленных. Когда слитый белок содержит один или несколько пептидных линкеров, каждый из пептидных лайнеров может быть одинаковым или разными. Когда слитый белок содержит одну или несколько детектируемых меток, каждая из детектируемых меток может быть одинаковой или разной. В аспектах данного изобретения слитый белок содержит от 1 до 10 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 9 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 8 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 7 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 6 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 5 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 4 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 3 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 2 детектируемых меток. В аспектах данного изобретения слитый белок содержит 1 детектируемую метку. В аспектах данного изобретения слитый белок содержит 2 детектируемых метки. В аспектах данного изобретения слитый белок содержит 3 детектируемых метки. В аспектах данного изобретения слитый белок содержит 4 детектируемых метки. В аспектах данного изобретения слитый белок содержит 5 детектируемых меток.

[0088] В вариантах реализации данного изобретения слитый белок содержит структуру A - B - C, или B - A - C, или C - A - B, или C - B - A, или B - C - A, или A - C - B; где А представляет собой фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; B представляет собой домен KRAB, C представляет собой домен метилтрансферазы ДНК; и при этом компонент слева является N-концом, а компонент справа является C-концом. В аспектах данного изобретения слитый белок дополнительно содержит один или несколько пептидных линкеров и одну или несколько детектируемых меток. В аспектах данного изобретения каждый из A - B, B - A, B - C, C - B, A - C и C - A независимо связан друг с другом ковалентной связью, пептидным линкером, детектируемой меткой, последовательностью ядерной локализации или комбинацией двух или более из них. Пептидный линкер может быть любым известным в данной области техники (например, пептид, расщепляемый P2A, линкер XTEN и тому подобное). В аспектах данного изобретения слитый белок содержит другие компоненты, такие как детектируемые метки (например, метка НА, синий флуоресцентный белок и т.п.).

[0089] В вариантах реализации данного изобретения слитый белок содержит структуру A - L1 - B - L2 - C, где A представляет собой фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; B представляет собой домен KRAB, C представляет собой домен метилтрансферазы ДНК, L1 представляет собой ковалентную связь или пептидный линкер, и L2 представляет собой ковалентную связь или пептидный линкер; и где A находится на N-конце, а C находится на C-конце. В аспектах данного изобретения A ковалентно связан с B через пептидный линкер. В аспектах данного изобретения A ковалентно связан с B через ковалентную связь. В аспектах данного изобретения B ковалентно связан с C через пептидный линкер. В аспектах данного изобретения B ковалентно связан с C через ковалентную связь. Пептидный линкер может быть любым известным в данной области техники (например, пептид, расщепляемый P2A, линкер XTEN и тому подобное). В аспектах данного изобретения слитый белок содержит другие компоненты, такие как детектируемые метки, последовательности ядерной локализации и т.п. В аспектах данного изобретения L1 представляет собой ковалентную связь, пептидный линкер, детектируемую метку, последовательность ядерной локализации или их комбинацию. В аспектах данного изобретения L2 представляет собой ковалентную связь, пептидный линкер, детектируемую метку, последовательность ядерной локализации или их комбинацию.

[0090] В вариантах реализации данного изобретения слитый белок содержит структуру B - L1 - A - L2 - C, где A представляет собой фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; B представляет собой домен KRAB, C представляет собой домен метилтрансферазы ДНК, L1 представляет собой ковалентную связь или пептидный линкер, и L2 представляет собой ковалентную связь или пептидный линкер; и где B находится на N-конце, а C находится на C-конце. В аспектах данного изобретения L1 представляет собой пептидный линкер. В аспектах данного изобретения L1 представляет собой ковалентную связь. В аспектах данного изобретения L2 представляет собой пептидный линкер. В аспектах данного изобретения L2 представляет собой ковалентную связь. Пептидный линкер может быть любым известным в данной области техники или описанным в данном документе (например, пептид, расщепляемый P2A, линкер XTEN и т.п.). В аспектах данного изобретения слитый белок содержит другие компоненты, такие как детектируемые метки. В аспектах данного изобретения L1 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или их комбинацию. В аспектах данного изобретения L2 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или их комбинацию. В аспектах данного изобретения слитый белок дополнительно содержит последовательность ядерной локализации. Иллюстративные слитые белки, содержащие структуру B - L1 - A - L2 - C, включают в себя p76, p90, p91, p92, p93, p94, p95, p96, p97, p98, p99, p100, p101 и p102 (Фиг. 5)

[0091] В вариантах реализации данного изобретения слитый белок содержит структуру B - L3 - A - L4 - C - L5 - D; где A представляет собой фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; B представляет собой домен KRAB, C представляет собой домен метилтрансферазы ДНК, D отсутствует или D представляет собой одну или несколько детектируемых меток, L3 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или комбинацию двух или более из них, L4 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или комбинацию двух или более из них, L5 отсутствует или L5 представляет собой ковалентную связь или пептидный линкер; и где B находится на N-конце, а D находится на C-конце. В аспектах данного изобретения L3 представляет собой пептидный линкер. В аспектах данного изобретения L3 представляет собой ковалентную связь. В аспектах данного изобретения L3 содержит пептидный линкер и детектируемую метку. В аспектах данного изобретения L3 содержит детектируемую метку. В аспектах данного изобретения L4 представляет собой пептидный линкер. В аспектах данного изобретения L4 содержит пептидный линкер и детектируемую метку. В аспектах данного изобретения L4 представляет собой ковалентную связь. В аспектах данного изобретения L4 содержит обнаруживаемую метку. В аспектах данного изобретения L5 представляет собой пептидный линкер. В аспектах данного изобретения L5 представляет собой ковалентную связь. В аспектах данного изобретения D содержит один или множество детектируемых меток. В аспектах данного изобретения D содержит одну детектируемую метку. В аспектах данного изобретения D содержит две детектируемых метки. В аспектах данного изобретения D содержит три детектируемых метки. В аспектах данного изобретения D содержит множество детектируемых меток. D может быть любой детектируемой меткой, известной в данной области техники и (или) описанной в данной документе (например, меткой НА, синим флуоресцентным белком и т.п.). В аспектах данного изобретения L5 и D могут отсутствовать. Когда L3, L4, L5 и D содержат две или более детектируемых метки, каждая из детектируемых меток является одинаковой или разной. Пептидный линкер может быть любым, известным в данной области техники и (или) описанным в данном документе (например, пептид, расщепляемый P2A, линкер XTEN и т.п.). В аспектах данного изобретения слитый белок дополнительно содержит последовательность ядерной локализации. Иллюстративные слитые белки, содержащие структуру B - L3 - A - L4 - C - L5 - D, включают в себя p76, p90, p91, p92, p93, p94, p95, p96, p97, p98, p99, p100, p101 и p102, как показано на Фиг. 5.

[0092] В вариантах реализации данного изобретения слитый белок содержит структуру C - L3 - A - L4 - B - L5 - D, где A представляет собой фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; B представляет собой домен KRAB, C представляет собой домен метилтрансферазы ДНК, D отсутствует или D содержит одну или несколько детектируемых меток, L3 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или комбинацию двух или более из них, L4 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или комбинацию двух или более из них, L5 отсутствует или L5 представляет собой ковалентную связь или пептидный линкер; и где C находится на N-конце, а D находится на C-конце. В аспектах данного изобретения L3 представляет собой пептидный линкер. В аспектах данного изобретения L3 представляет собой ковалентную связь. В аспектах данного изобретения L3 содержит детектируемую метку. В аспектах данного изобретения L3 содержит пептидный линкер и детектируемую метку. В аспектах данного изобретения L4 представляет собой пептидный линкер. В аспектах данного изобретения L4 представляет собой ковалентную связь. В аспектах данного изобретения L4 содержит обнаруживаемую метку. В аспектах данного изобретения L4 содержит пептидный линкер и детектируемую метку. В аспектах данного изобретения L5 представляет собой пептидный линкер. В аспектах данного изобретения L5 представляет собой ковалентную связь. В аспектах данного изобретения D содержит один или множество детектируемых меток. В аспектах данного изобретения D содержит одну детектируемую метку. В аспектах данного изобретения D содержит две детектируемых метки. В аспектах данного изобретения D содержит три детектируемых метки. В аспектах данного изобретения D содержит множество детектируемых меток. D может быть любой детектируемой меткой, известной в данной области техники и (или) описанной в данной документе (например, меткой НА, синим флуоресцентным белком и т.п.). В аспектах данного изобретения L5 и D могут отсутствовать. Когда L3, L4, L5 и D содержат две или более детектируемых метки, каждая из детектируемых меток является одинаковой или разной. Пептидный линкер может быть любым, известным в данной области техники и (или) описанным в данном документе (например, пептид, расщепляемый P2A, линкер XTEN и т.п.). В аспектах данного изобретения слитый белок дополнительно содержит последовательность ядерной локализации. Иллюстративные слитые белки, содержащие структуру C - L3 - A - L4 - B - L5 - D, включают в себя p112, как показано на Фиг. 5.

[0093] Термин «фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК» и тому подобные относятся в обычном и общепринятом смысле к РНК-направляемой эндонуклеазе ДНК (например, к мутантной форме встречающейся в природе РНК-направляемой эндонуклеазы ДНК), которая нацелена на специфическую фосфодиэфирную связь в полинуклеотиде ДНК, при этом распознаванию фосфодиэфирной связи способствует отдельная полинуклеотидная последовательность (например, последовательность РНК (например, единая гидовая РНК (егРНК)), но которая не способна расщеплять целевую фосфодиэфирную связь до значительной степени (например, отсутствует измеримый разрыв фосфодиэфирной связи в физиологических условиях). Нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, таким образом, сохраняет ДНК-связывающую способность (например, специфическое связывание с целевой последовательностью) при образовании комплекса с полинуклеотидом (например, егРНК), но не обладает значительной эндонуклеазной активностью (например, каким-либо детектируемым уровнем эндонуклеазной активности). В аспектах данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, ddCpf1, нуклеазо-дефицитный вариант Cas9, или нуклеазо-дефицитную эндонуклеазу CRISPR класса II.

[0094] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9. Термины «dCas9» или «белок dCas9» в контексте данного документа относятся к белку Cas9, в котором оба каталитических сайта для эндонуклеазной активности являются дефектными или неактивными. В аспектах данного изобретения белок dCas9 имеет мутации в положениях, соответствующих D10A и H840A в Cas9 от S. pyogenes. В аспектах данного изобретения белок dCas9 лишен эндонуклеазной активности из-за точечных мутаций в обоих каталитических эндонуклеазных сайтах (RuvC и HNH) Cas9 дикого типа. Точечные мутации могут представлять собой D10A и H840A. В аспектах данного изобретения dCas9 по существу не обладает детектируемой эндонуклеазной (например, эндодезоксирибонуклеазной) активностью. В аспектах данного изобретения dCas9 включает в себя аминокислотную последовательность с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 23.

[0095] Термины «связанный с CRISPR белок 9», «Cas9», «Csn1» или «белок Cas9» при употреблении в контексте данного документа включают в себя любую из рекомбинантных или встречающихся в природе форм эндонуклеазы Cas9, либо их варианты или гомологи, которые сохраняют эндонуклеазную активность фермента Cas9 (например, в пределах по меньшей мере 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или 100% активности по сравнению с Cas9). В некоторых аспектах данного изобретения варианты или гомологи по меньшей мере на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентичны аминокислотной последовательности по всей длине последовательности, или на участке последовательности (например, на непрерывном участке длиной 50, 100, 150 или 200 аминокислот) по сравнению с белком Cas9, встречающимся в природе. В аспектах данного изобретения белок Cas9 по существу идентичен белку, идентифицированному по регистрационному номеру UniProt Q99ZW2, либо варианту или гомологу, по существу идентичному белку с данным регистрационным номером. В аспектах данного изобретения последовательность белка Cas9 по меньшей мере на 75% идентична аминокислотной последовательностью белка, идентифицированного по регистрационному номеру UniProt Q99ZW2. В аспектах данного изобретения последовательность белка Cas9 по меньшей мере на 80% идентична аминокислотной последовательностью белка, идентифицированного по регистрационному номеру UniProt Q99ZW2. В аспектах данного изобретения последовательность белка Cas9 по меньшей мере на 85% идентична аминокислотной последовательностью белка, идентифицированного по регистрационному номеру UniProt Q99ZW2. В аспектах данного изобретения последовательность белка Cas9 по меньшей мере на 90% идентична аминокислотной последовательностью белка, идентифицированного по регистрационному номеру UniProt Q99ZW2. В аспектах данного изобретения последовательность белка Cas9 по меньшей мере на 95% идентична аминокислотной последовательностью белка, идентифицированного по регистрационному номеру UniProt Q99ZW2.

[0096] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой «ddCpf1» или «ddCas12a». Термины «Cpf1 с мертвой ДНКазой» или «ddCpf1» относятся к Cpf1 из Acidaminococcus sp. (AsCpf1), содержащему мутацию, которая приводит к инактивации ДНКазной активности в Cpf1. В аспектах данного изобретения ddCpf1 включает в себя мутацию E993A в домене RuvC AsCpf1. В аспектах данного изобретения ddCpf1 по существу не обладает детектируемой эндонуклеазной (например, эндодезоксирибонуклеазной) активностью. В аспектах данного изобретения ddCpf1 включает в себя аминокислотную последовательность с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 34.

[0097] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dLbCpf1. Термин «dLbCpf1» относится к мутированному Cpf1 из бактерии Lachnospiraceae ND2006 (LbCpf1), у которого отсутствует ДНКазная активность. В аспектах данного изобретения dLbCpf1 включает в себя мутацию D832A. В аспектах данного изобретения dLbCpf1 по существу не обладает детектируемой эндонуклеазной (например, эндодезоксирибонуклеазной) активностью. В аспектах данного изобретения dLbCpf1 включает в себя аминокислотную последовательность с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 35.

[0098] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dFnCpf1. Термин «dFnCpf1» относится к мутированному Cpf1 из Francisella novicida U112 (FnCpf1), у которого отсутствует ДНКазная активность. В аспектах данного изобретения dFnCpf1 включает в себя мутацию D917A. В аспектах данного изобретения dFnCpf1 по существу не обладает детектируемой эндонуклеазной (например, эндодезоксирибонуклеазной) активностью. В аспектах данного изобретения dFnCpf1 включает в себя аминокислотную последовательность с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 36.

[0099] Термин «Cpf1», или «белок Cpf1», употребляемый в контексте данного документа, включает в себя любую из рекомбинантных или встречающихся в природе форм эндонуклеазы Cpf1 (CRISPR из Prevotella и Francisella 1), или их вариантов или гомологов, которые сохраняют эндонуклеазную активность фермента Cpf1 (например, в пределах по меньшей мере 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или 100% активности по сравнению с Cpf1). В аспектах данного изобретения варианты или гомологи по меньшей мере на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентичны аминокислотной последовательности по всей длине последовательности, или на участке последовательности (например, на непрерывном участке длиной 50, 100, 150 или 200 аминокислот) по сравнению с белком Cpf1, встречающимся в природе. В аспектах данного изобретения белок Cpf1 по существу идентичен белку, идентифицированному по регистрационному номеру UniProt U2UMQ6, либо варианту или гомологу, по существу идентичному белку с данным регистрационным номером. В аспектах данного изобретения белок Cpf1 идентичен белку, идентифицированному по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения последовательность белка Cpf1 по меньшей мере на 75% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения последовательность белка Cpf1 по меньшей мере на 80% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения белок Cpf1 идентичен белку, идентифицированному по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения последовательность белка Cpf1 по меньшей мере на 85% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения белок Cpf1 идентичен белку, идентифицированному по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения последовательность белка Cpf1 по меньшей мере на 90% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения белок Cpf1 идентичен белку, идентифицированному по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения последовательность белка Cpf1 по меньшей мере на 95% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt U2UMQ6.

[0100] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой нуклеазо-дефицитный вариант Cas9. Термин «нуклеазо-дефицитный вариант Cas9» относится к белку Cas9, имеющему одну или несколько мутаций, которые увеличивают его специфичность связывания с ППМ (англ. «PAM») по сравнению с Cas9 дикого типа, и, кроме того, имеющему мутации, которые делают белок неспособным к эндонуклеазной активности или имеющим серьезно нарушенную эндонуклеазную активность. Не ограничиваясь теорией, считается, что целевая последовательность должна быть связана с ППМ (примыкающий к протоспейсеру мотив); то есть представляет собой короткую последовательность, которая распознается комплексом CRISPR. Требования к точной последовательности и длине для ППМ различаются в зависимости от используемого фермента CRISPR, но ППМ обычно представляют собой последовательности из 2-5 пар оснований, смежные с протоспейсером (то есть с целевой последовательностью). Специфичность связывания нуклеазо-дефицитных вариантов Cas9 с ППМ может быть определена любым методом, известным в данной области техники. Описание и применение известных вариантов Cas9 можно найти, например, в Shmakov et al., Diversity and evolution of class 2 CRISPR-Cas systems. Nat. Rev. Microbiol. 15, 2017, и в Cebrian-Serrano et al, CRISPR-Cas orthologues and variants: optimizing the repertoire, specificity and delivery of genome engineering tools. Mamm. Genome 7-8, 2017, которые во всей своей полноте и для всех целей включены в данный документ посредством ссылки. Иллюстративные варианты Cas9 перечислены в Таблице 4 ниже.

[0101] Таблица 4

Варианты Cas9 Домены ППМ Литературные источники Streptococcus pyogenes (Sp) Cas9 NGG Hsu et al. 2014 Cell Staphilococcus aureus (Sa) Cas9 NNGRRT или NNGRR NNGGGT, NNGAAT, NNGAGT (Zetsche) Ran et al. 2015 Nature Мутант SpCas9 VQR (D1135V, R1335Q, T1337R) NGAG > NGAT=NGAA > NGAC NGCG Kleinstiver et al. 2015 Nature Мутант SpCas9 VRER (D1135V/ G1218R/ R1335E/ T1337R) NGCG Kleinstiver et al. 2015 Nature SpCas9 D1135E NGG, большая точность, меньше сокращений на сайтах NAG и NGA Kleinstiver et al. 2015 Nature Мутант eSpCas9 1.1 (K848A/ K1003A/ R1060A) NGG Slaymaker et al. Science 2015 SpCas9 HF1
(Q695A, Q926A, N497A, R661A)
NGG Kleinstiver et al. 2016 Nature
AsCpf1 TTTN (5' в егРНК) Zetsche et al. 2015 Cell HypaCas9 (N692A, M694A, Q695A, H698A) Chen et al., Nature, volume 550, pages 407-410 (19 October 2017)

[0102] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой нуклеазо-дефицитную эндонуклеазу CRISPR класса II. Термин «нуклеазо-дефицитная эндонуклеаза CRISPR класса II», употребляемый в контексте данного документа, относится к любой эндонуклеазе CRISPR класса II, имеющей мутации, приводящие к снижению, нарушению или полной потере эндонуклеазной активности.

[0103] В вариантах реализации данного изобретения домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L. Термин «домен Dnmt3A-3L», употребляемый контексте данного документа, относится к белку, включающему в себя как Dnmt3A, так и Dnmt3L. В аспектах данного изобретения Dnmt3A и Dnmt3L ковалентно связаны. В некоторых аспектах данного изобретения Dnmt3A ковалентно связан с Dnmt3L через пептидный линкер. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 27. В аспектах данного изобретения домен Dnmt3A-3L включает в себя последовательность, изложенную в SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L представляет собой последовательность, изложенную в SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 33.

[0104] В вариантах реализации данного изобретения пептидный линкер представляет собой линкер XTEN. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 17 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 18 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 19 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 20 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 30 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 40 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 50 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 60 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 70 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 70 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 60 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 50 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 40 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 35 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 30 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 25 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 20 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя около 16 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя около 17 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя около 18 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя около 19 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя около 20 аминокислотных остатков.

[0105] В вариантах реализации данного изобретения линкер XTEN включает в себя последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN включает в себя последовательность, изложенную SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 32.

[0106] Слитый белок может включать в себя аминокислотные последовательности, пригодные для нацеливания слитого белка на определенные области клетки (например, цитоплазму, ядро). Таким образом, в аспектах данного изобретения слитый белок дополнительно включает в себя пептид сигнала ядерной локализации (СЯЛ). В аспектах данного изобретения СЯЛ включает в себя последовательность, изложенную в SEQ ID NO: 25. В аспектах данного изобретения СЯЛ представляет собой последовательность, изложенную в SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 25.

[0107] В вариантах реализации данного изобретения слитый белок включает в себя в направлении от N-конца до C-конца домен KRAB, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен метилтрансферазы ДНК.

[0108] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L.

[0109] В вариантах реализации данного изобретения dCas9 ковалентно связан с доменом KRAB через пептидный линкер, и при этом dCas9 ковалентно связан с доменом Dnmt3A-3L через пептидный линкер.

[0110] В вариантах реализации данного изобретения пептидный линкер представляет собой линкер XTEN. В аспектах данного изобретения линкер XTEN включает в себя последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN включает в себя последовательность, изложенную SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 32.

[0111] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 1. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 2. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 3. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 4. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 5. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 6. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 7. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 8. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 9. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 10. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 11. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 12. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 13. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 14. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 15. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 15.

[0112] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 15.

[0113] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 15.

[0114] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 15.

[0115] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 15.

[0116] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 15.

[0117] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 15.

[0118] Комплексы

[0119] Для того, чтобы слитый белок мог выполнять редактирование эпигенома, слитый белок взаимодействует с (например, нековалентно связан с) полинуклеотидом (например, егРНК), который комплементарен целевой полинуклеотидной последовательности (например, целевой последовательности ДНК, которая должна быть отредактирована) и, кроме того, включает в себя последовательность (т.е. последовательность связывания), с которой может связываться фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, как описано в данном документе. Путем образования такого комплекса, гибридный белок соответствующим образом позиционируется для выполнения редактирования эпигенома. Термин «комплекс» относится к композиции, которая включает в себя два или более компонента, при этом компоненты связываются вместе и образуют функциональную единицу. В аспектах данного изобретения описанный в данном документе комплекс включает в себя слитый белок, описанный в данном документе, и полинуклеотид, описанный в данном документе. Таким образом, в одном аспекте данного изобретения представлен слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, и полинуклеотид, включающий в себя: (1) нацеливающую на ДНК последовательность, которая комплементарна целевой полинуклеотидной последовательности; и (2) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, при этом фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК связан с полинуклеотидом через связывающую последовательность (например, аминокислотную последовательность, способную связываться с нацеливающей последовательностью ДНК).

[0120] Нацеливающая на ДНК последовательность относится к полинуклеотиду, который включает в себя нуклеотидную последовательность, комплементарную целевой полинуклеотидной последовательности (ДНК или РНК). В аспектах данного изобретения нацеливающая на ДНК последовательность может быть единой молекулой РНК (одиночным полинуклеотидом РНК), которая может включать в себя «единую гидовую РНК» или «егРНК». В аспектах данного изобретения нацеливающая на ДНК последовательность включает в себя две молекулы РНК (например, соединенные вместе посредством гибридизации по месту связывающей последовательности (например, по месту dCas9-связывающей последовательности). В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98% или на 99% комплементарна целевой полинуклеотидной последовательности. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98% или на 99% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) связывает последовательность клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по крайней мере на 75% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по крайней мере на 80% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) связывает последовательность клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по крайней мере на 85% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) связывает последовательность клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по крайней мере на 90% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) связывает последовательность клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по крайней мере на 95% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) связывает последовательность клеточного гена.

[0121] «Целевая полинуклеотидная последовательность», как предусмотрено в данном документе, представляет собой последовательность нуклеиновой кислоты, которая присутствует в клетке или экспрессируется ею, для которой сконструирована комплементарная направляющая последовательность (или нацеливающая на ДНК последовательность), при этом гибридизация между целевой последовательностью и направляющей последовательностью (или нацеливающей на ДНК последовательностью) способствует образованию комплекса CRISPR. Полная комплементарность не обязательно требуется при условии, что комплементарность достаточна, чтобы вызвать гибридизацию и способствовать образованию комплекса CRISPR. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой экзогенную последовательность нуклеиновой кислоты. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой эндогенную последовательность нуклеиновой кислоты.

[0122] Целевая полинуклеотидная последовательность может представлять собой любую область полинуклеотида (например, последовательность ДНК), подходящую для редактирования эпигенома. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть гена. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть транскрипционной регуляторной последовательности. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть промотора, энхансера или сайленсера. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть промотора. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть энхансера. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть сайленсера.

[0123] В вариантах реализации данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность гипометилированной нуклеиновой кислоты. Термин «последовательность гипометилированной нуклеиновой кислоты» употребляется в контексте данного документа в соответствии со стандартным значением в данной области техники и относится к потере или отсутствию метильных групп в 5-метилцитозиновом нуклеотиде (например, в CpG). Потеря или отсутствие метильных групп может быть относительно стандартного контроля. Гипометилирование может происходить, например, в стареющих клетках или при онкологическом заболевании (например, на ранних стадиях неоплазии) по сравнению с более молодой клеткой или нераковой клеткой, соответственно. Таким образом, комплекс может быть полезен для восстановления нормальных (например, незрелых или здоровых) уровней метилирования.

[0124] В вариантах реализации данного изобретения целевая полинуклеотидная последовательность находится в пределах около 3000 пар оснований (п.о.), фланкирующих сайт начала транскрипции. В аспектах данного изобретения целевая полинуклеотидная последовательность находится в пределах около 3000, около 2900, около 2800, около 2700, около 2600, около 2500, около 2400, около 2300, около 2200, около 2100, около 2000, около 1900, около 1800, около 1700, около 1600, около 1500, около 1400, около 1300, около 1200, около 1100, около 1000, около 900, около 800, около 700, около 600, около 500, около 400, около 300, около 200 или около 100 пар оснований (п.о.), фланкирующих сайт начала транскрипции.

[0125] В вариантах реализации данного изобретения целевая полинуклеотидная последовательность находится рядом с промоторной последовательностью, рядом с ней или внутри нее. В аспектах данного изобретения целевая полинуклеотидная последовательность находится внутри островка CpG. В аспектах данного изобретения известно, что целевая полинуклеотидная последовательность связана с заболеванием или патологическим состоянием, характеризующимся гипометилированием ДНК.

[0126] В вариантах реализации данного изобретения иллюстративные целевые полинуклеотидные последовательности включают в себя последовательности, описанные в Таблицах 1 и 2. В аспектах данного изобретения целевая полинуклеотидная последовательность включает в себя последовательность с SEQ ID NO: 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93 или 95. В аспектах данного изобретения целевая полинуклеотидная последовательность включает в себя аминокислотную последовательность, которая по меньшей мере на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93 или 95. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 37. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 39. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 41. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 43. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 45. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 47. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 49. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 51. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 53. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 55. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 57. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 59. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 61. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 63. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 65. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 67. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 69. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 71. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 73. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 75. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 77. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 79. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 81. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 83. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 85. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 87. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 89. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 91. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 93. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 95.

[0127] В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 37. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 39. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 41. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 43. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 45. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 47. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 49. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 51. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 53. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 55. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 57. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 59. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 61. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 63. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 65. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 67. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 69. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 71. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 73. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 75. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 77. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 79. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 81. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 83. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 85. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 87. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 89. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 91. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 93. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 95.

[0128] В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 37. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 39. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 41. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 43. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 45. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 47. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 49. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 51. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 53. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 55. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 57. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 59. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 61. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 63. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 65. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 67. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 69. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 71. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 73. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 75. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 77. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 79. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 81. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 83. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 85. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 87. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 89. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 91. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 93. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 95.

[0129] В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 37. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 39. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 41. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 43. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 45. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 47. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 49. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 51. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 53. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 55. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 57. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 59. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 61. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 63. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 65. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 67. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 69. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 71. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 73. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 75. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 77. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 79. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 81. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 83. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 85. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 87. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 89. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 91. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 93. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 95.

[0130] В вариантах реализации данного изобретения комплекс включает в себя dCas9, связанный с полинуклеотидом посредством связывания связывающей последовательности полинуклеотида и формирующий, таким образом, рибонуклеопротеидный комплекс. В аспектах данного изобретения связывающая последовательность образует шпилечную структуру. В аспектах данного изобретения связывающая последовательность составляет в длину 30-100 нуклеотидов, 35-50 нуклеотидов, 37-47 нуклеотидов или 42 нуклеотида.

[0131] В вариантах реализации данного изобретения связывающая последовательность (например, Cas9-связывающая последовательность) взаимодействует или связывается с белком Cas9 (например, с белком dCas9), и вместе они связываются с целевой полинуклеотидной последовательностью, которая распознается нацеливающей на ДНК последовательностью. Связывающая последовательность (например, Cas9-связывающая последовательность) включает в себя два комплементарных участка нуклеотидов, которые гибридизуются друг с другом с образованием дуплекса двухцепочечной РНК (дуплекс дцРНК). Эти два комплементарных участка нуклеотидов могут быть ковалентно связаны посредством промежуточных нуклеотидов, известных как линкеры или линкерные нуклеотиды (например, в случае одномолекулярного полинуклеотида), и гибридизоваться с образованием дуплекса двухцепочечной РНК (дуплекс дцРНК, или «Cas9-связывающая шпилька») связывающей последовательности (например, Cas9-связывающей последовательности), что приводит к формированию структуры стержень - петля. Альтернативно, в некоторых аспектах данного изобретения два комплементарных участка нуклеотидов могут не быть ковалентно связаны, а вместо этого удерживаются вместе посредством гибридизации между комплементарными последовательностями (например, в случае двухмолекулярного полинуклеотида).

[0132] Связывающая последовательность (например, Cas9-связывающая последовательность) может иметь длину от 10 нуклеотидов до 100 нуклеотидов, например, от 10 нуклеотидов (нт) до 20 нт, от 20 нт до 30 нт, от 30 нт до 40 нт, от 40 нт до 50 нт, от 50 нт до 60 нт, от 60 нт до 70 нт, от 70 нт до 80 нт, от 80 нт до 90 нт или от 90 нт до 100 нт. В аспектах данного изобретения связывающая последовательность имеет длину от 15 нуклеотидов (нт) до 80 нт. В аспектах данного изобретения связывающая последовательность имеет длину от 15 нт до 50 нт. В аспектах данного изобретения связывающая последовательность имеет длину от 15 нт до 40 нт. В аспектах данного изобретения связывающая последовательность имеет длину от 15 нт до 30 нт. В аспектах данного изобретения связывающая последовательность имеет длину от 37 нт до 47 нт (например, 42 нт). В аспектах данного изобретения связывающая последовательность имеет длину от 15 нт до 25 нт.

[0133] Дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) может иметь длину от 6 пар оснований (п.о.) до 50 п.о. Например, дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) может иметь длину от 6 п.о. до 40 п.о., от 6 п.о. до 30 п.о., от 6 п.о. до 25 п.о., от 6 п.о. до 20 п.о., от 6 п.о. до 15 п.о., от 8 п.о. до 40 п.о., от 8 п.о. до 30 п.о., от 8 п.о. до 25 п.о., от 8 п.о. до 20 п.о. или от 8 п.о. до 15 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 8 п.о. до 10 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 10 п.о. до 15 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 15 п.о. до 18 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 18 п.о. до 20 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 20 п.о. до 25 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 25 п.о. до 30 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 30 п.о. до 35 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 35 п.о. до 40 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 40 п.о. до 50 п.о.

[0134] В вариантах реализации данного изобретения иллюстративный полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя те полинуклеотиды, которые описаны в Таблицах 1 и 2 как егРНК. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92 или 94, или их соответствующие последовательности РНК. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность, которая по меньшей мере на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92 или 94, или их соответствующим последовательностям РНК. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 38. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 40. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 42. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 44. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 46. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 48. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 50. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 52. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 54. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 56. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 58. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 60. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 62. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 64. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 66. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 68. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 70. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 72. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 74. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 76. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 78. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 80. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 82. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 84. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 86. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 88. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 90. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 92. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 94.

[0135] Нуклеиновые кислоты и векторы

[0136] Слитый белок, описанный в данном документе, включительно с его вариантами реализации и аспектами, может быть представлен в виде последовательности нуклеиновой кислоты, кодирующей слитый белок. Таким образом, в одном аспекте данного изобретения представлена последовательность нуклеиновой кислоты, кодирующая слитый белок, описанный в данном документе, включительно с его вариантами реализации и аспектами. В одном аспекте данного изобретения представлена последовательность нуклеиновой кислоты, кодирующая слитый белок, описанный в данном документе (включая с нацеливающую на ДНК последовательность), включительно с его вариантами реализации и аспектами. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок, описанный в данном документе, включая слитые белки, имеющие аминокислотные последовательности с определенным % идентичности последовательностям, описанным в данном документе. В аспектах данного изобретения нуклеиновая кислота представляет собой РНК. В аспектах данного изобретения нуклеиновая кислота представляет собой информационную РНК. В аспектах данного изобретения информационная РНК представляет собой информационный РНП. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитые белки, описанные в данном документе, включительно с их вариантами реализации и аспектами. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 1. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 2. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 3. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 4. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 5. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 6. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 7. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 8. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 9. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 10. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 11. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 12. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 13. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 14. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 15.

[0137] Кроме того, предполагается, что последовательность нуклеиновой кислоты, кодирующая слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, может быть включена в вектор. Таким образом, в одном аспекте данного изобретения представлен вектор, включающий в себя последовательность нуклеиновой кислоты, как описано в данном документе, включительно с его вариантами реализации и аспектами. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок, описанный в данном документе, включая слитые белки, имеющие аминокислотные последовательности с определенным % идентичности последовательностям, описанным в данном документе. В аспектах данного изобретения нуклеиновая кислота представляет собой информационную РНК. В аспектах данного изобретения информационная РНК представляет собой информационный РНП. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 1. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 2. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 3. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 4. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 5. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 6. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 7. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 8. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 9. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 10. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 11. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 12. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 13. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 14. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 15.

[0138] В вариантах реализации данного изобретения вектор дополнительно включает в себя полинуклеотид, при этом полинуклеотид включает в себя: (1) нацеливающую на ДНК последовательность, которая комплементарна целевой полинуклеотидной последовательности; и (2) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК. Таким образом, один или несколько векторов могут включать в себя все необходимые компоненты для выполнения редактирования эпигенома.

[0139] Клетки

[0140] Композиции, описанные в данном документе, могут быть включены в клетку. Внутри клетки композиции, описанные в данном документе, включительно с их вариантами реализации и аспектами, могут выполнять редактирование эпигенома. Соответственно, в одном аспекте данного изобретения представлена клетка, которая включает в себя слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, нуклеиновую кислоту, как описано в данном документе, включительно с ее вариантами реализации и аспектами, комплекс, как описано в данном документе, включительно с его вариантами реализации и аспектами, или вектор, как описано в данном документе, включительно с его вариантами реализации и аспектами. В аспектах данного изобретения представлена клетка, которая включает в себя слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами. В аспектах данного изобретения представлена клетка, которая включает в себя нуклеиновую кислоту, как описано в данном документе, включительно с ее вариантами реализации и аспектами. В аспектах данного изобретения представлена клетка, которая включает в себя комплекс, как описано в данном документе, включительно с его вариантами реализации и аспектами. В аспектах данного изобретения представлена клетка, которая включает в себя вектор, как описано в данном документе, включительно с его вариантами реализации и аспектами. В аспектах данного изобретения клетка представляет собой эукариотическую клетку. В аспектах данного изобретения клетка представляет собой клетку млекопитающего.

[0141] Способы

[0142] Предполагается, что композиции, описанные в данном документе, можно использовать для редактирования эпигенома, и более конкретно - для редактирования эпигенома, приводящего к репрессии или сайленсингу целевых последовательностей нуклеиновых кислот (например, генов). Без намерения быть связанными какой-либо теорией, сайленсинг может быть результатом метилирования и (или) введения репрессивных хроматиновых маркеров (например, моно-, ди- или триметилирование определенных гистонов (например, H3K9, H3K27), деацетилирование, ацетилирование, фосфорилирование, убиквитинирование) в хроматин, содержащий целевую последовательность нуклеиновой кислоты. Без намерения быть связанными какой-либо теорией, данный метод может быть использован для изменения эпигенетического состояния, например, путем закрытия хроматина посредством метилирования или введения репрессивных хроматиновых маркеров в хроматин, содержащий целевую последовательность нуклеиновой кислоты (например, ген). Без намерения быть связанными какой-либо теорией, предполагается, что слитый белок Dnmt3A-3L функционирует для добавления метильных меток в ДНК в сайтах CG, обнаруживаемых на островках CpG, а домен KRAB рекрутирует эпигенетические факторы, которые модифицируют гистоны путем введения репрессивных меток. Без намерения быть связанными какой-либо теорией, ДНК метилируется по нуклеотиду C в последовательностях CG, обнаруженных на островках CpG (т. е. добавляются метильные метки на нуклеотиде C в ДНК в сайтах CG, обнаруживаемых на островках CpG).

[0143] В одном аспекте данного изобретения представлен способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включая доставку первого полинуклеотида, кодирующего слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, в клетку, содержащую целевую нуклеиновую кислоту; и доставку в клетку второго полинуклеотида, который включает в себя (i) нацеленную на ДНК последовательность, которая комплементарна последовательности целевой нуклеиновой кислоты, и (ii) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК. Без намерения быть связанным какой-либо теорией, слитый белок вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. Без намерения быть связанным какой-либо теорией, метилирование хроматина означает, что ДНК метилируется по нуклеотиду C в последовательностях CG, обнаруживаемых на островках CpG (т. е. добавляются метильные метки на нуклеотиде C в ДНК в сайтах CG, обнаруживаемых на островках CpG). В аспектах данного изобретения метилированной является последовательность, которая находится в пределах около 3000 пар оснований от последовательности целевой нуклеиновой кислоты. В аспектах данного изобретения метилированной является последовательность, которая находится в пределах около 3000, около 2900, около 2800, около 2700, около 2600, около 2500, около 2400, около 2300, около 2200, около 2100, около 2000, около 1900, около 1800, около 1700, около 1600, около 1500, около 1400, около 1300, около 1200, около 1100, около 1000, около 900, около 800, около 700, около 600, около 500, около 400, около 300, около 200 или около 100 пар оснований от последовательности целевой нуклеиновой кислоты.

[0144] Термин «репрессивные хроматиновые маркеры», употребляемый в контексте данного документа, относится к модификациям, внесенным в хроматин, которые приводят к сайленсингу (например, снижению или ингибированию транскрипции) последовательности целевой нуклеиновой кислоты (например, гена). Примеры репрессивных хроматиновых маркеров включают в себя, но не ограничиваются ими, моно-, ди- и (или) триметилирование, ацетилирование/ деацетилирование, фосфорилирование и убиквитинирование гистонов (например, H3K9, H3K27, H3K79, H2BK5).

[0145] В вариантах реализации данного изобретения сайленсинг относится к полному подавлению транскрипции. В аспектах данного изобретения сайленсинг относится к значительному снижению транскрипции по сравнению с контрольными уровнями транскрипции.

[0146] В вариантах реализации данного изобретения первый полинуклеотид содержится в первом векторе. В аспектах данного изобретения первый полинуклеотид содержится во втором векторе. В аспектах данного изобретения первый вектор и второй вектор одинаковы. В аспектах данного изобретения первый вектор отличается от второго вектора.

[0147] В вариантах реализации данного изобретения описанный в данном документе полинуклеотид доставляется в клетку любым способом, известным в данной области техники, например, путем трансфекции, электропорации или трансдукции.

[0148] Альтернативно, в одном аспекте данного изобретения представлен способ, приводящий к сайленсингу последовательности целевой нуклеиновой кислоты в клетке, включая доставку комплекса, как описано в данном документе, включительно с его вариантами реализации и аспектами, в клетку, которая содержит целевую нуклеиновую кислоту. Без намерения быть связанными какой-либо теорией, комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты.

[0149] В вариантах реализации данного изобретения клетка представляет собой клетку млекопитающего.

[0150] В вариантах реализации данного изобретения способ имеет специфичность, которая в 2 раза выше, чем специфичность к последовательности нецелевой нуклеиновой кислоты. В аспектах данного изобретения способ имеет специфичность, которая по меньшей мере в 2 раза (например, в 2, в 3, в 4, в 5, в 6, в 7, в 8, в 9, в 10, в 15, в 20, в 25 раз) выше, чем специфичность к последовательности нецелевой нуклеиновой кислоты. Методы определения специфичности хорошо известны в данной области техники и включают в себя, но не ограничиваются ими, секвенирование РНК, бисульфитное секвенирование, иммунопреципитацию хроматина, проточную цитометрию и количественную ПЦР. Таким образом, в аспектах данного изобретения специфичность определяется с помощью метода секвенирования РНК. В аспектах данного изобретения специфичность определяется с помощью метода бисульфитного секвенирования. В аспектах данного изобретения специфичность определяется с помощью метода иммунопреципитации хроматина. В аспектах данного изобретения специфичность определяется с помощью метода проточной цитометрии. В аспектах данного изобретения специфичность определяется с помощью метода количественной ПЦР.

[0151] В аспектах данного изобретения комплекс доставляется в клетку любыми способами, известными в данной области техники, например, посредством доставки рибонуклеопротеина (РНП).

[0152] Варианты реализации изобретения N1 - N41

[0153] Вариант реализации изобретения N1. Слитый белок, содержащий фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, домен, связанный с боксом , и домен метилтрансферазы ДНК.

[0154] Вариант реализации изобретения N2. Слитый белок по варианту реализации изобретения N1, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, ddCpf1, нуклеазо-дефицитный вариант Cas9 или нуклеазо-дефицитную эндонуклеазу CRISPR класса II.

[0155] Вариант реализации изобретения N3. Слитый белок по варианту реализации изобретения N1 или N2, отличающийся тем, что указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L.

[0156] Вариант реализации изобретения N4. Слитый белок по варианту реализации изобретения N1, отличающийся тем, что указанный слитый белок включает в себя, в направлении от N-конца до С-конца, домен метилтрансферазы ДНК, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен, связанный с боксом .

[0157] Вариант реализации изобретения N5. Слитый белок по варианту реализации изобретения N4, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L.

[0158] Вариант реализации изобретения N6. Слитый белок по варианту реализации изобретения N5, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L.

[0159] Вариант реализации изобретения N7. Слитый белок по варианту реализации изобретения N6, отличающийся тем, что указанный пептидный линкер представляет собой линкер XTEN.

[0160] Вариант реализации изобретения N8. Слитый белок по варианту реализации изобретения N1, отличающийся тем, что указанный слитый белок включает в себя, в направлении от N-конца до С-конца, домен, связанный с боксом , фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен метилтрансферазы ДНК.

[0161] Вариант реализации изобретения N9. Слитый белок по варианту реализации изобретения N8, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L.

[0162] Вариант реализации изобретения N10. Слитый белок по варианту реализации изобретения N9, отличающийся тем, что указанный dCas9 ковалентно связан с доменом Dnmt3A-3L через пептидный линкер, и при этом домен, связанный с боксом , ковалентно связан с dCas9 через пептидный линкер.

[0163] Вариант реализации изобретения N11. Слитый белок по варианту реализации изобретения N10, отличающийся тем, что указанный пептидный линкер представляет собой линкер XTEN.

[0164] Вариант реализации изобретения N12. Слитый белок по любому из вариантов реализации изобретения с N1 по N3, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК ковалентно связан с доменом, связанным с боксом , через пептидный линкер.

[0165] Вариант реализации изобретения N13. Слитый белок по любому из вариантов реализации с N1 по N3, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК ковалентно связан с доменом метилтрансферазы ДНК через пептидный линкер.

[0166] Вариант реализации изобретения N14. Слитый белок по любому из вариантов реализации с N1 по N3, отличающийся тем, что указанный домен, связанный с боксом , ковалентно связан с доменом метилтрансферазы ДНК через пептидный линкер.

[0167] Вариант реализации изобретения N15. Слитый белок по любому из вариантов реализации с N12 по N14, отличающийся тем, что указанный пептидный линкер представляет собой линкер XTEN.

[0168] Вариант реализации изобретения N16. Слитый белок по варианту реализации изобретения N15, отличающийся тем, что указанный линкер XTEN содержит от около 16 до около 80 аминокислотных остатков.

[0169] Вариант реализации изобретения N17. Слитый белок по любому из вариантов реализации с N1 по N16, дополнительно содержащий сигнальный пептид ядерной локализации.

[0170] Вариант реализации изобретения N18. Слитый белок по варианту реализации изобретения N1, отличающийся тем, что указанный слитый белок содержит аминокислотную последовательность с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15.

[0171] Вариант реализации изобретения N19. Последовательность нуклеиновой кислоты, кодирующая слитый белок по любому из вариантов реализации изобретения с N1 по N18.

[0172] Вариант реализации изобретения N20. Последовательность нуклеиновой кислоты по варианту реализации изобретения N19, отличающаяся тем, что указанная последовательность нуклеиновой кислоты представляет собой информационную РНК.

[0173] Вариант реализации изобретения N21. Комплекс, содержащий: (i) слитый белок по любому из вариантов реализации изобретения с N1 по N18; и (ii) полинуклеотид, содержащий: (а) нацеливающую на ДНК последовательность, комплементарную целевой полинуклеотидной последовательности; и (b) последовательность связывания для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, при этом фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК связан с полинуклеотидом через связывающую последовательность.

[0174] Вариант реализации изобретения N22. Комплекс по варианту реализации изобретения N21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть гена.

[0175] Вариант реализации изобретения N23. Комплекс по варианту реализации изобретения N21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть последовательности, регулирующей транскрипцию.

[0176] Вариант реализации изобретения N24. Комплекс по варианту реализации изобретения N21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть промотора, энхансера или сайленсера.

[0177] Вариант реализации изобретения N25. Комплекс по варианту реализации изобретения N21, отличающийся тем, что указанная целевая полинуклеотидная последовательность находится в пределах около 3000 п.о. и фланкирует сайт начала транскрипции.

[0178] Вариант реализации изобретения N26. Вектор, содержащий последовательность нуклеиновой кислоты по варианту реализации изобретения N19 или N20.

[0179] Вариант реализации изобретения N27. Вектор по варианту реализации изобретения N26, дополнительно содержащий полинуклеотид, при этом полинуклеотид содержит: (а) нацеливающую на ДНК последовательность, которая комплементарна целевой полинуклеотидной последовательности; и (b) последовательность связывания для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК.

[0180] Вариант реализации изобретения N28. Клетка, содержащая слитый белок по любому из вариантов реализации изобретения с N1 по N18; нуклеиновую кислоту по варианту реализации изобретения N19 или N20; комплекс по любому из вариантов реализации изобретения с N21 по N25, или вектор по варианту реализации изобретения N26 или N27.

[0181] Вариант реализации изобретения N29. Клетка по варианту реализации изобретения N28, отличающаяся тем, что указанная клетка представляет собой эукариотическую клетку.

[0182] Вариант реализации изобретения N30. Клетка по варианту реализации изобретения N28, отличающаяся тем, что указанная клетка представляет собой клетку млекопитающего.

[0183] Вариант реализации изобретения N31. Способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включающий: (i) доставку первого полинуклеотида, кодирующего слитый белок по любому из вариантов реализации изобретения с N1 по N18, в клетку, содержащую целевую нуклеиновую кислоту; и (ii) доставку в клетку второго полинуклеотида, который включает в себя (a) нацеленную на ДНК последовательность, которая комплементарна последовательности целевой нуклеиновой кислоты, и (b) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК.

[0184] Вариант реализации изобретения N32. Способ по варианту реализации изобретения N31, отличающийся тем, что указанный слитый белок вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты.

[0185] Вариант реализации изобретения N33. Способ по варианту реализации изобретения N31 или N32, отличающийся тем, что указанный первый полинуклеотид содержится в первом векторе.

[0186] Вариант реализации изобретения N34. Способ по любому из вариантов реализации изобретения с N31 по N33, отличающийся тем, что указанный первый полинуклеотид содержится во втором векторе.

[0187] Вариант реализации изобретения N35. Способ по варианту реализации изобретения N34, отличающийся тем, что указанные первый вектор и второй вектор одинаковы.

[0188] Вариант реализации изобретения N36. Способ по варианту реализации изобретения N34, отличающийся тем, что указанный первый вектор отличается от второго вектора.

[0189] Вариант реализации изобретения N37. Способ по варианту реализации изобретения N31, отличающийся тем, что указанная клетка представляет собой клетку млекопитающего.

[0190] Вариант реализации изобретения N38. Способ по варианту реализации изобретения N31, отличающийся тем, что специфичность указанного способа в 2 раза выше, чем специфичность по отношению к последовательности нецелевой нуклеиновой кислоты.

[0191] Вариант реализации изобретения N39. Способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включающий в себя доставку комплекса по любому из вариантов реализации изобретения с N21 по N25 в клетку, содержащую целевую нуклеиновую кислоту.

[0192] Вариант реализации изобретения N40. Способ по варианту реализации изобретения N39, отличающийся тем, что указанный комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты.

[0193] Вариант реализации изобретения N41. Способ по варианту реализации изобретения N39 или N40, отличающийся тем, что указанная клетка представляет собой клетку млекопитающего.

[0194] Вариант реализации изобретения N42. Способ по любому из вариантов реализации с N39 по N41, отличающийся тем, что специфичность указанного способа в 2 раза выше, чем специфичность по отношению к последовательности нецелевой нуклеиновой кислоты.

[0195] Варианты реализации изобретения с 1 по 36

[0196] Вариант реализации изобретения 1. Слитый белок, содержащий фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, домен, связанный с боксом (домен KRAB), и домен метилтрансферазы ДНК.

[0197] Вариант реализации изобретения 2. Слитый белок по варианту реализации изобретения 1, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, ddCpf1, нуклеазо-дефицитный вариант Cas9 или нуклеазо-дефицитную эндонуклеазу CRISPR класса II.

[0198] Вариант реализации изобретения 3. Слитый белок по варианту реализации изобретения 1 или 2, отличающийся тем, что указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L.

[0199] Вариант реализации изобретения 4. Слитый белок по любому из вариантов реализации изобретения с 1 по 3, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК ковалентно связан с доменом KRAB через пептидный линкер.

[0200] Вариант реализации изобретения 5. Слитый белок по любому из вариантов реализации изобретения с 1 по 4, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК ковалентно связан с доменом метилтрансферазы ДНК через пептидный линкер.

[0201] Вариант реализации изобретения 6. Слитый белок по любому из вариантов реализации изобретения с 1 по 5, отличающийся тем, что указанный домен KRAB ковалентно связан с доменом метилтрансферазы ДНК через пептидный линкер.

[0202] Вариант реализации изобретения 7. Слитый белок по любому из вариантов реализации изобретения с 4 по 6, отличающийся тем, что указанный пептидный линкер представляет собой линкер XTEN.

[0203] Вариант реализации изобретения 8. Слитый белок по варианту реализации изобретения 7, отличающийся тем, что указанный линкер XTEN содержит от около 16 до около 80 аминокислотных остатков.

[0204] Вариант реализации изобретения 9. Слитый белок по любому из вариантов реализации изобретения с 1 по 8, дополнительно содержащий сигнальный пептид ядерной локализации.

[0205] Вариант реализации изобретения 10. Слитый белок по любому из вариантов реализации изобретения с 1 по 9, отличающийся тем, что указанный слитый белок содержит, в направлении от N-конца до C-конца, домен KRAB, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, и домен метилтрансферазы ДНК.

[0206] Вариант реализации изобретения 11. Слитый белок по любому из вариантов реализации изобретения с 1 по 10, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L.

[0207] Вариант реализации изобретения 12. Слитый белок по варианту реализации изобретения 11, отличающийся тем, что указанный dCas9 ковалентно связан с доменом KRAB через пептидный линкер, и при этом dCas9 ковалентно связан с доменом Dnmt3A-3L через пептидный линкер.

[0208] Вариант реализации изобретения 13. Слитый белок по варианту реализации изобретения 12, отличающийся тем, что указанный пептидный линкер представляет собой линкер XTEN.

[0209] Вариант реализации изобретения 14. Слитый белок по любому из вариантов реализации изобретения с 1 по 13, отличающийся тем, что указанный слитый белок содержит аминокислотную последовательность с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 12, 13, 14 или 15.

[0210] Вариант реализации изобретения 15. Последовательность нуклеиновой кислоты, кодирующая слитый белок по любому из вариантов реализации изобретения с 1 по 14.

[0211] Вариант реализации изобретения 16. Комплекс, содержащий: (i) слитый белок по любому из вариантов реализации изобретения с 1по 18; и (ii) полинуклеотид, содержащий: (а) нацеливающую на ДНК последовательность, комплементарную целевой полинуклеотидной последовательности; и (b) последовательность связывания для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, при этом фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК связан с полинуклеотидом через связывающую последовательность.

[0212] Вариант реализации изобретения 17. Комплекс по варианту реализации изобретения 21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть гена.

[0213] Вариант реализации изобретения 18. Комплекс по варианту реализации изобретения 21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть последовательности, регулирующей транскрипцию.

[0214] Вариант реализации изобретения 19. Комплекс по варианту реализации изобретения 21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть промотора, энхансера или сайленсера.

[0215] Вариант реализации изобретения 20. Комплекс по варианту реализации изобретения 21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой гипометилированную последовательность нуклеиновой кислоты.

[0216] Вариант реализации изобретения 21. Комплекс по варианту реализации изобретения 21, отличающийся тем, что указанная целевая полинуклеотидная последовательность находится в пределах около 3000 п.о. и фланкирует сайт начала транскрипции.

[0217] Вариант реализации изобретения 22. Вектор, содержащий последовательность нуклеиновой кислоты по варианту реализации изобретения 19.

[0218] Вариант реализации изобретения 23. Вектор по варианту реализации изобретения 26, дополнительно содержащий полинуклеотид, при этом полинуклеотид содержит: (а) нацеливающую на ДНК последовательность, которая комплементарна целевой полинуклеотидной последовательности; и (b) последовательность связывания для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК.

[0219] Вариант реализации изобретения 24. Клетка, содержащая слитый белок по любому из вариантов реализации изобретения с 1 по 14; нуклеиновую кислоту по варианту реализации изобретения 15; комплекс по любому из вариантов реализации изобретения с 16 по 21; или вектор по варианту реализации изобретения 22 или 23.

[0220] Вариант реализации изобретения 25. Клетка по варианту реализации изобретения 28, отличающаяся тем, что указанная клетка представляет собой эукариотическую клетку.

[0221] Вариант реализации изобретения 26. Клетка по варианту реализации изобретения 28, отличающаяся тем, что указанная клетка представляет собой клетку млекопитающего.

[0222] Вариант реализации изобретения 27. Способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включающий: (i) доставку первого полинуклеотида, кодирующего слитый белок по любому из вариантов реализации изобретения с 1 по 14, в клетку, содержащую целевую нуклеиновую кислоту; и (ii) доставку в клетку второго полинуклеотида, который включает в себя (a) нацеленную на ДНК последовательность, которая комплементарна последовательности целевой нуклеиновой кислоты, и (b) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, при этом указанный слитый белок вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты.

[0223] Вариант реализации изобретения 28. Способ по варианту реализации изобретения 27, отличающийся тем, что указанный первый полинуклеотид содержится в первом векторе.

[0224] Вариант реализации изобретения 29. Способ по варианту реализации изобретения 27, отличающийся тем, что указанный первый полинуклеотид содержится во втором векторе.

[0225] Вариант реализации изобретения 30. Способ по варианту реализации изобретения 28 или 29, отличающийся тем, что указанные первый вектор и второй вектор одинаковы.

[0226] Вариант реализации изобретения 31. Способ по варианту реализации изобретения 28 или 29, отличающийся тем, что указанный первый вектор отличается от второго вектора.

[0227] Вариант реализации изобретения 32. Способ по любому из вариантов реализации изобретения с 27 по 31, отличающийся тем, что клетка представляет собой клетку млекопитающего.

[0228] Вариант реализации изобретения 33. Способ по любому из вариантов реализации изобретения с 27 по 32, отличающийся тем, что специфичность указанного способа в 2 раза выше, чем специфичность по отношению к последовательности нецелевой нуклеиновой кислоты.

[0229] Вариант реализации изобретения 34. Способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включающий в себя доставку комплекса по любому из вариантов реализации изобретения с 16 по 20 в клетку, содержащую целевую нуклеиновую кислоту, при этом комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке посредством: (i) метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, (ii) введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты, или (iii) метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты.

[0230] Вариант реализации изобретения 35. Способ по варианту реализации изобретения 34, отличающийся тем, что указанная клетка представляет собой клетку млекопитающего.

[0231] Вариант реализации изобретения 36. Способ по варианту реализации изобретения 34 или 35, отличающийся тем, что специфичность указанного способа в 2 раза выше, чем специфичность по отношению к последовательности нецелевой нуклеиновой кислоты.

ПРИМЕРЫ

[0232] Варианты реализации изобретения и аспекты, указанные в данном документе, дополнительно проиллюстрированы следующими примерами. Примеры предназначены лишь для иллюстрации вариантов реализации изобретения и аспектов, и их не следует истолковывать как ограничение объема изобретения, указанного в данном документе.

[0233] Пример 1

[0234] Слитые с dCas9 эпигенетические модуляторы протестированы на предмет постоянного сайленсинга генов. Исходная версия (В1, p76 (SEQ ID NO: 1)) белка «все в одном» (Фиг. 1A) содержит домен KRAB, слитый с -N-концом dCas9 (SEQ ID NO: 23), отделенный линкером GGSGGGS (SEQ ID NO: 17), и Dnmt3A - Dnmt3L на С-конце dCas9 (отделенные линкером EASGSGRASPGIPGSTR (SEQ ID NO: 19)). Еще один белок «все в одном», который объединил домен KRAB (SEQ ID NO: 16), dCas9 (D10A, H208A), Dnmt3A - Dnmt3L (SEQ ID NO: 33; где SEQ ID NO: 26 представляет собой Dnmt3A, а SEQ ID NO: 28 представляет собой Dnmt3L) в один полипептид (Фиг. 1B). Со ссылкой на Фиг. 1B, белок dCas9 - KRAB был адаптирован из Gilbert et al., Cell 2013, для применения с технологией интерференции CRISPR (CRISPRi), а слитый белок dCas9 - Dnmt3A - Dnmt3L был адаптирован из Stepper et al., Nucleic Acids Research, 2016.

[0235] Активность эпигенетического редактора В1 была протестирована на клетках HEK293T с использованием репортера GFP, чувствительного к метилированию ДНК (адаптированного из Stelzer et al., Cell 2015), для оценки длительного сайленсинга, вызываемого белком «все в одном» (Фиг. 1C). Универсальный хроматинраскрывающий элемент (УХЭ, англ. «UCOE») добавляли перед островком GAPDH CpG (CGI) для того, чтобы предотвратить фоновый сайленсинг лентивирусного вектора в клетках млекопитающих. Ген gfp отключается при метилировании GAPDH CGI. A, B и C обозначают положения, которые мы кодировали единой гидовой РНК (егРНК) для нацеливания в промоторе. Эти целевые последовательности и соответствующие последовательности егРНК перечислены в Таблице 1 ниже. В клетки котрансфицировали две плазмиды, одна из которых кодировала мутантный белок «hit-and-run», а другая плазмида кодировала егРНК (Фиг. 1D). Через двое суток после трансфекции были отсортированы клетки, которые экспрессируют белок «hit-and-run» и вектор, экспрессирующий егРНК. Флуоресценцию GFP оценивали с течением времени с помощью метода проточной цитометрии. Популяцию клеток, подвергающихся длительному сайленсингу репортера GFP, наблюдали в случае, когда белок «все в одном» экспрессируется с егРНК (Фиг. 1E). Количество клеток, подвергающихся длительному сайленсингу, было выше, чем при воздействии dCas9 - Dnmt3A - Dnmt3L (без домена KRAB).

[0236] Таблица 1

Название Целевая последовательность (от 5' к 3') Последовательность егРНК (от 5' к 3') А (JKNg156) ACTGCGGAAATTTGAGCGT
(SEQ ID NO: 37)
ACGCTCAAATTTCCGCAGT
(SEQ ID NO: 38)
B (JKNg158) AGGCAATGGCTGCACATGC
(SEQ ID NO: 39)
GCATGTGCAGCCATTGCCT
(SEQ ID NO: 40)
C (JKNg160) GACGCTTGGTTCTGAGGAG
(SEQ ID NO: 41)
CTCCTCAGAACCAAGCGTC
(SEQ ID NO: 42)

[0237] Сайленсинг репортера GFP зависит от последовательности егРНК, при этом гидовая последовательность C вызывает самый высокий уровень сайленсинга среди трех протестированных последовательностей егРНК. Объединение егРНК, кодирующих различные последовательности, в единый пул не привело к значительному изменению в сайленсинге генов.

[0238] Пример 2

[0239] Три гена (CD29, CD81, CD151) были мишенями для долгосрочного сайленсинга с использованием слитого белка «hit-and-run». Все три белка локализованы на поверхности клетки, и нокдаун оценивали путем окрашивания клеток антителами на поверхности клетки с последующей проточной цитометрией. Репрезентативные данные проточной цитометрии, полученные через 22 суток после трансфекции, показаны на Фиг. 2A - 2C. Квадрант IV представляет клетки, которые отключили ген, на что указывает процент клеток с отключенным геном. Отсутствие клеток в квадрантах I и II означает, что белок «hit-and-run» (содержащий метку СФБ) больше не присутствует в клетках. На Фиг. 2D представлена количественная оценка сайленсинга генов CD29, CD81 и CD151 с помощью трех различных егРНК, вызванного с помощью трех различных последовательностей егРНК или пула всех трех егРНК. Целевые последовательности ДНК и их егРНК, используемые в этом эксперименте, обобщены в Таблице 2.

[0240] Таблица 2

Название Целевая последовательность (от 5' к 3') Последовательность егРНК (от 5' к 3') CD29, егРНК - A TCCGGAAACGCATTCCTCT
(SEQ ID NO: 43)
AGAGGAATGCGTTTCCGGA
(SEQ ID NO: 44)
CD29, егРНК - B CCGCGTCAGCCCGGCCCGG (SEQ ID NO: 45) CCGGGCCGGGCTGACGCGG
(SEQ ID NO: 46)
CD29, егРНК - C CGACTCCCGCTGGGCCTCT (SEQ ID NO: 47) AGAGGCCCAGCGGGAGTCG
(SEQ ID NO: 48)
CD81, егРНК - A ccgttgcgcgctcgctctc
(SEQ ID NO: 49)
gagagcgagcgcgcaacgg
(SEQ ID NO: 50)
CD81, егРНК - B CCGCGCATCCTGCCAGGCC (SEQ ID NO: 51) GGCCTGGCAGGATGCGCGG
(SEQ ID NO: 52)
CD81, егРНК - C CCAACTTGGCGCGTTTCGG (SEQ ID NO: 53) CCGAAACGCGCCAAGTTGG
(SEQ ID NO: 54)
CD151, егРНК - A ACCACGCGTCCGAGTCCGG (SEQ ID NO: 55) CCGGACTCGGACGCGTGGT
(SEQ ID NO: 56)
CD151, егРНК - B TGCTCATTGTCCCTGGACA
(SEQ ID NO: 57)
TGTCCAGGGACAATGAGCA
(SEQ ID NO: 58)
CD151, егРНК - C GGACACCCTGCTCATTGTC
(SEQ ID NO: 59)
GACAATGAGCAGGGTGTCC
(SEQ ID NO: 60)

[0241] Одновременно мишенями были два или три гена для того, чтобы показать, что белок «все в одном» может быть мультиплексирован путем совместной доставки егРНК, нацеленных на разные гены. НК егРНК относится к ненацеленному контролю егРНК. Результаты показаны на Фиг. 2E.

[0242] Наблюдался генный сайленсинг в клетках, которые берут свое начало как единичный клон, и в большинстве клеток целевой ген CLTA оставался выключенным (37 из 39 клонов). График на Фиг. 2F представляет собой момент времени, взятый через 9 месяцев после трансфекции белка «все в одном» и егРНК, нацеленной на ген CLTA.

[0243] Описанная в данном документе система может нацеливаться на любые гены в геномах млекопитающих, особенно на те, которые содержат островки CpG на промоторе гена. Dnmt3A - Dnmt3L канонически нацелен на динуклеотиды CpG. Примеры генов, на которые может быть нацелена указанная система, включают в себя, но не ограничиваются ими, CXCR4, CD4, CD8, CD45, PD-1, CLTA-4, TGFBR, TCRa, TCRb, B2M.

[0244] Пример 3

[0245] Собирали клетки, которые утратили экспрессию ITGB1 (CD29), CD81 и CD151 через тридцать шесть суток после трансфекции, и анализировали их профили экспрессии РНК. Как показано на Фиг. 3A - 3C, был обнаружен успешный нокдаун целевых генов по сравнению с ненацеленным контролем егРНК. Фиг. 3D - 3F представляют собой вулканные диаграммы, показывающие, что нокдаун целевого гена является единственным значимым генным нокдауном для каждого эксперимента, что свидетельствует о высокой специфичности генного сайленсинга. Фиг. 3G - 3I представляют собой количественную оценку уровней транскриптов, показывающая более чем 96%-й нокдаун целевого гена.

[0246] Пример 4

[0247] Белок «все в одном» можно трансфицировать и экспрессировать в линии HeLa (клетки шейки матки), U2OS (клетки кости) и индуцированных плюрипотентных стволовых клетках человека (ИПСК). Графики проточной цитометрии на Фиг. 4A - 4F показывают экспрессию СФБ, который слит с белком. Мишенями были три эндогенных гена в клетках HeLa и U2OS (т. е. CD29, CD81 и CD151). Как показано на Фиг. 4G, был обнаружен стабильный сайленсинг, измеренный через 18 суток после трансфекции. При нацеливании на Pcsk9, Npc1, Spcs1 и Cd81 был обнаружен сайленсинг генов в клеточных линиях гепатоцитов мышей AML12. Сайленсинг был обнаружен с помощью кПЦР через 14 суток после трансфекции, как показано на Фиг. 4H. Последовательности егРНК, использованные в данном эксперименте, приведены в Таблице 3.

[0248] Таблица 3

Название Целевая последовательность
(от 5' к 3')
Последовательность егРНК (от 5' к 3')
Pcsk9 егРНК - 1 TCCGGAAACGCATTCCTCT
(SEQ ID NO: 43)
AGAGGAATGCGTTTCCGGA
(SEQ ID NO: 44)
Pcsk9 егРНК - 2 ACCGGCAGCCTGCGCGTCC
(SEQ ID NO: 61)
GGACGCGCAGGCTGCCGGT
(SEQ ID NO: 62)
Pcsk9 егРНК - 3 CGATGGGCACCCACTGCTC
(SEQ ID NO: 63)
GAGCAGTGGGTGCCCATCG
(SEQ ID NO: 64)
Pcsk9 егРНК - 4 CCTTCACGTGGACGCGCAG
(SEQ ID NO: 65)
CTGCGCGTCCACGTGAAGG
(SEQ ID NO: 66)
Pcsk9 егРНК - 5 CGTGAAGGTGGAAGCCTTC
(SEQ ID NO: 67)
GAAGGCTTCCACCTTCACG
(SEQ ID NO: 68)
Npc1 егРНК - 1 CTCCTTGGTCAGGCGCCGG
(SEQ ID NO: 69)
CCGGCGCCTGACCAAGGAG
(SEQ ID NO: 70)
Npc1 егРНК - 2 TGGTCAGGCGCCGGTTCCG
(SEQ ID NO: 71)
CGGAACCGGCGCCTGACCA
(SEQ ID NO: 72)
Npc1 егРНК - 3 TAGAGGTCGCCTTCTCCTC
(SEQ ID NO: 73)
GAGGAGAAGGCGACCTCTA
(SEQ ID NO: 74)
Npc1 егРНК - 4 CGACGCTCGGGTCGCGGTG
(SEQ ID NO: 75)
CACCGCGACCCGAGCGTCG
(SEQ ID NO: 76)
Npc1 егРНК - 5 ATGCTGTCGCCGCGCGGGG
(SEQ ID NO: 77)
CCCGCGGCGACAGCAT
(SEQ ID NO: 78)
Spcs1 егРНК - 1 CTCACCCTCACCGGAGCCA
(SEQ ID NO: 79)
TGGCTCCGGTGAGGGTGAG
(SEQ ID NO: 80)
Spcs1 егРНК - 2 CCGCAAACTTTACTCCTTA
(SEQ ID NO: 81)
TAAGGAGTAAAGTTTGCGG
(SEQ ID NO: 82)
Spcs1 егРНК - 3 CTCGGAGACATCCGCTTCC
(SEQ ID NO: 60)
GGAAGCGGATGTCTCCGAG
(SEQ ID NO: 60)
Spcs1 егРНК - 4 CTCCTAAGATTGGCTTCAC
(SEQ ID NO: 83)
GTGAAGCCAATCTTAGGAG
(SEQ ID NO: 84)
Spcs1 егРНК - 5 CCGGAGCCACTCCTAAGAT
(SEQ ID NO: 85)
ATCTTAGGAGTGGCTCCGG
(SEQ ID NO: 86)
Cd81 егРНК - 1 TTCTCTACCCTACGTCTCA
(SEQ ID NO: 87)
TGAGACGTAGGGTAGAGAA
(SEQ ID NO: 88)
Cd81 егРНК - 2 TACGTCTCATTCTCCGCAA
(SEQ ID NO: 89)
TTGCGGAGAATGAGACGTA
(SEQ ID NO: 90)
Cd81 егРНК - 3 GCTAGGCCTCCAGCCCTTC
(SEQ ID NO: 91)
GAAGGGCTGGAGGCCTAGC
(SEQ ID NO: 92)
Cd81 егРНК - 4 ACAGGTGGCGCCGCAACTT
(SEQ ID NO: 93)
AAGTTGCGGCGCCACCTGT
(SEQ ID NO: 94)
Cd81 егРНК - 5 AGCCGGAGGCGCGAGAGTC
(SEQ ID NO: 95)
GACTCTCGCGCCTCCGGCT
(SEQ ID NO: 96)

[0249] Пример 5

[0250] На Фиг. 5 представлена схема белковых конструкций «все в одном», которые были сконструированы и протестированы на предмет сайленсинга генов. Первоначальный формат (p76, В1) SEQ ID NO: 1 был модифицирован для кодирования линкеров XTEN (например, 16 аминокислот (SEQ ID NO: 31) или 80 аминокислот (SEQ ID NO: 32)) либо на N-конце, либо на С-конце dCas9 (SEQ ID NO: 29). Все векторы содержат метки HA (SEQ ID NO: 24) на С-конце dCas9. В аспектах данного изобретения используется промотор CAG, поскольку он обеспечивает хорошую экспрессию, например, в конструкциях p76 и p90-102, p112 (В2). Со ссылкой на Фиг. 5, белковые конструкции с p90 по p102 соответствуют последовательностям с SEQ ID NO: 2-14, соответственно, а белковые конструкции p112 соответствуют последовательности с SEQ ID NO: 15.

[0251] Пример 6

[0252] Белковые конструкции, показанные на Фиг. 5, тестировали на предмет сайленсинга гена CLTA в клетках HEK293T в течение 18 суток после трансфекции (Фиг. 6A - 6B). Были обнаружены переменные уровни активности в сайленсинге генов, включая ряд вариантов с более устойчивым сайленсингом генов по сравнению с конструкцией p76 (В1), таких как p99 (SEQ ID NO: 11), p100 (SEQ ID NO: 12) и p112 (SEQ ID NO: 15). На Фиг. 6A и 6B показано, что конструкции dCas9 - KRAB и dCas9 - Dnmt3A - Dnmt3L продемонстрировали кратковременную и более низкую эффективность длительного сайленсинга.

[0253] p76 (SEQ ID NO: 1), p112 (SEQ ID NO: 15) тестировали на предмет сайленсинга эндогенного гена HIST2H2BE (H2B) и синтетического репортерного гена Snrpn-GFP, стабильно экспрессируемого в клетках HEK293T (Фиг. 6C - 6D). За клетками наблюдали в течение 50 суток после трансфекции. Вариант p112 поддерживал сайленсинг гена с более высокой эффективностью, чем конструкция p76 (В1). Слитые белки dCas9 - Dnmt3A - Dnmt3L и dCas9 - KRAB продемонстрировали кратковременную и более низкую эффективность длительного сайленсинга. На Фиг. 6E представлен график экспрессии белков p76 и p112 в течение 50 суток для выключения гена HIST2H2BE (H2B). Уровни белка измеряли с помощью метода проточной цитометрии для детектирования СФБ, который экспрессируется совместно с белком «все в одном».

[0254] Пример 7

[0255] Анализ по методу вестерн-блоттинга проводили с вариантами белков «все в одном» p76, p90 - p102 с использованием антитела против Steptococcus pyogenes Cas9. Со ссылкой на Фиг. 7А, верхняя полоса представляет собой полноразмерный белок, а полосы меньшего размера представляют собой продукты протеолиза белка «все в одном». Варианты, для которых наблюдается слабый протеолиз, такие как p99 (SEQ ID NO: 11), p100 (SEQ ID NO: 12) и p102 (SEQ ID NO: 14), демонстрируют более высокую эффективность генного сайленсинга. Варианты с высокими уровнями протеолиза, такие как p96 (SEQ ID NO: 8) и p97 (SEQ ID NO: 9), приводили к более низкой эффективности устойчивого генного сайленсинга.

[0256] Анализ по методу вестерн-блоттинга проводили с вариантами белков «все в одном» для обнаружения свободного Dnmt3A, который отщепляется от слитого белка. Как показано на Фиг. 7B, варианты, для которых наблюдался слабо детектируемый свободный Dnmt3 или он вообще отсутствовал, такие как p92 (SEQ ID NO: 4), p100 (SEQ ID NO: 12), p101 (SEQ ID NO: 13) и p102 (SEQ ID NO: 14), проявляли более высокую эффективность устойчивого генного сайленсинга по сравнению с вариантами с детектируемым отщепленным Dnmt3A, то есть p76 (SEQ ID NO: 1), p91 (SEQ ID NO: 3), p96 (SEQ ID NO: 8), p98 (SEQ ID NO: 10).

[0257] Пример 8

[0258] Был проведен объединенный скрининг, как показано на Фиг. 8A, с целью определения оптимальных егРНК, которые приводят к долгосрочному сайленсингу генов. Использовали четыре клеточные линии HEK293T, каждая с различным геном с меткой GFP (CLTA, VIM, HIST2H2BE (H2B) и RAB11A). Тайлинг-библиотеки, состоящие из егРНК, охватывающих +/- 2,5 т.п.о. от сайта начала транскрипции (СНТ) каждого гена, стабильно экспрессировались в клетках путем доставки лентивирусов с последующей кратковременной экспрессией плазмидной ДНК, экспрессирующей белок «все в одном». Через четыре недели после трансфекции клетки, которые поддерживали сайленсинг генов, сортировали для идентификации конкретных егРНК. Фиг. 8B - 8E представляют собой гистограммы проточной цитометрии, показывающие процент клеток, подвергающихся генному сайленсингу через четыре недели после трансфекции.

[0259] Фиг. 9A - 9D представляют собой карты функциональности егРНК в сайте начала транскрипции целевого гена (CLTA, H2B, RAB11, VIM). Сайт начала транскрипции (СНТ, англ. «TSS») и островок CpG аннотированы над каждым графиком. Каждая точка отображает собой одну егРНК, а ее эффективность в долгосрочном генном сайленсинге отображено как изменение в log2-кратном содержании егРНК. Степень заполнения нуклеосом (нижний график) нанесена на графики по сигналу от МНазы (микрококковая нуклеаза, англ. «MNase»).

[0260] Пример 9

[0261] На Фиг. 10А представлен рабочий процесс объединенного скрининга в клетках HEK293T, проводимого с целью определения оптимальных положений нацеливания егРНК для белка «все в одном», адаптированный из предыдущего рицинового скрининга на биочипах высокой плотности в клетках K562 для определения оптимальных егРНК для dCas9 - KRAB (Gilbert, Horlbeck et al., Cell 2014). Сначала егРНК стабильно экспрессировали в клетках HEK293T путем доставки лентивирусов с последующей кратковременной трансфекцией плазмиды, кодирующей белок «все в одном» (День 0). Клетки, экспрессирующие белок «все в одном», сортировали (день 2) и позволяли им расти далее в течение трех суток. На 5-е сутки клетки рассаживали, и половину из них отбирали как образцы начального момента времени, а другую половину культивировали в течение еще десяти суток (День 15) как образцы конечного момента времени. Ростовой фенотип (γ) рассчитывается как log2 обогащения егРНК, деленный на количество удвоений клеток между T (начальное) и T (конечное).

[0262] На Фиг. 10B - 10E представлены репрезентативные графики, демонстрирующие ростовые фенотипы для четырех генов (ARL1, EIF6, SMC3, HEATR1) из существующих наборов данных dCas9 - KRAB/ CRISPRi в клетках K562 (Gilbert, Horlbeck et al., 2014) и с белком «все в одном» (нижний график). Каждая точка отображает собой егРНК. СНТ и аннотированный островок CpG показаны для каждого гена. Функциональные егРНК, использующие белок «все в одном», охватывают более широкий диапазон, чем просто функциональные егРНК, что означает более широкий диапазон эффективного нацеливания.

[0263] Пример 10

[0264] На Фиг. 11A - 11B представлено сравнение ростовых фенотипов и позиционирования нуклеосом (по сигналу от МНазы) для VPS53 и VPS54, и показано расположение функциональных егРНК в областях, лишенных нуклеосом. Более того, диапазон функциональных егРНК является более широким при использовании белка «все в одном» по сравнению с dCas9 - KRAB/ CRISPRi.

[0265] Пример 11

[0266] Транскрипция in vitro двух вариантов «все в одном» (p102 (SEQ ID NO: 14) и p112 (SEQ ID NO: 15)) демонстрирует полноразмерный синтез каждой конструкции (Фиг. 12A). На Фиг. 12B представлен график проточной цитометрии, показывающий экспрессию p102 и p112 через одни сутки после трансфекции мРНК в клетки HEK293T. На Фиг. 12C показана сайленсинг эндогенного гена CLTA с течением времени в клетках HEK293T после трансфекции мРНК, экспрессирующей варианты p102 и p112 белка «все в одном».

[0267] Пример 12

[0268] На Фиг. 13A представлены графики проточной цитометрии, показывающие индуцированную экспрессию белка «все в одном», полученную путем добавления доксициклина в клетки K562, которые стабильно кодируют белок «все в одном» под действием промотора, индуцируемого доксициклином. Экспрессию белка наблюдали в течение четырех суток после индукции доксициклином. Пунктирные линии на панелях на Фиг. 13А представляют собой базовую медианную флуоресценцию СФБ без введения доксициклина. Проводили вестерн-блоттинг клеток с целью выявления экспрессии белка «все в одном» до и после обработки доксициклином (Фиг. 13B). Присутствие белка «все в одном» не детектируется через 96 часов после индукции. Графики проточной цитометрии нокдауна CD81 и CD151 через 14 суток после обработки клеток K562 доксициклином представлены на Фиг. 13C - 13F. Показан процент клеток с отключенным целевым геном. Детектируемая экспрессия белка «все в одном» отсутствует, поскольку в квадрантах BFP+ нет клеток. Количественная оценка нокдауна CD81 и CD151 через 14 суток после обработки доксициклином или без обработки доксициклином представлена на Фиг. 13G.

[0269] Список литературы

[0270] Ecco et al, Development 144, 2017. Lambert et al., Cell 172, 2018. Siddique et al., J. Mol. Biol., 425, 2013. Stepper et al., Nucleic Acids Res., 45, 2017. Shmakov et al., Nat. Rev. Microbiol. 15, 2017. CCebrian-Serrano et al., Mamm. Genome 7-8, 2017. Pulecio et al., Cell Stem Cell 21, 2017.

[0271] Неофициальный список последовательностей

[0272] SEQ ID NO: 1 (p76 (последовательность белка «все в одном», версия 1): KRAB (жирный шрифт; из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив; остатки 612-912; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), СФБ (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGSpkkkrkvEASGSGRASPGIPGSTRNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln*

[0273] SEQ ID NO: 2 (p90 (KRAB - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014); линкеры (подчеркивание), dCas9 (курсив); метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN16 (заглавные буквы, последовательность из 16 аминокислот), Dnmt3A (жирный шрифт, курсив; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGSpkkkrkvSPGSGSETPGTSESATPESNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0274] SEQ ID NO: 3 (p91 (KRAB - dCas9 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGSpkkkrkvEASGSGRASPGIPGSTRNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0275] SEQ ID NO: 4 (p92 (KRAB - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN16 (последовательность из 16 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGSpkkkrkvSPGSGSETPGTSESATPESNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0276] SEQ ID NO: 5 (p93 (KRAB - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN80 (последовательность из 80 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGSpkkkrkvSPGGGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSENHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0277] SEQ ID NO: 6 (p94 (KRAB - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN80 (последовательность из 80 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGSpkkkrkvSPGGGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSENHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0278] SEQ ID NO: 7 (p95 (KRAB - XTEN16 - dCas9 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN16 (последовательность из 16 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPSGSETPGTSESATPESMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADypydvpdyaSGSpkkkrkvEASGSGRASPGIPGSTRNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0279] SEQ ID NO: 8 (p96 (KRAB - XTEN16 - dCas9 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN16 (последовательность из 16 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт); BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPSGSETPGTSESATPESMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADypydvpdyaSGSpkkkrkvEASGSGRASPGIPGSTRNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0280] SEQ ID NO: 9 (p97 (KRAB - XTEN80 - dCas9 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN80 (последовательность из 80 аминокислот), dCas9 (курсив); метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPGGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADypydvpdyaSGSpkkkrkvEASGSGRASPGIPGSTRNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0281] SEQ ID NO: 10 (p98 (KRAB - XTEN80 - dCas9 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN80 (последовательность из 80 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPGGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADypydvpdyaSGSpkkkrkvEASGSGRASPGIPGSTRNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0282] SEQ ID NO: 11 (p99 (KRAB - XTEN16 - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), XTEN16 (последовательность из 16 аминокислот), dCas9 (курсив), метка HA (строчные буквы), линкеры (подчеркивание), SV40 СЯЛ (строчные буквы, курсив), XTEN80 (строчные буквы, жирный шрифт, курсив, последовательность из 80 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPSGSETPGTSESATPESMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADypydvpdyaSGSpkkkrkvSPGggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepseNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0283] SEQ ID NO: 12 (p100 (KRAB - XTEN16 - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), XTEN16 (последовательность из 16 аминокислот), dCas9 (курсив), метка HA (строчные буквы), линкеры (подчеркивание), SV40 СЯЛ (строчные буквы, курсив), XTEN80 (строчные буквы, жирный шрифт, курсив, последовательность из 80 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPSGSETPGTSESATPESMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADypydvpdyaSGSpkkkrkvSPGggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepseNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0284] SEQ ID NO: 13 (p101 (KRAB - XTEN80 - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN80 (строчные буквы, жирный шрифт, курсив, последовательность из 80 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN16 (последовательность из 16 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepse MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGSpkkkrkvSPGSGSETPGTSESATPESNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0285] SEQ ID NO: 14 (p102 (KRAB - XTEN80 - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN80 (строчные буквы, жирный шрифт, курсив, последовательность из 80 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN16 (последовательность из 16 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание))

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepse MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGSpkkkrkvSPGSGSETPGTSESATPESNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLSRADpkkkrkvGSGatnfsllkqagdveenpgpGSGatnfsllkqagdveenpgpselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *

[0286] SEQ ID NO: 15 (p112 (Dnmt3A - Dnmt3L - XTEN80 - dCas9 - BFP - KRAB); KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN80 (строчные буквы, жирный шрифт, курсив, последовательность из 80 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), BFP (строчные буквы, подчеркивание))

NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL ggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepse MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD AypydvpdyaSLGSGSpkkkrkvEDpkkkrkvDGIGSGSNGSSGSselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghklnGGGGGMDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP *

[0287] SEQ ID NO: 16 (KRAB; из Gilbert et al., Cell, 2013, 2014)

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP

[0288] SEQ ID NO: 17 (линкер)

GGSGGGS

[0289] SEQ ID NO: 18 (линкер)

SGS

[0290] SEQ ID NO: 19 (линкер)

EASGSGRASPGIPGSTR

[0291] SEQ ID NO: 20 (линкер)

SRAD

[0292] SEQ ID NO: 21 (линкер)

GSG

[0293] SEQ ID NO: 22 (линкер

SPG

[0294] SEQ ID NO: 23 (dCas9)

MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

[0295] SEQ ID NO: 24 (метка НА)

YPYDVPDYA

[0296] SEQ ID NO: 25 (SV40 СЯЛ)

PKKKRKV

[0297] SEQ ID NO: 26 (Dnmt3A; остатки 612-912; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016)

NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV

[0298] SEQ ID NO: 27 (линкер из 27 аминокислот; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016)

SSGNSNANSRGPSFSSGLVPLSLRGSH

[0299] SEQ ID NO: 28 (Dnmt3L; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016)

MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL

[0300] SEQ ID NO: 29 (последовательность расщепления пептидом P2A)

ATNFSLLKQAGDVEENPGP

[0301] SEQ ID NO: 30 (СФП, англ. «BFP»)

SELIKENMHMKLYMEGTVDNHHFKCTSEGEGKPYEGTQTMRIKVVEGGPLPFAFDILATSFLYGSKTFINHTQGIPDFFKQSFPEGFTWERVTTYEDGGVLTATQDTSLQDGCLIYNVKIRGVNFTSNGPVMQKKTLGWEAFTETLYPADGGLEGRNDMALKLVGGSHLIANIKTTYRSKKPAKNLKMPGVYYVDYRLERIKEANNETYVEQHEVAVARYCDLPSKLGHKLN *

[0302] SEQ ID NO: 31 (XTEN16 (последовательность из 16 аминокислот))

SGSETPGTSESATPES

[0303] SEQ ID NO: 32 (XTEN80 (последовательность из 80 аминокислот))

GGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE

[0304] SEQ ID NO: 33 (домен Dnmt3A - Dnmt3L)

NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL

[0305] SEQ ID NO: 34 (ddAsCfp1)

MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLANLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRN

[0306] SEQ ID NO: 35 (ddLbCfp1)

MSKLEKFTNCYSLSKTLRFKAIPVGKTQENIDNKRLLVEDEKRAEDYKGVKKLLDRYYLSFINDVLHSIKLKNLNNYISLFRKKTRTEKENKELENLEINLRKEIAKAFKGNEGYKSLFKKDIIETILPEFLDDKDEIALVNSFNGFTTAFTGFFDNRENMFSEEAKSTSIAFRCINENLTRYISNMDIFEKVDAIFDKHEVQEIKEKILNSDYDVEDFFEGEFFNFVLTQEGIDVYNAIIGGFVTESGEKIKGLNEYINLYNQKTKQKLPKFKPLYKQVLSDRESLSFYGEGYTSDEEVLEVFRNTLNKNSEIFSSIKKLEKLFKNFDEYSSAGIFVKNGPAISTISKDIFGEWNVIRDKWNAEYDDIHLKKKAVVTEKYEDDRRKSFKKIGSFSLEQLQEYADADLSVVEKLKEIIIQKVDEIYKVYGSSEKLFDADFVLEKSLKKNDAVVAIMKDLLDSVKSFENYIKAFFGEGKETNRDESFYGDFVLAYDILLKVDHIYDAIRNYVTQKPYSKDKFKLYFQNPQFMGGWDKDKETDYRATILRYGSKYYLAIMDKKYAKCLQKIDKDDVNGNYEKINYKLLPGPNKMLPKVFFSKKWMAYYNPSEDIQKIYKNGTFKKGDMFNLNDCHKLIDFFKDSISRYPKWSNAYDFNFSETEKYKDIAGFYREVEEQGYKVSFESASKKEVDKLVEEGKLYMFQIYNKDFSDKSHGTPNLHTMYFKLLFDENNHGQIRLSGGAELFMRRASLKKEELVVHPANSPIANKNPDNPKKTTTLSYDVYKDKRFSEDQYELHIPIAINKCPKNIFKINTEVRVLLKHDDNPYVIGIARGERNLLYIVVVDGKGNIVEQYSLNEIINNFNGIRIKTDYHSLLDKKEKERFEARQNWTSIENIKELKAGYISQVVHKICELVEKYDAVIALADLNSGFKNSRVKVEKQVYQKFEKMLIDKLNYMVDKKSNPCATGGALKGYQITNKFESFKSMSTQNGFIFYIPAWLTSKIDPSTGFVNLLKTKYTSIADSKKFISSFDRIMYVPEEDLFEFALDYKNFSRTDADYIKKWKLYSYGNRIRIFRNPKKNNVFDWEEVCLTSAYKELFNKYGINYQQGDIRALLCEQSDKAFYSSFMALMSLMLQMRNSITGRTDVDFLISPVKNSDGIFYDSRNYEAQENAILPKNADANGAYNIARKVLWAIGQFKKAEDEKLDKVKIAISNKEWLEYAQTSVKH

[0307] SEQ ID NO: 36 (ddFnCfp1)

MYPYDVPDYASGSGMSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> The Regents of the University of California

Chen, Jin

Gilbert, Luke

Nunez, James

Weissman, Jonathan

<120> Композиции и способы редактирования генов

<130> 048536-620001WO

<140> PCT/US2019/028377

<141> 2019-04-19

<150> US 62/660,023

<151> 2018-04-19

<160> 96

<170> PatentIn, версия 3.5

<210> 1

<211> 2294

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 1

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp

65 70 75 80

Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp

85 90 95

Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val

100 105 110

Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala

115 120 125

Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg

130 135 140

Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu

145 150 155 160

Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe

165 170 175

His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu

180 185 190

Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu

195 200 205

Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr

210 215 220

Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile

225 230 235 240

Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn

245 250 255

Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln

260 265 270

Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala

275 280 285

Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile

290 295 300

Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile

305 310 315 320

Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu

325 330 335

Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp

340 345 350

Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe

355 360 365

Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu

370 375 380

Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile

385 390 395 400

Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu

405 410 415

Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln

420 425 430

Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu

435 440 445

Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr

450 455 460

Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln

465 470 475 480

Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu

485 490 495

Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys

500 505 510

Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr

515 520 525

Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr

530 535 540

Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val

545 550 555 560

Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe

565 570 575

Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu

580 585 590

Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val

595 600 605

Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys

610 615 620

Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys

625 630 635 640

Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val

645 650 655

Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr

660 665 670

His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu

675 680 685

Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe

690 695 700

Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu

705 710 715 720

Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly

725 730 735

Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln

740 745 750

Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn

755 760 765

Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu

770 775 780

Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu

785 790 795 800

His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu

805 810 815

Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His

820 825 830

Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr

835 840 845

Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu

850 855 860

Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu

865 870 875 880

Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn

885 890 895

Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser

900 905 910

Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp

915 920 925

Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys

930 935 940

Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr

945 950 955 960

Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp

965 970 975

Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala

980 985 990

Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His

995 1000 1005

Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

1010 1015 1020

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

1025 1030 1035

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val

1040 1045 1050

Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn

1055 1060 1065

Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu

1070 1075 1080

Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys

1085 1090 1095

Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys

1100 1105 1110

Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile

1115 1120 1125

Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr

1130 1135 1140

Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe

1145 1150 1155

Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val

1160 1165 1170

Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile

1175 1180 1185

Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp

1190 1195 1200

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala

1205 1210 1215

Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys

1220 1225 1230

Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu

1235 1240 1245

Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys

1250 1255 1260

Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1265 1270 1275

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala

1280 1285 1290

Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser

1295 1300 1305

Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu

1310 1315 1320

Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu

1325 1330 1335

Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu

1340 1345 1350

Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val

1355 1360 1365

Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln

1370 1375 1380

Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala

1385 1390 1395

Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg

1400 1405 1410

Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln

1415 1420 1425

Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu

1430 1435 1440

Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr

1445 1450 1455

Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly

1460 1465 1470

Ser Gly Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn His

1475 1480 1485

Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala

1490 1495 1500

Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile

1505 1510 1515

Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp

1520 1525 1530

Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly

1535 1540 1545

Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg

1550 1555 1560

Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu

1565 1570 1575

Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro

1580 1585 1590

Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu

1595 1600 1605

Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp

1610 1615 1620

Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val

1625 1630 1635

Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val

1640 1645 1650

Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr

1655 1660 1665

Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr

1670 1675 1680

Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg

1685 1690 1695

Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn

1700 1705 1710

Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn

1715 1720 1725

Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe

1730 1735 1740

Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu

1745 1750 1755

Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile

1760 1765 1770

Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser

1775 1780 1785

Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser

1790 1795 1800

Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met

1805 1810 1815

Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg

1820 1825 1830

Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu

1835 1840 1845

Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys

1850 1855 1860

Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys

1865 1870 1875

Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly

1880 1885 1890

Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His

1895 1900 1905

Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro

1910 1915 1920

Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp

1925 1930 1935

Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu

1940 1945 1950

Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp

1955 1960 1965

Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro

1970 1975 1980

Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys

1985 1990 1995

Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu

2000 2005 2010

Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro

2015 2020 2025

Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly

2030 2035 2040

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu

2045 2050 2055

Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys

2060 2065 2070

Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr

2075 2080 2085

Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg

2090 2095 2100

Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile

2105 2110 2115

Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His

2120 2125 2130

Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly

2135 2140 2145

Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu

2150 2155 2160

Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr

2165 2170 2175

Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val

2180 2185 2190

Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu

2195 2200 2205

Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu

2210 2215 2220

Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr

2225 2230 2235

Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val

2240 2245 2250

Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn

2255 2260 2265

Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys

2270 2275 2280

Asp Leu Pro Ser Lys Leu Gly His Lys Leu Asn

2285 2290

<210> 2

<211> 2296

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 2

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp

65 70 75 80

Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp

85 90 95

Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val

100 105 110

Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala

115 120 125

Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg

130 135 140

Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu

145 150 155 160

Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe

165 170 175

His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu

180 185 190

Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu

195 200 205

Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr

210 215 220

Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile

225 230 235 240

Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn

245 250 255

Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln

260 265 270

Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala

275 280 285

Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile

290 295 300

Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile

305 310 315 320

Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu

325 330 335

Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp

340 345 350

Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe

355 360 365

Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu

370 375 380

Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile

385 390 395 400

Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu

405 410 415

Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln

420 425 430

Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu

435 440 445

Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr

450 455 460

Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln

465 470 475 480

Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu

485 490 495

Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys

500 505 510

Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr

515 520 525

Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr

530 535 540

Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val

545 550 555 560

Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe

565 570 575

Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu

580 585 590

Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val

595 600 605

Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys

610 615 620

Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys

625 630 635 640

Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val

645 650 655

Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr

660 665 670

His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu

675 680 685

Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe

690 695 700

Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu

705 710 715 720

Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly

725 730 735

Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln

740 745 750

Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn

755 760 765

Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu

770 775 780

Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu

785 790 795 800

His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu

805 810 815

Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His

820 825 830

Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr

835 840 845

Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu

850 855 860

Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu

865 870 875 880

Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn

885 890 895

Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser

900 905 910

Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp

915 920 925

Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys

930 935 940

Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr

945 950 955 960

Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp

965 970 975

Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala

980 985 990

Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His

995 1000 1005

Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

1010 1015 1020

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

1025 1030 1035

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val

1040 1045 1050

Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn

1055 1060 1065

Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu

1070 1075 1080

Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys

1085 1090 1095

Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys

1100 1105 1110

Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile

1115 1120 1125

Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr

1130 1135 1140

Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe

1145 1150 1155

Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val

1160 1165 1170

Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile

1175 1180 1185

Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp

1190 1195 1200

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala

1205 1210 1215

Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys

1220 1225 1230

Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu

1235 1240 1245

Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys

1250 1255 1260

Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1265 1270 1275

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala

1280 1285 1290

Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser

1295 1300 1305

Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu

1310 1315 1320

Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu

1325 1330 1335

Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu

1340 1345 1350

Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val

1355 1360 1365

Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln

1370 1375 1380

Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala

1385 1390 1395

Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg

1400 1405 1410

Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln

1415 1420 1425

Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu

1430 1435 1440

Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr

1445 1450 1455

Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Ser

1460 1465 1470

Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser

1475 1480 1485

Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val

1490 1495 1500

Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp

1505 1510 1515

Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln

1520 1525 1530

Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr

1535 1540 1545

Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp

1550 1555 1560

Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe

1565 1570 1575

Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val

1580 1585 1590

Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe

1595 1600 1605

Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly

1610 1615 1620

Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met

1625 1630 1635

Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn

1640 1645 1650

Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala

1655 1660 1665

Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala

1670 1675 1680

Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His

1685 1690 1695

Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg

1700 1705 1710

Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe

1715 1720 1725

Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg

1730 1735 1740

Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser

1745 1750 1755

Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro

1760 1765 1770

Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys

1775 1780 1785

Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe

1790 1795 1800

Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly

1805 1810 1815

Pro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro

1820 1825 1830

Val Arg Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys

1835 1840 1845

Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr

1850 1855 1860

Leu Lys Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val

1865 1870 1875

Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro

1880 1885 1890

Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln

1895 1900 1905

Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln

1910 1915 1920

Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu

1925 1930 1935

Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val

1940 1945 1950

Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg

1955 1960 1965

Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu

1970 1975 1980

Thr Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg

1985 1990 1995

Ser Lys Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys

2000 2005 2010

Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser

2015 2020 2025

Leu Pro Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly

2030 2035 2040

Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val

2045 2050 2055

Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His

2060 2065 2070

Met Lys Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys

2075 2080 2085

Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr

2090 2095 2100

Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe

2105 2110 2115

Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile

2120 2125 2130

Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro

2135 2140 2145

Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly

2150 2155 2160

Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu

2165 2170 2175

Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly

2180 2185 2190

Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu

2195 2200 2205

Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met

2210 2215 2220

Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys

2225 2230 2235

Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro

2240 2245 2250

Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala

2255 2260 2265

Asn Asn Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg

2270 2275 2280

Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu Asn

2285 2290 2295

<210> 3

<211> 2316

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 3

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp

65 70 75 80

Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp

85 90 95

Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val

100 105 110

Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala

115 120 125

Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg

130 135 140

Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu

145 150 155 160

Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe

165 170 175

His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu

180 185 190

Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu

195 200 205

Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr

210 215 220

Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile

225 230 235 240

Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn

245 250 255

Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln

260 265 270

Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala

275 280 285

Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile

290 295 300

Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile

305 310 315 320

Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu

325 330 335

Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp

340 345 350

Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe

355 360 365

Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu

370 375 380

Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile

385 390 395 400

Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu

405 410 415

Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln

420 425 430

Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu

435 440 445

Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr

450 455 460

Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln

465 470 475 480

Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu

485 490 495

Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys

500 505 510

Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr

515 520 525

Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr

530 535 540

Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val

545 550 555 560

Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe

565 570 575

Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu

580 585 590

Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val

595 600 605

Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys

610 615 620

Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys

625 630 635 640

Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val

645 650 655

Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr

660 665 670

His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu

675 680 685

Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe

690 695 700

Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu

705 710 715 720

Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly

725 730 735

Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln

740 745 750

Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn

755 760 765

Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu

770 775 780

Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu

785 790 795 800

His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu

805 810 815

Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His

820 825 830

Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr

835 840 845

Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu

850 855 860

Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu

865 870 875 880

Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn

885 890 895

Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser

900 905 910

Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp

915 920 925

Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys

930 935 940

Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr

945 950 955 960

Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp

965 970 975

Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala

980 985 990

Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His

995 1000 1005

Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

1010 1015 1020

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

1025 1030 1035

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val

1040 1045 1050

Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn

1055 1060 1065

Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu

1070 1075 1080

Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys

1085 1090 1095

Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys

1100 1105 1110

Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile

1115 1120 1125

Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr

1130 1135 1140

Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe

1145 1150 1155

Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val

1160 1165 1170

Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile

1175 1180 1185

Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp

1190 1195 1200

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala

1205 1210 1215

Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys

1220 1225 1230

Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu

1235 1240 1245

Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys

1250 1255 1260

Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1265 1270 1275

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala

1280 1285 1290

Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser

1295 1300 1305

Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu

1310 1315 1320

Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu

1325 1330 1335

Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu

1340 1345 1350

Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val

1355 1360 1365

Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln

1370 1375 1380

Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala

1385 1390 1395

Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg

1400 1405 1410

Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln

1415 1420 1425

Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu

1430 1435 1440

Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr

1445 1450 1455

Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly

1460 1465 1470

Ser Gly Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn His

1475 1480 1485

Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala

1490 1495 1500

Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile

1505 1510 1515

Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp

1520 1525 1530

Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly

1535 1540 1545

Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg

1550 1555 1560

Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu

1565 1570 1575

Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro

1580 1585 1590

Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu

1595 1600 1605

Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp

1610 1615 1620

Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val

1625 1630 1635

Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val

1640 1645 1650

Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr

1655 1660 1665

Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr

1670 1675 1680

Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg

1685 1690 1695

Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn

1700 1705 1710

Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn

1715 1720 1725

Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe

1730 1735 1740

Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu

1745 1750 1755

Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile

1760 1765 1770

Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser

1775 1780 1785

Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser

1790 1795 1800

Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met

1805 1810 1815

Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg

1820 1825 1830

Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu

1835 1840 1845

Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys

1850 1855 1860

Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys

1865 1870 1875

Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly

1880 1885 1890

Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His

1895 1900 1905

Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro

1910 1915 1920

Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp

1925 1930 1935

Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu

1940 1945 1950

Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp

1955 1960 1965

Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro

1970 1975 1980

Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys

1985 1990 1995

Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu

2000 2005 2010

Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro

2015 2020 2025

Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly

2030 2035 2040

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu

2045 2050 2055

Asn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys

2060 2065 2070

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile

2075 2080 2085

Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp

2090 2095 2100

Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr

2105 2110 2115

Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro

2120 2125 2130

Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly

2135 2140 2145

Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe

2150 2155 2160

Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr

2165 2170 2175

Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu

2180 2185 2190

Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn

2195 2200 2205

Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp

2210 2215 2220

Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu

2225 2230 2235

Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu

2240 2245 2250

Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys

2255 2260 2265

Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu

2270 2275 2280

Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu

2285 2290 2295

Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His

2300 2305 2310

Lys Leu Asn

2315

<210> 4

<211> 2318

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 4

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp

65 70 75 80

Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp

85 90 95

Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val

100 105 110

Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala

115 120 125

Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg

130 135 140

Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu

145 150 155 160

Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe

165 170 175

His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu

180 185 190

Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu

195 200 205

Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr

210 215 220

Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile

225 230 235 240

Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn

245 250 255

Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln

260 265 270

Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala

275 280 285

Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile

290 295 300

Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile

305 310 315 320

Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu

325 330 335

Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp

340 345 350

Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe

355 360 365

Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu

370 375 380

Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile

385 390 395 400

Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu

405 410 415

Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln

420 425 430

Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu

435 440 445

Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr

450 455 460

Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln

465 470 475 480

Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu

485 490 495

Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys

500 505 510

Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr

515 520 525

Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr

530 535 540

Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val

545 550 555 560

Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe

565 570 575

Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu

580 585 590

Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val

595 600 605

Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys

610 615 620

Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys

625 630 635 640

Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val

645 650 655

Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr

660 665 670

His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu

675 680 685

Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe

690 695 700

Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu

705 710 715 720

Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly

725 730 735

Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln

740 745 750

Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn

755 760 765

Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu

770 775 780

Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu

785 790 795 800

His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu

805 810 815

Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His

820 825 830

Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr

835 840 845

Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu

850 855 860

Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu

865 870 875 880

Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn

885 890 895

Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser

900 905 910

Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp

915 920 925

Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys

930 935 940

Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr

945 950 955 960

Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp

965 970 975

Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala

980 985 990

Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His

995 1000 1005

Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

1010 1015 1020

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

1025 1030 1035

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val

1040 1045 1050

Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn

1055 1060 1065

Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu

1070 1075 1080

Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys

1085 1090 1095

Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys

1100 1105 1110

Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile

1115 1120 1125

Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr

1130 1135 1140

Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe

1145 1150 1155

Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val

1160 1165 1170

Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile

1175 1180 1185

Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp

1190 1195 1200

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala

1205 1210 1215

Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys

1220 1225 1230

Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu

1235 1240 1245

Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys

1250 1255 1260

Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1265 1270 1275

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala

1280 1285 1290

Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser

1295 1300 1305

Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu

1310 1315 1320

Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu

1325 1330 1335

Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu

1340 1345 1350

Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val

1355 1360 1365

Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln

1370 1375 1380

Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala

1385 1390 1395

Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg

1400 1405 1410

Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln

1415 1420 1425

Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu

1430 1435 1440

Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr

1445 1450 1455

Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Ser

1460 1465 1470

Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser

1475 1480 1485

Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val

1490 1495 1500

Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp

1505 1510 1515

Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln

1520 1525 1530

Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr

1535 1540 1545

Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp

1550 1555 1560

Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe

1565 1570 1575

Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val

1580 1585 1590

Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe

1595 1600 1605

Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly

1610 1615 1620

Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met

1625 1630 1635

Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn

1640 1645 1650

Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala

1655 1660 1665

Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala

1670 1675 1680

Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His

1685 1690 1695

Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg

1700 1705 1710

Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe

1715 1720 1725

Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg

1730 1735 1740

Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser

1745 1750 1755

Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro

1760 1765 1770

Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys

1775 1780 1785

Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe

1790 1795 1800

Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly

1805 1810 1815

Pro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro

1820 1825 1830

Val Arg Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys

1835 1840 1845

Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr

1850 1855 1860

Leu Lys Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val

1865 1870 1875

Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro

1880 1885 1890

Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln

1895 1900 1905

Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln

1910 1915 1920

Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu

1925 1930 1935

Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val

1940 1945 1950

Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg

1955 1960 1965

Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu

1970 1975 1980

Thr Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg

1985 1990 1995

Ser Lys Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys

2000 2005 2010

Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser

2015 2020 2025

Leu Pro Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly

2030 2035 2040

Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val

2045 2050 2055

Glu Glu Asn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu

2060 2065 2070

Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu

2075 2080 2085

Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr

2090 2095 2100

Val Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys

2105 2110 2115

Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly

2120 2125 2130

Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu

2135 2140 2145

Tyr Gly Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp

2150 2155 2160

Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val

2165 2170 2175

Thr Thr Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr

2180 2185 2190

Ser Leu Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly

2195 2200 2205

Val Asn Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu

2210 2215 2220

Gly Trp Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly

2225 2230 2235

Leu Glu Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser

2240 2245 2250

His Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro

2255 2260 2265

Ala Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg

2270 2275 2280

Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln

2285 2290 2295

His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu

2300 2305 2310

Gly His Lys Leu Asn

2315

<210> 5

<211> 2360

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 5

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp

65 70 75 80

Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp

85 90 95

Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val

100 105 110

Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala

115 120 125

Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg

130 135 140

Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu

145 150 155 160

Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe

165 170 175

His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu

180 185 190

Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu

195 200 205

Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr

210 215 220

Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile

225 230 235 240

Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn

245 250 255

Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln

260 265 270

Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala

275 280 285

Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile

290 295 300

Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile

305 310 315 320

Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu

325 330 335

Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp

340 345 350

Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe

355 360 365

Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu

370 375 380

Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile

385 390 395 400

Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu

405 410 415

Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln

420 425 430

Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu

435 440 445

Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr

450 455 460

Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln

465 470 475 480

Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu

485 490 495

Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys

500 505 510

Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr

515 520 525

Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr

530 535 540

Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val

545 550 555 560

Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe

565 570 575

Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu

580 585 590

Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val

595 600 605

Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys

610 615 620

Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys

625 630 635 640

Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val

645 650 655

Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr

660 665 670

His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu

675 680 685

Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe

690 695 700

Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu

705 710 715 720

Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly

725 730 735

Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln

740 745 750

Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn

755 760 765

Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu

770 775 780

Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu

785 790 795 800

His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu

805 810 815

Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His

820 825 830

Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr

835 840 845

Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu

850 855 860

Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu

865 870 875 880

Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn

885 890 895

Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser

900 905 910

Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp

915 920 925

Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys

930 935 940

Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr

945 950 955 960

Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp

965 970 975

Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala

980 985 990

Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His

995 1000 1005

Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

1010 1015 1020

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

1025 1030 1035

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val

1040 1045 1050

Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn

1055 1060 1065

Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu

1070 1075 1080

Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys

1085 1090 1095

Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys

1100 1105 1110

Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile

1115 1120 1125

Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr

1130 1135 1140

Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe

1145 1150 1155

Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val

1160 1165 1170

Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile

1175 1180 1185

Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp

1190 1195 1200

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala

1205 1210 1215

Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys

1220 1225 1230

Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu

1235 1240 1245

Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys

1250 1255 1260

Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1265 1270 1275

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala

1280 1285 1290

Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser

1295 1300 1305

Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu

1310 1315 1320

Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu

1325 1330 1335

Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu

1340 1345 1350

Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val

1355 1360 1365

Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln

1370 1375 1380

Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala

1385 1390 1395

Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg

1400 1405 1410

Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln

1415 1420 1425

Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu

1430 1435 1440

Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr

1445 1450 1455

Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Gly

1460 1465 1470

Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala

1475 1480 1485

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr

1490 1495 1500

Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser

1505 1510 1515

Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

1520 1525 1530

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

1535 1540 1545

Glu Pro Ser Glu Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val

1550 1555 1560

Tyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu

1565 1570 1575

Ser Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp

1580 1585 1590

Leu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu

1595 1600 1605

Asp Ser Ile Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met

1610 1615 1620

Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu

1625 1630 1635

Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp

1640 1645 1650

Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr

1655 1660 1665

Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg

1670 1675 1680

Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn

1685 1690 1695

Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe

1700 1705 1710

Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala

1715 1720 1725

Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn

1730 1735 1740

Arg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu

1745 1750 1755

Cys Leu Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr

1760 1765 1770

Ile Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His

1775 1780 1785

Phe Pro Val Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr

1790 1795 1800

Glu Met Glu Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val

1805 1810 1815

Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser

1820 1825 1830

Trp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu

1835 1840 1845

Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg

1850 1855 1860

Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly

1865 1870 1875

Ser His Met Gly Pro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp

1880 1885 1890

Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe Arg Asn Ile Asp

1895 1900 1905

Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser

1910 1915 1920

Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr Asn Val Val

1925 1930 1935

Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr Gly

1940 1945 1950

Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp

1955 1960 1965

Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg

1970 1975 1980

Gln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu

1985 1990 1995

Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln

2000 2005 2010

Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln

2015 2020 2025

Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys

2030 2035 2040

His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln

2045 2050 2055

Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val Asp Leu Leu

2060 2065 2070

Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe

2075 2080 2085

Ser Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp Pro Lys Lys Lys

2090 2095 2100

Arg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln

2105 2110 2115

Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile Lys

2120 2125 2130

Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp Asn

2135 2140 2145

His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu

2150 2155 2160

Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu

2165 2170 2175

Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser

2180 2185 2190

Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys

2195 2200 2205

Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr

2210 2215 2220

Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln

2225 2230 2235

Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe

2240 2245 2250

Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu

2255 2260 2265

Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly

2270 2275 2280

Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile

2285 2290 2295

Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn

2300 2305 2310

Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg

2315 2320 2325

Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu Val

2330 2335 2340

Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys

2345 2350 2355

Leu Asn

2360

<210> 6

<211> 2382

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 6

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp

65 70 75 80

Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp

85 90 95

Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val

100 105 110

Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala

115 120 125

Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg

130 135 140

Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu

145 150 155 160

Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe

165 170 175

His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu

180 185 190

Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu

195 200 205

Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr

210 215 220

Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile

225 230 235 240

Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn

245 250 255

Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln

260 265 270

Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala

275 280 285

Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile

290 295 300

Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile

305 310 315 320

Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu

325 330 335

Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp

340 345 350

Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe

355 360 365

Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu

370 375 380

Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile

385 390 395 400

Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu

405 410 415

Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln

420 425 430

Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu

435 440 445

Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr

450 455 460

Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln

465 470 475 480

Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu

485 490 495

Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys

500 505 510

Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr

515 520 525

Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr

530 535 540

Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val

545 550 555 560

Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe

565 570 575

Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu

580 585 590

Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val

595 600 605

Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys

610 615 620

Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys

625 630 635 640

Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val

645 650 655

Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr

660 665 670

His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu

675 680 685

Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe

690 695 700

Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu

705 710 715 720

Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly

725 730 735

Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln

740 745 750

Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn

755 760 765

Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu

770 775 780

Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu

785 790 795 800

His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu

805 810 815

Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His

820 825 830

Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr

835 840 845

Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu

850 855 860

Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu

865 870 875 880

Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn

885 890 895

Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser

900 905 910

Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp

915 920 925

Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys

930 935 940

Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr

945 950 955 960

Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp

965 970 975

Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala

980 985 990

Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His

995 1000 1005

Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

1010 1015 1020

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

1025 1030 1035

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val

1040 1045 1050

Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn

1055 1060 1065

Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu

1070 1075 1080

Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys

1085 1090 1095

Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys

1100 1105 1110

Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile

1115 1120 1125

Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr

1130 1135 1140

Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe

1145 1150 1155

Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val

1160 1165 1170

Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile

1175 1180 1185

Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp

1190 1195 1200

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala

1205 1210 1215

Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys

1220 1225 1230

Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu

1235 1240 1245

Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys

1250 1255 1260

Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1265 1270 1275

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala

1280 1285 1290

Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser

1295 1300 1305

Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu

1310 1315 1320

Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu

1325 1330 1335

Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu

1340 1345 1350

Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val

1355 1360 1365

Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln

1370 1375 1380

Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala

1385 1390 1395

Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg

1400 1405 1410

Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln

1415 1420 1425

Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu

1430 1435 1440

Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr

1445 1450 1455

Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Gly

1460 1465 1470

Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala

1475 1480 1485

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr

1490 1495 1500

Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser

1505 1510 1515

Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

1520 1525 1530

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

1535 1540 1545

Glu Pro Ser Glu Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val

1550 1555 1560

Tyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu

1565 1570 1575

Ser Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp

1580 1585 1590

Leu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu

1595 1600 1605

Asp Ser Ile Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met

1610 1615 1620

Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu

1625 1630 1635

Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp

1640 1645 1650

Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr

1655 1660 1665

Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg

1670 1675 1680

Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn

1685 1690 1695

Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe

1700 1705 1710

Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala

1715 1720 1725

Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn

1730 1735 1740

Arg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu

1745 1750 1755

Cys Leu Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr

1760 1765 1770

Ile Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His

1775 1780 1785

Phe Pro Val Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr

1790 1795 1800

Glu Met Glu Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val

1805 1810 1815

Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser

1820 1825 1830

Trp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu

1835 1840 1845

Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg

1850 1855 1860

Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly

1865 1870 1875

Ser His Met Gly Pro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp

1880 1885 1890

Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe Arg Asn Ile Asp

1895 1900 1905

Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser

1910 1915 1920

Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr Asn Val Val

1925 1930 1935

Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr Gly

1940 1945 1950

Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp

1955 1960 1965

Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg

1970 1975 1980

Gln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu

1985 1990 1995

Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln

2000 2005 2010

Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln

2015 2020 2025

Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys

2030 2035 2040

His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln

2045 2050 2055

Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val Asp Leu Leu

2060 2065 2070

Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe

2075 2080 2085

Ser Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp Pro Lys Lys Lys

2090 2095 2100

Arg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln

2105 2110 2115

Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Gly Ser Gly Ala Thr

2120 2125 2130

Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro

2135 2140 2145

Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr

2150 2155 2160

Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr Ser Glu

2165 2170 2175

Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys

2180 2185 2190

Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala

2195 2200 2205

Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His Thr Gln

2210 2215 2220

Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr

2225 2230 2235

Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu Thr Ala

2240 2245 2250

Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr Asn Val

2255 2260 2265

Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val Met Gln

2270 2275 2280

Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu Tyr Pro

2285 2290 2295

Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu Lys Leu

2300 2305 2310

Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg

2315 2320 2325

Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr

2330 2335 2340

Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr

2345 2350 2355

Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu

2360 2365 2370

Pro Ser Lys Leu Gly His Lys Leu Asn

2375 2380

<210> 7

<211> 2303

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 7

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr Ser

65 70 75 80

Glu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu

85 90 95

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

100 105 110

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

115 120 125

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

130 135 140

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

145 150 155 160

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

165 170 175

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

180 185 190

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

195 200 205

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

210 215 220

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

225 230 235 240

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

245 250 255

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

260 265 270

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

275 280 285

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

290 295 300

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

305 310 315 320

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

325 330 335

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

340 345 350

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

355 360 365

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

370 375 380

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

385 390 395 400

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

405 410 415

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

420 425 430

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

435 440 445

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

450 455 460

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

465 470 475 480

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

485 490 495

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

500 505 510

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

515 520 525

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

530 535 540

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

545 550 555 560

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

565 570 575

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

580 585 590

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

595 600 605

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

610 615 620

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

625 630 635 640

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

645 650 655

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

660 665 670

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

675 680 685

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

690 695 700

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

705 710 715 720

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

725 730 735

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

740 745 750

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

755 760 765

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

770 775 780

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

785 790 795 800

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

805 810 815

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

820 825 830

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

835 840 845

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

850 855 860

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

865 870 875 880

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

885 890 895

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

900 905 910

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile

915 920 925

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

930 935 940

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

945 950 955 960

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

965 970 975

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

980 985 990

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

995 1000 1005

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp

1010 1015 1020

Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg

1025 1030 1035

Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe

1040 1045 1050

Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr

1055 1060 1065

His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala

1070 1075 1080

Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly

1085 1090 1095

Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu

1100 1105 1110

Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn

1115 1120 1125

Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1130 1135 1140

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu

1145 1150 1155

Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val

1160 1165 1170

Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln

1175 1180 1185

Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser

1190 1195 1200

Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr

1205 1210 1215

Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val

1220 1225 1230

Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys

1235 1240 1245

Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys

1250 1255 1260

Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys

1265 1270 1275

Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu

1280 1285 1290

Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln

1295 1300 1305

Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu

1310 1315 1320

Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp

1325 1330 1335

Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu

1340 1345 1350

Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile

1355 1360 1365

Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys

1370 1375 1380

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His

1385 1390 1395

Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr

1400 1405 1410

Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu

1415 1420 1425

Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr

1430 1435 1440

Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala

1445 1450 1455

Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro Lys

1460 1465 1470

Lys Lys Arg Lys Val Glu Ala Ser Gly Ser Gly Arg Ala Ser Pro

1475 1480 1485

Gly Ile Pro Gly Ser Thr Arg Asn His Asp Gln Glu Phe Asp Pro

1490 1495 1500

Pro Lys Val Tyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro Ile

1505 1510 1515

Arg Val Leu Ser Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu Val

1520 1525 1530

Leu Lys Asp Leu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser Glu

1535 1540 1545

Val Cys Glu Asp Ser Ile Thr Val Gly Met Val Arg His Gln Gly

1550 1555 1560

Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His

1565 1570 1575

Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro

1580 1585 1590

Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr

1595 1600 1605

Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His

1610 1615 1620

Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu

1625 1630 1635

Phe Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile

1640 1645 1650

Ser Arg Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu

1655 1660 1665

Val Ser Ala Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro

1670 1675 1680

Gly Met Asn Arg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu

1685 1690 1695

Leu Gln Glu Cys Leu Glu His Gly Arg Ile Ala Lys Phe Ser Lys

1700 1705 1710

Val Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly Lys

1715 1720 1725

Asp Gln His Phe Pro Val Phe Met Asn Glu Lys Glu Asp Ile Leu

1730 1735 1740

Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe Pro Val His Tyr

1745 1750 1755

Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu Leu

1760 1765 1770

Gly Arg Ser Trp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro

1775 1780 1785

Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala

1790 1795 1800

Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser

1805 1810 1815

Leu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr Lys Thr Val

1820 1825 1830

Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe Arg

1835 1840 1845

Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly

1850 1855 1860

Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr

1865 1870 1875

Asn Val Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu

1880 1885 1890

Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys

1895 1900 1905

Pro Gly Trp Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala

1910 1915 1920

Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met

1925 1930 1935

Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg

1940 1945 1950

Phe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly Arg

1955 1960 1965

Asp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu

1970 1975 1980

Lys Ser Lys His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu

1985 1990 1995

Gln Ala Gln Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val

2000 2005 2010

Asp Leu Leu Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe

2015 2020 2025

Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp Pro

2030 2035 2040

Lys Lys Lys Arg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser Leu

2045 2050 2055

Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu

2060 2065 2070

Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr

2075 2080 2085

Val Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys

2090 2095 2100

Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly

2105 2110 2115

Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu

2120 2125 2130

Tyr Gly Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp

2135 2140 2145

Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val

2150 2155 2160

Thr Thr Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr

2165 2170 2175

Ser Leu Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly

2180 2185 2190

Val Asn Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu

2195 2200 2205

Gly Trp Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly

2210 2215 2220

Leu Glu Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser

2225 2230 2235

His Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro

2240 2245 2250

Ala Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg

2255 2260 2265

Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln

2270 2275 2280

His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu

2285 2290 2295

Gly His Lys Leu Asn

2300

<210> 8

<211> 2325

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 8

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr Ser

65 70 75 80

Glu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu

85 90 95

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

100 105 110

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

115 120 125

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

130 135 140

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

145 150 155 160

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

165 170 175

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

180 185 190

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

195 200 205

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

210 215 220

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

225 230 235 240

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

245 250 255

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

260 265 270

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

275 280 285

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

290 295 300

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

305 310 315 320

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

325 330 335

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

340 345 350

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

355 360 365

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

370 375 380

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

385 390 395 400

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

405 410 415

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

420 425 430

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

435 440 445

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

450 455 460

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

465 470 475 480

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

485 490 495

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

500 505 510

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

515 520 525

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

530 535 540

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

545 550 555 560

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

565 570 575

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

580 585 590

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

595 600 605

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

610 615 620

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

625 630 635 640

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

645 650 655

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

660 665 670

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

675 680 685

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

690 695 700

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

705 710 715 720

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

725 730 735

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

740 745 750

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

755 760 765

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

770 775 780

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

785 790 795 800

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

805 810 815

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

820 825 830

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

835 840 845

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

850 855 860

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

865 870 875 880

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

885 890 895

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

900 905 910

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile

915 920 925

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

930 935 940

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

945 950 955 960

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

965 970 975

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

980 985 990

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

995 1000 1005

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp

1010 1015 1020

Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg

1025 1030 1035

Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe

1040 1045 1050

Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr

1055 1060 1065

His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala

1070 1075 1080

Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly

1085 1090 1095

Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu

1100 1105 1110

Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn

1115 1120 1125

Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1130 1135 1140

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu

1145 1150 1155

Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val

1160 1165 1170

Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln

1175 1180 1185

Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser

1190 1195 1200

Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr

1205 1210 1215

Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val

1220 1225 1230

Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys

1235 1240 1245

Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys

1250 1255 1260

Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys

1265 1270 1275

Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu

1280 1285 1290

Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln

1295 1300 1305

Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu

1310 1315 1320

Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp

1325 1330 1335

Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu

1340 1345 1350

Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile

1355 1360 1365

Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys

1370 1375 1380

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His

1385 1390 1395

Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr

1400 1405 1410

Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu

1415 1420 1425

Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr

1430 1435 1440

Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala

1445 1450 1455

Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro Lys

1460 1465 1470

Lys Lys Arg Lys Val Glu Ala Ser Gly Ser Gly Arg Ala Ser Pro

1475 1480 1485

Gly Ile Pro Gly Ser Thr Arg Asn His Asp Gln Glu Phe Asp Pro

1490 1495 1500

Pro Lys Val Tyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro Ile

1505 1510 1515

Arg Val Leu Ser Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu Val

1520 1525 1530

Leu Lys Asp Leu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser Glu

1535 1540 1545

Val Cys Glu Asp Ser Ile Thr Val Gly Met Val Arg His Gln Gly

1550 1555 1560

Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His

1565 1570 1575

Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro

1580 1585 1590

Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr

1595 1600 1605

Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His

1610 1615 1620

Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu

1625 1630 1635

Phe Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile

1640 1645 1650

Ser Arg Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu

1655 1660 1665

Val Ser Ala Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro

1670 1675 1680

Gly Met Asn Arg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu

1685 1690 1695

Leu Gln Glu Cys Leu Glu His Gly Arg Ile Ala Lys Phe Ser Lys

1700 1705 1710

Val Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly Lys

1715 1720 1725

Asp Gln His Phe Pro Val Phe Met Asn Glu Lys Glu Asp Ile Leu

1730 1735 1740

Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe Pro Val His Tyr

1745 1750 1755

Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu Leu

1760 1765 1770

Gly Arg Ser Trp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro

1775 1780 1785

Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala

1790 1795 1800

Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser

1805 1810 1815

Leu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr Lys Thr Val

1820 1825 1830

Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe Arg

1835 1840 1845

Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly

1850 1855 1860

Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr

1865 1870 1875

Asn Val Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu

1880 1885 1890

Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys

1895 1900 1905

Pro Gly Trp Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala

1910 1915 1920

Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met

1925 1930 1935

Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg

1940 1945 1950

Phe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly Arg

1955 1960 1965

Asp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu

1970 1975 1980

Lys Ser Lys His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu

1985 1990 1995

Gln Ala Gln Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val

2000 2005 2010

Asp Leu Leu Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe

2015 2020 2025

Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp Pro

2030 2035 2040

Lys Lys Lys Arg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser Leu

2045 2050 2055

Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Gly Ser

2060 2065 2070

Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu

2075 2080 2085

Glu Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met

2090 2095 2100

Lys Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys

2105 2110 2115

Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met

2120 2125 2130

Arg Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp

2135 2140 2145

Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn

2150 2155 2160

His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu

2165 2170 2175

Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val

2180 2185 2190

Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile

2195 2200 2205

Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro

2210 2215 2220

Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr

2225 2230 2235

Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala

2240 2245 2250

Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr

2255 2260 2265

Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly

2270 2275 2280

Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn

2285 2290 2295

Asn Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr

2300 2305 2310

Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu Asn

2315 2320 2325

<210> 9

<211> 2367

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 9

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro Pro

65 70 75 80

Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

85 90 95

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

100 105 110

Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

115 120 125

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

Thr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu

145 150 155 160

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

165 170 175

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

180 185 190

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

195 200 205

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

210 215 220

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

225 230 235 240

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

245 250 255

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

260 265 270

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

275 280 285

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

290 295 300

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

305 310 315 320

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

325 330 335

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

340 345 350

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

355 360 365

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

370 375 380

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

385 390 395 400

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

405 410 415

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

420 425 430

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

435 440 445

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

450 455 460

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

465 470 475 480

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

485 490 495

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

500 505 510

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

515 520 525

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

530 535 540

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

545 550 555 560

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

565 570 575

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

580 585 590

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

595 600 605

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

610 615 620

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

625 630 635 640

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

645 650 655

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

660 665 670

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

675 680 685

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

690 695 700

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

705 710 715 720

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

725 730 735

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

740 745 750

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

755 760 765

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

770 775 780

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

785 790 795 800

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

805 810 815

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

820 825 830

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

835 840 845

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

850 855 860

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

865 870 875 880

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

885 890 895

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

900 905 910

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

915 920 925

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

930 935 940

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

945 950 955 960

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

965 970 975

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile

980 985 990

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

995 1000 1005

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser

1010 1015 1020

Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu

1025 1030 1035

Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys

1040 1045 1050

Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile

1055 1060 1065

Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala

1070 1075 1080

Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp

1085 1090 1095

Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu

1100 1105 1110

Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu

1115 1120 1125

Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

1130 1135 1140

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu

1145 1150 1155

Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile

1160 1165 1170

Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe

1175 1180 1185

Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu

1190 1195 1200

Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly

1205 1210 1215

Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr

1220 1225 1230

Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys

1235 1240 1245

Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro

1250 1255 1260

Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp

1265 1270 1275

Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser

1280 1285 1290

Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu

1295 1300 1305

Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser

1310 1315 1320

Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr

1325 1330 1335

Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser

1340 1345 1350

Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala

1355 1360 1365

Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr

1370 1375 1380

Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly

1385 1390 1395

Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His

1400 1405 1410

Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser

1415 1420 1425

Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser

1430 1435 1440

Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu

1445 1450 1455

Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala

1460 1465 1470

Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr

1475 1480 1485

Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile

1490 1495 1500

Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly

1505 1510 1515

Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser

1520 1525 1530

Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly Ser Gly

1535 1540 1545

Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn His Asp Gln

1550 1555 1560

Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala Glu Lys

1565 1570 1575

Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile Ala Thr

1580 1585 1590

Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg Tyr

1595 1600 1605

Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val

1610 1615 1620

Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val

1625 1630 1635

Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile

1640 1645 1650

Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg

1655 1660 1665

Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr

1670 1675 1680

Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro

1685 1690 1695

Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val Ser Asp

1700 1705 1710

Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val Met Ile

1715 1720 1725

Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr Phe Trp

1730 1735 1740

Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr Val Asn

1745 1750 1755

Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg Ile Ala

1760 1765 1770

Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile

1775 1780 1785

Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn Glu Lys

1790 1795 1800

Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe

1805 1810 1815

Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg

1820 1825 1830

Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg His

1835 1840 1845

Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly

1850 1855 1860

Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu

1865 1870 1875

Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu Ile

1880 1885 1890

Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu

1895 1900 1905

Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe

1910 1915 1920

Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val

1925 1930 1935

Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys Trp Gly

1940 1945 1950

Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser Ser

1955 1960 1965

Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His Arg Ile

1970 1975 1980

Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe

1985 1990 1995

Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu

2000 2005 2010

Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp

2015 2020 2025

Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn

2030 2035 2040

Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro Lys Glu

2045 2050 2055

Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys Leu Asp

2060 2065 2070

Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu Pro Leu

2075 2080 2085

Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Ser

2090 2095 2100

Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ala Thr

2105 2110 2115

Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro

2120 2125 2130

Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr

2135 2140 2145

Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr Ser Glu

2150 2155 2160

Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys

2165 2170 2175

Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala

2180 2185 2190

Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His Thr Gln

2195 2200 2205

Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr

2210 2215 2220

Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu Thr Ala

2225 2230 2235

Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr Asn Val

2240 2245 2250

Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val Met Gln

2255 2260 2265

Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu Tyr Pro

2270 2275 2280

Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu Lys Leu

2285 2290 2295

Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg

2300 2305 2310

Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr

2315 2320 2325

Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr

2330 2335 2340

Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu

2345 2350 2355

Pro Ser Lys Leu Gly His Lys Leu Asn

2360 2365

<210> 10

<211> 2389

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 10

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro Pro

65 70 75 80

Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

85 90 95

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

100 105 110

Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

115 120 125

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

Thr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu

145 150 155 160

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

165 170 175

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

180 185 190

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

195 200 205

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

210 215 220

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

225 230 235 240

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

245 250 255

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

260 265 270

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

275 280 285

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

290 295 300

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

305 310 315 320

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

325 330 335

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

340 345 350

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

355 360 365

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

370 375 380

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

385 390 395 400

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

405 410 415

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

420 425 430

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

435 440 445

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

450 455 460

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

465 470 475 480

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

485 490 495

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

500 505 510

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

515 520 525

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

530 535 540

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

545 550 555 560

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

565 570 575

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

580 585 590

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

595 600 605

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

610 615 620

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

625 630 635 640

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

645 650 655

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

660 665 670

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

675 680 685

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

690 695 700

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

705 710 715 720

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

725 730 735

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

740 745 750

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

755 760 765

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

770 775 780

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

785 790 795 800

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

805 810 815

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

820 825 830

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

835 840 845

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

850 855 860

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

865 870 875 880

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

885 890 895

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

900 905 910

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

915 920 925

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

930 935 940

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

945 950 955 960

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

965 970 975

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile

980 985 990

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

995 1000 1005

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser

1010 1015 1020

Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu

1025 1030 1035

Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys

1040 1045 1050

Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile

1055 1060 1065

Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala

1070 1075 1080

Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp

1085 1090 1095

Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu

1100 1105 1110

Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu

1115 1120 1125

Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

1130 1135 1140

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu

1145 1150 1155

Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile

1160 1165 1170

Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe

1175 1180 1185

Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu

1190 1195 1200

Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly

1205 1210 1215

Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr

1220 1225 1230

Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys

1235 1240 1245

Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro

1250 1255 1260

Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp

1265 1270 1275

Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser

1280 1285 1290

Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu

1295 1300 1305

Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser

1310 1315 1320

Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr

1325 1330 1335

Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser

1340 1345 1350

Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala

1355 1360 1365

Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr

1370 1375 1380

Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly

1385 1390 1395

Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His

1400 1405 1410

Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser

1415 1420 1425

Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser

1430 1435 1440

Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu

1445 1450 1455

Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala

1460 1465 1470

Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr

1475 1480 1485

Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile

1490 1495 1500

Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly

1505 1510 1515

Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser

1520 1525 1530

Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly Ser Gly

1535 1540 1545

Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn His Asp Gln

1550 1555 1560

Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala Glu Lys

1565 1570 1575

Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile Ala Thr

1580 1585 1590

Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg Tyr

1595 1600 1605

Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val

1610 1615 1620

Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val

1625 1630 1635

Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile

1640 1645 1650

Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg

1655 1660 1665

Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr

1670 1675 1680

Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro

1685 1690 1695

Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val Ser Asp

1700 1705 1710

Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val Met Ile

1715 1720 1725

Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr Phe Trp

1730 1735 1740

Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr Val Asn

1745 1750 1755

Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg Ile Ala

1760 1765 1770

Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile

1775 1780 1785

Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn Glu Lys

1790 1795 1800

Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe

1805 1810 1815

Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg

1820 1825 1830

Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg His

1835 1840 1845

Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly

1850 1855 1860

Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu

1865 1870 1875

Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu Ile

1880 1885 1890

Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu

1895 1900 1905

Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe

1910 1915 1920

Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val

1925 1930 1935

Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys Trp Gly

1940 1945 1950

Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser Ser

1955 1960 1965

Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His Arg Ile

1970 1975 1980

Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe

1985 1990 1995

Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu

2000 2005 2010

Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp

2015 2020 2025

Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn

2030 2035 2040

Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro Lys Glu

2045 2050 2055

Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys Leu Asp

2060 2065 2070

Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu Pro Leu

2075 2080 2085

Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Ser

2090 2095 2100

Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ala Thr

2105 2110 2115

Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro

2120 2125 2130

Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala

2135 2140 2145

Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu

2150 2155 2160

Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp Asn His

2165 2170 2175

His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly

2180 2185 2190

Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu Pro

2195 2200 2205

Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys

2210 2215 2220

Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln

2225 2230 2235

Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu

2240 2245 2250

Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp

2255 2260 2265

Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr

2270 2275 2280

Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala

2285 2290 2295

Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg

2300 2305 2310

Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala

2315 2320 2325

Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu

2330 2335 2340

Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile

2345 2350 2355

Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu Val Ala

2360 2365 2370

Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu

2375 2380 2385

Asn

<210> 11

<211> 2369

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 11

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr Ser

65 70 75 80

Glu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu

85 90 95

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

100 105 110

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

115 120 125

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

130 135 140

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

145 150 155 160

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

165 170 175

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

180 185 190

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

195 200 205

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

210 215 220

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

225 230 235 240

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

245 250 255

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

260 265 270

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

275 280 285

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

290 295 300

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

305 310 315 320

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

325 330 335

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

340 345 350

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

355 360 365

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

370 375 380

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

385 390 395 400

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

405 410 415

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

420 425 430

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

435 440 445

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

450 455 460

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

465 470 475 480

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

485 490 495

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

500 505 510

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

515 520 525

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

530 535 540

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

545 550 555 560

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

565 570 575

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

580 585 590

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

595 600 605

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

610 615 620

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

625 630 635 640

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

645 650 655

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

660 665 670

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

675 680 685

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

690 695 700

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

705 710 715 720

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

725 730 735

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

740 745 750

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

755 760 765

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

770 775 780

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

785 790 795 800

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

805 810 815

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

820 825 830

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

835 840 845

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

850 855 860

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

865 870 875 880

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

885 890 895

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

900 905 910

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile

915 920 925

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

930 935 940

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

945 950 955 960

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

965 970 975

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

980 985 990

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

995 1000 1005

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp

1010 1015 1020

Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg

1025 1030 1035

Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe

1040 1045 1050

Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr

1055 1060 1065

His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala

1070 1075 1080

Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly

1085 1090 1095

Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu

1100 1105 1110

Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn

1115 1120 1125

Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1130 1135 1140

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu

1145 1150 1155

Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val

1160 1165 1170

Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln

1175 1180 1185

Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser

1190 1195 1200

Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr

1205 1210 1215

Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val

1220 1225 1230

Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys

1235 1240 1245

Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys

1250 1255 1260

Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys

1265 1270 1275

Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu

1280 1285 1290

Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln

1295 1300 1305

Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu

1310 1315 1320

Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp

1325 1330 1335

Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu

1340 1345 1350

Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile

1355 1360 1365

Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys

1370 1375 1380

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His

1385 1390 1395

Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr

1400 1405 1410

Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu

1415 1420 1425

Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr

1430 1435 1440

Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala

1445 1450 1455

Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro Lys

1460 1465 1470

Lys Lys Arg Lys Val Ser Pro Gly Gly Gly Pro Ser Ser Gly Ala

1475 1480 1485

Pro Pro Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr

1490 1495 1500

Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

1505 1510 1515

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala

1520 1525 1530

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser

1535 1540 1545

Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Asn His

1550 1555 1560

Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala

1565 1570 1575

Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile

1580 1585 1590

Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp

1595 1600 1605

Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly

1610 1615 1620

Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg

1625 1630 1635

Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu

1640 1645 1650

Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro

1655 1660 1665

Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu

1670 1675 1680

Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp

1685 1690 1695

Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val

1700 1705 1710

Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val

1715 1720 1725

Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr

1730 1735 1740

Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr

1745 1750 1755

Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg

1760 1765 1770

Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn

1775 1780 1785

Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn

1790 1795 1800

Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe

1805 1810 1815

Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu

1820 1825 1830

Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile

1835 1840 1845

Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser

1850 1855 1860

Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser

1865 1870 1875

Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met

1880 1885 1890

Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg

1895 1900 1905

Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu

1910 1915 1920

Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys

1925 1930 1935

Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys

1940 1945 1950

Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly

1955 1960 1965

Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His

1970 1975 1980

Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro

1985 1990 1995

Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp

2000 2005 2010

Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu

2015 2020 2025

Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp

2030 2035 2040

Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro

2045 2050 2055

Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys

2060 2065 2070

Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu

2075 2080 2085

Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro

2090 2095 2100

Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly

2105 2110 2115

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu

2120 2125 2130

Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys

2135 2140 2145

Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr

2150 2155 2160

Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg

2165 2170 2175

Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile

2180 2185 2190

Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His

2195 2200 2205

Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly

2210 2215 2220

Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu

2225 2230 2235

Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr

2240 2245 2250

Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val

2255 2260 2265

Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu

2270 2275 2280

Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu

2285 2290 2295

Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr

2300 2305 2310

Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val

2315 2320 2325

Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn

2330 2335 2340

Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys

2345 2350 2355

Asp Leu Pro Ser Lys Leu Gly His Lys Leu Asn

2360 2365

<210> 12

<211> 2391

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 12

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr Ser

65 70 75 80

Glu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu

85 90 95

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

100 105 110

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

115 120 125

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

130 135 140

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

145 150 155 160

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

165 170 175

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

180 185 190

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

195 200 205

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

210 215 220

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

225 230 235 240

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

245 250 255

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

260 265 270

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

275 280 285

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

290 295 300

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

305 310 315 320

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

325 330 335

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

340 345 350

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

355 360 365

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

370 375 380

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

385 390 395 400

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

405 410 415

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

420 425 430

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

435 440 445

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

450 455 460

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

465 470 475 480

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

485 490 495

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

500 505 510

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

515 520 525

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

530 535 540

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

545 550 555 560

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

565 570 575

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

580 585 590

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

595 600 605

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

610 615 620

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

625 630 635 640

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

645 650 655

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

660 665 670

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

675 680 685

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

690 695 700

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

705 710 715 720

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

725 730 735

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

740 745 750

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

755 760 765

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

770 775 780

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

785 790 795 800

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

805 810 815

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

820 825 830

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

835 840 845

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

850 855 860

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

865 870 875 880

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

885 890 895

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

900 905 910

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile

915 920 925

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

930 935 940

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

945 950 955 960

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

965 970 975

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

980 985 990

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

995 1000 1005

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp

1010 1015 1020

Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg

1025 1030 1035

Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe

1040 1045 1050

Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr

1055 1060 1065

His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala

1070 1075 1080

Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly

1085 1090 1095

Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu

1100 1105 1110

Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn

1115 1120 1125

Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1130 1135 1140

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu

1145 1150 1155

Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val

1160 1165 1170

Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln

1175 1180 1185

Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser

1190 1195 1200

Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr

1205 1210 1215

Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val

1220 1225 1230

Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys

1235 1240 1245

Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys

1250 1255 1260

Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys

1265 1270 1275

Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu

1280 1285 1290

Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln

1295 1300 1305

Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu

1310 1315 1320

Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp

1325 1330 1335

Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu

1340 1345 1350

Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile

1355 1360 1365

Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys

1370 1375 1380

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His

1385 1390 1395

Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr

1400 1405 1410

Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu

1415 1420 1425

Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr

1430 1435 1440

Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala

1445 1450 1455

Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro Lys

1460 1465 1470

Lys Lys Arg Lys Val Ser Pro Gly Gly Gly Pro Ser Ser Gly Ala

1475 1480 1485

Pro Pro Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr

1490 1495 1500

Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

1505 1510 1515

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala

1520 1525 1530

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser

1535 1540 1545

Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Asn His

1550 1555 1560

Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala

1565 1570 1575

Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile

1580 1585 1590

Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp

1595 1600 1605

Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly

1610 1615 1620

Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg

1625 1630 1635

Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu

1640 1645 1650

Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro

1655 1660 1665

Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu

1670 1675 1680

Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp

1685 1690 1695

Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val

1700 1705 1710

Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val

1715 1720 1725

Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr

1730 1735 1740

Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr

1745 1750 1755

Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg

1760 1765 1770

Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn

1775 1780 1785

Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn

1790 1795 1800

Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe

1805 1810 1815

Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu

1820 1825 1830

Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile

1835 1840 1845

Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser

1850 1855 1860

Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser

1865 1870 1875

Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met

1880 1885 1890

Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg

1895 1900 1905

Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu

1910 1915 1920

Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys

1925 1930 1935

Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys

1940 1945 1950

Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly

1955 1960 1965

Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His

1970 1975 1980

Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro

1985 1990 1995

Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp

2000 2005 2010

Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu

2015 2020 2025

Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp

2030 2035 2040

Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro

2045 2050 2055

Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys

2060 2065 2070

Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu

2075 2080 2085

Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro

2090 2095 2100

Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly

2105 2110 2115

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu

2120 2125 2130

Asn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys

2135 2140 2145

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile

2150 2155 2160

Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp

2165 2170 2175

Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr

2180 2185 2190

Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro

2195 2200 2205

Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly

2210 2215 2220

Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe

2225 2230 2235

Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr

2240 2245 2250

Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu

2255 2260 2265

Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn

2270 2275 2280

Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp

2285 2290 2295

Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu

2300 2305 2310

Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu

2315 2320 2325

Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys

2330 2335 2340

Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu

2345 2350 2355

Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu

2360 2365 2370

Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His

2375 2380 2385

Lys Leu Asn

2390

<210> 13

<211> 2369

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 13

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro Pro

65 70 75 80

Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

85 90 95

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

100 105 110

Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

115 120 125

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

Thr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu

145 150 155 160

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

165 170 175

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

180 185 190

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

195 200 205

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

210 215 220

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

225 230 235 240

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

245 250 255

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

260 265 270

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

275 280 285

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

290 295 300

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

305 310 315 320

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

325 330 335

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

340 345 350

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

355 360 365

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

370 375 380

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

385 390 395 400

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

405 410 415

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

420 425 430

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

435 440 445

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

450 455 460

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

465 470 475 480

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

485 490 495

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

500 505 510

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

515 520 525

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

530 535 540

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

545 550 555 560

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

565 570 575

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

580 585 590

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

595 600 605

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

610 615 620

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

625 630 635 640

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

645 650 655

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

660 665 670

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

675 680 685

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

690 695 700

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

705 710 715 720

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

725 730 735

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

740 745 750

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

755 760 765

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

770 775 780

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

785 790 795 800

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

805 810 815

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

820 825 830

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

835 840 845

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

850 855 860

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

865 870 875 880

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

885 890 895

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

900 905 910

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

915 920 925

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

930 935 940

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

945 950 955 960

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

965 970 975

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile

980 985 990

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

995 1000 1005

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser

1010 1015 1020

Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu

1025 1030 1035

Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys

1040 1045 1050

Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile

1055 1060 1065

Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala

1070 1075 1080

Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp

1085 1090 1095

Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu

1100 1105 1110

Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu

1115 1120 1125

Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

1130 1135 1140

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu

1145 1150 1155

Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile

1160 1165 1170

Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe

1175 1180 1185

Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu

1190 1195 1200

Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly

1205 1210 1215

Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr

1220 1225 1230

Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys

1235 1240 1245

Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro

1250 1255 1260

Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp

1265 1270 1275

Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser

1280 1285 1290

Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu

1295 1300 1305

Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser

1310 1315 1320

Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr

1325 1330 1335

Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser

1340 1345 1350

Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala

1355 1360 1365

Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr

1370 1375 1380

Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly

1385 1390 1395

Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His

1400 1405 1410

Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser

1415 1420 1425

Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser

1430 1435 1440

Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu

1445 1450 1455

Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala

1460 1465 1470

Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr

1475 1480 1485

Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile

1490 1495 1500

Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly

1505 1510 1515

Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser

1520 1525 1530

Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Ser Gly Ser

1535 1540 1545

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asn His

1550 1555 1560

Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala

1565 1570 1575

Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile

1580 1585 1590

Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp

1595 1600 1605

Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly

1610 1615 1620

Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg

1625 1630 1635

Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu

1640 1645 1650

Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro

1655 1660 1665

Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu

1670 1675 1680

Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp

1685 1690 1695

Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val

1700 1705 1710

Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val

1715 1720 1725

Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr

1730 1735 1740

Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr

1745 1750 1755

Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg

1760 1765 1770

Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn

1775 1780 1785

Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn

1790 1795 1800

Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe

1805 1810 1815

Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu

1820 1825 1830

Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile

1835 1840 1845

Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser

1850 1855 1860

Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser

1865 1870 1875

Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met

1880 1885 1890

Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg

1895 1900 1905

Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu

1910 1915 1920

Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys

1925 1930 1935

Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys

1940 1945 1950

Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly

1955 1960 1965

Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His

1970 1975 1980

Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro

1985 1990 1995

Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp

2000 2005 2010

Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu

2015 2020 2025

Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp

2030 2035 2040

Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro

2045 2050 2055

Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys

2060 2065 2070

Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu

2075 2080 2085

Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro

2090 2095 2100

Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly

2105 2110 2115

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu

2120 2125 2130

Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys

2135 2140 2145

Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr

2150 2155 2160

Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg

2165 2170 2175

Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile

2180 2185 2190

Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His

2195 2200 2205

Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly

2210 2215 2220

Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu

2225 2230 2235

Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr

2240 2245 2250

Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val

2255 2260 2265

Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu

2270 2275 2280

Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu

2285 2290 2295

Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr

2300 2305 2310

Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val

2315 2320 2325

Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn

2330 2335 2340

Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys

2345 2350 2355

Asp Leu Pro Ser Lys Leu Gly His Lys Leu Asn

2360 2365

<210> 14

<211> 2391

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 14

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro Pro

65 70 75 80

Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

85 90 95

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

100 105 110

Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

115 120 125

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

Thr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu

145 150 155 160

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

165 170 175

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

180 185 190

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

195 200 205

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

210 215 220

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

225 230 235 240

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

245 250 255

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

260 265 270

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

275 280 285

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

290 295 300

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

305 310 315 320

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

325 330 335

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

340 345 350

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

355 360 365

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

370 375 380

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

385 390 395 400

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

405 410 415

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

420 425 430

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

435 440 445

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

450 455 460

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

465 470 475 480

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

485 490 495

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

500 505 510

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

515 520 525

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

530 535 540

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

545 550 555 560

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

565 570 575

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

580 585 590

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

595 600 605

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

610 615 620

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

625 630 635 640

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

645 650 655

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

660 665 670

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

675 680 685

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

690 695 700

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

705 710 715 720

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

725 730 735

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

740 745 750

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

755 760 765

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

770 775 780

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

785 790 795 800

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

805 810 815

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

820 825 830

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

835 840 845

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

850 855 860

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

865 870 875 880

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

885 890 895

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

900 905 910

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

915 920 925

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

930 935 940

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

945 950 955 960

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

965 970 975

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile

980 985 990

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

995 1000 1005

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser

1010 1015 1020

Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu

1025 1030 1035

Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys

1040 1045 1050

Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile

1055 1060 1065

Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala

1070 1075 1080

Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp

1085 1090 1095

Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu

1100 1105 1110

Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu

1115 1120 1125

Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

1130 1135 1140

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu

1145 1150 1155

Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile

1160 1165 1170

Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe

1175 1180 1185

Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu

1190 1195 1200

Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly

1205 1210 1215

Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr

1220 1225 1230

Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys

1235 1240 1245

Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro

1250 1255 1260

Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp

1265 1270 1275

Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser

1280 1285 1290

Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu

1295 1300 1305

Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser

1310 1315 1320

Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr

1325 1330 1335

Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser

1340 1345 1350

Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala

1355 1360 1365

Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr

1370 1375 1380

Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly

1385 1390 1395

Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His

1400 1405 1410

Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser

1415 1420 1425

Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser

1430 1435 1440

Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu

1445 1450 1455

Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala

1460 1465 1470

Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr

1475 1480 1485

Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile

1490 1495 1500

Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly

1505 1510 1515

Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser

1520 1525 1530

Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Ser Gly Ser

1535 1540 1545

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asn His

1550 1555 1560

Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala

1565 1570 1575

Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile

1580 1585 1590

Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp

1595 1600 1605

Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly

1610 1615 1620

Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg

1625 1630 1635

Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu

1640 1645 1650

Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro

1655 1660 1665

Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu

1670 1675 1680

Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp

1685 1690 1695

Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val

1700 1705 1710

Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val

1715 1720 1725

Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr

1730 1735 1740

Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr

1745 1750 1755

Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg

1760 1765 1770

Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn

1775 1780 1785

Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn

1790 1795 1800

Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe

1805 1810 1815

Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu

1820 1825 1830

Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile

1835 1840 1845

Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser

1850 1855 1860

Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser

1865 1870 1875

Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met

1880 1885 1890

Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg

1895 1900 1905

Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu

1910 1915 1920

Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys

1925 1930 1935

Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys

1940 1945 1950

Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly

1955 1960 1965

Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His

1970 1975 1980

Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro

1985 1990 1995

Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp

2000 2005 2010

Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu

2015 2020 2025

Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp

2030 2035 2040

Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro

2045 2050 2055

Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys

2060 2065 2070

Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu

2075 2080 2085

Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro

2090 2095 2100

Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly

2105 2110 2115

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu

2120 2125 2130

Asn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys

2135 2140 2145

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile

2150 2155 2160

Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp

2165 2170 2175

Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr

2180 2185 2190

Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro

2195 2200 2205

Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly

2210 2215 2220

Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe

2225 2230 2235

Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr

2240 2245 2250

Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu

2255 2260 2265

Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn

2270 2275 2280

Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp

2285 2290 2295

Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu

2300 2305 2310

Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu

2315 2320 2325

Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys

2330 2335 2340

Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu

2345 2350 2355

Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu

2360 2365 2370

Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His

2375 2380 2385

Lys Leu Asn

2390

<210> 15

<211> 2345

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 15

Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro

1. 5 10 15

Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile

20 25 30

Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg

35 40 45

Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val

50 55 60

Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr

65 70 75 80

Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly

85 90 95

Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu

100 105 110

Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His

115 120 125

Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe

130 135 140

Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg

145 150 155 160

Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala

165 170 175

Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg

180 185 190

Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu

195 200 205

Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr

210 215 220

Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe

225 230 235 240

Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val

245 250 255

Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu

260 265 270

Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg

275 280 285

His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly

290 295 300

Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val

305 310 315 320

Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr Lys

325 330 335

Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe

340 345 350

Arg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly

355 360 365

Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr Asn

370 375 380

Val Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr

385 390 395 400

Gly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp

405 410 415

Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln

420 425 430

Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu

435 440 445

Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala

450 455 460

Val Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg

465 470 475 480

Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr

485 490 495

Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys

500 505 510

Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu Pro

515 520 525

Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Gly

530 535 540

Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala Gly

545 550 555 560

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu

565 570 575

Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

580 585 590

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu

595 600 605

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Met

610 615 620

Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly

625 630 635 640

Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys

645 650 655

Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly

660 665 670

Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys

675 680 685

Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr

690 695 700

Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe

705 710 715 720

Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His

725 730 735

Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His

740 745 750

Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser

755 760 765

Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met

770 775 780

Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp

785 790 795 800

Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn

805 810 815

Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys

820 825 830

Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu

835 840 845

Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu

850 855 860

Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp

865 870 875 880

Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp

885 890 895

Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu

900 905 910

Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile

915 920 925

Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met

930 935 940

Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala

945 950 955 960

Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp

965 970 975

Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln

980 985 990

Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly

995 1000 1005

Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

1010 1015 1020

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His

1025 1030 1035

Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr

1040 1045 1050

Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr

1055 1060 1065

Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser

1070 1075 1080

Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro

1085 1090 1095

Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser

1100 1105 1110

Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

1115 1120 1125

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val

1130 1135 1140

Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg

1145 1150 1155

Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp

1160 1165 1170

Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys

1175 1180 1185

Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile

1190 1195 1200

Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His

1205 1210 1215

Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu

1220 1225 1230

Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu

1235 1240 1245

Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

1250 1255 1260

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg

1265 1270 1275

Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile

1280 1285 1290

Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser

1295 1300 1305

Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp

1310 1315 1320

Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly

1325 1330 1335

Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser

1340 1345 1350

Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

1355 1360 1365

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val

1370 1375 1380

Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys

1385 1390 1395

Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu

1400 1405 1410

Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln

1415 1420 1425

Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg

1430 1435 1440

Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp

1445 1450 1455

Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp

1460 1465 1470

Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly

1475 1480 1485

Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

1490 1495 1500

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg

1505 1510 1515

Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu

1520 1525 1530

Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg

1535 1540 1545

Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn

1550 1555 1560

Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val

1565 1570 1575

Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe

1580 1585 1590

Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His

1595 1600 1605

Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys

1610 1615 1620

Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val

1625 1630 1635

Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly

1640 1645 1650

Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe

1655 1660 1665

Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg

1670 1675 1680

Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp

1685 1690 1695

Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro

1700 1705 1710

Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe

1715 1720 1725

Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile

1730 1735 1740

Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp

1745 1750 1755

Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu

1760 1765 1770

Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly

1775 1780 1785

Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp

1790 1795 1800

Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile

1805 1810 1815

Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg

1820 1825 1830

Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu

1835 1840 1845

Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser

1850 1855 1860

His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys

1865 1870 1875

Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile

1880 1885 1890

Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala

1895 1900 1905

Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys

1910 1915 1920

Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu

1925 1930 1935

Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr

1940 1945 1950

Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala

1955 1960 1965

Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile

1970 1975 1980

Asp Leu Ser Gln Leu Gly Gly Asp Ala Tyr Pro Tyr Asp Val Pro

1985 1990 1995

Asp Tyr Ala Ser Leu Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys

2000 2005 2010

Val Glu Asp Pro Lys Lys Lys Arg Lys Val Asp Gly Ile Gly Ser

2015 2020 2025

Gly Ser Asn Gly Ser Ser Gly Ser Ser Glu Leu Ile Lys Glu Asn

2030 2035 2040

Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp Asn His His

2045 2050 2055

Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr

2060 2065 2070

Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe

2075 2080 2085

Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr

2090 2095 2100

Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser

2105 2110 2115

Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp

2120 2125 2130

Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly

2135 2140 2145

Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser

2150 2155 2160

Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe

2165 2170 2175

Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn

2180 2185 2190

Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn

2195 2200 2205

Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys

2210 2215 2220

Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys

2225 2230 2235

Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu Val Ala Val

2240 2245 2250

Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu Asn

2255 2260 2265

Gly Gly Gly Gly Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser

2270 2275 2280

Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg

2285 2290 2295

Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg

2300 2305 2310

Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr

2315 2320 2325

Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu

2330 2335 2340

Glu Pro

2345

<210> 16

<211> 71

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 16

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1. 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro

65 70

<210> 17

<211> 7

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 17

Gly Gly Ser Gly Gly Gly Ser

1. 5

<210> 18

<211> 3

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 18

Ser Gly Ser

1

<210> 19

<211> 17

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 19

Glu Ala Ser Gly Ser Gly Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr

1. 5 10 15

Arg

<210> 20

<211> 4

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 20

Ser Arg Ala Asp

1

<210> 21

<211> 3

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 21

Gly Ser Gly

1

<210> 22

<211> 3

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 22

Ser Pro Gly

1

<210> 23

<211> 1368

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 23

Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val

1. 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 24

<211> 9

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 24

Tyr Pro Tyr Asp Val Pro Asp Tyr Ala

1. 5

<210> 25

<211> 7

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 25

Pro Lys Lys Lys Arg Lys Val

1. 5

<210> 26

<211> 301

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 26

Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro

1. 5 10 15

Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile

20 25 30

Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg

35 40 45

Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val

50 55 60

Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr

65 70 75 80

Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly

85 90 95

Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu

100 105 110

Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His

115 120 125

Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe

130 135 140

Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg

145 150 155 160

Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala

165 170 175

Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg

180 185 190

Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu

195 200 205

Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr

210 215 220

Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe

225 230 235 240

Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val

245 250 255

Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu

260 265 270

Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg

275 280 285

His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val

290 295 300

<210> 27

<211> 27

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 27

Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser

1. 5 10 15

Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His

20 25

<210> 28

<211> 215

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 28

Met Gly Pro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln

1. 5 10 15

Pro Val Arg Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys

20 25 30

Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu

35 40 45

Lys Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys

50 55 60

Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser

65 70 75 80

Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His Arg Ile

85 90 95

Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe Trp

100 105 110

Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr

115 120 125

Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly

130 135 140

Arg Asp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu

145 150 155 160

Lys Ser Lys His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu Gln

165 170 175

Ala Gln Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val Asp Leu

180 185 190

Leu Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe

195 200 205

Ser Gln Asn Ser Leu Pro Leu

210 215

<210> 29

<211> 19

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 29

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

1. 5 10 15

Pro Gly Pro

<210> 30

<211> 232

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 30

Ser Glu Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly

1. 5 10 15

Thr Val Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys

20 25 30

Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly

35 40 45

Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly

50 55 60

Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys

65 70 75 80

Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu

85 90 95

Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly

100 105 110

Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn

115 120 125

Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu

130 135 140

Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala

145 150 155 160

Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr

165 170 175

Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val Tyr

180 185 190

Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr

195 200 205

Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu Pro

210 215 220

Ser Lys Leu Gly His Lys Leu Asn

225 230

<210> 31

<211> 16

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 31

Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser

1. 5 10 15

<210> 32

<211> 80

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 32

Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala

1. 5 10 15

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro

20 25 30

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

35 40 45

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr

50 55 60

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu

65 70 75 80

<210> 33

<211> 543

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 33

Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro

1. 5 10 15

Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile

20 25 30

Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg

35 40 45

Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val

50 55 60

Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr

65 70 75 80

Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly

85 90 95

Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu

100 105 110

Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His

115 120 125

Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe

130 135 140

Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg

145 150 155 160

Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala

165 170 175

Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg

180 185 190

Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu

195 200 205

Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr

210 215 220

Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe

225 230 235 240

Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val

245 250 255

Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu

260 265 270

Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg

275 280 285

His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly

290 295 300

Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val

305 310 315 320

Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr Lys

325 330 335

Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe

340 345 350

Arg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly

355 360 365

Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr Asn

370 375 380

Val Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr

385 390 395 400

Gly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp

405 410 415

Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln

420 425 430

Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu

435 440 445

Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala

450 455 460

Val Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg

465 470 475 480

Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr

485 490 495

Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys

500 505 510

Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu Pro

515 520 525

Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu

530 535 540

<210> 34

<211> 1307

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 34

Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr

1. 5 10 15

Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln

20 25 30

Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys

35 40 45

Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln

50 55 60

Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile

65 70 75 80

Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile

85 90 95

Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly

100 105 110

Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile

115 120 125

Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys

130 135 140

Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg

145 150 155 160

Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg

165 170 175

Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg

180 185 190

Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe

195 200 205

Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn

210 215 220

Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val

225 230 235 240

Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp

245 250 255

Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu

260 265 270

Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn

275 280 285

Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro

290 295 300

Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu

305 310 315 320

Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr

325 330 335

Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu

340 345 350

Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His

355 360 365

Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr

370 375 380

Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys

385 390 395 400

Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu

405 410 415

Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser

420 425 430

Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala

435 440 445

Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys

450 455 460

Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu

465 470 475 480

Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe

485 490 495

Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser

500 505 510

Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val

515 520 525

Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp

530 535 540

Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn

545 550 555 560

Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys

565 570 575

Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys

580 585 590

Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys

595 600 605

Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr

610 615 620

Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys

625 630 635 640

Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln

645 650 655

Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala

660 665 670

Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr

675 680 685

Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr

690 695 700

Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His

705 710 715 720

Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu

725 730 735

Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys

740 745 750

Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu

755 760 765

Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln

770 775 780

Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His

785 790 795 800

Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr

805 810 815

Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His

820 825 830

Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn

835 840 845

Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe

850 855 860

Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln

865 870 875 880

Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu

885 890 895

Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg

900 905 910

Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu

915 920 925

Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu

930 935 940

Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val

945 950 955 960

Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile

965 970 975

His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu

980 985 990

Ala Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu

995 1000 1005

Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu

1010 1015 1020

Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly

1025 1030 1035

Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala

1040 1045 1050

Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro

1055 1060 1065

Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe

1070 1075 1080

Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu

1085 1090 1095

Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe

1100 1105 1110

Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly

1115 1120 1125

Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn

1130 1135 1140

Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys

1145 1150 1155

Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr

1160 1165 1170

Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu

1175 1180 1185

Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu

1190 1195 1200

Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu

1205 1210 1215

Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly

1220 1225 1230

Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys

1235 1240 1245

Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp

1250 1255 1260

Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu

1265 1270 1275

Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile

1280 1285 1290

Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn

1295 1300 1305

<210> 35

<211> 1228

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 35

Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr

1. 5 10 15

Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp

20 25 30

Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys

35 40 45

Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp

50 55 60

Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu

65 70 75 80

Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn

85 90 95

Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn

100 105 110

Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu

115 120 125

Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe

130 135 140

Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn

145 150 155 160

Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile

165 170 175

Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys

180 185 190

Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys

195 200 205

Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe

210 215 220

Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile

225 230 235 240

Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn

245 250 255

Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys

260 265 270

Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser

275 280 285

Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe

290 295 300

Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys

305 310 315 320

Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile

325 330 335

Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe

340 345 350

Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp

355 360 365

Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp

370 375 380

Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu

385 390 395 400

Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu

405 410 415

Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser

420 425 430

Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys

435 440 445

Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys

450 455 460

Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr

465 470 475 480

Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile

485 490 495

Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr

500 505 510

Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro

515 520 525

Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala

530 535 540

Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys

545 550 555 560

Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly

565 570 575

Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met

580 585 590

Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro

595 600 605

Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly

610 615 620

Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys

625 630 635 640

Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn

645 650 655

Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu

660 665 670

Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys

675 680 685

Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile

690 695 700

Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His

705 710 715 720

Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile

725 730 735

Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys

740 745 750

Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys

755 760 765

Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr

770 775 780

Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile

785 790 795 800

Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val

805 810 815

Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Ala

820 825 830

Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly

835 840 845

Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn

850 855 860

Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu

865 870 875 880

Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile

885 890 895

Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys

900 905 910

Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn

915 920 925

Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln

930 935 940

Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys

945 950 955 960

Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile

965 970 975

Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe

980 985 990

Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr

995 1000 1005

Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp

1010 1015 1020

Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro

1025 1030 1035

Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser

1040 1045 1050

Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr

1055 1060 1065

Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val

1070 1075 1080

Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu

1085 1090 1095

Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala

1100 1105 1110

Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met

1115 1120 1125

Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly

1130 1135 1140

Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp

1145 1150 1155

Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala

1160 1165 1170

Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala

1175 1180 1185

Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp

1190 1195 1200

Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp

1205 1210 1215

Leu Glu Tyr Ala Gln Thr Ser Val Lys His

1220 1225

<210> 36

<211> 1314

<212> Белок

<213> Искусственная последовательность

<220>

<223> Синтетический полипептид

<400> 36

Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Gly Met Ser

1. 5 10 15

Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr Leu Arg

20 25 30

Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys Ala Arg

35 40 45

Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys Lys Ala

50 55 60

Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu Ile Leu

65 70 75 80

Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser Asp Val

85 90 95

Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys Asp Phe

100 105 110

Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr Ile Lys

115 120 125

Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile Asp Ala

130 135 140

Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln Ser Lys

145 150 155 160

Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr Asp Ile

165 170 175

Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr Thr Tyr

180 185 190

Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser Asn Asp

195 200 205

Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu Pro Lys

210 215 220

Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys Ala Pro

225 230 235 240

Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu Glu Leu

245 250 255

Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg Val Phe

260 265 270

Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr Leu Asn

275 280 285

Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys Phe Val

290 295 300

Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile Asn Leu

305 310 315 320

Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys Met Ser

325 330 335

Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser Phe Val

340 345 350

Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met Gln Ser

355 360 365

Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys Ser Ile

370 375 380

Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln Lys Leu

385 390 395 400

Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr Asp Leu

405 410 415

Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala Val Leu

420 425 430

Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn Pro Ser

435 440 445

Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala Lys Tyr

450 455 460

Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn Lys His

465 470 475 480

Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala Asn Phe

485 490 495

Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys Asp Asn

500 505 510

Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys Asp Leu

515 520 525

Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp Leu Leu

530 535 540

Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His Ile Ser

545 550 555 560

Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His Phe Tyr

565 570 575

Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val Pro Leu

580 585 590

Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser Asp Glu

595 600 605

Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly Trp Asp

610 615 620

Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys Asp Asp

625 630 635 640

Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile Phe Asp

645 650 655

Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys Ile Val

660 665 670

Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val Phe Phe

675 680 685

Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile Leu Arg

690 695 700

Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln Lys Gly

705 710 715 720

Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe Ile Asp

725 730 735

Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp Phe Gly

740 745 750

Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu Phe Tyr

755 760 765

Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn Ile Ser

770 775 780

Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr Leu Phe

785 790 795 800

Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg Pro Asn

805 810 815

Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn Leu Gln

820 825 830

Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr Arg Lys

835 840 845

Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala Ile Ala

850 855 860

Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu Tyr Asp

865 870 875 880

Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe His Cys

885 890 895

Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe Asn Asp

900 905 910

Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His Ile Leu

915 920 925

Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu Val Asp

930 935 940

Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile Gly Asn

945 950 955 960

Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile Glu Lys

965 970 975

Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn Ile Lys

980 985 990

Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile Ala Lys

995 1000 1005

Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu Asn

1010 1015 1020

Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val Tyr

1025 1030 1035

Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu Val

1040 1045 1050

Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg Ala

1055 1060 1065

Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly Lys

1070 1075 1080

Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys

1085 1090 1095

Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr

1100 1105 1110

Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys

1115 1120 1125

Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe Asp

1130 1135 1140

Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr Ile

1145 1150 1155

Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp Lys

1160 1165 1170

Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu Leu

1175 1180 1185

Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly Glu

1190 1195 1200

Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe Phe

1205 1210 1215

Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg Asn

1220 1225 1230

Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val Ala

1235 1240 1245

Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys Asn

1250 1255 1260

Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly Leu

1265 1270 1275

Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly

1280 1285 1290

Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe

1295 1300 1305

Val Gln Asn Arg Asn Asn

1310

<210> 37

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 37

actgcggaaa tttgagcgt 19

<210> 38

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 38

acgctcaaat ttccgcagt 19

<210> 39

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 39

aggcaatggc tgcacatgc 19

<210> 40

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 40

gcatgtgcag ccattgcct 19

<210> 41

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 41

gacgcttggt tctgaggag 19

<210> 42

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 42

ctcctcagaa ccaagcgtc 19

<210> 43

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 43

tccggaaacg cattcctct 19

<210> 44

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 44

agaggaatgc gtttccgga 19

<210> 45

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 45

ccgcgtcagc ccggcccgg 19

<210> 46

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 46

ccgggccggg ctgacgcgg 19

<210> 47

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 47

cgactcccgc tgggcctct 19

<210> 48

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 48

agaggcccag cgggagtcg 19

<210> 49

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 49

ccgttgcgcg ctcgctctc 19

<210> 50

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 50

gagagcgagc gcgcaacgg 19

<210> 51

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 51

ccgcgcatcc tgccaggcc 19

<210> 52

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 52

ggcctggcag gatgcgcgg 19

<210> 53

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 53

ccaacttggc gcgtttcgg 19

<210> 54

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 54

ccgaaacgcg ccaagttgg 19

<210> 55

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 55

accacgcgtc cgagtccgg 19

<210> 56

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 56

ccggactcgg acgcgtggt 19

<210> 57

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 57

tgctcattgt ccctggaca 19

<210> 58

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 58

tgtccaggga caatgagca 19

<210> 59

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 59

ggacaccctg ctcattgtc 19

<210> 60

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 60

gacaatgagc agggtgtcc 19

<210> 61

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 61

accggcagcc tgcgcgtcc 19

<210> 62

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 62

ggacgcgcag gctgccggt 19

<210> 63

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 63

cgatgggcac ccactgctc 19

<210> 64

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 64

gagcagtggg tgcccatcg 19

<210> 65

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 65

ccttcacgtg gacgcgcag 19

<210> 66

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 66

ctgcgcgtcc acgtgaagg 19

<210> 67

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 67

cgtgaaggtg gaagccttc 19

<210> 68

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 68

gaaggcttcc accttcacg 19

<210> 69

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 69

ctccttggtc aggcgccgg 19

<210> 70

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 70

ccggcgcctg accaaggag 19

<210> 71

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 71

tggtcaggcg ccggttccg 19

<210> 72

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 72

cggaaccggc gcctgacca 19

<210> 73

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 73

tagaggtcgc cttctcctc 19

<210> 74

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 74

gaggagaagg cgacctcta 19

<210> 75

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 75

cgacgctcgg gtcgcggtg 19

<210> 76

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 76

caccgcgacc cgagcgtcg 19

<210> 77

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 77

atgctgtcgc cgcgcgggg 19

<210> 78

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 78

ccccgcgcgg cgacagcat 19

<210> 79

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 79

ctcaccctca ccggagcca 19

<210> 80

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 80

tggctccggt gagggtgag 19

<210> 81

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 81

ccgcaaactt tactcctta 19

<210> 82

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 82

taaggagtaa agtttgcgg 19

<210> 83

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 83

ctcctaagat tggcttcac 19

<210> 84

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 84

gtgaagccaa tcttaggag 19

<210> 85

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 85

ccggagccac tcctaagat 19

<210> 86

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 86

atcttaggag tggctccgg 19

<210> 87

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 87

ttctctaccc tacgtctca 19

<210> 88

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 88

tgagacgtag ggtagagaa 19

<210> 89

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 89

tacgtctcat tctccgcaa 19

<210> 90

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 90

ttgcggagaa tgagacgta 19

<210> 91

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 91

gctaggcctc cagcccttc 19

<210> 92

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 92

gaagggctgg aggcctagc 19

<210> 93

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 93

acaggtggcg ccgcaactt 19

<210> 94

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 94

aagttgcggc gccacctgt 19

<210> 95

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 95

agccggaggc gcgagagtc 19

<210> 96

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический полинуклеотид

<400> 96

gactctcgcg cctccggct 19

<---

Похожие патенты RU2804665C2

название год авторы номер документа
ГЛИКАНЗАВИСИМЫЕ ИММУНОТЕРАПЕВТИЧЕСКИЕ МОЛЕКУЛЫ 2016
  • Деметриоу Майкл
  • Чжоу Рэймонд Вэньхоу
RU2754661C2
КОМПОЗИЦИИ И СПОСОБЫ ДЛЯ ИЗБИРАТЕЛЬНОЙ ЭКСПРЕССИИ БЕЛКА 2017
  • Голосов Андрей
  • Гимарэс Карла
  • Мотц Грегори
  • Майлон Майкл
  • Эллебрехт Кристоф Т.
  • Пэйн Эми С.
RU2795467C2
КОНСТРУКЦИИ ДНК-АНТИТЕЛ ДЛЯ ПРИМЕНЕНИЯ ПРОТИВ БОЛЕЗНИ ЛАЙМА 2017
  • Уэйнер, Дэвид, Б.
  • Флингай, Селеке
RU2813829C2
ХИМЕРНЫЙ АНТИГЕННЫЙ РЕЦЕПТОР (CAR) ПРОТИВ CD123 ДЛЯ ИСПОЛЬЗОВАНИЯ В ЛЕЧЕНИИ ЗЛОКАЧЕСТВЕННЫХ ОПУХОЛЕЙ 2015
  • Брогдон Дженнифер
  • Джилл Саар
  • Гласс Дэвид
  • Кендериан Саад
  • Лев Андреас
  • Манник Джоан
  • Майлон Майкл
  • Мерфи Леон
  • Портер Дэвид Л.
  • Руелла Марко
  • Ван Юнцян
  • У Цилун
  • Чжан Цзицюань
RU2724999C2
ЛЕЧЕНИЕ ЗЛОКАЧЕСТВЕННОГО НОВООБРАЗОВАНИЯ С ИСПОЛЬЗОВАНИЕМ ГУМАНИЗИРОВАННОГО ХИМЕРНОГО АНТИГЕННОГО РЕЦЕПТОРА ПРОТИВ ВСМА 2015
  • Брогдон Дженнифер
  • Чой Юджин
  • Эберсбах Хилмар
  • Гласс Дэвид
  • Хют Хитер
  • Джун Карл Х.
  • Манник Джоан
  • Майлон Майкл С.
  • Мерфи Леон
  • Плиса Габриэла
  • Ричардсон Селеста
  • Руелла Марко
  • Сингх Решма
  • Ван Юнцян
  • У Цилун
RU2751660C2
МОДИФИЦИРОВАННЫЕ НЕПРИРОДНЫЕ ЛИГАНДЫ NKG2D, КОТОРЫЕ ИЗБИРАТЕЛЬНО ДОСТАВЛЯЮТ ПРИСОЕДИНЕННЫЕ ГЕТЕРОЛОГИЧНЫЕ МОЛЕКУЛЫ К НЕПРИРОДНЫМ РЕЦЕПТОРАМ NKG2D НА CAR-КЛЕТКАХ 2020
  • Ким, Каман
  • Кайлин, Найджел
  • Херциг, Эйтан
  • Грин, Уорнер
RU2823728C2
ТЕРАПЕВТИЧЕСКИЕ СРЕДСТВА И СПОСОБЫ ДЛЯ ЛЕЧЕНИЯ TLR2-ОПОСРЕДОВАННЫХ ЗАБОЛЕВАНИЙ И НАРУШЕНИЙ 2019
  • Вицтум, Джозеф, Л.
  • Цимикас, Сотириос
  • Цюэ, Сюйчу
RU2791022C2
ТРИСПЕЦИФИЧЕСКИЕ И/ИЛИ ТРИВАЛЕНТНЫЕ СВЯЗЫВАЮЩИЕ БЕЛКИ С ПРИМЕНЕНИЕМ КРОССОВЕРНОГО ФОРМАТА С ДВОЙНЫМ ВАРИАБЕЛЬНЫМ ДОМЕНОМ (CODV) ДЛЯ ЛЕЧЕНИЯ ИНФЕКЦИИ, ВЫЗВАННОЙ HIV 2020
  • Асокан, Мангаиаркараси
  • Байль, Кристиан
  • Бенинга, Йохен
  • Биркенфельд, Йерг
  • Коннорс, Марк
  • Коуп, Ричард А.
  • Квон, Йонг До
  • Квонг, Питер Д.
  • Лю, Циньбо
  • Луссо, Паоло
  • Маскола, Джон Р.
  • Нейбел, Гари Дж.
  • Пегу, Амарендра
  • Рао, Эрколе
  • Вэй, Ронни
  • Сюй, Лин
  • Ян, Цжи-Юн
RU2820164C2
ГИБРИДНЫЕ БЕЛКИ ВАРИАНТА sPD-1—FC 2019
  • Джачча, Амато Дж.
  • Агилера, Тодд А.
  • Кариолис, Михалис С.
  • Мяо, Юй
  • Тхаккар, Каушик
  • Чжан, Синь Эрик
RU2785993C2
КОМПОЗИЦИЯ И ПРИМЕНЕНИЕ ИСТОЩАЮЩИХ ЗАПАСЫ АРГИНИНА СРЕДСТВ ПРИ РАКЕ, ОЖИРЕНИИ, МЕТАБОЛИЧЕСКИХ НАРУШЕНИЯХ И СВЯЗАННЫХ С НИМИ ОСЛОЖНЕНИЯХ И СОПУТСТВУЮЩИХ ЗАБОЛЕВАНИЯХ 2019
  • Лёнг, Юн Чунь
  • Шум, Алиса Сау-Вун
RU2826185C2

Иллюстрации к изобретению RU 2 804 665 C2

Реферат патента 2023 года КОМПОЗИЦИИ И СПОСОБЫ РЕДАКТИРОВАНИЯ ГЕНОВ

Изобретение относится к области биотехнологии, в частности к слитому белку, содержащему в направлении от N-конца до С-конца домен метилтрансферазы ДНК, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен, связанный с боксом или домен, связанный с боксом , фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен метилтрансферазы ДНК, а также комплекс, его содержащий. Также раскрыты молекула нуклеиновой кислоты, кодирующая вышеуказанный слитый белок, а также вектор и клетка, ее содержащие. Изобретение эффективно для сайленсинга последовательности целевой нуклеиновой кислоты в клетке. 8 н. и 52 з.п. ф-лы, 13 ил., 2 табл., 12 пр.

Формула изобретения RU 2 804 665 C2

1. Слитый белок для сайленсинга последовательности целевой нуклеиновой кислоты, содержащий, в направлении от N-конца до С-конца:

(i) домен метилтрансферазы ДНК, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен, связанный с боксом ; или

(ii) домен, связанный с боксом , фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен метилтрансферазы ДНК.

2. Слитый белок по п. 1, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой нуклеазо-дефицитную эндонуклеазу CRISPR класса II.

3. Слитый белок по п. 1, отличающийся тем, что указанный домен метилтрансферазы ДНК содержит белок Dnmt3A и белок Dnmt3L (домен Dnmt3A-3L).

4. Слитый белок по п. 1, отличающийся тем, что указанный слитый белок включает в себя, в направлении от N-конца до С-конца, домен метилтрансферазы ДНК, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен, связанный с боксом .

5. Слитый белок по п. 4, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а указанный домен метилтрансферазы ДНК содержит белок Dnmt3A и белок Dnmt3L (домен Dnmt3A-3L); где указанный dCas9 ковалентно связан с доменом Dnmt3A-3L через линкер XTEN.

6. Слитый белок по п. 5, отличающийся тем, что указанный dCas9 ковалентно связан с указанным доменом Dnmt3A-3L через линкер XTEN, и при этом указанный домен Dnmt3A-3L ковалентно связан с указанным доменом, связанным с боксом , через линкер XTEN.

7. Слитый белок по п. 1, отличающийся тем, что указанный слитый белок включает в себя, в направлении от N-конца до С-конца, домен, связанный с боксом , фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, линкер XTEN и домен метилтрансферазы ДНК.

8. Слитый белок по п. 7, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а указанный домен метилтрансферазы ДНК содержит белок Dnmt3A и белок Dnmt3L (домен Dnmt3A-3L).

9. Слитый белок по п. 8, отличающийся тем, что указанный dCas9 ковалентно связан с указанным доменом Dnmt3A-3L через линкер XTEN, и при этом указанный домен, связанный с боксом , ковалентно связан с указанным dCas9 через линкер XTEN.

10. Слитый белок по п. 1, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК ковалентно связан с указанным доменом, связанным с боксом , через пептидный линкер.

11. Слитый белок по п. 1, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК ковалентно связан с указанным доменом метилтрансферазы ДНК через пептидный линкер.

12. Слитый белок по п. 1, отличающийся тем, что указанный домен, связанный с боксом , ковалентно связан с указанным доменом метилтрансферазы ДНК через линкер XTEN.

13. Слитый белок по п. 10, отличающийся тем, что указанный пептидный линкер представляет собой линкер XTEN.

14. Слитый белок по п. 13, отличающийся тем, что указанный линкер XTEN содержит от около 16 до около 80 аминокислотных остатков.

15. Слитый белок по п. 1, дополнительно содержащий сигнальный пептид ядерной локализации.

16. Слитый белок по п. 1, отличающийся тем, что указанный слитый белок содержит аминокислотную последовательность с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15.

17. Нуклеиновая кислота, кодирующая слитый белок по п. 1.

18. Нуклеиновая кислота по п. 17, отличающаяся тем, что указанная последовательность нуклеиновой кислоты представляет собой информационную РНК.

19. Комплекс для сайленсинга последовательности целевой нуклеиновой кислоты, содержащий: (i) слитый белок по п. 1; и (ii) полинуклеотид, содержащий: (а) нацеливающую на ДНК последовательность, комплементарную целевой полинуклеотидной последовательности; и (b) последовательность связывания для указанного фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, при этом указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК связан с указанным полинуклеотидом через связывающую последовательность.

20. Комплекс по п. 19, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть гена.

21. Комплекс по п. 19, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть последовательности, регулирующей транскрипцию.

22. Комплекс по п. 19, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть промотора, энхансера или сайленсера.

23. Комплекс по п. 19, отличающийся тем, что указанная целевая полинуклеотидная последовательность находится в пределах около 3000 п.о. и фланкирует сайт начала транскрипции.

24. Экспрессионный вектор для сайленсинга целевого гена, содержащий последовательность нуклеиновой кислоты, кодирующую слитый белок по п. 1.

25. Экспрессионный вектор по п. 24, дополнительно содержащий полинуклеотид, отличающийся тем, что указанный полинуклеотид содержит: (а) нацеливающую на ДНК последовательность, которая комплементарна целевой полинуклеотидной последовательности; и (b) последовательность связывания для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК.

26. Выделенная клетка для направленного сайленсинга гена, содержащая слитый белок по п. 1; нуклеиновую кислоту по п. 17; комплекс по п. 19 или вектор по п. 24, где указанная клетка содержит целевой ген, подвергшийся сайленсингу.

27. Выделенная клетка по п. 26, отличающаяся тем, что указанная клетка представляет собой эукариотическую клетку.

28. Выделенная клетка по п. 26, отличающаяся тем, что указанная клетка представляет собой клетку млекопитающего.

29. Способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включающий: (i) доставку первого полинуклеотида, кодирующего слитый белок по п. 1 в клетку, содержащую указанную целевую нуклеиновую кислоту; и (ii) доставку в указанную клетку второго полинуклеотида, который включает в себя (a) нацеленную на ДНК последовательность, которая комплементарна указанной последовательности целевой нуклеиновой кислоты, и (b) связывающую последовательность для указанного фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК.

30. Способ по п. 29, отличающийся тем, что указанный слитый белок вызывает сайленсинг указанной последовательности целевой нуклеиновой кислоты в указанной клетке путем метилирования хроматина, содержащего указанную последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий указанную последовательность целевой нуклеиновой кислоты.

31. Способ по п. 29, отличающийся тем, что указанный первый полинуклеотид содержится в первом векторе.

32. Способ по п. 29, отличающийся тем, что указанный первый полинуклеотид содержится во втором векторе.

33. Способ по п. 32, отличающийся тем, что указанные первый вектор и второй вектор одинаковы.

34. Способ по п. 32, отличающийся тем, что указанный первый вектор отличается от указанного второго вектора.

35. Способ по п. 29, отличающийся тем, что указанная клетка представляет собой клетку млекопитающего.

36. Способ по п. 29, отличающийся тем, что специфичность указанного способа в 2 раза выше, чем специфичность по отношению к последовательности нецелевой нуклеиновой кислоты.

37. Способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включающий в себя доставку комплекса по п. 19 в клетку, содержащую указанную целевую нуклеиновую кислоту.

38. Способ по п. 37, отличающийся тем, что указанный комплекс вызывает сайленсинг указанной последовательности целевой нуклеиновой кислоты в указанной клетке путем метилирования хроматина, содержащего указанную последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий указанную последовательность целевой нуклеиновой кислоты.

39. Способ по п. 37, отличающийся тем, что указанная клетка представляет собой клетку млекопитающего.

40. Способ по п. 37, отличающийся тем, что специфичность указанного способа в 2 раза выше, чем специфичность по отношению к последовательности нецелевой нуклеиновой кислоты.

41. Слитый белок по п. 1, отличающийся тем, что указанный фермент нуклеазо-дефицитной РНК-направляемой эндонуклеазы ДНК представляет собой фермент dCas9, который содержит аминокислотную последовательность, имеющую по меньшей мере 85% идентичности последовательности с SEQ ID NO:23; ddCas12a, который содержит аминокислотную последовательность, по меньшей мере на 85% идентичную SEQ ID NO:34; dLbCfp1, который содержит аминокислотную последовательность, по меньшей мере на 85% идентичную SEQ ID NO:35; или dFnCfp1, который содержит аминокислотную последовательность, по меньшей мере на 85% идентичную SEQ ID NO: 36.

42. Слитый белок по п. 1, отличающийся тем, что указанный домен, связанный с боксом , содержит аминокислотную последовательность, имеющую по меньшей мере 85% идентичности последовательности с SEQ ID NO: 16.

43. Слитый белок по п. 3, отличающийся тем, что указанный белок Dnmt3A содержит аминокислотную последовательность, имеющую по меньшей мере 85% идентичности последовательности с SEQ ID NO: 26, а указанный белок Dnmt3L содержит аминокислотную последовательность, имеющую по меньшей мере 85% идентичности последовательности с SEQ ID NO: 28.

44. Слитый белок по п. 1, отличающийся тем, что указанный слитый белок содержит аминокислотную последовательность, имеющую по меньшей мере 85% идентичности последовательности с SEQ ID NO: 15.

45. Слитый белок по п. 1, отличающийся тем, что указанный фермент нуклеазо-дефицитной РНК-направляемой эндонуклеазы ДНК выбран из группы, состоящей из dCas9, ddCpf1, ddCas12a, ddLbCfp1 и ddFnCfp1.

46. Слитый белок для сайленсинга последовательности целевой нуклеиновой кислоты, содержащий домен метилтрансферазы ДНК, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен, связанный с боксом ; где

(1) указанный фермент нуклеазо-дефицитной РНК-направляемой эндонуклеазы ДНК представляет собой фермент dCas9, который содержит аминокислотную последовательность, имеющую по меньшей мере 85% идентичности последовательности с SEQ ID NO:23; ddCas12a, который содержит аминокислотную последовательность, по меньшей мере на 85% идентичную SEQ ID NO:34; dLbCfp1, который содержит аминокислотную последовательность, по меньшей мере на 85% идентичную SEQ ID NO:35; или dFnCfp1, который содержит аминокислотную последовательность, по меньшей мере на 85% идентичную SEQ ID NO: 36;

(2) указанный домен, связанный с боксом , содержит аминокислотную последовательность, имеющую по меньшей мере 85% идентичности последовательности с SEQ ID NO: 16; и

(3) домен ДНК-метилтрансферазы содержит белок Dnmt3A, белок Dnmt3L или белок Dnmt3A и белок Dnmt3L; при этом указанный белок Dnmt3A содержит аминокислотную последовательность, имеющую по меньшей мере 85% идентичности последовательности с SEQ ID NO: 26, а указанный белок Dnmt3L содержит аминокислотную последовательность, имеющую по меньшей мере 85% идентичности последовательности с SEQ ID NO: 28.

47. Слитый белок по п. 46, отличающийся тем, что указанный домен, связанный с боксом , содержит аминокислотную последовательность, имеющую по меньшей мере 90% идентичности последовательности с SEQ ID NO: 16.

48. Слитый белок по п. 47, отличающийся тем, что указанный домен, связанный с боксом , содержит аминокислотную последовательность, имеющую по меньшей мере 95% идентичности последовательности с SEQ ID NO: 16.

49. Слитый белок по п. 48, отличающийся тем, что указанный домен, связанный с боксом , содержит аминокислотную последовательность, имеющую по меньшей мере 99% идентичности последовательности с SEQ ID NO: 16.

50. Слитый белок по п. 46, отличающийся тем, что указанный белок Dnmt3A содержит аминокислотную последовательность, имеющую по меньшей мере 90% идентичности последовательности с SEQ ID NO: 26.

51. Слитый белок по п. 50, отличающийся тем, что указанный белок Dnmt3A содержит аминокислотную последовательность, имеющую по меньшей мере 95% идентичности последовательности с SEQ ID NO: 26.

52. Слитый белок по п. 51, отличающийся тем, что указанный белок Dnmt3A содержит аминокислотную последовательность, имеющую по меньшей мере 99% идентичности последовательности с SEQ ID NO: 26.

53. Слитый белок по п. 46, отличающийся тем, что указанный белок Dnmt3L содержит аминокислотную последовательность, имеющую по меньшей мере 90% идентичности последовательности с SEQ ID NO: 28.

54. Слитый белок по п. 53, отличающийся тем, что указанный белок Dnmt3L содержит аминокислотную последовательность, имеющую по меньшей мере 95% идентичности последовательности с SEQ ID NO: 28.

55. Слитый белок по п. 54, отличающийся тем, что указанный белок Dnmt3L содержит аминокислотную последовательность, имеющую по меньшей мере 99% идентичности последовательности с SEQ ID NO: 28.

56. Слитый белок по п. 46, отличающийся тем, что указанный dCas9 содержит аминокислотную последовательность, имеющую по меньшей мере 90% идентичности последовательности с SEQ ID NO: 23.

57. Слитый белок по п. 56, отличающийся тем, что указанный dCas9 содержит аминокислотную последовательность, имеющую по меньшей мере 95% идентичности последовательности с SEQ ID NO: 23.

58. Слитый белок по п. 57, отличающийся тем, что указанный dCas9 содержит аминокислотную последовательность, имеющую по меньшей мере 99% идентичности последовательности с SEQ ID NO: 23.

59. Слитый белок по п. 46, отличающийся тем, что указанный домен, связанный с боксом , содержит аминокислотную последовательность SEQ ID NO: 16, указанный белок Dnmt3A содержит аминокислотную последовательность SEQ ID NO: 26, указанный белок Dnmt3L содержит аминокислотную последовательность SEQ ID NO: 28, а указанный dCas9 содержит аминокислотную последовательность SEQ ID NO: 23.

60. Слитый белок по п. 59, отличающийся тем, что указанный слитый белок содержит, в направлении от N-конца до С-конца, домен метилтрансферазы ДНК, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен, связанный с боксом .

Документы, цитированные в отчете о поиске Патент 2023 года RU2804665C2

WO2016063264 A1, 28.04.2016
TAFADZWA MLAMBO et al., Designer epigenome modifiers enable robust and sustained gene silencing in clinically relevant human cells, Nucleic Acids Research, 10 March 2018, Vol
Способ изготовления звездочек для французской бороны-катка 1922
  • Тарасов К.Ф.
SU46A1
Разборный с внутренней печью кипятильник 1922
  • Петухов Г.Г.
SU9A1
СЧЕТНЫЙ ПРИБОР 1926
  • Федаш В.З.
SU4456A1
WO2018053035 A1, 22.03.2018
JOHN P GUILINGER et al., Fusion of catalytically inactive Cas9 to FokI nuclease improves

RU 2 804 665 C2

Авторы

Чэнь, Цзинь

Гилберт, Люк

Нунез, Джеймс

Вейссман, Джонатан

Даты

2023-10-03Публикация

2019-04-19Подача