СРЕДСТВО РАЗРЕЗАНИЯ ДНК НА ОСНОВЕ CAS9 БЕЛКА ИЗ БАКТЕРИИ DEMEQUINA SEDIMINICOLA Российский патент 2020 года по МПК C12Q1/68 

Описание патента на изобретение RU2722933C1

Область техники

Изобретение относится к биотехнологии, а именно, к новым ферментам Cas нуклеазам систем CRISPR-Cas, применяемым для разрезания ДНК и редактирования генома различных организмов. Данная технология может применяться в будущем для генной терапии наследственных заболеваний человека, а также для редактирования генома других организмов.

Уровень техники

Изменение последовательности ДНК – одна из актуальных задач биотехнологии на сегодняшний день. Редактирование и изменение геномов эукариотических и прокариотических организмов, а также манипуляции с ДНК in vitro, требуют направленного внесения двунитевых разрывов в последовательности ДНК.

Для решения этой задачи в настоящее время используют следующие методики: искусственные нуклеазные системы, содержащей домены типа «цинковые пальцы», TALEN-системы и бактериальные CRISPR-Cas системы. Первые два метода требуют трудозатратой оптимизации аминокислотной последовательности нуклеазы для узнавания конкретной последовательности ДНК. В отличие от них в случае CRISPR-Cas систем структурами, узнающими ДНК мишень, являются не белки, а короткие направляющие РНК. Разрезание конкретной ДНК мишени не требует синтеза нуклеазы или ее гена de novo, а обеспечивается за счет использования направляющих РНК, комплементарных целевой последовательности. Это делает CRISPR Cas системы удобными и эффективными инструментами разрезания различных ДНК-последовательностей. Методика позволяет осуществлять единовременное разрезание ДНК в нескольких участках при использовании направляющих РНК разной последовательностей. Такой подход используется в том числе для одновременного изменения нескольких генов в эукариотических организмах.

По своей природе CRISPR-Cas системы являются иммунными системами прокариот, способными высоко специфично вносить разрывы в генетический материал вирусов (Mojica F. J. M. et al. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements //Journal of molecular evolution. – 2005. – Т. 60. – №. 2. – С. 174-182). Аббревиатура CRISPR-Cas расшифровывается как “Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR associated genes” (Jansen R. et al. Identification of genes that are associated with DNA repeats in prokaryotes //Molecular microbiology. – 2002. – Т. 43. – №. 6. – С. 1565-1575), что переводе с английского обозначает “короткие палиндромные повторы, регулярно расположенные группами, и aссоциированные с ними гены”. Все CRISPR-Cas системы состоят из CRISPR кассет и генов, кодирующих различные Cas белки (Jansen R. et al. , Molecular microbiology. – 2002. – Т. 43. – №. 6. – С. 1565-1575). CRISPR кассеты состоят из последовательностей-спейсеров, каждый из которых имеет уникальную нуклеотидную последовательность, и повторяющихся палиндромных повторов (Jansen R. et al. , Molecular microbiology. – 2002. – Т. 43. – №. 6. – С. 1565-1575). В результате транскрипции CRISPR кассет и их последующего процессинга образуются направляющие крРНК, которые вместе с Cas белками формируют эффекторный комплекс (Brouns S. J. J. et al. Small CRISPR RNAs guide antiviral defense in prokaryotes //Science. – 2008. – Т. 321. – №. 5891. – С. 960-964). За счет комплементарного спаривания крРНК с целевым участком ДНК, именуемым протоспейсером, Cas-нуклеаза узнает ДНК-мишень и высоко специфично вносит в нее разрыв.

CRISPR-Cas системы, представленными одиночным белком-эффектором, разделяют на шесть различных типов (от I до VI) в зависимости от Cas белков, входящих в состав систем. В 2013 году впервые было предложено использовать систему CRISPR-Cas9, относящуюся к типу II, для редактирования геномной ДНК клеток человека (Cong L, et al., Multiplex genome engineering using CRISPR/Cas systems. Science. 2013 Feb 15;339(6121):819-23). Система CRISPR-Cas9 II типа отличается простотой состава и механизма работы: для ее функционирования необходимо формирование эффекторного комплекса, состоящего лишь из одного белка Cas9 и двух коротких РНК: крРНК (crRNA) и трейсерной РНК (tracrRNA, или трРНК). Трейсерная РНК комплементарно спаривается с участком крРНК, проиcходящим из CRISPR повтора, образуя вторичную структуру, необходимую для связывания направляющих РНК с Cas эффектором. Определение последовательности направляющих РНК является важным шагом в характеризации неизученных ранее Cas-ортологов. Эффекторный белок Cas9 является РНК-зависимой ДНК эндонуклеазой с двумя нуклеазными доменами (HNH и RuvC), вносящими разрывы в комплементарные нити целевой ДНК, таким образом образуя двунитевой разрыв ДНК (Deltcheva E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III //Nature. – 2011. – Т. 471. – №. 7340. – С. 602).

На сегодняшний день известно несколько CRISPR-Cas нуклеаз, способных направлено и специфично вносить двунитевые разрывы в ДНК. Технология CRISPR-Cas9 является одной из самых современных и быстроразвивающихся методик внесения разрывов в ДНК различных организмов, начиная от бактериальных штаммов и заканчивая клетками человека, а также in vitro (Song M. The CRISPR/Cas9 system: Their delivery, in vivo and ex vivo applications and clinical development by startups. Biotechnol Prog. 2017 Jul;33(4):1035-1045).

Эффекторному рибонуклеиновому комплексу, состоящему из Cas9 и дуплекса крРНК и тракрРНК, для распознавания и последующего гидролиза ДНК помимо комплементарного соответствия спейсера крРНК и протоспейсера необходимо присутствие PAM (от англ. “PAM” - protospacer adjusted motif) на ДНК мишени (Mojica F. J. M. et al. 2009). PAM представляет собой строго определенную последовательность из нескольких нуклеотидов, расположенных в системах типа II вплотную либо в нескольких нуклеотидах от 3’-конца протоспейсера на нетаргетной цепи. При отсутствии PAM гидролиза связей в ДНК с образованием двунитевого разрыва не происходит. Необходимость присутствия PAM последовательности на мишени повышает специфичность узнавания, но в то же время накладывает ограничение в выборе целевых участков ДНК, в которые необходимо внести разрыв. Таким образом, наличие нужной PAM последовательности, фланирующей ДНК-мишень с 3'-конца, является характеристикой, ограничивающей применение CRISPR-Cas систем на любых участках ДНК.

Различные CRISPR-Cas белки используют для своей работы разные, оригинальные PAM последовательности. Использование CRISPR-Cas белков с новыми разнообразными PAM последовательностями необходимо для обеспечения возможности изменения любого участка ДНК, как in vitro, так и в геноме живых организмов. Изменение эукариотических геномов также требует использования нуклеаз малого размера для обеспечения доставки CRISPR-Cas систем в клетки посредством AAV вирусов.

Несмотря на известность ряда способов разрезания ДНК и изменения последовательности геномной ДНК, на сегодняшний день сохраняется потребность в новых эффективных инструментах для модификации ДНК в различных организмах и в строго определенных местах последовательности ДНК.

Сущность изобретения

Задачей настоящего изобретения является создание новых инструментов для изменения последовательности геномной ДНК одноклеточных или многоклеточных организмов на основе систем CRISPR-Cas9. Существующие в настоящее время системы имеют ограниченное применение из-за специфичной последовательности РАМ, которая должна присутствовать на 3'-конце участка ДНК, подвергающегося модификации. Поиск новых ферментов Cas9 с другими РАМ последовательностями позволит расширить арсенал имеющихся средств для образования двунитевого разрыва в необходимых, строго определенных местах в молекулах ДНК разных организмов. Для решения этой задачи авторами была охарактеризована ранее предсказанная для бактерии Demequina sediminicola (D. sediminicola)

CRISPR нуклеаза II типа DsCas9, которая может быть применена для внесения направленных изменений в геном как этого, так и других организмов. Существенными признаками, отличающими настоящее изобретение, являются: (а) короткая, отличающаяся от других известных последовательность PAM; (б) относительно малый размер охарактеризованного белка DsCas9 – 1021 аминокислотных остатков (а.о.).

Указанная задача решается путем применения белка, содержащего аминокислотную последовательность SEQ ID NO: 1, или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5’- NA/GNNACN -3’ в указанной молекуле ДНК. В предпочтительных вариантах изобретения данное применение характеризуется тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре 37 оС.

Указанная задача также решается путем создания способа изменения последовательности геномной ДНК одноклеточного или многоклеточного организма, включающего введение в по меньшей мере одну клетку этого организма эффективного количества: а) либо белка, содержащего аминокислотную последовательность SEQ ID NO: 1, либо нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1, и б) либо направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5’- NA/GNNACN -3’, и взаимодействующей с указанным белком после образования дуплекса, либо последовательности ДНК, кодирующей указанную направляющую РНК; при этом взаимодействие указанного белка с направляющей РНК и нуклеотидной последовательностью 5’- NA/GNNACN -3’ приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5’-NA/GNNACN-3’. В некоторых вариантах изобретения данный способ характеризуется тем, что дополнительно включающий введение экзогенной последовательности ДНК одновременно с направляющей РНК.

В качестве направляющей РНК может быть использована смесь из крРНК (crRNA) и трейсерной РНК (tracrRNA), способных образовать комплекс с участком целевой ДНК и белком DsCas9. В предпочтительных вариантах изобретения в качестве направляющей РНК может быть использована гибридная РНК, сконструированная на основе крРНК и трейсерной РНК. Методы конструирования гибридной направляющей РНК известны специалистам (Hsu PD, et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013 Sep;31(9):827-32).

Изобретение может быть использовано как для разрезания целевой ДНК in vitro, так и для модификации генома какого-либо живого организма. Модификация генома может проводиться прямым способом – разрезанием генома в соответствующем сайте, а также вставкой экзогенной последовательности ДНК за счет гомологичной репарации.

В качестве экзогенной последовательности ДНК может быть использован любой участок двунитевой или однонитевой ДНК из генома организма, отличного от организма, используемого при введении (или смесь таких участков между собой и с другими фрагментами ДНК), при этом этот участок (или смесь участков) предназначен для интеграции в место двуцепочечного разрыва в целевой ДНК, образованного под действием нуклеазы DsCas9. В некоторых вариантах изобретения в качестве экзогенной последовательности ДНК может быть использован участок двуцепочечной ДНК из генома организма, используемого при введении белка DsCas9, но при этом измененный мутациями (заменой нуклеотидов), а также вставками или делециями одного или нескольких нуклеотидов.

Техническим результатом настоящего изобретения является повышение универсальности доступных систем CRISPR-Cas9, позволяющее использовать нуклеазу Cas9 для разрезания геномной или плазмидной ДНК в большем количестве специфических сайтов и специфических условий.

Краткое описание рисунков

Фиг. 1. Схема устройства локуса CRISPR DsCas9 системы. DR - direct repeat, или прямой повтор - регулярно повторяющийся участок, входящий в состав CRISPR кассеты.

Фиг. 2. Выравнивание прочтений, полученных при секвенировании малых РНК, экстрагированных из клеток, несущих CRISPR DsCas9 систему, на последовательность CRISPR кассеты. DR - прямой повтор; spacer - спейсер, уникальная последовательность CRISPR кассеты, находящаяся между двумя прямыми повторами; нт – нуклеотиды.

Фиг. 3. (А) PAM скрининг in vitro, схема эксперимента. (Б) Анализ результатов in vitro скрининга нуклеазы PpCas9 для определения PAM. Для каждой позиции обозначены частоты представленности аденина, цитозина, тимина и гуанина. Высота букв соответствует частоте представленности нуклеотида в данной позиции PAM последовательности.

Фиг. 4. Расщепление ДНК с PAM-последовательностью AACAACG белком DsCas9 в различных условиях. М – маркер; 1 – DsCas9, РНК 1X; 2 – DsCas9 2X, РНК 2X; 3 – DsCas9 2X, РНК 1X; 4 – контроль (без добавления РНК).

Фиг. 5. Влияние однонуклеотидных замен в PAM-последовательности на нуклеазную активность белка DsCas9. Специфическое расщепление ДНК с различными вариантами PAM. Соответствующие PAM-последовательности указаны ниже в столбцах в направлении сверху вниз. Стрелкой обозначено положение продукта разрезания ДНК.

Фиг. 6. In vitro проверка специфичной нуклеазной активности DsCas9 на различных мишенях в рамках гена Grin2B человека. PAM-последовательности: 1 – AACAACT, 2 – CACAACC, 3 – AACTACT, 4 – CACGACT, 5 – TACAAAA.

Фиг. 7. Схема рибонуклеопротеинового комплекса DsCas9 с направляющими РНК DR – прямой повтор.

Фиг. 8. Выравнивание аминокислотных последовательностей белков DsCas9 (верхняя последовательность) и Cas9 из Staphylococcus aureus (нижняя последовательность) при помощи программы NCBI BLASTp (default parameters).

Подробное раскрытие изобретения

В описании данного изобретения термины «включает» и «включающий» интерпретируются как означающие «включает, помимо всего прочего». Указанные термины не предназначены для того, чтобы их истолковывали как «состоит только из». Если не определено отдельно, технические и научные термины в данной заявке имеют стандартные значения, общепринятые в научной и технической литературе.

Используемый здесь термин «процент гомологии двух последовательностей» эквивалентен термину «процент идентичности двух последовательностей». Идентичность последовательностей определяется на основании референсной последовательности. Алгоритмы для анализа последовательности известны в данной области, такие как BLAST, описанный в Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990). Для целей настоящего изобретения для определения уровня идентичности и сходства между нуклеотидными последовательностями и аминокислотными последовательностями может быть использовано сравнение нуклеотидных и аминокислотных последовательностей, производимое с помощью пакета программ Blast, предоставляемого National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/blast) с использованием содержащего разрывы выравнивания со стандартными параметрами. Процент идентичности двух последовательностей определяется числом положений идентичных аминокислот в этих двух последовательностях с учетом числа пробелов и длины каждого пробела, которые необходимо ввести для оптимального сопоставления двух последовательностей путем выравнивания. Процент идентичности равен числу идентичных аминокислот в данных положениях с учетом выравнивания последовательностей, разделенному на общее число положений и умноженному на 100.

Термин "специфически гибридизуется" относится к ассоциации между двумя одноцепочечными молекулами нуклеиновых кислот или в достаточной степени комплементарными последовательностями, что разрешает такую гибридизацию в предопределенных условиях, обычно использующихся в данной области.

Фраза "двунитевой разрыв, расположенный непосредственно перед нуклеотидной последовательностью РАМ" означает, что двунитевой разрыв в целевой последовательности ДНК будет произведен на расстоянии от 0 до 25 нуклеотидов перед нуклеотидной последовательностью РАМ.

Под экзогенной последовательностью ДНК, вводимой одновременно с направляющей РНК, следует понимать последовательность ДНК, подготовленную специально для специфической модификации двуцепочечной целевой ДНК в месте разрыва, определяемого специфичностью направляющей РНК. Подобной модификацией может быть, например, вставка или делеция определенных нуклеотидов в месте разрыва целевой ДНК. Экзогенной ДНК может служить как участок ДНК из другого организма, так и участок ДНК из того же организма, что и целевая ДНК.

Под белком, содержащим определенную аминокислотную последовательность следует понимать белок, имеющий аминокислотную последовательность, составленную из указанной аминокислотной последовательности и, возможно, других последовательностей, соединённых пептидными связями с указанной аминокислотной последовательностью. Примером других последовательностей может служить последовательность сигнала ядерной локализации (NLS), или другие последовательности, обеспечивающие повышенную функциональность для указанной аминокислотной последовательности.

Под экзогенной последовательностью ДНК, вводимой одновременно с направляющей РНК, следует понимать последовательность ДНК, подготовленную специально для специфической модификации двуцепочечной целевой ДНК в месте разрыва, определяемого специфичностью направляющей РНК. Подобной модификацией может быть, например, вставка или делеция определенных нуклеотидов в месте разрыва целевой ДНК. Экзогенной ДНК может служить как участок ДНК из другого организма, так и участок ДНК из того же организма, что и целевая ДНК.

Под эффективным количеством вводимых в клетку белка и РНК следует понимать такое количество белка и РНК, которое при попадании в указанную клетку будет способно образовать функциональный комплекс, то есть комплекс, который будет специфически связываться с целевой ДНК и производить в ней двунитевой разрыв в месте, определяемом направляющей РНК и РАМ последовательностью на ДНК. Эффективность этого процесса может быть оценена при помощи анализа целевой ДНК, выделенной из указанной клетки с помощью стандартных методов, известных специалистам.

Доставка белка и РНК в клетку может быть осуществлена различными способами. Например, белок может быть доставлен в виде ДНК-плазмиды, которая кодирует ген этого белка, как мРНК для трансляции этого белка в цитоплазме клетки, или как рибонуклеопротеидный комплекс, включающий этот белок и направляющую РНК. Доставка может быть осуществлена различными методами, известными специалистам.

Нуклеиновая кислота, кодирующая компоненты системы, может быть введена в клетку, непосредственно или опосредованно: за счет трансфекции или трансформации клеток известными специалистам способами, за счет использования рекомбинатного вируса, за счет манипуляций с клеткой, таких как микроинъекция ДНК и т.п.

Доставка рибонуклеинового комплекса, состоящего из нуклеазы и направляющих РНК и экзогенной ДНК (при необходимости) может осуществляться путем трансфекции комплексов в клетку или за счет механического введения комплекса внутрь клетки, например, микроинъекции.

Молекула нуклеиновой кислоты, кодирующая белок, который необходимо ввести в клетку, может быть интегрирована в хромосому или может представлять собой внехромосомно реплицирующуюся ДНК. В некоторых вариантах для обеспечения эффективной экспрессии гена белка с вводимой в клетку ДНК необходимо изменить последовательность этой ДНК в соответствии с типом клетки в целях оптимизации кодонов при экспрессии, обусловленное неравномерностью частот встречаемости синонимичных кодонов в кодирующих областях генома различных организмов. Оптимизация кодонов необходима для увеличения экспрессии в клетках животных, растений, грибов или микроорганизмов.

Для функционирования белка, имеющего последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1, в эукариотической клетке необходимо, чтобы этот белок оказался в ядре этой клетки. Поэтому, в некоторых вариантах изобретения, для образования двунитевых разрывов в целевой ДНК используют белок, имеющий последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1, и который дополнительно модифицирован с одного или с обоих концов добавлением одного или нескольких сигналов ядерной локализации. Например, может быть использован сигнал ядерной локализации из вируса SV40. Для эффективной доставки в ядро сигнал ядерной локализации может быть отделен от основной последовательности белка спейсерной последовательностью, например, описанной в Shen B, et al. "Generation of gene-modified mice via Cas9/RNA-mediated gene targeting", Cell Res. 2013 May;23(5):720-3. Также, в других вариантах осуществления, может быть использован другой сигнал ядерной локализации, или альтернативный метод доставки указанного белка в ядро клетки.

Настоящее изобретение охватывает применение белка из организма D. sediminicola, гомологичного ранее охарактеризованным белкам Cas9, для внесения двуцепочечных разрывов в молекулы ДНК в строго определенных положениях. Использование CRISPR нуклеаз для внесения направленных изменений в геном имеет ряд преимуществ. Во-первых, специфичность действия системы определяется последовательностью крРНК, что позволяет использовать один тип нуклеазы для всех локусов-мишеней. Во-вторых, методика позволяет доставить в клетку сразу несколько направляющих РНК, комплементарных разным генам-мишеням, что позволяет осуществлять единовременное изменение сразу нескольких генов.

DsCas9 – Cas нуклеаза, найденная в настоящем изобретении в бактериях D. sediminicola. CRISPR Cas9 система из бактерии Demequina sediminicola относится к системам IIC типа и имеет характерное для Cas9 систем устройство локуса. В состав CRISPR кассеты входит 33 прямых повтора (DR, direct repeats) последовательностью

GTTGCGGCCAGAGCTCATTTCCCAGAGCGATAGGCT, перемежающихся уникальными последовательностями, спейсерами. Адаптационный модуль, ответственный за встраивание новых спейсеров в CRISPR кассету, представлены генами Cas1 и Cas2. Рядом с геном эффекторного Cas9 белка была идентифицирована последовательность трейсерной РНК (tracrRNA, трRNA) (Рис. 1).

Для биохимической характеризации белка Cas9 из D. sediminicola (DsCas9) локус, кодирующий основные компоненты системы (гены белков СсCas9, cas1, cas2, а также часть CRSIPR кассеты и трейсерную РНК), был клонирован в малокопийный бактериальный вектор pACYC184. Полученный вектор был трансформирован в клетки E. coli, в которых далее проводилось изучение активности системы.

Определение последовательности направляющих РНК.

Проверка экспресcии генов CRISPR DsCas9 в E. coli проводилась посредством секвенирования малых РНК, экстрагированных из клеток E.coli, несущих систему CRISPR. Анализ результатов секвенирования позволил выяснить последовательности направляющих РНК (Таблица 1, Рис. 2).

Таблица 1. Последовательности направляющих РНК системы CRISPR DsCas9.

Название Последовательность DsCas9 трРНК CCUAUCGCUCUGGGAAAUGGGCUCUGCCGCuAACAAGGAGAAACUUGUUGGAUCAGGACUCCACAAGAUGAGACGGCUCCCUCGUGGGGCCGUUUUCUUUUU DsCas9 крРНК XXXXXXXXXXXXXXXXXXXXGUUGCGGCCAGAGCUCAUUUCCCAGAGCGAUAGGCU

Определение PAM последовательности белка DsCas9. Бактериальный PAM скрининг.

Интерференция – это процесс защиты бактериальных клеток от чужеродной ДНК с помощью CRSIPR Cas систем. Для определения PAM последовательности белка DsCas9 клетки E.coli BL21 Star, несущие плазмиду DsCas9_pACYC184, были трансформированы библиотекой плазмид, содержащих последовательность спейсера 5’-TTCATGCACGAAGTCCTCCGCCGCATGTCC-3’ CRISPR кассеты DsCas9 системы, фланкированной рандомизированной семибуквенной последовательностью с 5’ или 3’ конца.

Плазмиды, несущие последовательность, соответствующую PAM системы DsCas9, подвергались деградации под действием CRISPR Cas системы, в то время как остальные плазмиды библиотеки эффективно трансформировались в клетки, придавая им устойчивость к антибиотику ампициллину. После трансформации и инкубации клеток на чашках с антибиотиком колонии смывались с поверхности агара и из них экстрагировали ДНК с помощью Qiagen Plasmid Purification Midi kit. С выделенного пула плазмид ПЦР амплифицировались участки, включающие рандомизированную PAM последовательность, которые затем подвергали высокоэффективному секвенированию на платформе Illumina. Полученные прочтения анализировали: сравнивалась эффективность трансформации плазмид с уникальными PAM, входящими в библиотеку, в клетки, несущие DsCas9_pACYC184, или в контрольные клетки, несущие пустой вектор pACYC184. Полученные результаты анализировали методами биоинформатики. В результате удалось выявить PAM системы DsCas9 – трехбуквенную последовательность NA/GNNACN c 3’ конца протоспейсера (Рис. 3).

Для проверки активности DsCas9 нуклеазы и определения требуемого для DsCas9 PAM мотива, были проведены эксперименты по воссозданию реакции разрезания ДНК in vitro.

Для проверки нуклеазной активности DsCas9 в рамках in vitro скрининга требовалось наличие следующих компонентов реакции:

1) Рекомбинантный белок DsCas9

2) крРНК DsCas9

3) трейсерная РНК DsCas9

4) ДНК-мишень

Определение последовательности направляющих РНК РНК-секвенированием (Таблица 1) позволило синтезировать in vitro молекулы crRNA и tracrRNA. Синтез осуществляли с помощью набора NEB HiScribe T7 RNA synthesis. Двунитевые ДНК мишени представляли собой фрагменты РНК размером 374 пар нуклеотидов (п.н.), содержащие последовательность протоспейсера, фланкированную соответствующими PAM последовательностями c 3’ конца: 5’-

XXXXXXX – вариабельный PAM участок. В зависимосьти от условий эксперимента использовались различные PAM  последовательности.

Для разрезания таких мишеней использовали направляющие РНК следующей последовательности:

DsCas9 tracrRNA:

CCUAUCGCUCUGGGAAAUGGGCUCUGCCGCuAACAAGGAGAAACUUGUUGGAUCAGGACUCCACAAGAUGAGACGGCUCCCUCGUGGGGCCGUUUUCUUUUU

DsCas9 крРНК 1:

uaucuccuuucauugagcacGUUGCGGCCAGAGCUCAUUUCCCAGAGCGAUAGGCU

или

DsCas9 крРНК 2:

ucaaggaccuuaucuccuuucauugagcacGUUGCGGCCAGAGCUCAUUUCCCAGAGCGAUAGGCU

Для получения рекомбинантного белка DsCas9 его ген был клонирован в плазмиду pET21a. С N-конца к последовательности DsCas9 был добавлен белок MBP для повышения растворимости. Клетки E.coli Rosetta были трансформированы полученной плазмидой pET21a MBP_DsCas9_6xHis.

500 мкл ночной культуры разводили в 500 мл среды LB, и растили клетки при температуре 37 оС до достижения оптической плотности 0.6 отн.ед. Синтез целевого белка индуцировали добавлением ИПТГ до концентрации 1 мМ, после чего клетки инкубировали при температуре 20 оC в течение 6 часов. Затем проводили центрифугирование клеток на скорости 5000 g в течение 30 минут, полученные осадки замораживали при температуре -20 оС.

Осадки размораживали на льду в течение 30 минут, ресуспензировали в 15 мл лизисного буфера (Tris-HCl 50мМ pH 8, 500 мМ NaCl, β-меркаптоэтанол 1 мМ, имидазол 10 мМ) с добавлением 15 мг лизоцима и снова инкубировали на льду в течение 30 минут. Затем клетки разрушали воздействием ультразвука в течение 30 минут и центрифугировали в течение 40 минут на скорости 16000 g. Полученный супернатант пропускали через фильтр 0,2 мкм и наносили на колонку HisTrap HP 1 mL (GE Healthcare) на скорости 1 мл/мин.

Хроматографию проводили при помощи FPLC хроматографа AKTA (GE Healthcare) на скорости 1 мл/мин. Колонку с нанесенным белком промывали 20 мл лизисного буфера с добавлением 30 мМ имидазола, после чего белок смывали лизисным буфером с добавлением 300 мМ имидазола.

Затем, фракцию белка, полученную в ходе афинной хроматографии, пропускали через гель-фильтрационную колонку Superdex 200 10/300 GL (24мл), уравновешенную следующим буфером: Tris-HCl 50 мМ pH 8, 500 мМ NaCl, 1 мМ DTT. При помощи концентратора Аmicon (с фильтром на 30 кДа) фракции, соответствующие мономерной форме белка DsCas9, сконцентрировали до 3 мг/мл, после чего очищенный белок хранили при температуре -80 оС в буфере, содержащем 10% глицерин.

In vitro реакцию разрезания ДНК проводили в следующих условиях.

Реакционная смесь состояла из:

1X CutSmart буфера (NEB),

5 мМ DTT,

40 нМ ДНК-мишень,

2 мкМ трРНК/крРНК,

400 нМ белка DsCas9.

Реакции проводились при температуре 37 °С

По данным in vivo скрининга были отобраны несколько конкретных PAM-последовательностей, предположительно узнаваемых нуклеазой DsCas9. ДНК-мишени, несущие эти PAM последовательности, проверяли на эффективность разрезания нуклеазой. В результате было установлено узнавание белком DsCas9 следующей 7-нуклеотидной PAM-последовательности: 5’-AACAACG-3’, в согласии с PAM консенсусом 5’-NA/GNNACN-3’ (Рис. 4).

Длина РНК не оказывала влияние на активность DsCas9, в связи с чем для работы была выбрана направляющая РНК меньшей длины, DsCas9 крРНК 1.

С целью выявления позиций PAM последовательности, значимых для специфического узнавания DsCas9, были синтезированы ДНК-мишени, содержащие однонуклеотидные замены в последовательности 5’-AACAACG-3’. Каждый из 7 нуклеотидов PAM поочередно заменяли с пурина на пиримидин или наоборот. Результат реакции in vitro разрезания DsCas9 таких ДНК-мишеней показал значимость нуклеотида C в 6-й позиции PAM последовательности (Рис. 5). Замена C на G в данной позиции привела к нарушению специфического распознавания мишени нуклеазой, что привело к предотвращению разрезания. Замены в остальных позициях никак не сказались на нуклеазной активности DsCas9, что может свидетельствовать о строгом требовании к нуклеотидному составу PAM последоватльности только в 6-й позиции.

В результате исследований in vitro, а также исследований работы системы в бактериях удалось сделать следующий вывод: PAM, распознаваемый нуклеазой DsCas9, соответствует следующей формуле 5’-NA/GNNACN-3’. Причем только С в шестой позиции является строгим требованием DsCas9.

Нижеследующие примеры осуществления способа приведены в целях раскрытия характеристик настоящего изобретения и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения.

Пример 1. Тестирование активности белка DsCas9 в разрезании различных ДНК мишеней.

Использование Cas нуклеаз для внесения двунитевых разрывов в различных сайтах ДНК клеток человека требует эффективного распознавания нуклеазой разных ДНК-мишеней. Поэтому следующим шагом биохимической характеризации DsCas9 после определения и валидации PAM последовательности являлась проверка эффективности разрезания белком различных сайтов ДНК in vitro.

Способность DsCas9 разрезать различные мишени была проверена на ПЦР фрагменте гена человека grin2b, длиной 1592 пары оснований.

gagagagatggccaaggcttatattctatagagcattatgtccttagtttgatgcatagaataagatttagggtcatatgtggaagtaaaaaggaaggagttctttgtaggtaaaaggtggcaaattatatgaaaatacggtatcagtcattttagggaagtcacgactataggatggcatcaggaaaaaaaaaggaacatttttcaaatgtggctctaacattacttcagctgctaatggtatttgtttaagtttctgtattttggtgtataaatagattggagtaatatgtgttccttataataattggttatatgagaggcagttccacgtagtgtaatagaacacatattggaatacaaaagtcagaagatctgggttcaggtttgtttcacttaattgattggttcatggtcttagaacacttagcttctctgagccttggcgtcaacatttataaaaatggtgataataatgtttttcttattttattccctactgggtcattgtaaggatcaattgaggcaatgttttaaaactactagtcatgtatcagttgttcttgtagtttaatattaagagccagatactaacaaggttactaaagaattttctggctgttgtcctcattgaggcaaacataaggtgaaggcagcaagaatgcagggcttgtgtacttatagccccccacatccagtttatccagcccatgttctgttgctcacctctgctgagcacgtttttctgctcactttgtctggccttgctttccttcagcccaagaacagtacaagggtgggctgtaacaggagggccaggagatttgtgtatgcatactcgcatggctacctggaccactcacaacctcttttcctcctttgtctctgcctgtagctgccaatgactatagcaatagcaccttttattgccttgttcaaggatttctgaggcttttgaaagtttcattttctctcattctgcagagcaaataccagagataagagagtaggctggtagatggagttgggtttggtgctcaatgaaaggagataaggtccttgaattgcagtatctagcctcttctaagacaggttacgtgatgtagatcctattttaacatgctctttctttgtgtttgcagggagtcgacgagttgaagatgaagcccagagcggagtgctgttctcccaagttctggttggtgttggccgtcctggccgtgtcaggcagcagagctcgttctcagaagagcccccccagcattggcattgctgtcatcctcgtgggcacttccgacgaggtggccatcaaggatgcccacgagaaagatgatttccaccatctctccgtggtaccccgggtggaactggtagccatgaatgagaccgacccaaagagcatcatcacccgcatctgtgatctcatgtctgaccggaagatccagggggtggtgtttgctgatgacacagaccaggaagccatcgcccagatcctcgatttcatttcagcacagactctcacccccatcctgggcatccacgggggctcctctatgataatggcagataaggtaaaaaggggctgcagggag

На этом участке было выбрано пять сайтов с последовательностями PAM, предположительно распознаваемыми DsCas9 на основе in vivo и in vitro данных (Таблица 2):

Таблица 2. Последовательности PAM и соответствующего проспейсера, расположенные на гене grin2b человека.

PAM (5’-3’) Протоспейсер (5’-3’) AACAACT TCTTAATATTAAACTACAAG CACAACC GCATGGCTACCTGGACCACT AACTACT CAATTGAGGCAATGTTTTAA CACGACT ATCAGTCATTTTAGGGAAGT TACAAAA TAATAGAACACATATTGGAA

Для распознавания этих сайтов были синтезированы крРНК, с последовательностью прямого повтора (DR) DsCas9, и спейсерной последовательностью, соответствующей выбранным протоспейсерам.

Далее проводилась реакция in vitro разрезания ДНК-мишени белком DsCas9 в комплексе с полученными крРНК и трейсерной РНК. Реакции проводили по стандартной схеме.

Фермент DsCas9 успешно распознал и разрезал все пять мишеней (Рис. 6). Белок показал высокую эффективность в специфическом расщеплении ДНК в случае всех пяти мишеней. Разрезание ДНК специфично: продукты реакции имеют длину, ожидаемую в соответствии с положением сайта узнавания на ДНК.

Таким образом, проведенные исследовательские испытания показали наличие нуклеазной активности у DsCas9, а также позволили определить его PAM последовательность и верифицировать последовательности направляющих РНК.

DsCas9 рибонуклеопротеиновый комплекс специфически вносит разрывы в мишени, ограниченные PAM 5’-NA/GNNACN-3’ c 3’ конца протоспейсера. Схема DsCas9-РНК комплекса представлена на Фиг. 7.

Пример 2. Белки Cas9 из близкородственных организмов, относящихся к D. sediminicola.

На сегодняшний день в D. sediminicola не охарактеризовано ни одного фермента системы CRISPR-Cas9. Сравнимый по размерам белок Cas9 из Staphylococcus aureus идентичен DsCas9 на 30 % (Фиг. 8, степень идентичности была рассчитана по программе BLASTp, default parameters). Похожая степень идентичности была установлена и для других известных белков Cas9 (не показано).

Таким образом, белок DsCas9 существенно отличается по аминокислотной последовательности от других Cas9 белков, изученных на сегодняшний день.

Специалисту в области генетической инженерии очевидно, что полученный и охарактеризованный в данном Описании вариант последовательности белка DsCas9 может быть изменен без изменения функции самого белка (например, направленным мутагенезом аминокислотных остатков, напрямую не влияющих на функциональную активность (Sambrook et al., Molecular Cloning: A Laboratory Manual, (1989), CSH Press, pp. 15.3-15.108)). В частности, специалисту известно, что могут быть изменены неконсервативные аминокислотные остатки, не затрагивающие остатки, определяющие функциональность белка (определяющие его функцию или структуру). Примерами таких изменений могут служить замены неконсервативных аминокислотных остатков на гомологичные. Некоторые из участков, содержащих неконсервативные аминокислотные остатки, приведены на Фиг. 12. В некоторых вариантах осуществления изобретения возможно использование белка, содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5’- NA/GNNACN-3’ в указанной молекуле ДНК. Гомологичные белки могут быть получены путем мутагенеза (например, сайт-направленного или ПЦР-опосредуемого мутагенеза) соответствующих молекул нуклеиновых кислот с последующим тестированием кодируемого модифицированного белка Cas9 на сохранение его функций в соответствии с описанными здесь функциональными анализами.

Пример 3. Описанная в настоящем изобретении система DsCas9 в комплексе с направляющими РНК может быть использована для изменения последовательности геномной ДНК многоклеточного организма, в том числе эукариотического. Для введения система DsCas9 в комплексе с направляющими РНК в клетки этого организма (во все клетки или в часть клеток) могут быть применены различные подходы, известные специалистам. Например, методы доставки CRISPR-Cas9 систем в клетки организмов раскрыты в источниках (Liu C et al., Delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications. J Control Release. 2017 Nov 28;266:17-26; Lino CA et al., Delivering CRISPR: a review of the challenges and approaches. Drug Deliv. 2018 Nov;25(1):1234-1257), и в источниках, раскрытых внутри этих источников.

Для эффективной экспрессии нуклеазы DsCas9 в эукариотических клетках будет желательно провести оптимизацию кодонов для аминокислотной последовательности белка DsCas9 методами, известными специалистам (например, IDT codon optimization tool).

Для эффективной работы нуклеазы DsCas9 в эукариотических клетках необходимо обеспечить импорт этого белка внутрь ядра эукариотической клетки. Для этого можно использовать сигнал ядерной локализации из Т-антигена вируса SV40 (Lanford et al., Cell, 1986, 46: 575–582), соединённый с последовательностью DsCas9 с помощью спейсерной последовательности, описанной в Shen B, et al. "Generation of gene-modified mice via Cas9/RNA-mediated gene targeting", Cell Res. 2013 May;23(5):720-3 или без нее. Таким образом, полная аминокислотная последовательность нуклеазы транспортируемой внутрь ядра эукариотической клетки будет представлять собой следующую последовательность: MAPKKKRKVGIHGVPAA-DsCas9-KRPAATKKAGQAKKKK (далее DsCas9 NLS). Для доставки белка с приведенной выше аминокислотной последовательностью, могут быть использованы по меньшей мере два подхода.

Доставка в виде гена осуществляется путем создания плазмиды, несущей ген DsCas9 NLS под регуляцией промотора (например, CMV промотора) и последовательности, кодирующей направляющие РНК под регуляцией U6 промотора. В качестве ДНК- мишеней используются ДНК последовательности фланкированные 3’- NA/GNNACN -5’, например, последовательности гена grin2b человека:

5’-TCTTAATATTAAACTACAAG-3’

Таким образом, кассета для экспрессии крРНК выглядит следующим образом:

GagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgTCTTAATATTAAACTACAAGGUUGCGGCCAGAGCUCAUUUCCCAGAGCGAUAGGCU

Жирным шрифтом выделена последовательность U6 промотора, далее последовательность, необходимая для узнавания целевой ДНК, последовательность прямого повтора выделена красным цветом.

Кассета для экспрессии трейсерной РНК выглядит следующим образом:

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgCCTATCGCTCTGGGAAATGGGCTCTGCCGCTAACAAGGAGAAACTTGTTGGATCAGGACTCCACAAGATGAGACGGCTCCCTCGTGGGGCCGTTTTCTTTTT

Жирным шрифтом выделена последовательность U6 промотора, далее последовательность, кодирующая трейсерную РНК.

Плазмидную ДНК очищают и трансфицируют в клетки человека HEK293 c помощью реагента Lipofectamine 2000 (Thermo Fisher Scientific). Клетки инкубируют в течение 72 часов, после чего из них выделяется геномная ДНК с помощью колонок для очистки геномной ДНК (Thermo Fisher Scientific). Целевой ДНК сайт анализируется с помощью секвенирования на платформе Illumina с целью определения числа вставок-делеций в ДНК, происходящих в целевом сайте по причине направленного двунитевого разрыва и последующей его репарации.

Для амплификации целевых фрагментов используют праймеры, фланкирующие предположительное место внесения разрыва.

После амплификации пробы готовятся по протоколу реагента Ultra II DNA Library Prep Kit for Illumina (NEB) для подготовки образцов к высокопроизводительному секвенированию. Затем проводится секвенирование на платформе Illumina 300cycles, прямое прочтение. Результаты секвенирования анализируются биоинформатическими методами. В качестве детекции разрезания принимается вставка или делеция нескольких нуклеотидов в целевой последовательности ДНК.

Доставка в виде рибонуклеинового комплекса осуществляется путем инкубации рекомбинантной формы DsCas9 NLS c направляющими РНК в CutSmart буфере (NEB). Рекомбинантный белок получают из бактериальных клеток-продуцентов, очищая его с помощью аффинной хроматографии (NiNTA, Qiagen) разделением по размеру (Superdex 200). 

Белок смешивают с РНК в соотношении 1:2:2 (DsCas9 NLS: crRNA :tracrRNA), инкубируют в течение 10 минут на комнатной температуре, затем смесь трансфицируют в клетки.

Далее проводится анализ экстрагированной из них ДНК на предмет вставок-делеций в целевом ДНК сайте (как описано выше).

Охарактеризованная в настоящем изобретении нуклеаза DsCas9 из бактерии D. sediminicola имеет ряд преимуществ относительно ранее охарактеризованных Cas9 белков.

DsCas9 обладает коротким, трехбуквенным, отличным от других известных Cas нуклеаз PAM мотивом, необходимым для функционирования системы. В изобретении было показано, что для функционирования DsCas9 достаточно присутствия короткого PAM мотива, распложенного в нескольких нуклеотидах от протоспейсера.

Известные на сегодняшний день большинство Cas нуклеаз, способных вносить двунитевые разрывы в ДНК, имеют сложные многобуквенные PAM последовательности, ограничивающие выбор последовательностей, пригодных для разрезания. Среди изученных Cas нуклеаз, распознающих короткие PAM, только DsCas9 может распознавать последовательности, фланкированные 3’- NA/GNNACN-5’ мотивом. Несмотря на трехбуквенный PAM возможность использования пуринов A или G во второй позиции расширяет спектр возможных к изменению мишеней.

Второе преимущество DsCas9 – малый размер белка (1021 а.о). На сегодняшний день это единственный изученный малоразмерный белок, обладающий NA/GNNACN PAM последовательностью.

DsСas9 – новая, малоразмерная Cas нуклеаза, имеющая относительно короткий, простой в использовании PAM, отличающийся от известных на сегодняшний день PAM последовательностей других нуклеаз. Белок DsCas9 разрезает с высокой эффективностью различные ДНК-мишени при температуре 37 °С, и может стать основой нового инструмента геномного редактирования.

Несмотря на то, что изобретение описано со ссылкой на раскрываемые варианты воплощения, для специалистов в данной области должно быть очевидно, что конкретные подробно описанные случаи приведены лишь в целях иллюстрирования настоящего изобретения, и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения. Должно быть, понятно, что возможно осуществление различных модификаций без отступления от сути настоящего изобретения. 

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> Автономная некоммерческая образовательная организация высшего образования «Сколковский институт науки и технологий»

<120> СРЕДСТВО РАЗРЕЗАНИЯ ДНК НА ОСНОВЕ CAS9 БЕЛКА ИЗ БАКТЕРИИ DEMEQUINA SEDIMINICOLA

<130> 1

<160> 2

<210> 1

<211> 1021

<212> PRT

<213> Demequina sediminicola

<220>

<223> белок, гомологичный Cas9

<400> 1

Met Thr Gly Thr Asp Ala Thr Ala His Ser His Thr Pro Tyr Arg Leu

1 5 10 15

Gly Leu Asp Val Gly Thr Gly Ser Leu Gly Trp Ala Val Val Glu Leu

20 25 30

Asp Thr Asp Gly Asn Pro Val Arg Ile Val Arg Thr Gly Ser Arg Ile

35 40 45

Tyr Gly Ser Gly Arg Lys Pro Lys Asp Phe Ser Ser Leu Ala Ala Asp

50 55 60

Arg Arg Ala Ala Arg Gln Met Arg Lys Gln Arg Asp Arg Tyr Leu Gln

65 70 75 80

Arg Arg Thr Arg Leu Met His Glu Leu Val Ala Ala Gly Leu Met Pro

85 90 95

Glu Ala Glu Val Glu Arg Gln Lys Leu Lys Asp Leu Asn Pro Tyr Leu

100 105 110

Leu Arg Ala Arg Gly Val Lys Glu Glu Leu Thr Ala His Glu Leu Gly

115 120 125

Arg Ala Leu Phe His Leu Gln Gln Arg Arg Gly Phe Lys Ser Asn Arg

130 135 140

Lys Thr Asp Arg Lys Asp Asp Asp Arg Ser Ala Met Lys Ser Ala Ile

145 150 155 160

Ala Ser Leu Gln Ser Asp Leu Gly Asp Asp Thr Leu Gly Thr Tyr Met

165 170 175

Trp Lys Arg Ile Gln Asn Gly Glu Ser Val Arg Ser Arg Pro Arg Lys

180 185 190

Val Gly Ser Lys Asn Glu Tyr Asp Phe Tyr Val Asn Arg Ala Met Val

195 200 205

Glu Asp Glu Phe Asn Gln Leu Trp Asp Tyr Gln Ser Gln Ser His Gly

210 215 220

Asp Leu Leu Thr Asp Glu Ala Arg Ile Arg Val His Asp Ala Ile Phe

225 230 235 240

Ser Gln Arg Pro Leu Lys Pro Val Asp Pro Gly Arg Cys Thr Phe Glu

245 250 255

Thr Asp Gln Arg Arg Ala Pro Lys Ala Leu Pro Ser Ser Gln Leu Phe

260 265 270

Arg Ile Tyr Gln Glu Leu Asn Ala Ile Arg Val Ile Asp Pro Phe Ser

275 280 285

Ser Asp Gln Ala Asp Arg Pro Leu Thr Arg Gln Glu Arg Asp Ala Gly

290 295 300

Ala Ser Phe Leu Leu Gly Arg Val Lys Ala Thr Phe Pro Gln Leu Lys

305 310 315 320

Lys Ala Met Phe Gly Pro Thr Lys Leu Gln Leu Ser Leu Glu Tyr Gly

325 330 335

Glu Arg Lys Asn Ile Leu Gly Asp Val Val Gly Ser Glu Leu Arg Lys

340 345 350

Ala Gln His Ile Gly Pro Asp Trp Glu Thr Tyr Asp Leu Ala Thr Gln

355 360 365

Asp Leu Ile Val Thr Ile Leu Leu Glu Ala Asp Thr Asp Asp Glu Val

370 375 380

Ile Glu Arg Leu Gln Ala Glu Ser Ser Leu Ser Leu Asp Gln Val His

385 390 395 400

Gly Ala Leu Glu Ala Pro Leu Pro Asp Asp Tyr Leu Arg Leu Ser His

405 410 415

Arg Ala Ile Gly Lys Ile Leu Pro His Leu Lys Asp Glu Trp Asn Glu

420 425 430

Glu Gly Asn Ala Pro Val Met Tyr Asp Ala Ala Val Arg Ala Ala Gly

435 440 445

Tyr Gln Ser His Ser Glu Phe His Ser Gly Val Leu Glu Asp Thr Leu

450 455 460

Pro Tyr Tyr Gly Lys Val Leu Lys Arg Tyr Thr Gln Glu Val Ser Gly

465 470 475 480

Ser Ser Gln Ala Ala Thr Asn Pro Asp Glu Trp Glu Phe Gly Lys Ile

485 490 495

Ala Asn Pro Thr Val His Ile Gly Leu Asn Gln Ile Arg Thr Val Val

500 505 510

Asn Ser Leu Ile Asp Arg Tyr Gly Leu Pro Thr Gln Ile His Val Glu

515 520 525

Val Ala Arg Asp Leu Gly Gln Ser Ala Glu Gly Arg Arg Glu Ala Ala

530 535 540

Ser Asn Arg Ala Lys Asn Glu Arg Ala Asn Glu Ala Leu Asn Ala Arg

545 550 555 560

Leu Thr Glu Leu Gly Gln Arg Thr Asn Phe Ala Asn Arg Glu Arg Leu

565 570 575

Arg Leu Tyr Asp Glu Ile Ser Val Leu Asn His Arg Cys Val Leu Thr

580 585 590

Gly Ile Pro Ile Glu Met Ser Arg Leu Phe Thr Asn Asp Tyr Gln Val

595 600 605

Asp His Ile Leu Pro Phe Ser Arg Thr Leu Asp Asp Ser Arg Gly Asn

610 615 620

Lys Ile Leu Val His His Thr Ala Asn Gln Phe Lys Gly Ala Arg Ser

625 630 635 640

Pro Phe Glu Ala Tyr Ser Glu Thr Ala Asp Trp Asp His Ile Leu Gln

645 650 655

Arg Ala Ser Asp Ala Phe Gly Ala Thr Ser Pro Lys Phe Lys Arg Phe

660 665 670

Ser Ala Asp Ala Met Asp Arg Tyr Ser Asn Gly Glu Gln Asp Phe Ile

675 680 685

Ala Arg Gln Leu Asn Asp Thr Ser Tyr Leu Ala Arg Val Thr Arg Glu

690 695 700

Tyr Leu Gly Ser Ile Val Asp Pro Asp Arg Ile Leu Ala Thr Pro Gly

705 710 715 720

Arg Leu Thr Ser Leu Leu Arg His His Trp Gly Leu Asn Gly Leu Leu

725 730 735

Ser Asp Ala Ala Glu Lys Asn Arg Ser Asp His Arg His His Ala Ile

740 745 750

Asp Ala Leu Val Val Ala Leu Ser Glu Arg Val Thr Leu Lys Ala Val

755 760 765

Thr Asp Ala Asn Arg Arg Ala Gly Asp Gln Gly Ile Glu Arg Leu Leu

770 775 780

Val Asp Leu Pro Gln Pro Trp Glu Gly Phe Ala Asp His Ala Arg Glu

785 790 795 800

Ser Val Asp Arg Ile Val Val Ser His Lys Pro Asp His Asn Glu Lys

805 810 815

Gly Gln Leu His Glu Glu Thr Ala Tyr Gly Val Leu Glu Gly Pro Asp

820 825 830

Lys Lys Gly Arg Phe Leu Thr Arg Lys Arg Ile Thr Asp Pro Ala Lys

835 840 845

Gly Val Val Gly Ser Trp Glu Gln Pro Lys Trp Arg Asp Val Ile Pro

850 855 860

Leu Tyr Arg Arg Gly Glu Gly Pro Asp Ser Thr Leu Pro Tyr Lys Ala

865 870 875 880

Tyr Ile Gly Gly Ser Asn Tyr Cys Ile Glu Ile Val Arg Thr Ala Lys

885 890 895

Gly Lys Trp Ala Gly Glu Val Val Ser Thr His Thr Ala Asn Thr Ala

900 905 910

Glu Tyr Arg Ala Phe Met Ala Glu Pro Gly Ala Tyr Arg Ala Gln Ser

915 920 925

Tyr Ala Gly Gly Asp Leu Val Met Arg Leu Ile Ala Asn Asp Thr Ile

930 935 940

Ala Ile Glu Val Gly Asp Ala Gly Arg Gln Ile Met Arg Leu Cys Gln

945 950 955 960

Leu Glu Thr Val Gly Ala Met Tyr Phe Ala Asn Val Arg Glu Gly Asn

965 970 975

Val Ala Ala Arg Ser Arg Ala Arg Asp Asn Asp Phe Ser Leu Leu Lys

980 985 990

Lys Ala Ala Ser Thr Leu Gln Pro Leu Lys Ala Arg Arg Val Phe Val

995 1000 1005

Asp Pro Ile Gly Arg Val Phe Asp Pro Asp Phe Lys Glu

1010 1015 1020

<210> 2

<211> 3066

<212> DNA

<213> Demequina sediminicola

<220>

<223> белок, гомологичный Cas9

<400> 2

atgactggca ctgacgccac agcacactcg cacacgccgt accgcctcgg gctcgatgta 60

gggacaggat ctttgggttg ggccgtcgtt gaactcgata ccgacggcaa tcctgtccgc 120

atcgtgcgca ccggctcgcg gatctatggg agcgggcgca aacccaagga cttttcatcg 180

ttagcggccg accggcgtgc cgcacgtcag atgcgcaagc aacgcgaccg ctatcttcaa 240

cgccgcacgc gcctcatgca tgaactggtg gccgccggtc tgatgcccga ggccgaggtg 300

gagcggcaga agctcaagga tctcaacccc tacctgctac gcgctcgtgg ggttaaagag 360

gaactgaccg cccacgaact tggcagggct ctctttcatc tccagcagcg ccgtggcttc 420

aagtcaaatc gcaagacaga ccgcaaggac gacgaccgca gcgcgatgaa gagcgccatc 480

gcatcgctcc aatccgactt gggcgacgac acccttggca cgtacatgtg gaagcggatc 540

cagaacggcg aatctgtgcg gtcccgtccg cgaaaggtcg ggtcaaagaa cgagtacgac 600

ttttacgtga accgcgcgat ggtcgaggat gagttcaatc agttgtggga ctaccaaagc 660

cagtcccacg gcgacctcct cacggacgaa gcccgcatcc gcgttcatga cgccatcttt 720

agccaacgtc cgctcaagcc ggtggacccg gggcgctgca cgttcgaaac agatcagcga 780

cgcgcaccga aggcactccc gagctctcaa ctgttccgca tctaccaaga acttaacgcg 840

atcagagtga tcgatccgtt ctcatcagac caagcagatc gacccctgac gcgtcaggag 900

cgcgatgccg gcgcatcgtt cctcctgggc agggtgaagg ccaccttccc tcaactcaag 960

aaggcgatgt ttgggcccac aaagctccaa ctctcacttg agtacggaga acgcaagaac 1020

atcctgggtg acgtcgtagg aagcgagttg cgcaaagcgc agcacatcgg cccagactgg 1080

gagacgtatg acctcgccac ccaggacctc atcgtgacga tcctgctcga ggcagacact 1140

gacgatgaag tgatcgagcg gcttcaggct gagtcgtcgc tatcgctcga tcaggtccac 1200

ggcgcgcttg aggcaccact cccggacgac tacctacggc tgagccatcg tgcgattggc 1260

aagatcctgc ctcatctcaa ggatgaatgg aatgaagagg gcaatgcacc ggtgatgtat 1320

gacgcggccg tccgtgccgc gggataccaa tcgcactcag agttccacag cggtgttctt 1380

gaagacacgc tcccctatta cgggaaggtg ctgaagcgat acacgcaaga ggtctccggg 1440

agcagccaag ctgctacgaa ccctgacgaa tgggagttcg gcaagatcgc caatccgacc 1500

gtgcacatcg gcctcaatca gatccgcacc gtcgtgaact cactgattga ccgctacggc 1560

ctgcccacac agattcatgt cgaggtagcc cgcgacttgg gccagtcggc tgagggaagg 1620

cgtgaagcag cgtccaaccg tgccaagaat gaacgagcaa acgaagcgct caacgcccgc 1680

ctgaccgaac tgggacaacg caccaacttt gccaatcggg agcggctgcg cctctacgat 1740

gagatctcag tcctcaatca caggtgtgtc ctgacaggca tccccatcga gatgtcgcga 1800

ctgttcacca atgactatca ggttgaccac atcctgccgt tctcccggac cctggacgac 1860

tcgcgcggaa acaagattct ggttcaccac acggccaatc agttcaaggg cgcccggagc 1920

cccttcgagg catactcgga gacggcagac tgggatcaca tccttcaacg cgcaagcgat 1980

gcctttggcg ctacgagccc caagttcaag cgcttttctg ccgacgccat ggacaggtac 2040

tcgaacggcg agcaagactt catcgcccgc caactcaacg acaccagcta cctggcacga 2100

gtgacacgcg agtatctagg gagcatcgtg gatcccgacc ggatcctagc cacaccgggc 2160

agacttactt cgctcttgcg ccaccactgg gggctcaatg gcctgctatc cgatgccgcg 2220

gagaagaacc gctcagatca ccggcaccac gccatcgatg cccttgtcgt tgcactcagt 2280

gagcgagtaa ctctaaaggc cgtcaccgac gccaaccgtc gtgccggtga ccaaggcatc 2340

gaacgcttgc tagtcgacct cccccagccg tgggagggct ttgcggatca tgcccgtgag 2400

tctgttgatc gcattgtggt gtctcacaag ccagatcaca atgagaaagg ccagctccac 2460

gaagagaccg cctatggagt cctggaaggg cccgacaaaa agggcaggtt cctcacccgc 2520

aagcgcatca cggaccctgc caaaggtgtg gtaggcagtt gggagcaacc caagtggcgt 2580

gacgtcattc cgctgtacag gcgcggcgag gggccagact cgacccttcc ctacaaggct 2640

tacattggcg gctccaacta ctgcatcgag atcgtccgaa ctgccaaggg gaaatgggct 2700

ggggaggtag tctccacgca caccgccaac acggccgagt atcgcgcttt catggcagag 2760

ccgggcgcgt atcgcgccca gagttacgcc ggtggtgacc tcgtcatgcg gctcatcgcc 2820

aatgacacca tcgcaatcga agtcggcgat gcgggtcgcc agatcatgag gctgtgccag 2880

ttggagacgg tcggagctat gtacttcgca aatgtgcgtg aaggcaacgt cgcagcacgt 2940

tcacgggctc gagacaacga cttttcgttg ctcaagaagg cggcaagcac acttcagcca 3000

ctcaaggctc ggagagtctt tgttgatccc attggcaggg tttttgaccc tgatttcaag 3060

gagtag 3066

<---

Похожие патенты RU2722933C1

название год авторы номер документа
СРЕДСТВО РАЗРЕЗАНИЯ ДНК НА ОСНОВЕ CAS9 БЕЛКА ИЗ БАКТЕРИИ PASTEURELLA PNEUMOTROPICA 2019
  • Северинов Константин Викторович
  • Шмаков Сергей Анатольевич
  • Артамонова Дарья Николаевна
  • Горянин Игнатий Игоревич
  • Мушарова Ольга Сергеевна
  • Андреева Юлия Валерьевна
  • Зюбко Татьяна Игоревна
  • Фёдорова Яна Витальевна
  • Ходорковский Михаил Алексеевич
  • Побегалов Георгий Евгеньевич
  • Арсениев Анатолий Николаевич
  • Селькова Полина Анатольевна
  • Васильева Александра Андреевна
  • Артамонова Татьяна Олеговна
  • Абрамова Марина Викторовна
RU2722934C1
ПРИМЕНЕНИЕ CAS9 БЕЛКА ИЗ БАКТЕРИИ PASTEURELLA PNEUMOTROPICA ДЛЯ МОДИФИКАЦИИ ГЕНОМНОЙ ДНК В КЛЕТКАХ 2019
  • Северинов Константин Викторович
  • Шмаков Сергей Анатольевич
  • Артамонова Дарья Николаевна
  • Горянин Игнатий Игоревич
  • Мушарова Ольга Сергеевна
  • Андреева Юлия Валерьевна
  • Зюбко Татьяна Игоревна
  • Фёдорова Яна Витальевна
  • Ходорковский Михаил Алексеевич
  • Побегалов Георгий Евгеньевич
  • Арсениев Анатолий Николаевич
  • Селькова Полина Анатольевна
  • Васильева Александра Андреевна
  • Артамонова Татьяна Олеговна
  • Абрамова Марина Викторовна
RU2724470C1
Средство разрезания ДНК на основе Cas9 белка из бактерии Capnocytophaga ochracea 2021
  • Северинов Константин Викторович
  • Васильева Александра Андреевна
  • Селькова Полина Анатольевна
  • Арсениев Анатолий Николаевич
  • Ходорковский Михаил Алексеевич
  • Федорова Яна Витальевна
RU2778156C1
Средство разрезания двунитевой ДНК с помощью Cas12d белка из Katanobacteria и гибридной РНК, полученной путем слияния направляющей CRISPR РНК и scout РНК 2020
  • Северинов Константин Викторович
  • Васильева Александра Андреевна
  • Селькова Полина Анатольевна
  • Арсениев Анатолий Николаевич
  • Федорова Яна Витальевна
  • Ходорковский Михаил Алексеевич
RU2771626C1
СИСТЕМА РЕДАКТИРОВАНИЯ ГЕНОМА CRISPR/CAS9 II ТИПА И ЕЕ ПРИМЕНЕНИЕ 2022
  • Тянь Жуй
  • Хуан Лун
  • Се Хунсянь
RU2794774C1
ШТАММ ESCHERICHIA COLI BL21(DE3)PLYSS/PET15B-HISCPF1 - ПРОДУЦЕНТ РНК-НАПРАВЛЯЕМОЙ ЭНДОНУКЛЕАЗЫ CRISPR/CPF1 2021
  • Васиховская Валерия Александровна
  • Романенко Маргарита Владимировна
  • Нетесов Сергей Викторович
RU2774120C1
КОМПОНЕНТЫ СИСТЕМЫ CRISPR-CAS, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ 2013
  • Чжан, Фэн
  • Бикард, Девид, Оливье
  • Цун, Лэ
  • Кокс, Девид Бенджамин, Туриц
  • Хсю, Патрик
  • Цзян, Вэньянь
  • Линь, Шауйлян
  • Марраффини, Лучано
  • Платт, Рэндол, Джеффри
  • Ран, Фэй
  • Санджана, Невилл, Эспи
RU2796549C2
НОВЫЕ ФЕРМЕНТЫ И СИСТЕМЫ CRISPR 2016
  • Кунин Юджин
  • Чжан Фэн
  • Вольф Юрий И.
  • Шмаков Сергей
  • Северинов Константин
  • Семенова Екатерина
  • Минахин Леонид
  • Макарова Кира С.
  • Конерманн Сильвана
  • Джунг Джулия
  • Гутенберг Джонатан С.
  • Абудайех Омар О.
RU2777988C2
КОНСТРУИРОВАНИЕ СИСТЕМ, СПОСОБЫ И ОПТИМИЗИРОВАННЫЕ НАПРАВЛЯЮЩИЕ КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ 2013
  • Чжан, Фэн
  • Цун, Лэ
  • Хсю, Патрик
  • Ран, Фэй
RU2796017C2
НОВЫЕ ФЕРМЕНТЫ CRISPR И СИСТЕМЫ 2016
  • Северинов Константин
  • Чжан Фэн
  • Вольф Юрий И.
  • Шмаков Сергей
  • Семенова Екатерина
  • Минахин Леонид
  • Макарова Кира С.
  • Кунин Юджин
  • Конерманн Сильвана
  • Джунг Джулия
  • Гутенберг Джонатан С.
  • Абудайех Омар О.
  • Ландер Эрик С.
RU2771826C2

Иллюстрации к изобретению RU 2 722 933 C1

Реферат патента 2020 года СРЕДСТВО РАЗРЕЗАНИЯ ДНК НА ОСНОВЕ CAS9 БЕЛКА ИЗ БАКТЕРИИ DEMEQUINA SEDIMINICOLA

Изобретение относится к биотехнологии и касасется применения белка, содержащего аминокислотную последовательность SEQ ID NO: 1 или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5'-NN/GNNACN-3' в указанной молекуле ДНК. Изобретение позволяет достигнуть упрощения редактирования генома биотехнологически значимой бактерии. 2 н. и 3 з.п. ф-лы, 8 ил., 2 табл., 3 пр.

Формула изобретения RU 2 722 933 C1

1. Применение белка, содержащего аминокислотную последовательность SEQ ID NO: 1 или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5'-NA/GNNACN-3' в указанной молекуле ДНК.

2. Применение белка по п. 1, характеризующееся тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре 37°С .

3. Применение белка по п. 1, где белок содержит аминокислотную последовательность SEQ ID NO: 1.

4. Способ образования двунитевого разрыва в последовательности геномной ДНК одноклеточного или многоклеточного организма, непосредственно примыкающей к последовательности 5'-NA/GNNACN-3', включающий введение в по меньшей мере одну клетку этого организма эффективного количества: а) белка, содержащего аминокислотную последовательность SEQ ID NO: 1, либо нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1, и б) направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5'-NA/GNNACN-3' и взаимодействующей с указанным белком после образования дуплекса, либо последовательности ДНК, кодирующей указанную направляющую РНК;

при этом взаимодействие указанного белка с указанной направляющей РНК и нуклеотидной последовательностью 5'-NA/GNNACN-3' приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5'-NA/GNNACN-3'.

5. Способ по п. 4, дополнительно включающий введение экзогенной последовательности ДНК одновременно с направляющей РНК.

Документы, цитированные в отчете о поиске Патент 2020 года RU2722933C1

ОПОСРЕДОВАННОЕ НУКЛЕАЗОЙ НАЦЕЛИВАНИЕ С БОЛЬШИМИ НАЦЕЛИВАЮЩИМИ ВЕКТОРАМИ 2013
  • Френдивей Дэвид
  • Ауэрбах Войтек
  • Валензуэла Дэвид М.
  • Янкопулос Джродж Д.
  • Лай Ка-Ман Венус
RU2645475C2
WO 2014093661 A2, 19.06.2014
RU 2015143201 A, 20.04.2017
DELTCHEVA E
et al
КОЛЕНЧАТО-РЫЧАЖНЫЙ ПРЕСС ДЛЯ ЦЕМЕНТНЫХ ЧЕРЕПИЦ, ПЛИТОК И Т.П. С МНОГОКРАТНЫМ НАЖАТИЕМ НА ФОРМУЕМУЮ МАССУ 1922
  • Смирнов М.Н.
SU471A1

RU 2 722 933 C1

Авторы

Северинов Константин Викторович

Шмаков Сергей Анатольевич

Артамонова Дарья Николаевна

Горянин Игнатий Игоревич

Мушарова Ольга Сергеевна

Андреева Юлия Валерьевна

Зюбко Татьяна Игоревна

Фёдорова Яна Витальевна

Ходорковский Михаил Алексеевич

Побегалов Георгий Евгеньевич

Арсениев Анатолий Николаевич

Селькова Полина Анатольевна

Васильева Александра Андреевна

Артамонова Татьяна Олеговна

Абрамова Марина Викторовна

Даты

2020-06-05Публикация

2019-06-11Подача