Родственные заявки и включение при помощи ссылки
Данная заявка заявляет приоритет предварительной заявки на патент США 61/836127, озаглавленной "КОНСТРУИРОВАНИЕ СИСТЕМ, СПОСОБЫ И ОПТИМИЗИРОВАННЫЕ КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED COMPOSITIONS FOR SEQUENCE MANIPULATION), поданной 17 июня 2013 г. Данная заявка также заявляет приоритет предварительных заявок на патент США 61/758468; 61/769046; 61/802174; 61/806375; 61/814263; 61/819803 и 61/828130, каждая из которых озаглавлена "КОНСТРУИРОВАНИЕ И ОПТИМИЗАЦИЯ СИСТЕМ, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION), поданных 30 января 2013 г.; 25 февраля 2013 г.; 15 марта 2013 г.; 28 марта 2013 г.; 20 апреля 2013 г.; 6 мая 2013 г. и 28 мая 2013 г., соответственно. Также заявляется приоритет предварительных заявок на патент США 61/736527 и 61/748427, обе из которых озаглавлены "СИСТЕМЫ, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION), поданных 12 декабря 2012 г. и 2 января 2013 г., соответственно. Также заявляется приоритет предварительных заявок на патент США 61/791409 и 61/835931, обе из которых озаглавлены BI-2011/008/44790.02.2003 и BI-2011/008/44790.03.2003, поданных 15 марта 2013 г. и 17 июня 2013 г., соответственно.
Также делается ссылка на предварительные заявки на патент США 61/835936, 61/836101, 61/836080, 61/836123 и 61/835973, каждая из которых подана 17 июня 2013 г.
Вышеприведенные заявки и все документы, цитируемые в них или во время их рассмотрения ("цитируемые документы заявки"), и все документы, цитируемые или упомянутые в цитируемых документах заявки, и все документы, цитируемые или упомянутые в данном документе ("документы, цитируемые в данном документе"), и все документы, цитируемые или упомянутые в документах, цитируемых в данном документе, совместно с любыми инструкциями изготовителя, описаниями, характеристиками продукта и технологическими картами для любых продуктов, упомянутых в данном документе или в любом документе, включенном с помощью ссылки в данный документ, таким образом, включены в данный документ с помощью ссылки и могут быть использованы в практическом осуществлении настоящего изобретения. Более конкретно, все документы, на которые ссылаются, включены при помощи ссылки в такой же мере, как если бы конкретно и отдельно было указано, что каждый отдельный документ включен при помощи ссылки.
Область техники
Настоящее изобретение в целом относится к системам, способам и композициям, применяемым для контроля экспрессии генов, включающего целенаправленное воздействие на последовательность, такое как внесение изменений в геном или редактирование гена, при котором можно использовать векторные системы, близкие к коротким палиндромным повторам, регулярно расположенным группами, (CRISPR) и их компонентам.
Утверждение касательно финансируемого из федерального бюджета исследования Настоящее изобретение было разработано при правительственной поддержке, выданной Национальными институтами здравоохранения, NIH Pioneer Award DP1MH100706. Правительство обладает определенными правами на настоящее изобретение.
Предпосылки изобретения
Недавние достижения в технологиях секвенирования генома и способах анализа значительно ускорили возможность каталогизации и картирования генетических факторов, ассоциированных с широким разнообразием биологических функций и заболеваний. Технологии точного целенаправленного воздействия на геном необходимы для обеспечения систематичного обратного конструирования казуальных генетических изменений путем обеспечения возможности селективного внесения изменений в отдельные генетические элементы, а также для продвижения применений в области синтетической биологии, биотехнологии и медицины. Несмотря на то, что технологии редактирования генома, такие как конструктор доменов "цинковые пальцы", подобные транскрипционным активаторам эффекторы (TALE) или хоминг мегануклеазы, доступны для осуществления внесений изменений в целевой геном, все еще существует необходимость в новых технологиях конструирования генома, которые являются доступными, простыми в осуществлении, масштабируемыми и характеризуются возможностью целенаправленного воздействия на несколько положений в эукариотическом геноме.
Краткое описание изобретения
Существует актуальная необходимость в альтернативных и функциональных системах и технологиях для целенаправленного воздействия на последовательность с широким спектром применений. Настоящее изобретение удовлетворяет этой необходимости и предусматривает связанные с этим преимущества. CRISPR/Cas или система CRISPR-Cas (оба выражения используют взаимозаменяемо по всей данной заявке) не предусматривает получение индивидуализированных белков для целенаправленного воздействия на конкретные последовательности, но скорее один фермент Cas может быть запрограммирован короткой молекулой РНК для узнавания специфичной ДНК-мишени, другими словами, фермент Cas может связываться со специфичной ДНК-мишенью при помощи указанной короткой молекулы РНК. Добавление системы CRISPR-Cas к спектру технологий секвенирования генома и способов анализа может значительно упростить методику и ускорить возможность каталогизации и картирования генетических факторов, ассоциированных с широким разнообразием биологических функций и заболеваний. Для того чтобы эффективно использовать систему CRISPR-Cas для редактирования генома без вредного действия, важно понимать аспекты конструирования и оптимизации этих средств для конструирования генома, которые являются аспектами заявленного изобретения.
В одном аспекте настоящее изобретение предусматривает векторную систему, содержащую один или несколько векторов. В некоторых вариантах осуществления система содержит (а) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в клетке, к примеру, эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации; где компоненты (а) и (b) находятся в одном и том же или в разных векторах системы. В некоторых вариантах осуществления компонент (а) дополнительно содержит tracr-последовательность ниже парной tracr-последовательности под контролем первого регуляторного элемента. В некоторых вариантах осуществления компонент (а) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления система содержит tracr-последовательность под контролем третьего регуляторного элемента, такого как промотор полимеразы III. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. В некоторых вариантах осуществления комплекс CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного комплекса CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. Не желая быть связанными теорией, полагают, что последовательность ядерной локализации не является необходимой для активности комплекса CRISPR у эукариот, но что включение таких последовательностей повышает активность системы, особенно в отношении нацеливания на молекулы нуклеиновых кислот в ядре. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления направляющая последовательность составляет по меньшей мере 15, 16, 17, 18, 19, 20, 25 нуклеотидов, или от 10 до 30, или от 15 до 25, или от 15 до 20 нуклеотидов в длину. В целом и по всему данному описанию выражение "вектор" относится к молекуле нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она была связана. Векторы включают, без ограничения, молекулы нуклеиновых кислот, которые являются одноцепочечными, двухцепочечными или частично двухцепочечными; молекулы нуклеиновых кислот, которые содержат один или несколько свободных концов, не содержат свободных концов (к примеру, кольцевые); молекулы нуклеиновых кислот, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известных в уровне техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухцепочечной ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, при помощи стандартных технологий молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (к примеру, ретровирусы, ретровирусы с дефективной системой репликации, аденовирусы, аденовирусы с дефективной системой репликации и аденоассоциированные вирусы). Вирусные векторы также включают полинуклеотиды, переносимые вирусами для трансфекции клетки-хозяина. Определенные векторы способны к саморегулируемой репликации в клетке-хозяине, в которую они введены (к примеру, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (к примеру, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку- хозяина и, таким образом, реплицируются наряду с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе называют "векторами экспрессии". Общепринятые пригодные в технологиях рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.
Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту согласно настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается использовать для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии выражение "функционально связанный" предназначено означать, что представляющая интерес нуклеотидная последовательность связана с регуляторным(и) элементом(ами) таким образом, при котором обеспечивается экспрессия нуклеотидной последовательности (к примеру, в in vitro системе транскрипции/трансляции или в клетке-хозяине, когда вектор вводят в клетку-хозяина).
Выражение "регуляторный элемент" предназначено включать промоторы, энхансеры, участки внутренней посадки рибосомы (IRES) и другие контролирующие экспрессию элементы (к примеру, сигналы терминации транскрипции, такие как сигналы полиаденилирования и поли-U-последовательности). Такие регуляторные элементы описаны, например, в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Регуляторные элементы включают такие, которые управляют конститутивной экспрессией нуклеотидной последовательности во многих типах клеток-хозяев, и такие, которые управляют экспрессией нуклеотидной последовательности только в определенных клетках-хозяевах (к примеру, тканеспецифичные регуляторные последовательности). Тканеспецифичный промотор может управлять экспрессией преимущественно в представляющей интерес целевой ткани, такой как мышца, нейрон, кость, кожа, кровь, конкретных органах (к примеру, печени, поджелудочной железе) или определенных типах клеток (к примеру, лимфоцитах). Регуляторные элементы также могут управлять экспрессией зависимым от времени образом, как, например, зависимым от клеточного цикла или зависимым от стадии развития образом, который может быть или может не быть также тканеспецифичным или специфичным к типу клеток. В некоторых вариантах осуществления вектор содержит один или несколько промоторов pol III (к примеру, 1, 2, 3, 4, 5 или более промоторов pol III), один или несколько промоторов pol II (к примеру, 1, 2, 3, 4, 5 или более промоторов pol II), один или несколько промоторов pol I (к примеру, 1, 2, 3, 4, 5 или более промоторов pol I) или их комбинации. Примеры промоторов pol III включают без ограничения промоторы U6 и H1. Примеры промоторов pol II включают без ограничения ретровирусный промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV), промотор цитомегаловируса (CMV) (необязательно с энхансером CMV) [см., например, Boshart et al, Cell, 41: 521-530 (1985)], промотор SV40, промотор дигидрофолатредуктазы, промотор β-актина, промотор глицерофосыаткиназы (PGK) и промотор EF1α. Также выражением "регуляторный элемент" охвачены энхансерные элементы, такие как WPRE; энхансеры CMV; сегмент R-U5' в LTR HTLV-I (Mol. Cell. Biol., Vol.8(1), p.466-472, 1988); энхансер SV40; и интронная последовательность между экзонами 2 и 3 β-глобина кролика (Proc. Natl. Acad. Sci. USA., Vol.78(3), p.1527-31, 1981). Специалистам в данной области будет понятно, что структура вектора экспрессии может зависеть от таких факторов, как выбор клетки хозяина, подлежащей трансформации, желательный уровень экспрессии и т.п. Вектор можно вводить в клетки-хозяева с получением, таким образом, транскриптов, белков или пептидов, в том числе слитых белков или пептидов, кодируемых нуклеиновыми кислотами, которые описаны в данном документе (к примеру, транскриптов коротких палиндромных повторов, регулярно расположенных группами (CRISPR), белков, ферментов, их мутантных форм, их слитых белков и т.п.).
Преимущественные векторы включают лентивирусы и аденоассоциированные вирусы, и типы таких векторов также могут быть выбраны для целенаправленного воздействия на определенные типы клеток.
В одном аспекте настоящее изобретение предусматривает вектор, содержащий регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации. В некоторых вариантах осуществления указанный регуляторный элемент управляет транскрипцией фермента CRISPR в эукариотической клетке, так что указанный фермент CRISPR накапливается в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК.
В одном аспекте настоящее изобретение предусматривает фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления у фермента CRISPR отсутствует способность расщеплять одну или несколько нитей целевой последовательности, с которой он связывается.
В одном аспекте настоящее изобретение предусматривает эукариотическую клетку-хозяина, содержащую (а) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и/или (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления клетка-хозяин содержит компоненты (а) и (b). В некоторых вариантах осуществления компонент (а), компонент (b) или компоненты (а) и (b) стабильно интегрируются в геном эукариотической клетки-хозяина. В некоторых вариантах осуществления компонент (а) дополнительно содержит tracr-последовательность ниже парной tracr-последовательности под контролем первого регуляторного элемента. В некоторых вариантах осуществления компонент (а) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления эукариотическая клетка-хозяин дополнительно содержит третий регуляторный элемент, такой как промотор полимеразы III, функционально связанный с указанной tracr- последовательностью. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. В некоторых вариантах осуществления фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления направляющая последовательность составляет по меньшей мере 15, 16, 17, 18, 19, 20, 25 нуклеотидов, или от 10 до 30, или от 15 до 25, или от 15 до 20 нуклеотидов в длину. В одном аспекте настоящее изобретение предусматривает отличный от человека эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина согласно любому из описанных вариантов осуществления. В других аспектах настоящее изобретение предусматривает эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина согласно любому из описанных вариантов осуществления. Организм в некоторых вариантах осуществления данных аспектов может быть животным, например, млекопитающим. Также организмом может быть членистоногое, как, например, насекомое. Организмом также может быть растение. Кроме того, организмом может быть гриб.
В одном аспекте настоящее изобретение предусматривает набор, содержащий один или несколько компонентов, описанных в данном документе. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (а) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и/или (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления набор содержит компоненты (а) и (b), находящиеся в одном и том же или в разных векторах системы. В некоторых вариантах осуществления компонент (а) дополнительно содержит tracr-последовательность ниже парной tracr-последовательности под контролем первого регуляторного элемента. В некоторых вариантах осуществления компонент (а) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления система дополнительно содержит третий регуляторный элемент, такой как промотор полимеразы III, функционально связанный с указанной tracr-последовательностью. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. В некоторых вариантах осуществления фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления направляющая последовательность составляет по меньшей мере 15, 16, 17, 18, 19, 20, 25 нуклеотидов, или от 10 до 30, или от 15 до 25, или от 15 до 20 нуклеотидов в длину.
В одном аспекте настоящее изобретение предусматривает способ модификации целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида с модификацией, таким образом, целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. В некоторых вариантах осуществления указанное расщепление включает расщепление одной или двух нитей в определенной точке целевой последовательности указанным ферментом CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида при помощи гомологичной рекомбинации с экзогенным матричным полинуклеотидом, где указанная репарация приводит к мутации, включающей вставку, делецию или замену одного или нескольких нуклеотидов указанного целевого полинуклеотида. В некоторых вариантах осуществления указанная мутация приводит к одной или нескольким аминокислотным заменам в белке, экспрессируемом с гена, содержащего целевую последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности. В некоторых вариантах осуществления указанные векторы доставляют в эукариотическую клетку в субъекте. В некоторых вариантах осуществления указанная модификация имеет место в указанной эукариотической клетке в клеточной культуре. В некоторых вариантах осуществления способ дополнительно включает выделение указанной эукариотической клетки из субъекта перед указанной модификацией. В некоторых вариантах осуществления способ дополнительно включает возвращение указанной эукариотической клетки и/или клеток, полученных из субъекта, указанному субъекту.
В одном аспекте настоящее изобретение предусматривает способ модификации экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности.
В одном аспекте настоящее изобретение предусматривает способ получения модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, является любым геном, ассоциированным с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (а) введение одного или нескольких векторов в эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности; и (b) обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в указанном гене, ответственном за развитие заболевания, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в целевом полинуклеотиде, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью, таким образом, получая модельную эукариотическую клетку, содержащую мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления указанное расщепление включает расщепление одной или двух нитей в определенной точке целевой последовательности указанным ферментом CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида при помощи гомологичной рекомбинации с экзогенным матричным полинуклеотидом, где указанная репарация приводит к мутации, включающей вставку, делецию или замену одного или нескольких нуклеотидов указанного целевого полинуклеотида. В некоторых вариантах осуществления указанная мутация приводит к одной или нескольким аминокислотным заменам при экспрессии белка с гена, содержащего целевую последовательность.
В одном аспекте настоящее изобретение предусматривает способ получения биологически активного средства, которое модулирует процесс передачи сигнала в клетке, ассоциированный с геном, ответственным за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, является любым геном, ассоциированным с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (а) приведение тестового соединения в контакт с модельной клеткой по любому одному из описанных вариантов осуществления и (b) обнаружение изменения при считывании, которое свидетельствует об уменьшении или усилении процесса передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением, таким образом, указанного биологически активного средства, которое модулирует указанный процесс передачи сигнала в клетке, ассоциированный с указанным геном, ответственным за развитие заболевания.
В одном аспекте настоящее изобретение предусматривает рекомбинантный полинуклеотид, содержащий направляющую последовательность выше парной tracr- последовательности, где направляющая последовательность при экспрессии управляет специфичным к последовательности связыванием комплекса CRISPR с соответствующей целевой последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевая последовательность является вирусной последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевая последовательность является протоонкогеном или онкогеном.
В одном аспекте настоящее изобретение предусматривает способ отбора одной или нескольких прокариотических клеток путем введения одной или нескольких мутаций в ген в одной или нескольких прокариотических клетках, при этом способ включает введение одного или нескольких векторов в прокариотическую(ие) клетку(и), где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, tracr-последовательности и матрицы редактирования; где матрица редактирования содержит одну или несколько мутаций, которые прекращают расщепление фермента CRISPR; обеспечение гомологичной рекомбинации матрицы редактирования с целевым полинуклеотидом в отбираемой(ых) клетке(ах); обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в указанном гене, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в целевом полинуклеотиде, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью, где связывание комплекса CRISPR с целевым полинуклеотидом индуцирует гибель клеток, с обеспечением тем самым отбора одной или нескольких прокариотических клеток, в которые были введены одна или несколько мутаций. В предпочтительном варианте осуществления фермент CRISPR представляет собой Cas9. В другом аспекте настоящего изобретения отбираемая клетка может быть эукариотической клеткой. Аспекты настоящего изобретения предусматривают отбор конкретных клеток без необходимости наличия маркера отбора или двухстадийного способа, который может включать систему негативного отбора.
В некоторых аспектах настоящее изобретение предусматривает не встречающуюся в природе или сконструированную композицию, содержащую полинуклеотидную последовательность химерной РНК (chiRNA) системы CRISPR-CAS, где полинуклеотидная последовательность содержит (а) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке, (b) парную tracr-последовательность и (с) tracr-последовательность, где (а), (b) и (с) расположены в 5'-3' ориентации, где при транскрипции парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью,
или
ферментную систему CRISPR, где система кодируется векторной системой, содержащей один или несколько векторов, которые содержат I. первый регуляторный элемент, функционально связанный с полинуклеотидной последовательностью химерной РНК (chiRNA) системы CRISPR-CAS, где полинуклеотидная последовательность содержит (а) одну или несколько направляющих последовательностей, способных гибридизироваться с одной или несколькими целевыми последовательностями в эукариотической клетке, (b) парную tracr-последовательность и (с) одну или несколько tracr-последовательностей, и II. второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей фермент CRISPR, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации, где (а), (b) и (с) расположены в 5'-3' ориентации, где компоненты I и II находятся в одном и том же или в разных векторах системы, где при транскрипции парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью, или мультиплексную ферментную систему CRISPR, где система кодируется векторной системой, содержащей один или несколько векторов, которые содержат I. первый регуляторный элемент, функционально связанный с (а) одним или несколькими направляющими последовательностями, способными гибридизироваться с целевой последовательностью в клетке, и (b) по меньшей мере одной или несколькими парными tracr-последовательностями, II. второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей фермент CRISPR, и III. третий регуляторный элемент, функционально связанный с tracr-последовательностью, где компоненты I, II и III находятся в одном и том же или в разных векторах системы, где при транскрипции парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью, и где в мультиплексной системе используется множество направляющих последовательностей и одна tracr-последовательность; и где одна или несколько из направляющих, tracr- и парных tracr-последовательностей модифицируются с повышением стабильности.
В аспектах настоящего изобретения модификация включает сконструированную вторичную структуру. Например, модификация может включать уменьшение участка гибридизации между парной tracr-последовательностью и tracr-последовательностью. Например, модификация также может включать слияние парной tracr-последовательности и tracr-последовательности посредством искусственной петли. Модификация может включать tracr-последовательность с длиной от 40 до 120 п.о. В вариантах осуществления настоящего изобретения tracr-последовательность составляет от 40 п.о. до полной длины tracr. В определенных вариантах осуществления длина tracRNA включает по меньшей мере нуклеотиды 1-67, а в некоторых вариантах осуществления по меньшей мере нуклеотиды 1-85 tracRNA дикого типа. В некоторых вариантах осуществления можно использовать по меньшей мере нуклеотиды, соответствующие нуклеотидам 1-67 или 1-85 tracRNA Cas9 S. pyogenes дикого типа. В тех случаях, когда в системе CRISPR используются ферменты, отличные от Cas9 или отличные от SpCas9, тогда в релевантной tracRNA дикого типа могут присутствовать соответствующие нуклеотиды. В некоторых вариантах осуществления длина tracRNA включает не более чем нуклеотиды 1-67 или 1-85 tracRNA дикого типа. Модификация может включать оптимизацию последовательности. В определенных аспектах оптимизация последовательности может включать снижение частоты встречаемости полиТ-последовательностей в tracr- и/или парной tracr-последовательности. Оптимизацию последовательности можно совмещать с уменьшением участка гибридизации между парной tracr-последовательностью и tracr- последовательностью; например, tracr-последовательностью уменьшенной длины.
В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает уменьшение полиТ- последовательностей в tracr- и/или парной tracr-последовательности. В некоторых аспектах настоящего изобретения один или несколько Т, присутствующих в полиТ-последовательности соответствующей последовательности дикого типа (то есть, фрагмент из более 3, 4, 5, 6 или более смежных Т-оснований; в некоторых вариантах осуществления фрагмент из не более 10, 9, 8, 7, 6 смежных Т-оснований), могут быть заменены на отличный от Т нуклеотид, к примеру, А, так что цепочка распадается на меньшие фрагменты из Т, при этом каждый фрагмент имеет 4 или менее 4 (например, 3 или 2) смежных Т. Основания, отличные от А можно использовать для замены, например, С или G, или не встречающиеся в природе нуклеотиды, или модифицированные нуклеотиды. Если цепочка из Т участвует в образовании "шпильки" (или структуры по типу "петля-на-стебле"), тогда предпочтительно, чтобы комплементарное основание для отличного от Т основания было изменено на комплементарное отличному от Т нуклеотиду. Например, если отличным от Т основанием является А, тогда его комплементарное основание может быть изменено на Т, к примеру, для сохранения или содействия сохранению вторичной структуры. К примеру, 5'-ТТТТТ может быть изменено с получением 5'-ТТТАТ, а комплементарная 5'-ААААА может быть изменена на 5'- АТААА.
В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает добавление терминаторной полиТ-последовательности. В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает добавление терминаторной полиТ-последовательности в tracr- и/или парные tracr-последовательности. В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает добавление терминаторной полиТ-последовательности в направляющую последовательность. Терминаторная полиТ-последовательность может содержать 5 смежных Т-оснований или более 5.
В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает изменение петель и/или "шпилек". В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает обеспечение минимум двух "шпилек" в направляющей последовательности. В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает обеспечение "шпильки", образованной при помощи комплементации между tracr- и парной tracr-последовательностью (прямой повтор). В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает обеспечение одной или нескольких дополнительных "шпилек" на 3'-конце последовательности tracrRNA или по направлению к нему. Например, "шпилька" может быть образована путем обеспечения самокомплементарных последовательностей в последовательности tracRNA, соединенных петлей так, что "шпилька" образуется при самосворачивании. В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает обеспечение дополнительных "шпилек", добавленных на 3' направляющей последовательности. В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает удлинение 5'-конца направляющей последовательности. В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает обеспечение одной или нескольких "шпилек" на 5'-конце направляющей последовательности. В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает введение последовательности (5'-AGGACGAAGTCCTAA) на 5'-конце направляющей последовательности. Другие последовательности, подходящие для образования "шпилек", известны специалисту в данной области, и их можно использовать в определенных аспектах настоящего изобретения. В некоторых аспектах настоящего изобретения предусмотрено по меньшей мере 2, 3, 4, 5 или более дополнительных "шпилек". В некоторых аспектах настоящего изобретения предусмотрено не более 10, 9, 8, 7, 6 дополнительных "шпилек". В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает две "шпильки". В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает три "шпильки". В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает самое большее пять "шпилек".
В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает обеспечение образования перекрестных связей или обеспечение одного или нескольких модифицированных нуклеотидов в полинуклеотидной последовательности. Модифицированные нуклеотиды и/или образование перекрестных связей могут предусматриваться в любой или во всех из tracr-, парных tracr- и/или направляющих последовательностей, и/или кодирующей фермент последовательности, и/или в векторных последовательностях. Модификации могут включать включение по меньшей мере одного не встречающегося в природе нуклеотида или модифицированного нуклеотида, или их аналогов. Модифицированные нуклеотиды могут быть модифицированы по фрагменту рибозы, фосфата и/или основания. Модифицированные нуклеотиды могут включать 2'-O-метил-аналоги, 2'-дезокси-аналоги или 2'-фтор-аналоги. Остов нуклеиновой кислоты можно модифицировать, например, можно использовать фосфотиоатный остов. Также возможно использование закрытых нуклеиновых кислот (LNA) или мостиковых нуклеиновых кислот (BNA). Дополнительные примеры модифицированных оснований включают без ограничения 2-аминопурин, 5-бромуридин, псевдоуридин, инозин, 7-метилгуанозин.
Будет понятно, что любая или все из вышеперечисленных модификаций могут быть предусмотрены в отдельности или в комбинации в данной системе CRISPR-Cas или ферментной системе CRISPR. Такая система может включать одну, две, три, четыре, пять или более указанных модификаций.
В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где фермент CRISPR является ферментом системы CRISPR II типа, к примеру, ферментом Cas9. В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где фермент CRISPR состоит менее чем из одной тысячи аминокислот, или менее чем из четырех тысяч аминокислот. В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где фермент Cas9 представляет собой StCas9 или StlCas9, или фермент Cas9 является ферментом Cas9 из организма, выбранного из группы, состоящей из рода Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium или Corynebacter. В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где фермент CRISPR является нуклеазой, управляющей расщеплением обеих нитей в определенной точке целевой последовательности.
В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где первый регуляторный элемент является промотором полимеразы III. В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где второй регуляторный элемент является промотором полимеразы II.
В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где направляющая последовательность содержит по меньшей мере пятнадцать нуклеотидов.
В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где модификация включает оптимизированную tracr- последовательность, и/или оптимизированную направляющую последовательность РНК, и/или совместно свернутую структуру tracr-последовательности и/или парной(ых) tracr- последовательности(ей), и/или стабилизирующие вторичные структуры tracr- последовательности, и/или tracr-последовательности с уменьшенным участком спаривания оснований, и/или tracr-последовательности, слитой с РНК-элементами; и/или в мультиплексной системе находятся две РНК, содержащие tracer и содержащие множество гидов, или одна РНК, содержащая множество химерных элементов.
В аспектах настоящего изобретения архитектура химерной РНК дополнительно оптимизирована в соответствии с результатами исследований мутационного процесса. В химерной РНК с двумя или более "шпильками" мутации в проксимальном прямом повторе для стабилизации "шпильки" могут привести к разрушению активности комплекса CRISPR. Мутации в дистальном прямом повторе для укорачивания или стабилизации "шпильки" могут не производить никакого воздействия на активность комплекса CRISPR. Рандомизация последовательности в петлевом участке между проксимальным и дистальным повторами может значительно снизить активность комплекса CRISPR. Замены одной пары оснований или рандомизация последовательности в линкерном участке между "шпильками" может привести к полной потере активности комплекса CRISPR. Стабилизация "шпильки" дистальных "шпилек", которые следуют за первой "шпилькой" после направляющей последовательности, может привести к сохранению или улучшению активности комплекса CRISPR. Соответственно, в предпочтительных вариантах осуществления настоящего изобретения архитектура химерной РНК может быть дополнительно оптимизирована путем получения меньшей химерной РНК, которая может иметь практическую значимость в отношении возможностей доставки для терапевтических целей и других применений, и этого можно достичь путем изменения дистального прямого повтора для того, чтобы укоротить или стабилизировать "шпильку". В дополнительных предпочтительных вариантах осуществления настоящего изобретения архитектура химерной РНК может быть дополнительно оптимизирована путем стабилизации одной или нескольких дистальных "шпилек". Стабилизация "шпилек" может включать модификацию последовательностей, подходящих для образования "шпилек". В некоторых аспектах настоящего изобретения предусмотрено по меньшей мере 2, 3, 4, 5 или более дополнительных "шпилек". В некоторых аспектах настоящего изобретения предусмотрено не более 10, 9, 8, 7, 6 дополнительных "шпилек". В некоторых аспектах настоящего изобретения стабилизацией может быть образование перекрестных связей и другие модификации. Модификации могут включать включение по меньшей мере одного не встречающегося в природе нуклеотида или модифицированного нуклеотида, или их аналогов. Модифицированные нуклеотиды могут быть модифицированы по фрагменту рибозы, фосфата и/или основания. Модифицированные нуклеотиды могут включать 2'-O-метил-аналоги, 2'-дезокси-аналоги или 2'-фтор-аналоги. Остов нуклеиновой кислоты можно модифицировать, например, можно использовать фосфотиоатный остов. Также возможно использование закрытых нуклеиновых кислот (LNA) или мостиковых нуклеиновых кислот (BNA). Дополнительные примеры модифицированных оснований включают без ограничения 2-аминопурин, 5-бромуридин, псевдоуридин, инозин, 7-метилгуанозин.
В одном аспекте настоящее изобретение предусматривает систему CRISPR-Cas или ферментную систему CRISPR, где фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке.
Соответственно, в некоторых аспектах настоящего изобретения длина tracRNA, необходимая для конструкции согласно настоящему изобретению, к примеру, химерной конструкции, необязательно должна быть фиксированной, и в некоторых аспектах настоящего изобретения она может составлять от 40 до 120 п.о., а в некоторых аспектах настоящего изобретения может составлять до полной длины tracr, к примеру, в некоторых аспектах настоящего изобретения, до 3'-конца tracr, которая прерывается сигналом терминации транскрипции в бактериальном геноме. В определенных вариантах осуществления длина tracRNA включает по меньшей мере нуклеотиды 1-67, а в некоторых вариантах осуществления по меньшей мере нуклеотиды 1-85 tracRNA дикого типа. В некоторых вариантах осуществления можно использовать по меньшей мере нуклеотиды, соответствующие нуклеотидам 1-67 или 1-85 tracRNA Cas9 S. pyogenes дикого типа. В тех случаях, когда в системе CRISPR используются ферменты, отличные от Cas9 или отличные от SpCas9, тогда в релевантной tracRNA дикого типа могут присутствовать соответствующие нуклеотиды. В некоторых вариантах осуществления длина tracRNA включает не более чем нуклеотиды 1-67 или 1-85 tracRNA дикого типа. В отношении оптимизации последовательности (к примеру, уменьшения полиТ-последовательностей), к примеру, касательно цепочек из Т, внутренних по отношению к парной tracr (прямой повтор) или tracrRNA, в некоторых аспектах настоящего изобретения один или несколько Т, присутствующих в полиТ-последовательности соответствующей последовательности дикого типа (то есть фрагмент из более 3, 4, 5, 6 или более смежных Т-оснований; в некоторых вариантах осуществления фрагмент из не более 10, 9, 8, 7, 6 смежных Т-оснований), могут быть заменены на отличный от Т нуклеотид, к примеру, А, так что цепочка распадается на меньшие фрагменты из Т, при этом каждый фрагмент имеет 4 или менее 4 (например, 3 или 2) смежных Т. Если цепочка из Т участвует в образовании "шпильки" (или структуры по типу "петля-на-стебле"), тогда предпочтительно, чтобы комплементарное основание для отличного от Т основания было изменено на комплементарное отличному от Т нуклеотиду. Например, если отличным от Т основанием является А, тогда его комплементарное основание может быть изменено на Т, к примеру, для сохранения или содействия сохранению вторичной структуры. К примеру, 5'-ТТТТТ может быть изменено с получением 5'-ТТТАТ, а комплементарная 5'-ААААА может быть изменена на 5'-ATAAA. В отношении присутствия терминаторных полиТ-последовательностей в транскрипте tracr + парная tracr, к примеру, поли-Т-терминатора (ТТТТТ или больше), в некоторых аспектах настоящего изобретения предпочтительно, чтобы таковой был добавлен к концу транскрипта, будь то в форме с двумя РНК (tracr и парной tracr) или с одной направляющей РНК. Касательно петель и "шпилек" в транскриптах tracr и парной tracr, в некоторых аспектах настоящего изобретения предпочтительно, чтобы минимум две "шпильки" присутствовали в химерной направляющей РНК. Первая "шпилька" может быть "шпилькой", образованной при помощи комплементации между tracr-последовательностью и парной tracr-последовательностью (прямой повтор). Вторая "шпилька" может быть на 3'-конце последовательности tracrRNA, и это может обеспечивать вторичную структуру для взаимодействия с Cas9. Дополнительные "шпильки" могут быть добавлены на 3' направляющей РНК, к примеру, в некоторых аспектах настоящего изобретения для того, чтобы повысить стабильность направляющей РНК. Кроме того, 5'-конец направляющей РНК в некоторых аспектах настоящего изобретения может быть удлинен. В некоторых аспектах настоящего изобретения можно рассматривать 20 п.о. на 5'-конце в качестве направляющей последовательности. 5'-часть может быть удлинена. Одна или несколько "шпилек" могут быть предусмотрены на 5'-части, к примеру, в некоторых аспектах настоящего изобретения это также может повышать стабильность направляющей РНК. В некоторых аспектах настоящего изобретения конкретная "шпилька" может быть обеспечена путем введения последовательности (5'-AGGACGAAGTCCTAA) на 5'-конце направляющей последовательности, а в некоторых аспектах настоящего изобретения это может помочь повысить стабильность. Другие последовательности, подходящие для образования "шпилек", известны специалисту в данной области, и их можно использовать в определенных аспектах настоящего изобретения. В некоторых аспектах настоящего изобретения предусмотрено по меньшей мере 2, 3, 4, 5 или более дополнительных "шпилек". В некоторых аспектах настоящего изобретения предусмотрено не более 10, 9, 8, 7, 6 дополнительных "шпилек". Вышеизложенное также предусматривает аспекты настоящего изобретения, включающие вторичную структуру в направляющие последовательности. В некоторых аспектах настоящего изобретения могут иметь место образование перекрестных связей и другие модификации, к примеру, для повышения стабильности. Модификации могут включать включение по меньшей мере одного не встречающегося в природе нуклеотида или модифицированного нуклеотида, или их аналогов. Модифицированные нуклеотиды могут быть модифицированы по фрагменту рибозы, фосфата и/или основания. Модифицированные нуклеотиды могут включать 2'-O-метил-аналоги, 2'-дезокси-аналоги или 2'-фтор-аналоги. Остов нуклеиновой кислоты можно модифицировать, например, можно использовать фосфотиоатный остов. Также возможно использование закрытых нуклеиновых кислот (LNA) или мостиковых нуклеиновых кислот (BNA). Дополнительные примеры модифицированных оснований включают без ограничения 2-аминопурин, 5-бромуридин, псевдоуридин, инозин, 7-метилгуанозин. Такие модификации или образование перекрестных связей могут иметь место в направляющей последовательности или других последовательностях, смежных с направляющей последовательностью.
Соответственно, целью настоящего изобретения не является охват в пределах настоящего изобретения любого ранее известного продукта, способа получения продукта или способа применения продукта, так что заявители оставляют за собой право и настоящим раскрывают отказ от прав на любой ранее известный продукт, процесс или способ. Следует дополнительно отметить, что настоящее изобретение не предназначено охватывать в пределах объема настоящего изобретения любой продукт, способ получения продукта или способ применения продукта, который не соответствует письменному описанию и требованиям достаточного раскрытия сути изобретения USPTO (первый пункт § 112 статьи 35 USC) или ЕРО (статья 83 ЕРС), так что заявители оставляют за собой право и настоящим раскрывают отказ от прав на любой ранее описанный продукт, способ получения продукта или способ применения продукта.
Следует отметить, что в данном раскрытии и особенно в формуле изобретения и/или параграфах такие выражения, как "содержит", "содержащийся", "содержащий" и т.п., могут иметь значение, приписываемое им в патентном законодательстве США, например, они могут означать "включает", "включенный", "включающий" и т.п., и что такие выражения, как "состоящий, по сути, из" и "состоит, по сути, из" имеют значение, приписываемое им в патентном законодательстве США, например, они допускают не указанные прямо элементы, но исключают элементы, которые имеются в известном уровне техники или которые влияют на основные или новые характеристики настоящего изобретения. Эти и другие варианты осуществления раскрыты или являются очевидными, исходя из следующего подробного описания, и охвачены им.
Краткое описание графических материалов
Новые признаки настоящего изобретения изложены с характерными особенностями в прилагаемой формуле изобретения. Лучшее понимание признаков и преимуществ настоящего изобретения будет доступно благодаря ссылке на следующее подробное описание, в котором изложены показательные варианты осуществления, в которых используют принципы настоящего изобретения, и на сопутствующие графические материалы.
На фигуре 1 изображена схематическая модель системы CRISPR. Нуклеаза Cas9 из Streptococcus pyogenes (желтый) нацелена на геномную ДНК при помощи синтетической направляющей РНК (sgRNA), состоящей из 20-нуклеотидной направляющей последовательности (голубой) и каркаса (красный). Направляющая последовательность образует пары оснований с ДНК-мишенью (голубой) непосредственно выше необходимого мотива, смежного с протоспейсером (РАМ; пурпурный) 5'-NGG, и Cas9 опосредует двухцепочечный разрыв (DSB) на ~3 п.о. выше РАМ (красный треугольник).
На фигурах 2A-F изображена показательная система CRISPR, возможный механизм действия, иллюстративная адаптация для экспрессии в эукариотических клетках и результаты тестов, оценивающих ядерную локализацию и активность CRISPR.
На фигурах 3А-С изображена показательная кассета экспрессии для экспрессии элементов системы CRISPR в эукариотических клетках, предсказанные структуры иллюстративных направляющих последовательностей и активность системы CRISPR, которая измерена в эукариотических и прокариотических клетках.
На фигурах 4A-D показаны результаты оценивания специфичности SpCas9 в отношении иллюстративной мишени.
На фигурах 5A-G изображена показательная векторная система и результаты ее применения при управлении гомологичной рекомбинацией в эукариотических клетках.
На фигурах 6А-С показано сравнение различных транскриптов tracrRNA для опосредованного Cas9 целенаправленного воздействия на ген.
На фигурах 7A-D изображена показательная система CRISPR, иллюстративная адаптация для экспрессии в эукариотических клетках и результаты тестов, оценивающих активность CRISPR.
На фигурах 8А-С изображены иллюстративные манипуляции с системой CRISPR для целенаправленного воздействия на локусы генома в клетках млекопитающего.
На фигурах 9А-В показаны результаты анализа с помощью нозерн-блоттинга процессинга crRNA в клетках млекопитающего.
На фигурах 10А-С показаны схематическое изображение химерных РНК и результаты анализа с помощью SURVEYOR относительно активности системы CRISPR в эукариотических клетках.
На фигурах 11А-В показано графическое изображение результатов анализа с помощью SURVEYOR относительно активности системы CRISPR в эукариотических клетках.
На фигуре 12 показаны предсказанные вторичные структуры для показательных химерных РНК, содержащих направляющую последовательность, парную tracr- последовательность и tracr-последовательность.
На фигуре 13 представлено филогенетическое дерево генов Cas.
На фигурах 14A-F показан филогенетический анализ, выявляющий пять семейств Cas9, включая три группы больших Cas9 (~1400 аминокислот) и две малых Cas9 (~1100 аминокислот).
На фигуре 15 показан график, показывающий функцию разных оптимизированных направляющих РНК.
На фигуре 16 показана последовательность и структура разных направляющих химерных РНК.
На фигуре 17 показана совместно свернутая структура tracrRNA и прямого повтора.
На фигуре 18А и В показаны данные, полученные в результате in vitro оптимизации химерной направляющей РНК StlCas9.
На фигуре 19А-В показано расщепление либо неметилированных, либо метилированных мишеней при помощи клеточного лизата с SpCas9.
На фигурах 20A-G показана оптимизация архитектуры направляющей РНК для SpCas9-опосредованного редактирования генома млекопитающих, (а) Схематическое изображение бицистронного вектора экспрессии (РХ330) для управляемой промотором U6 одиночной направляющей РНК (sgRNA) и управляемого промотором CBh человеческого кодон-оптимизированного Cas9 Streptococcus pyogenes (hSpCas9), применяемых для всех последующих экспериментов. sgRNA, усеченная в разных указанных положениях, состоит из 20-нт направляющей последовательности (голубой) и каркаса (красный). (b) Анализ с помощью SURVEYOR в отношении опосредованных SpCas9 вставок/делеций в локусах ЕМХ1 и PVALB человека. Стрелки указывают на ожидаемые фрагменты, полученные в результате расщепления с помощью SURVEYOR (n=3). (с) Анализ с помощью нозерн-блотгинга для четырех усеченных архитектур sgRNA с U1 в качестве загрузочного контроля, (d) Как SpCas9 дикого типа (wt), так и никаза-мутант (D10A) SpCas9 способствовали вставке сайта HindIII. в ген ЕМХ1 человека. Однонитевые о лито нуклеотиды (ssODN), ориентированные либо в смысловом, либо антисмысловом направлении по отношению к геномной последовательности, использовали в качестве матриц для гомологичной рекомбинации, (е) Схематическое изображение локуса SERPINB5 человека. sgRNA и РАМ указаны при помощи цветных полос над последовательностями; метилцитозины (Me) выделены (розовый) и пронумерованы по отношению к сайту инициации транскрипции (TSS, +1). (f) Статус метилирования SERPINB5, оцененный при помощи бисульфитного секвенирования 16 клонов. Заполненные круги, метилированный CpG; белые круги, неметилированный CpG. (g) Эффективность модификации у трех sgRNA, нацеливающих на метилированный участок SEKPINB5, оцененная при помощи "глубокого" секвинирования (n=2). "Усы" указывают на интервалы Уилсона (способы он-лайн).
На фигурах 21А-В показана дополнительная оптимизация архитектуры sgRNA CRISPR-Cas. (а) Схематическое изображение четырех дополнительных архитектур sgRNA, I-IV. Каждая состоит из 20-нт направляющей последовательности (голубой), соединенной с прямым повтором (DR, серый), который гибридизируется с tracrRNA (красный). Гибрид DR-tracrRNA усечен в +12 или +22, которые указаны, искусственной структурой по типу "петля-на-стебле" GAAA. Положения усечения tracrRNA пронумерованы в соответствии с предварительно сообщенным сайтом инициации транскрипции для tracrRNA. Архитектуры II и IV sgRNA несут мутации в их полиU отрезках, которые могут служить в качестве терминаторов для осуществления преждевременной терминации транскрипции. (b) Анализ с помощью SURVEYOR в отношении опосредованных SpCas9 вставок/делеций в локусе ЕМХ1 человека для целевых сайтов 1-3. Стрелки указывают на ожидаемые фрагменты, полученные в результате расщепления с помощью SURVEYOR (n=3).
На фигуре 22 показана визуализация некоторых целевых сайтов в геноме человека.
На фигурах 23А-В показаны (А) схематическое изображение sgRNA и (В) анализ при помощи SURVEYOR пяти вариантов sgRNA касательно SaCas9 в отношении оптимальной усеченной архитектуры с наивысшей эффективностью расщепления.
Фигуры приведены в данном документе только в целях иллюстрации, и они не обязательно изображены в масштабе.
Подробное описание изобретения
Выражения "полинуклеотид", "нуклеотид", "нуклеотидная последовательность", "нуклеиновая кислота" и "олигонуклеотид" используют взаимозаменяемо. Они обозначают полимерную форму нуклеотидов любой длины, как дезоксирибонуклеотидов, так и рибонуклеотидов или их аналогов. Полинуклеотиды могут обладать любой пространственной структурой и могут выполнять любую функцию, известную или неизвестную. Неограничивающими примерами полинуклеотидов являются следующие: кодирующие или некодирующе участки гена или фрагмента гена, локусы(локус), определенные в результате анализа сцепления, экзоны, интроны, информационная РНК (иРНК), транспортная РНК, рибосомная РНК, короткая интерферирующая РНК (siRNA), короткая шпилечная РНК (shRNA), микроРНК (miRNA), рибозимы, кДНК, рекомбинантные полинуклеотиды, разветвленные полинуклеотиды, плазмиды, векторы, выделенная ДНК любой последовательности, выделенная РНК любой последовательности, зонды для нуклеиновых кислот и праймеры. Полинуклеотид может содержать один или несколько модифицированных нуклеотидов, как, например, метилированные нуклеотиды и аналоги нуклеотидов. При наличии, модификации в нуклеотидную структуру могут быть внесены до или после сборки полимера. Последовательность нуклеотидов может прерываться отличными от нуклеотидов компонентами. Полинуклеотид можно дополнительно модифицировать после полимеризации, как, например, путем конъюгации с компонентом для мечения.
В аспектах настоящего изобретения выражения "химерная РНК", "химерная направляющая РНК", "направляющая РНК", "одиночная направляющая РНК" и "синтетическая направляющая РНК" используют взаимозаменяемо, и они обозначают полинуклеотидную последовательность, содержащую направляющую последовательность, tracr-последовательность и парную tracr-последовательность. Выражение "направляющая последовательность" обозначает последовательность из приблизительно 20 п.о. в пределах направляющей РНК, которая определяет целевой сайт, и ее можно использовать взаимозаменяемо с выражениями "гид" или "спейсер". Выражение "парная tracr-последовательность" также можно использовать взаимозаменяемо с выражением "прямой(ые) повтор(ы)".
Используемое в данном документе выражение "дикий тип" является выражением из данной области, понятным специалисту в данной области, и означает типичную форму организма, штамма, гена или характеристики, которые встречаются в природе в отличие от мутантных или вариантных форм.
Используемое в данном документе выражение "вариант" следует понимать как означающее проявление качеств, которые характеризуются паттерном, который отличается от такового, встречающегося в природе.
Выражение "не встречающийся в природе" или "сконструированный" используют взаимозаменяемо, и оно указывает на вмешательство человека. Выражения, в тех случаях, когда они касаются молекул нуклеиновых кислот или полипептидов, означают, что молекула нуклеиновой кислоты или полипептид по меньшей мере практически не содержат по меньшей мере один отличный компонент, с которым они естественным образом связаны в природе и встречаются в природе.
"Комплементарность" означает способность нуклеиновой кислоты образовывать водородную(ые) связь(и) с другой последовательностью нуклеиновой кислоты при помощи либо традиционного спаривания оснований по Уотсону-Крику, либо других нетрадиционных типов. Процент комплементарности показывает процентную долю остатков в молекуле нуклеиновой кислоты, которые могут образовывать водородные связи (к примеру, образование пар по Уотсону-Крику) со второй последовательностью нуклеиновой кислоты (к примеру, при этом 5, 6, 7, 8, 9, 10 из 10 будут на 50%, 60%, 70%, 80%, 90% и 100% комплементарны). "Точная комплементарность" означает, что все граничащие остатки последовательности нуклеиновой кислоты будут связаны водородными связями с тем же количеством граничащих остатков во второй последовательности нуклеиновой кислоты. Выражение "практически комплементарный", используемое в данном документе, означает степень комплементарности, которая составляет по меньшей мере 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% или 100% в пределах участка из 8, 9,10, 11, 12, 13,14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 30, 35,40, 45, 50 или более нуклеотидов, или относится к двум нуклеиновым кислотам, которые гибиридизируются при жестких условиях.
Используемые в данном документе "жесткие условия" в отношении гибридизации означают условия, при которых нуклеиновая кислота с комплементарностью к целевой последовательности преимущественно гибридизируется с целевой последовательностью и практически не гибридизируется с нецелевыми последовательностями. Жесткие условия, как правило, являются зависимыми от последовательности и изменяются в зависимости от ряда факторов. Как правило, чем длиннее последовательность, тем выше температура, при которой последовательность специфично гибридизируется с целевой последовательностью. Неограничивающие примеры жестких условий описаны подробно в Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y.
"Гибридизация" означает реакцию, при которой один или несколько полинуклеотидов реагируют с образованием комплекса, который стабилизируется посредством образования водородных связей между основаниями нуклеотидных остатков. Образование водородных связей может происходить по принципу спаривания оснований по Уотсону-Крику, Хугстиновского связывания или любым другим специфичным к последовательности образом. Комплекс может содержать две нити, образующие дуплексную структуру, три или более нитей, образующих многонитевой комплекс, одиночную самогибридизирующуюся нить или любую их комбинацию. Реакция габридизапии может представлять собой стадию в более обширном способе, такую как начальная стадия ПЦР или расщепление полинуклеотида при помощи фермента. Последовательность, способную гибридизироваться с данной последовательностью, называют "комплементарной последовательностью" данной последовательности.
Используемое в данном документе выражение "стабилизация" или "повышение стабильности" в отношении компонентов системы CRISPR относится к предохранению или обеспечению устойчивости структуры молекулы. Это можно выполнить путем введения одной или нескольких мутаций, в том числе замен одной или нескольких пар оснований, увеличения количества "шпилек", образования перекрестных связей, разрушения определенных фрагментов нуклеотидов и других модификаций. Модификации могут включать включение по меньшей мере одного не встречающегося в природе нуклеотида или модифицированного нуклеотида, или их аналогов. Модифицированные нуклеотиды могут быть модифицированы по фрагменту рибозы, фосфата и/или основания. Модифицированные нуклеотиды могут включать 2'-O-метил-аналоги, 2'-дезокси-аналоги или 2'-фтор-аналоги. Остов нуклеиновой кислоты можно модифицировать, например, можно использовать фосфотиоатный остов. Также возможно использование закрытых нуклеиновых кислот (LNA) или мостиковых нуклеиновых кислот (BNA). Дополнительные примеры модифицированных оснований включают без ограничения 2-аминопурин, 5-бромуридин, псевдоуридин, инозин, 7-метилгуанозин. Такие модификации можно применять по отношению к любому компоненту системы CRISPR. В предпочтительных вариантах осуществления такие модификации осуществляют с РНК-компонентами, к примеру, направляющей РНК или химерной полинуклеотидной последовательностью.
Используемое в данном документе выражение "экспрессия" означает процесс, при котором полинуклеотид транскрибируется с ДНК-матрицы (как, например, с образованием мРНК или другого РНК-транскрипта), и/или способ, при помощи которого транскрибированная мРНК далее транслируется с образованием пептидов, полипептидов или белков. Транскрипты и кодируемые полипептиды можно в совокупности называть "продукт гена". Если полинуклеотид получен из геномной ДНК, то экспрессия может включать сплайсинг иРНК в эукариотической клетке.
Выражения "полипептид", "пептид" и "белок" используют взаимозаменяемо в данном документе для обозначения полимеров из аминокислот любой длины. Полимер может быть линейным или разветвленным, он может содержать модифицированные аминокислоты, и его структура может прерываться отличными от аминокислот компонентами. Выражения также охватывают полимер из аминокислот, который был модифицирован; например, образованием дисульфидных связей, гликозилированием, липидизацией, ацетилированием, фосфорилированием или любой другой манипуляцией, такой как соединение с компонентом для мечения. Используемое в данном документе выражение "аминокислота" включает природные и/или неприродные или синтетические аминокислоты, в том числе глицин и как D-, так и L-оптические изомеры, и аналога аминокислот, и пептидомиметики.
Выражения "субъект", "индивидуум" и "пациент" используют взаимозаменяемо в данном документе для обозначения позвоночного, предпочтительно млекопитающего, более предпочтительно человека. Млекопитающие включают без ограничения мышей, обезьян, людей, сельскохозяйственных животных, животных для спорта и домашних животных. Также охватываются ткани, клетки и их потомство биологического организма, полученные in vivo или культивированные in vitro. В некоторых вариантах осуществления субъектом может быть беспозвоночное животное, например, насекомое или нематода; в то время как в других субъектом может быть растение или гриб.
Выражения "терапевтическое средство", "оказывающее терапевтический эффект средство" или "средство для лечения" используют взаимозаменяемо, и они означают молекулу или соединение, которые оказывают некоторое благоприятное воздействие при введении субъекту. Благоприятное воздействие включает осуществление диагностических определений; облегчение заболевания, симптома, нарушения или патологического состояния; ослабление или предупреждение начала проявления заболевания, симптома, нарушения или состояния; а также общее противодействие заболеванию, симптому, нарушению или патологическому состоянию.
Используемые в данном документе выражения "лечение", или "осуществление лечения", или "временное ослабление", или "облегчение" используют взаимозаменяемо. Эти выражения означают подход для получения благоприятных или желательных результатов, в том числе без ограничения терапевтической полезности и/или профилактической полезности. Под терапевтическим эффектом понимают любые терапевтически значимые улучшение или действие в отношении одного или нескольких заболеваний, состояний или симптомов при лечении. Для профилактического эффекта композиции можно вводить субъекту с риском развития конкретного заболевания, состояния или симптома или субъекту, который сообщает об одном или нескольких физиологических симптомах заболевания, даже если заболевание, состояние или симптом могли еще не проявиться.
Выражение "эффективное количество" или "терапевтически эффективное количество" означает количество средства, которого достаточно для обеспечения благоприятных или желательных результатов. Терапевтически эффективное количество может изменяться в зависимости от одного или нескольких из: субъекта и болезненного состояния, которые подлежат лечению, веса и возраста субъекта, тяжести болезненного состояния, способа введения и подобного, что специалист в данной области легко может определить. Выражение также применимо к дозе, с помощью которой можно получить изображение для определения любым одним из способов визуализации, описанных в данном документе. Конкретная доза может изменяться в зависимости от одного или нескольких из: конкретного выбранного средства, режима дозирования, которому следуют, того, вводят ли его в комбинации с другими средствами, выбора времени введения, визуализируемой ткани и физической системы доставки, в которой оно заключено.
Практическое применение настоящего изобретения предусматривает, если не указано иное, традиционные методики иммунологии, биохимии, химии, молекулярной биологии, микробиологии, клеточной биологии, геномики и технологию рекомбинантной ДНК, которые находятся в пределах квалификации специалиста в данной области. См. Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F.M. Ausubel, et al. eds., (1987)); серия METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL, and ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)).
Некоторые аспекты настоящего изобретения касаются векторных систем, содержащих один или несколько векторов, или векторов как таковых. Векторы могут быть разработаны для экспрессии транскриптов CRISPR (к примеру, транскриптов нуклеиновых кислот, белков или ферментов) в прокариотических или эукариотических клетках. Например, транскрипты CRISPR могут экспрессироваться в бактериальных клетках, как, например, Escherichia coli, клетках насекомых (с использованием бакуловирусных векторов экспрессии), клетках дрожжей или клетках млекопитающих. Подходящие клетки-хозяева дополнительно рассматриваются в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). В качестве альтернативы рекомбинантный вектор экспрессии может транскрибироваться и транслироваться in vitro, например, при помощи регуляторных последовательностей промотора Т7 и полимеразы Т7.
Векторы можно вводить и размножать в прокариоте. В некоторых вариантах осуществления прокариота используют для амплификации копий вектора, который предполагается вводить в эукариотическую клетку, или в качестве промежуточного вектора при получении вектора, который предполагается вводить в эукариотическую клетку (к примеру, путем амплификации плазмиды как части системы упаковки вирусного вектора). В некоторых вариантах осуществления прокариота используют для амплификации копий вектора и экспрессии одной или нескольких нуклеиновых кислот, как, например, для обеспечения источника одного или нескольких белков для доставки в клетку-хозяина или организм-хозяин. Экспрессию белков в прокариотах наиболее часто осуществляют в Escherichia coli с векторами, содержащими конститутивные или индуцибельные промоторы, управляющие экспрессией либо слитых белков, либо отличных от слитых белков. В слитых векторах добавляют некоторое количество аминокислот к белку, закодированному в них, как, например, к амино-концу рекомбинантного белка. Такие слитые векторы могут служить для одной или нескольких целей, как например: (i) для повышения экспрессии рекомбинантного белка; (ii) для повышения растворимости рекомбинантного белка и (iii) для содействия очистке рекомбинантного белка посредством функционирования в качестве лиганда при аффинной очистке. Часто в слитые векторы экспрессии сайт протеолигического расщепления вводят в место соединения фрагмента слияния и рекомбинантного белка для облегчения отделения рекомбинантного белка от фрагмента слияния после очистки слитого белка. Такие ферменты и их когнатные распознающие последовательности включают фактор Ха, тромбин и энтерокиназу. Иллюстративные слитые векторы экспрессии включают pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40), pMAL (New England Biolabs, Беверли, Массачусетс) и pRTT5 (Pharmacia, Пискатауэй, Нью-Джерси), в которых глутатион-S-трансфераза (GST), мальтоза-связывающий белок Е или белок А, соответственно, слиты с целевым рекомбинантным белком.
Примеры подходящих индуцибельных не являющихся слитыми векторов экспрессии Е. coli включают pTrc (Amrann et al., (1988) Gene 69: 301-315) и pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89).
В некоторых вариантах осуществления вектор является вектором экспрессии для дрожжей. Примеры векторов для экспрессии в дрожжах Saccharomyces cerivisae включают pYepSecl (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, Сан-Диего, Калифорния) и picZ (InVitrogen Corp, Сан-Диего, Калифорния).
В некоторых вариантах осуществления вектор управляет экспрессией белка в клетках насекомых при помощи бакуловирусных векторов экспрессии. Бакуловирусные векторы, доступные для экспрессии белков в культивируемых клетках насекомых (к примеру, клетках SF9), включают группу рАс (Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165) и группу pVL (Lucklow and Summers, 1989. Virology 170: 31-39).
В некоторых вариантах осуществления вектор способен управлять экспрессией одной или нескольких последовательностей в клетках млекопитающих при помощи вектора экспрессии для млекопитающих. Примеры векторов экспрессии для млекопитающих включают pCDM8 (Seed, 1987. Nature 329: 840) и рМТ2РС (Kaufman, et al., 1987. EMBO J. 6: 187-195). При использовании клеток млекопитающих функции контроля вектора экспрессии, как правило, обеспечиваются одним или несколькими регуляторными элементами. Например, широко используемые промоторы получают из вируса полиомы, аденовируса 2, цитомегаловируса, вируса обезьян 40 и других, раскрытых в данном документе и известных в уровне техники. Что качается других подходящих систем экспрессии как для прокариотических, так и для эукариотических клеток, см., к примеру, главы 16 и 17 в Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.
В некоторых вариантах осуществления рекомбинантные векторы экспрессии для млекопитающих способны управлять экспрессией нуклеиновой кислоты преимущественно в определенном типе клеток (к примеру, тканеспецифичные регуляторные элементы используют для экспрессии нуклеиновой кислоты). Тканеспецифичные регуляторные элементы известны из уровня техники. Неограничивающие примеры подходящих тканеспецифичных промоторов включают промотор гена альбумина (специфичный к печени; Pinkert, et al., 1987. Genes Dev. 1: 268-277), специфичные к лимфоидной ткани промоторы (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), в частности, промоторы рецепторов Т-клеток (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) и иммуноглобулины (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), нейрон-специфичные промоторы (к примеру, промотор гена нейрофиламента; Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477), специфичные к клеткам поджелудочной железы промоторы (Edlund, et al., 1985. Science 230: 912-916) и специфичные к клеткам молочной железы промоторы (к примеру, промотор молочной сыворотки; патент США №4873316 и публикация европейской заявки №264166). Регулируемые стадией развития промоторы также охвачены, к примеру, промоторы генов hox мыши (Kessel and Grass, 1990. Science 249: 374-379) и промотор гена α-фетопротеина (Campes and Tilghman, 1989. Genes Dev. 3: 537- 546).
В некоторых вариантах осуществления регуляторный элемент является функционально связанным с одним или несколькими элементами системы CRISPR так, чтобы управлять экспрессией одного или нескольких элементов системы CRISPR. В целом, CRISPR (короткие палиндромные повторы, регулярно расположенные группами), также известные как SPIDR (чередующиеся со спейсерами прямые повторы), составляют семейство локусов ДНК, которые, как правило, специфичны для определенного вида бактерий. Локус CRISPR включает определенный класс чередующихся коротких повторов последовательностей (SSR), которые были обнаружены у Е. coli (Ishino et al., J. Bacteriol., 169: 5429-5433 [1987]; и Nakata et al., J. Bacteriol., 171: 3553-3556 [1989]), и ассоциированные гены. Подобные чередующиеся SSR были идентифицированы у Haloferax mediterranei, Streptococcus pyogenes, Anabaena и Mycobacterium tuberculosis (см., Groenen et al., Mol. Microbiol., 10: 1057-1065 [1993]; Hoe et al., Emerg. Infect. Dis., 5: 254-263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1307: 26-30 [1996]; и Mojica et al., Mol. Microbiol., 17: 85-93 [1995]). Локусы CRISPR, как правило, отличаются от других SSR по структуре повторов, которые были названы короткими повторами с регулярными интервалами (SRSR) (Janssen et al., OMICS J. Integ. Biol, 6:23-33 [2002]; и Mojica et al., Mol. Microbiol., 36:244-246 [2000]). В целом, повторы являются короткими элементами, которые встречаются группами, которые регулярно разделены уникальными вставочными последовательностями с практически постоянной длинной (Mojica et al., [2000], выше). Несмотря на то, что последовательности повторов высоко консервативны между штаммами, некоторое количество чередующихся повторов и последовательностей спейсерных участков, как правило, отличаются от штамма к штамму (van Embden et al., J. Bacteriol., 182: 2393-2401 [2000]). Локусы CRISPR были идентифицированы у более чем 40 видов прокариот (см., к примеру, Jansen et al., Mol. Microbiol., 43: 1565-1575 [2002]; и Mojica et al., [2005]), в том числе, без ограничения, Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema и Thermotoga.
В целом, "система CRISPR" означает в совокупности транскрипты и другие элементы, участвующие в экспрессии CRISPR-ассоциированных ("Cas") генов или управлении их активностью, в том числе последовательности, кодирующие ген Cas, tracr-(транс-активируемую CRISPR) последовательность (к примеру, tracrRNA или активную частичную tracrRNA), парную tracr-последовательность (охватывающую "прямой повтор" и tracrRNA-процессированный неполный прямой повтор в контексте эндогенной системы CRISPR), направляющую последовательность (также называемую "спейсером" в контексте эндогенной системы CRISPR) или другие последовательности и транскрипты с локуса CRISPR. В некоторых вариантах осуществления один или несколько элементов системы CRISPR получены из системы CRISPR I типа, II типа или Ш типа. В некоторых вариантах осуществления один или несколько элементов системы CRISPR получены из определенного организма, содержащего эндогенную систему CRISPR, как, например, Streptococcus pyogenes. В целом, система CRISPR характеризуется элементами, которые способствуют образованию комплекса CRISPR на сайте целевой последовательности (также называемой протоспейсером в контексте эндогенной системы CRISPR). В контексте образования комплекса CRISPR "целевая последовательность" означает последовательность, по отношению к которой направляющая последовательность разработана так, чтобы обладать комплементарностью, где гибридизация между целевой последовательностью и направляющей последовательностью способствует образованию комплекса CRISPR. Полная комплементарность не обязательна при условии, что имеет место достаточная комплементарность для осуществления гибридизации и способствования образованию комплекса CRISPR. Целевая последовательность может содержать любой полинуклеотид, как, например, ДНК- или РНК-полинуклеотиды. В некоторых вариантах осуществления целевая последовательность расположена в ядре или цитоплазме клетки. В некоторых вариантах осуществления целевая последовательность может находиться в органелле эукариотической клетки, например, митохондрии или хлоропласте. Последовательность или матрицу, которую можно применять для рекомбинации в целевом локусе, содержащем целевые последовательности, называют "матрицей редактирования", или "полинуклеотидом для редактирования", или "последовательностью для редактирования". В аспектах настоящего изобретения экзогенный матричный полинуклеотид можно называть матрицей редактирования. В одном аспекте настоящего изобретения рекомбинация является гомологичной рекомбинацией.
Как правило, в контексте эндогенной системы CRISPR образование комплекса CRISPR (содержащего направляющую последовательность, гибридизирующуюся с целевой последовательностью и образующую комплекс с одним или несколькими белками Cas) приводит к расщеплению одной или обеих нитей в или около (к примеру, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований от) целевой последовательности. Не желая быть связанными теорией, полагают, что tracr-последовательность, которая может содержать или состоять из всей или части tracr-последовательности дикого типа (к примеру, приблизительно или более чем приблизительно 20, 26, 32, 45, 48, 54, 63, 67, 85 или более нуклеотидов tracr-последовательности дикого типа), может также образовывать часть комплекса CRISPR, как, например, путем гибридизации вдоль по меньшей мере части tracr-последовательности со всей или частью парной tracr-последовательности, которая функционально связана с направляющей последовательностью. В некоторых вариантах осуществления tracr-последовательность обладает достаточной комплементарностью с парной tracr-последовательностью для гибридизации и участия в образовании комплекса CRISPR. Как и в случае с целевой последовательностью, полагают, что полная комплементарность не является необходимой при условии, что она является достаточной для выполнения функции. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. В некоторых вариантах осуществления один или несколько векторов, управляющих экспрессией одного или нескольких элементов системы CRISPR, вводят в клетку-хозяина, так что экспрессия элементов системы CRISPR управляет образованием комплекса CRISPR на одном или нескольких целевых сайтах. Например, каждое из фермента Cas, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности может быть функционально связано с отдельными регуляторными элементами в отдельных векторах. В качестве альтернативы, два или более элементов, экспрессируемых с одних и тех же или разных регуляторных элементов, можно объединять в одном векторе, с одним или несколькими дополнительными векторами, обеспечивая любые компоненты системы CRISPR, не включенные в первый вектор. Элементы системы CRISPR, которые объединены в один вектор, могут быть расположены в любой удобной ориентации, как, например, один элемент, расположенный 5' ("выше") относительно или 3' ("ниже") относительно второго элемента. Кодирующая последовательность одного элемента может быть расположена на той же или противоположной нити кодирующей последовательности второго элемента и направлена в том же или противоположном направлении. В некоторых вариантах осуществления один промотор управляет экспрессией транскрипта, кодирующего фермент CRISPR, и одной или нескольких из направляющей последовательности, парной tracr-последовательности (необязательно функционально связанной с направляющей последовательностью) и tracr-последовательности, встроенных в одну или несколько интронных последовательностей (к примеру, каждая в разном интроне, две или более по меньшей мере в одном интроне или все в одном интроне). В некоторых вариантах осуществления фермент CRISPR, направляющая последовательность, парная tracr-последовательность и tracr-последовательность функционально связаны с одним и тем же промотором и экспрессируются с него.
В некоторых вариантах осуществления вектор содержит один или несколько сайтов встраивания, как, например, последовательность узнавания рестрикционной эндонуклеазой (также называемая "сайтом клонирования"). В некоторых вариантах осуществления один или несколько сайтов встраивания (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов встраивания) расположены выше и/или ниже одного или нескольких элементов последовательности одного или нескольких векторов. В некоторых вариантах осуществления вектор содержит сайт встраивания выше парной tracr-последовательности и необязательно ниже регуляторного элемента, функционально связанного с парной tracr-последовательностью, так что после встраивания направляющей последовательности в сайт встраивания и при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления вектор содержит два или более сайта встраивания, при этом каждый сайт встраивания расположен между двумя парными tracr-последовательностями с тем, чтобы обеспечить возможность встраивания направляющей последовательности в каждый сайт. В таком расположении две или более направляющие последовательности могут содержать две или более копий одной направляющей последовательности, две или более различных направляющих последовательностей или их комбинации. В тех случаях, когда применяют несколько различных направляющих последовательностей, может быть использована одна экспрессирующая конструкция для целенаправленного воздействия активности CRISPR на несколько различных соответствующих целевых последовательностей в клетке. Например, один вектор может содержать приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 или более направляющих последовательностей. В некоторых вариантах осуществления приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более таких содержащих направляющие последовательности векторов могут быть предусмотрены и необязательно доставлены в клетку.
В некоторых вариантах осуществления вектор содержит регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей фермент CRISPR, как, например, белок Cas. Неограничивающие примеры белков Cas включают Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (также известный как Csn1 и Csx12), Cas10, Csy1, Csy2, Csy3, Csc1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csxl5, Csf1, Csf2, Csf3, Csf4, их гомологи или их модифицированные варианты. Эти ферменты известны; например, аминокислотную последовательность белка Cas9 S. pyogenes можно найти в базе данных SwissProt под номером доступа Q99ZW2. В некоторых вариантах осуществления немодифицированный фермент CRISPR характеризуется активностью для расщепления ДНК, как, например, Cas9. В некоторых вариантах осуществления фермент CRISPR представляет собой Cas9, и им может быть Cas9 из S. pyogenes или S. pneumoniae. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или обеих нитей в определенной точке целевой последовательности, как, например, в пределах целевой последовательности и/или в пределах комплементарной последовательности целевой последовательности. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или обеих нитей в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 или более пар оснований от первого или последнего нуклеотида целевой последовательности. В некоторых вариантах осуществления вектор кодирует фермент CRISPR, который является мутированным по отношению к соответствующему ферменту дикого типа, так что у мутированного фермента CRISPR отсутствует способность расщеплять одну или обе нити целевого полинуклеотида, содержащего целевую последовательность. Например, замена аспартата на аланин (D10A) в каталитическом домене RuvC I Cas9 из S. pyogenes трансформирует Cas9 из нуклеазы, которая расщепляет обе нити, в никазу (расщепляет одну нить). Другие примеры мутаций, которые превращают Cas9 в никазу, включают без ограничения Н840А, N854A и N863A. В некоторых вариантах осуществления никазу Cas9 можно использовать в комбинации с направляющей(ими) последовательностью(ями), к примеру, двумя направляющими последовательностями, которые целенаправленно воздействуют, соответственно, на смысловую и антисмысловую нити ДНК-мишени. Эта комбинация позволяет надрезать обе нити и использовать их для индукции NHEJ. Авторы данной заявки показали (данные не показаны) эффективность двух мишеней для никаз (т.е. sgRNA, нацеленных на одну и ту же точку, но на различные нити ДНК) при индуцировании мутагенного NHEJ. Одиночная никаза (Cas9-D10A с одной sgRNA) не способна индуцировать NHEJ и создавать вставки/делеции, но авторы данной заявки показали, что двойная никаза (Cas9- D10A и две sgRNA, нацеленные на различные нити в одной и той же точке) способна делать это в эмбриональных стволовых клетках человека (hESC). Эффективность составляет приблизительно 50% таковой нуклеазы (т.е. нормального Cas9 без мутации D10) в hESC.
В качестве дополнительного примера два или более каталитических доменов Cas9 (RuvC I, RuvC II и RuvC III) можно подвергать мутациям с получением мутированного Cas9, у которого практически отсутствует вся активность для расщепления ДНК. В некоторых вариантах осуществления мутацию D10A объединяют с одной или несколькими из мутаций Н840А, N854A или N863A с получением фермента Cas9, у которого практически отсутствует вся активность для расщепления ДНК. В некоторых вариантах осуществления фермент CRISPR рассматривают как такой, у которого практически отсутствует вся активность для расщепления ДНК, в случаях, когда активность для расщепления ДНК мутированного фермента составляет менее приблизительно 25%, 10%, 5%, 1%, 0,1%, 0,01% или меньше по отношению к его не мутированной форме. Могут быть целесообразными другие мутации; в тех случаях, когда Cas9 или другой фермент CRISPR получен из вида, отличного от S. pyogenes, могут быть произведены мутации в соответствующих аминокислотах для достижения подобных эффектов.
В некоторых вариантах осуществления кодирующая фермент последовательность, кодирующая фермент CRISPR, является кодон-оптимизированной для экспрессии в определенных клетках, как, например, эукариотических клетках. Эукариотические клетки могут быть клетками определенного организма или полученными из него, как, например, млекопитающего, в том числе, без ограничения, человека, мыши, крысы, кролика, собаки или отличного от человека примата. В целом, оптимизация кодонов означает способ модификации последовательности нуклеиновой кислоты для повышения экспрессии в представляющих интерес клетках-хозяевах путем замещения по меньшей мере одного кодона (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более кодонов) нативной последовательности кодонами, которые чаще или наиболее часто используют в генах этой клетки-хозяина, в то же время сохраняя нативную аминокислотную последовательность. Разные виды проявляют определенное "предпочтение" в отношении конкретных кодонов определенной аминокислоты. "Предпочтение" кодонов (различия в частоте использования кодонов между организмами) часто соотносят с эффективностью трансляции информационной РНК (иРНК), которая, в свою очередь, как полагают, зависит, среди прочего, от свойств кодонов, которые транслируются, и доступности конкретных молекул транспортной РНК (тРНК). Преобладание выбранных тРНК в клетке, как правило, является отражением кодонов, используемых наиболее часто при синтезе пептидов. Соответственно, гены могут быть приспособлены для оптимальной экспрессии генов в данном организме с использованием оптимизации кодонов. Таблицы частоты использования кодонов общедоступны, например, в "Базе данных частот использования кодонов" ("Codon Usage Database"), и эти таблицы можно адаптировать различными способами. См. Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000). Также доступны компьютерные алгоритмы для оптимизации кодонов определенной последовательности для экспрессии в определенной клетке-хозяине, как, например, также доступный Gene Forge (Aptagen; Джакобус, Пенсильвания). В некоторых вариантах осуществления один или несколько кодонов (к примеру, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более или все кодоны) в последовательности, кодирующей фермент CRISPR, соответствуют наиболее часто используемому кодону для определенной аминокислоты.
В некоторых вариантах осуществления вектор кодирует фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации (NLS), как, например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS. В некоторых вариантах осуществления фермент CRISPR содержит приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9,10 или более NLS на амино-конце или рядом с ним, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS на карбокси-конце или рядом с ним или комбинацию этого (к примеру, одну или несколько NLS на амино-конце и одну или несколько NLS на карбокси-конце). В тех случаях, когда присутствуют несколько NLS, каждая может быть выбрана независимо от других, так что одна NLS может присутствовать в нескольких копиях и/или в комбинации с одной или несколькими другими NLS, присутствующими в одной или нескольких копиях. В предпочтительном варианте осуществления настоящего изобретения фермент CRISPR содержит самое большее 6 NLS. В некоторых вариантах осуществления считают, что NLS находится рядом с N- или С-концом в тех случаях, когда самая близкая аминокислота NLS находится в пределах приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 или более аминокислот вдоль полипетидной цепи от N- или С-конца. Обычно, NLS состоит из одной или нескольких коротких последовательностей положительно заряженных молекул лизина или аргинина, расположенных на поверхности белка, но известны другие типы NLS. Неограничивающие примеры NLS включают NLS-последовательности, полученные из: NLS из большого Т-антигена вируса SV40 с аминокислотной последовательностью PKKKRKV; NLS из нуклеоплазмина (к примеру, двойной NLS из нуклеоплазмина с последовательностью KRPAATKKAGQAKKKK); NLS из c-myc с аминокислотной последовательностью PAAKRVKLD или RQRRNELKRSP; NLS из hRNPA1 М9 с последовательностью NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY; последовательность RMRIZFKNKGKTDTAELRRRRVEVSVELRKAKKDEQILKRRNV домена IBB из импортина-альфа; последовательности VSRKRPRP и PPKKARED из Т-белка миомы; последовательность POPKKKPL из р53 человека; последовательность SALIKKKKKMAP из c-abl IV мыши; последовательности DRLRR и PKQKKRK из NS1 вируса гриппа; последовательность PKLKKKIKKL из дельта-антигена вируса гепатита; последовательность REKKKFLKRR из белка Mxl мыши; последовательность KRKGDEVDGVDEVAKKKSKK из поли(АДФ-рибоза)-полимеразы человека и последовательность RKCLQAGMNLEARKTKK из рецепторов стероидных гормонов для глюкокортикоидов (человека).
В целом, одна или несколько NLS являются достаточно эффективными, чтобы управлять накоплением фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В целом, степень проявления активности ядерной локализации может быть результатом следующего: количества NLS в ферменте CRISPR, конкретных(ой) используемых(ой) NLS или комбинации этих факторов. Обнаружение накопления в ядре можно выполнять при помощи любой подходящей методики. Например, детектируемый маркер может быть слит с ферментом CRISPR, так что расположение в клетке может быть визуализировано, как, например, в комбинации со средствами для обнаружения расположения ядра (к примеру, окрашивающим средством, специфичным к ядру, таким как DAPI). Примеры детектируемых маркеров включают флуоресцентные белки (такие как зеленые флуоресцентные белки или GFP; RFP; CFP) и эпитопные метки (НА-метку, flag-метку, SNAP-метку). Ядра клеток также можно выделять из клеток, содержимое которых можно затем анализировать при помощи любого подходящего способа для обнаружения белка, как, например, иммуногистохимии, вестерн-блоттинга или анализа на активность фермента. Накопление в ядре также можно определить опосредованно, как, например, при помощи анализа действия образования комплекса CRISPR (к примеру, анализа на расщепление ДНК или мутацию в целевой последовательности или анализа на измененную при помощи образования комплекса CRISPR и/или активности фермента CRISPR активность экспрессии генов) по сравнению с контролем, который не подвергали воздействию фермента или комплекса CRISPR или подвергали воздействию фермента CRISPR, у которого отсутствуют одна или несколько NLS.
В целом, направляющая последовательность представляет собой любую полинуклеотидную последовательность, обладающую достаточной комплементарностью с целевой полинуклеотидной последовательностью для габридизапии с целевой последовательностью и управления специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью. В некоторых вариантах осуществления степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью при оптимальном выравнивании с использованием подходящего алгоритма выравнивания составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или более. Оптимальное выравнивание можно определять при помощи любого подходящего алгоритма для выравниваемых последовательностей, неограничивающие примеры которого включают алгоритм Смита-Ватермана, алгоритм Нидлмана-Вунша, алгоритмы, основанные на преобразовании Барроуза-Уилера (к примеру, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies), ELAND (Illumina, Сан-Диего, Калифорния), SOAP (доступный на soap.genomics.org.cn) и Maq (доступный на maq.sourceforge.net). В некоторых вариантах осуществления направляющая последовательность составляет приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов в длину. В некоторых вариантах осуществления направляющая последовательность составляет менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20,15, 12 или менее нуклеотидов в длину. Способность направляющей последовательности управлять специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью можно оценить при помощи любого подходящего анализа. Например, компоненты системы CRISPR, достаточные для образования комплекса CRISPR, в том числе направляющая последовательность, которую необходимо исследовать, могут быть доставлены в клетку-хозяина с соответствующей целевой последовательностью, как, например, при помощи трансфекции векторами, кодирующими компоненты последовательности CRISPR, с последующей оценкой предпочтительного расщепления в пределах целевой последовательности, как, например, при помощи анализа с помощью Surveyor, который описан в данном документе. Подобным образом, расщепление целевой полинуклеотидной последовательности может быть установлено в пробирке путем обеспечения целевой последовательности, компонентов комплекса CRISPR, в том числе направляющей последовательности, которую необходимо исследовать, и контрольной направляющей последовательности, отличной от тестовой направляющей последовательности, и сравнения воздействий тестовой и контрольной направляющей последовательности на связывание или скорость расщепления целевой последовательности. Другие анализы возможны и будут очевидны специалисту в данной области.
Направляющая последовательность может быть выбрана для целенаправленного воздействия на любую целевую последовательность. В некоторых вариантах осуществления целевая последовательность является последовательностью в пределах генома клетки. Иллюстративные целевые последовательности включают те, которые являются уникальными в целевом геноме. Например, для Cas9 S. pyogenes уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде , где (N представляет собой A, G, Т или С; и X может быть любым) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 S. pyogenes в виде где (N представляет собой A, G, T или С; и X может быть любым) характеризуется единичным появлением в геноме. Для Cas9 CRISPR1 S. thermophilus уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде , где (N представляет собой A, G, Т или С; X может быть любым; и W представляет собой А или Т) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 CRISPR1 S. thermophilus в виде , где (N представляет собой A, G, Т или С; X может быть любым; и W представляет собой А или Т) характеризуется единичным появлением в геноме. Для Cas9 S. pyogenes уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде , где (N представляет собой A, G, Т или С; и X может быть любым) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 S. pyogenes в виде где (N представляет собой A, G, Т или С; и X может быть любым) характеризуется единичным появлением в геноме. В каждой из этих последовательностей "М" может представлять собой A, G, Т или С и не должен учитываться при идентификации последовательности как уникальной.
В некоторых вариантах осуществления направляющая последовательность выбрана для снижения доли вторичной структуры в направляющей последовательности. Вторичную структуру можно определить при помощи любого подходящего алгоритма сворачивания полинуклеотида. Некоторые программы основаны на вычислении минимальной свободной энергии Гиббса. Примером одного такого алгоритма является mFold, который описан Zuker и Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Другим примером алгоритма сворачивания является доступный в режиме онлайн веб-сервер RNAfold, разработанный в Институте теоретической химии при Венском университете, в котором используется алгоритм прогнозирования структуры на основе центроидного метода (см., к примеру, A.R. Gruber et al., 2008, Cell 106(1): 23-24; и PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62). Дополнительные алгоритмы можно найти в заявке на патент США с серийным номером ТВА (общая ссылка В1-2012/084 44790.11.2022); включенной в данный документ при помощи ссылки.
В общем, парная tracr-последовательность включает любую последовательность, которая характеризуется достаточной комплементарностью с tracr-последовательностью для содействия одному или нескольким из следующих: (1) вырезания направляющей последовательности, фланкированной парными tracr-последовательностями, в клетке, содержащей соответствующую tracr-последовательность; и (2) образования комплекса CRISPR на целевой последовательности, где комплекс CRISPR содержит парную tracr-последовательность, габридизирующуюся с tracr-последовательностью. В общем, степень комплементарности указана на основании оптимального выравнивания парной tracr-последовательности и tracr-последовательности по длине более короткой из двух последовательностей. Оптимальное выравнивание можно определить при помощи любого подходящего алгоритма выравнивания и можно дополнительно высчитать для вторичных структур, как, например, самокомплементарность в пределах либо tracr-последовательности, либо парной tracr-последовательности. В некоторых вариантах осуществления степень комплементарности между tracr-последовательностью и парной tracr-последовательностью по длине более короткой из двух при оптимальном выравнивании составляет приблизительно или более чем приблизительно 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% или более. Примерные иллюстрации оптимального выравнивания между tracr-последовательностью и парной tracr-последовательностью представлены на фигурах 12В и 13В. В некоторых вариантах осуществления tracr-последовательность составляет приблизительно или более чем приблизительно 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 или более нуклеотидов в длину. В некоторых вариантах осуществления tracr-последовательность и парная tracr-последовательность содержатся в одном транскрипте, так что габридизация между ними двумя дает транскрипт со вторичной структурой, такой как "шпилька". Предпочтительные петлеобразующие последовательности для использования в "шпилечных" структурах составляют четыре нуклеотида в длину и наиболее предпочтительно имеют последовательность GAAA. Однако можно использовать более короткие или длинные последовательности петли, а также альтернативные последовательности. Последовательности предпочтительно включают нуклеотидный триплет (например, AAA) и дополнительный нуклеотид (например, С или G). Примеры петлеобразующих последовательностей включают СААА и AAAG. В одном варианте осуществления настоящего изобретения транскрипт или транскрибированная полинуклеотидная последовательность характеризуются по меньшей мере двумя или более "шпильками". В предпочтительных вариантах осуществления транскрипт характеризуется двумя, тремя, четырьмя или пятью "шпильками". В дополнительном варианте осуществления настоящего изобретения транскрипт характеризуется самое большее пятью "шпильками". В некоторых вариантах осуществления один транскрипт дополнительно включает последовательность терминапии транскрипции; предпочтительно она является полиТ-последовательностью, например, из шести нуклеотидов Т. Примерная иллюстрация такой "шпилечной" структуры представлена в нижней части фигуры 13В, где часть последовательности в 5' направлении по отношению к концевому "N" и выше петли соответствует парной tracr-последовательности, а часть последовательности в 3' направлении по отношению к петле соответствует tracr-последовательности. Дополнительными неограничивающими примерами отдельных полинуклеотидов, содержащих направляющую последовательность, парную tracr-последовательность и tracr-последовательность, являются следующие (перечисленные от 5' к 3'), где "N" представляет собой основание направляющей последовательности, первый блок букв нижнего регистра представляет собой парную tracr-последовательность, а второй блок букв нижнего регистра представляет собой tracr-последовательность, и конечная поли-Т-последовательность представляет собой терминатор транскрипции:
(1)
;
(2)
;
(3)
;
(4)
;
(5)
и (6) . В некоторых вариантах осуществления последовательности (1)-(3) используют в комбинации с Cas9 из CRISPR1 S. thermophilus. В некоторых вариантах осуществления последовательности (4)-(6) используют в комбинации с Cas9 из S. pyogenes. В некоторых вариантах осуществления tracr-последовательность является транскриптом, отдельным от транскрипта, содержащего парную tracr-последовательность (как, например, показанная в верхней части фигуры 13В).
В некоторых вариантах осуществления также предусмотрена матрица для рекомбинации. Матрица для рекомбинации может быть компонентом другого вектора, который описан в данном документе, может содержаться в отдельном векторе или предусматриваться в виде отдельного полинуклеотида. В некоторых вариантах осуществления матрица для рекомбинации разработана так, чтобы служить в качестве матрицы при гомологичной рекомбинации, как, например, в пределах или рядом с целевой последовательностью, надрезанной или расщепленной ферментом CRISPR, в качестве части комплекса CRISPR. Матричный полинуклеотид может быть любой подходящей длины, как, например, приблизительно или более чем приблизительно 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000 или более нуклеотидов в длину. В некоторых вариантах осуществления матричный полинуклеотид комплементарен части полинуклеотида, содержащего целевую последовательность. При оптимальном выравнивании матричный полинуклеотид может перекрываться с одним или несколькими нуклеотидами целевых последовательностей (к примеру, с приблизительно или более чем приблизительно 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 или более нуклеотидами). В некоторых вариантах осуществления при оптимальном выравнивании матричной последовательности и полинуклеотида, содержащего целевую последовательность, наиболее близкий нуклеотид матричного полинуклеотида находится в пределах приблизительно 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000 или более нуклеотидов от целевой последовательности.
В некоторых вариантах осуществления фермент CRISPR является частью слитого белка, содержащего один или несколько доменов гетерологичного белка (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9,10 или более доменов в дополнение к ферменту CRISPR). Слитый белок, содержащий фермент CRISPR, может содержать любую дополнительную последовательность белка и необязательно линкерную последовательность между любыми двумя доменами. Примеры белковых доменов, которые могут быть слиты с ферментом CRISPR, включают, без ограничения, эпитопные метки, последовательности генов-репортеров и белковые домены с одним или несколькими из следующих видов активности: метилазной активности, деметилазной активности, активности для активации транскрипции, активности для репрессии транскрипции, активности фактора освобождения при транскрипции, активности для модификации гистонов, активности для расщепления ДНК и активности для связывания нуклеиновой кислоты. Неограничивающие примеры эпитопных меток включают гастидиновые (His) метки, V5-метки, FLAG-метки, метки гемагглютинина вируса гриппа (НА), Мус-метки, VSV-G-метки и тиоредоксиновые (Trx) метки. Примеры генов-репортеров включают, без ограничения, глутатион-S-трансферазу (GST), пероксидазу хрена (HRP), хлорамфеникол-ацетилтрансферазу (CAT), бета-галактозидазу, бета-глюкуронидазу, люциферазу, зеленый флуоресцентный белок (GFP), HcRed, DsRed, голубой флуоресцентный белок (CFP), желтый флуоресцентный белок (YFP) и автофлуорисцирующие белки, в том числе синий флуоресцевлный белок (BFP). Фермент CRISPR может быть слит с последовательностью гена, кодирующей белок или фрагмент белка, которые связываются с молекулой ДНК или связываются с другими клеточными молекулами, в том числе, без ограничения, связывающим мальтозу белком (МБР), S-меткой, продуктами слияния Lex А и ДНК-связывающего домена (DBD), продуктами слияния GAL4 и ДНК-связывающего домена и продуктами слияния белка BP 16 вируса простого герпеса (HSV). Дополнительные домены, которые могут образовывать часть слитого белка, содержащего фермент CRISPR, описаны в US 20110059502, включенном в данный документ при помощи ссылки. В некоторых вариантах осуществления меченный фермент CRISPR используют для идентификации расположения целевой последовательности.
В некоторых аспектах настоящее изобретение предусматривает способы, включающие доставку одного или нескольких полинуклеотидов, как, например, или одного или нескольких векторов, которые описаны в данном документе, одного или нескольких их транскриптов и/или одного или нескольких белков, транскрибируемых с них, в клетку-хозяина. В некоторых аспектах настоящее изобретение дополнительно предусматривает клетки, полученные при помощи таких способов, и организмы (такие как животные, растения или грибы), содержащие такие клетки или полученные из них. В некоторых вариантах осуществления фермент CRISPR в комбинации с (и необязательно образующий комплекс с) направляющей последовательностью доставляют в клетку. Традиционные способы переноса генов с использованием вирусов и без использования вирусов можно применять для введения нуклеиновых кислот в клетки млекопитающих или целевые ткани. Такие способы можно использовать для введения нуклеиновых кислот, кодирующих компоненты системы CRISPR, в клетки в культуре и в организме-хозяине. Системы доставки на основе отличных от вирусных векторов включают ДНК-плазмиды РНК (к примеру, транскрипт вектора, описанного в данном документе), "оголенную" нуклеиновую кислоту и нуклеиновую кислоту, образующую комплекс со средством доставки, как, например, липосому. Системы доставки на основе вирусного вектора включают ДНК- и РНК-вирусы, которые имеют либо эписомальный, либо интегрированный геномы после доставки в клетку. В отношении обзора процедур генной терапии см. Anderson, Science 256: 808-813 (1992); Nabel & Feigner, TIBTECH 11: 211-217 (1993); Mitani & Caskey, TIBTECH 11: 162-166 (1993); Dillon, TIBTECH 11: 167-175 (1993); Miller, Nature 357: 455-460 (1992); Van Brunt, Biotechnology 6(10): 1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8: 35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1): 31-44 (1995); Haddada et al., в Current Topics in Microbiology and Immunology, Doerfler and (eds) (1995); и Yu et al., Gene Therapy 1: 13-26 (1994).
Способы отличной от вирусной доставки нуклеиновых кислот включают липофекцию, нуклеофекцию, микроинъекцию, баллистическую трансфекцию, виросомы, липосомы, иммунолипосомы, поликатион или конъюгаты липид: нуклеиновая кислота, "оголенную" ДНК, искусственные вирионы и повышенное при помощи средства поглощение ДНК. Липофекция описана, например, в патентах США №№5049386, 4946787 и 4897355), и реагенты для липофекции реализуются в промышленных масштабах (к примеру, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, которые подходят для эффективной липофекции полинуклеотидов с узнаванием рецептора, включают таковые из Feigner, WO 91/17424; WO 91/16024. Доставка может осуществляться в клетки (к примеру, in vitro или ex vivo введение) или целевые ткани (к примеру, in vivo введение).
Получение комплексов липид: нуклеиновая кислота, в том числе целенаправленно воздействующих липосом, как, например, иммунолилидных комплексов, хорошо известно специалистам в данной области (см., к примеру, Crystal, Science 270: 404-410 (1995); Blaese et al., Cancer Gene Ther. 2: 291-297 (1995); Behr et al., Bioconjugate Chem. 5: 382-389 (1994); Remy et al., Bioconjugate Chem. 5: 647-654 (1994); Gao et al., Gene Therapy 2: 710-722 (1995); Ahmad et al., Cancer Res. 52: 4817-4820 (1992); патенты США №№4186183, 4217344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 и 4946787).
При применении систем на основе РНК- и ДНК-вирусов для доставки нуклеиновых кислот используют тщательно разработанные способы обеспечения целенаправленного воздействия вируса на конкретные клетки в организме и перемещения полезных последовательностей вируса в ядро. Вирусные векторы можно вводить непосредственно пациентам (in vivo) или их можно использовать для обработки клеток in vitro и модифицированные клетки можно необязательно вводить пациентам (ex vivo). Традиционные системы на основе вирусов могут включать ретровирусные, лентивирусные, аденовирусные векторы, векторы на основе аденоассоциированного вируса и вируса простого герпеса для переноса генов. Интеграция в геном хозяина возможна со способами переноса генов на основе ретровируса, лентивируса и аденоассоциированного вируса, что часто приводит к длительной экспрессии встроенного трансгена. Кроме того, высокие показатели эффективности трансдукции наблюдали у многих различных типов клеток и целевых тканей.
Тропизм ретровирусов может быть изменен путем включения чужеродных белков оболочки с расширением возможной целевой популяции целевых клеток. Лентивирусные векторы являются ретровирусными векторами, которые способны трансфицировать или инфицировать неделящиеся клетки и, как правило, дают высокие вирусные титры. Выбор системы переноса генов на основе ретровирусов, таким образом, будет зависеть от целевой ткани. Ретровирусные векторы состоят из действующих в цис-положении длинных концевых повторов с упаковывающей способностью до 6-10 п.о. чужеродной последовательности. Минимальных действующих в цис-положении LTR достаточно для репликации и упаковки векторов, которые затем используют для интеграции терапевтического гена в целевую клетку с получением постоянной экспрессии трансгена. Широко применяемые ретровирусные векторы включают такие, которые основаны на вирусе лейкоза мышей (MuLV), вирусе лейкоза гиббонов (GaLV), вирусе иммунодефицита обезьян (SIV), вирусе иммунодефицита человека (HTV) и их комбинациях (см., к примеру, Buchscher et al., J. Virol. 66: 2731-2739 (1992); Johann et al., J. Virol. 66: 1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63: 2374-2378 (1989); Miller et al., J. Virol. 65: 2220-2224 (1991); PCT/US94/05700).
В применениях, в которых транзиентная экспрессия является предпочтительной, можно применять системы на основе аденовирусов. Векторы на основе аденовирусов способны проявлять очень высокую эффективность трансдукции во многих типах клеток и не требуют деления клеток. С такими векторами были получены высокие титры и уровни экспрессии. Такой вектор можно получать в больших количествах в относительно простой системе. Векторы на основе аденоассоциированного вируса ("AAV") также можно использовать для трансдукции клеток целевыми нуклеиновыми кислотами, к примеру, при получении in vitro нуклеиновых кислот и пептидов, и для процедур генной терапии in vivo и ex vivo (см., к примеру, West et al., Virology 160: 38-47 (1987); патент США №4797368; WO 93/24641; Kotin, Human Gene Therapy 5: 793-801 (1994); Muzyczka, J. Clin. Invest. 94: 1351 (1994). Создание рекомбинантных AAV-векторов описано в ряде публикаций, в том числе в патенте США №5173414; Tratschin et al., Mol. Cell. Biol. 5: 3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4: 2072-2081 (1984); Hermonat & Muzyczka, PNAS 81: 6466-6470 (1984); и Samulski et al., J. Virol. 63: 03822-3828 (1989).
Упаковывающие клетки, как правило, используют для получения вирусных частиц, которые способны инфицировать клетку-хозяина. Такие клетки включают клетки 293, которые упаковывают аденовирус, и клетки ψ2 или клетки РАЗ 17, которые упаковывают ретровирус. Вирусные векторы, используемые в генной терапии, как правило, создают путем получения линии клеток, которые упаковывают вектор на основе нуклеиновой кислоты в вирусную частицу. Векторы обычно содержат минимальные вирусные последовательности, необходимые для упаковки и последующей интеграции в хозяина, при этом другие вирусные последовательности замещены кассетой экспрессии для экспрессии полинуклеотида(ов). Отсутствующие вирусные функции, как правило, обеспечивают во вспомогательном объекте при помощи линии упаковывающих клеток. Например, AAV-векторы, применяемые в генной терапии, как правило, имеют только ITR-последовательности из генома AAV, которые необходимы для упаковки и интеграции в геном хозяина. Вирусная ДНК упакована в линии клеток, которая содержит вспомогательную плазмиду, кодирующую другие гены AAV, а именно rep и cap, но без ITR-последовательностей. Линия клеток также может быть инфицирована аденовирусом в качестве вируса-помощника. Вирус-помощник способствует репликации AAV-вектора и экспрессии генов AAV из вспомогательной плазмиды. Вспомогательная плазмида не упакована в значительном количестве в связи с отсутствием ITR-последовательностей. Контаминация аденовирусом может быть снижена, к примеру, при помощи тепловой обработки, к которой аденовирус более чувствителен, чем AAV. Дополнительные способы доставки нуклеиновых кислот в клетки известны специалистам в данной области. См., например, US 20030087817, включенный в данный документ при помощи ссылки.
В некоторых вариантах осуществления клетка-хозяин транзиентно или не транзиентно трасфипирована одним или несколькими векторами, описанными в данном документе. В некоторых вариантах осуществления клетка трансфицирована так, как это в естественных условиях происходит у субъекта. В некоторых вариантах осуществления клетка, которую трансфицируют, взята от субъекта. В некоторых вариантах осуществления клетка получена из клеток, взятых от субъекта, как, например, линия клеток. Широкий спектр линий клеток для культуры тканей известен из уровня техники. Примеры линий клеток включают, без ограничения, С8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, эпителиальные клетки почки обезьяны BS-C-1, эмбриональные фибробласты мыши BALB/ 3T3, 3T3 Swiss, 3T3-L1, фетальные фибробласты человека 132-d5; фибробласты мыши 10.1, 293-Т, 3Т3, 721, 9L, А2780, A2780ADR, A2780cis, А172, А20, А253, А431, А-549, ALC, В16, В35, клетки ВСР-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10Т1/2, С6/36, Cal-27, СНО, СНО-7, CHO-IR, СНО-K1, СНО-K2, СНО-Т, СНО Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, СМТ, СТ26, D17, DH82, DU145, DuCaP, EL4, ЕМ2, ЕМ3, EMT6/AR1, EMT6/AR10.0, FM3, Н1299, Н69, НВ54, НВ55, НСА2, HEK-293, HeLa, Hepa1c1c7, HL-60, НМЕС, НТ-29, Jurkat, клетки JY, клетки K562, Ku812, KCL22, KG1, KY01, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, линии клеток OPCN/OPCT, Peer, PNT-1A/PNT 2, RenCa, RIN-5F, RMA/RMAS, клетки Saos-2, Sf-9, SkBr3, T2, T-47D, T84, линию клеток THP1, U373, U87, U937, VCaP, клетки Vero, WM39, WT-49, X63, YAC-1, YAR и их трансгенные варианты. Линии клеток доступны из ряда источников, известных специалистам в данной области (см., к примеру, Американскую коллекцию типовых культур (АТСС) (Манассас, Вирджиния)). В некоторых вариантах осуществления клетку, трансфицированную одним или несколькими векторами, описанными в данном документе, используют для получения новой линии клеток, содержащей одну или несколько полученных из вектора последовательностей. В некоторых вариантах осуществления клетку, транзиентно трансфицированную компонентами системы CRISPR, которая описана в данном документе (как, например, путем транзиентной трансфекции одним или несколькими векторами или трансфекции РНК), и модифицированную при помощи активности комплекса CRISPR, используют для получения новой линии клеток, содержащей клетки, которые содержат модификацию, но у которых отсутствует любая другая экзогенная последовательность. В некоторых вариантах осуществления клетки, транзиентно или не транзиентно трансфицированные одним или несколькими векторами, описанными в данном документе, или линии клеток, полученные из таких клеток, использовали при оценивании одного или нескольких тестовых соединений.
В некоторых вариантах осуществления один или несколько векторов, описанных в данном документе, используют для получения отличного от человека трансгенного животного или трансгенного растения. В некоторых вариантах осуществления трансгенным животным является млекопитающее, как, например, мышь, крыса или кролик. В определенных вариантах осуществления организмом или субъектом является растение. В определенных вариантах осуществления организмом, или субъектом, или растением является водоросль. Способы получения трансгенных растений и животных известны в уровне техники и, как правило, начинаются со способа трансфекции клетки, такого как описанный в данном документе. Также представлены трансгенные животные, как и трансгенные растения, в частности, сельскохозяйственные культуры и водоросли. Трансгенное животное или растение могут быть полезными в других путях применения, помимо обеспечения модели заболевания. Они могут включать производство пищи или кормопроизводство посредством биосинтеза, например, белков, углеводов, питательных веществ или витаминов на более высоких уровнях, чем будет наблюдаться в обычных условиях у дикого типа. В этом отношении предпочтительными являются трансгенные растения, в особенности зернобобовые и клубнеплоды, и животные, в особенности млекопитающие, такие как крупный рогатый скот (коровы, овцы, козы и свиньи), но также домашняя птица и съедобные насекомые.
Трансгенные водоросли или другие растения, такие как рапс, могут быть особенно применимыми в производстве растительных масел или таких видов биотоплива, как, например, спирты (особенно метанол и этанол). Они могут быть сконструированы для синтеза или сверхсинтеза масла или спиртов на высоких уровнях для применения в масложировой или биотопливной промышленности.
В одном аспекте настоящее изобретение предусматривает способы модификации целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида с модификацией, таким образом, целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.
В одном аспекте настоящее изобретение предусматривает способ модификации экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.
С учетом недавних достижений в области геномики сельскохозяйственных культур возможность применения системы CRISPR-Cas для осуществления эффективных и экономичных редактирования генов и манипуляции с ними обеспечит возможность быстрого отбора и сравнения одиночных и мультиплексных генетических манипуляций для трансформирования таких геномов в отношении повышенного производства и улучшенных признаков. В связи с этим делается ссылка на патенты США и публикации патентов США: патент США №6603061 - опосредованный агробактериями способ трансформации растений (Agrobacterium-Mediated Plant Transformation Method); патент США №7868149 - последовательности генома растений и их применение (Plant Genome Sequences and Uses Thereof) и US 2009/0100536 - трансгенные растения с улучшенными агротехническими признаками (Transgenic Plants with Enhanced Agronomic Traits), все содержания и раскрытия каждого из которых включены в данный документ при помощи ссылки в полном объеме. При осуществлении на практике настоящего изобретения содержание и раскрытие Morrell et al "Crop genomics:advances and applications" Nat Rev Genet. 2011 Dec 29;13(2): 85-96 также включены в данный документ при помощи ссылки в полном объеме. В преимущественном варианте осуществления настоящего изобретения систему CRISPR/Cas9 используют для конструирования микроводорослей (пример 14). Соответственно, в данном документе ссылка на клетки животных также может быть применима, с учетом необходимых изменений, по отношению к клеткам растений, если явно не следует иное.
В одном аспекте настоящее изобретение предусматривает способы модификации целевого полинуклеотида в эукариотической клетке, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает забор клетки или популяции клеток от человека, или отличного от человека животного, или растения (в том числе микроскопических водорослей) и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение (в том числе микроскопические водоросли).
В одном аспекте настоящее изобретение предусматривает наборы, содержащие любой один или несколько из элементов, раскрытых в приведенных выше способах и композициях. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (а) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания направляющей последовательности выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и/или (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации. Элементы могут быть предоставлены отдельно или в комбинациях и могут быть предоставлены в любом подходящем контейнере, как, например, пузырьке, флаконе или пробирке. В некоторых вариантах осуществления набор включает инструкции на одном или нескольких языках, например, на более чем одном языке.
В некоторых вариантах осуществления набор содержит один или несколько реагентов для применения в способе, в котором используется один или несколько элементов, описанных в данном документе. Реагенты могут быть предоставлены в любом подходящем контейнере. Например, набор может предусматривать один или несколько реакционных буферов или буферов для хранения. Реагенты могут быть предоставлены в форме, которая применима в конкретном анализе, или в форме, которая предусматривает добавление одного или нескольких других компонентов перед применением (к примеру, в форме концентрата или лиофилизированной форме). Буфер может быть любым буфером, в том числе без ограничения буфером с карбонатом натрия, буфером с бикарбонатом натрия, боратным буфером, Tris-буфером, буфером MOPS, буфером HEPES и их комбинациями. В некоторых вариантах осуществления буфер является щелочным. В некоторых вариантах осуществления буфер имеет значение рН от приблизительно 7 до приблизительно 10. В некоторых вариантах осуществления набор содержит один или несколько олигонуклеотидов, соответствующих направляющей последовательности, для встраивания в вектор для того, чтобы имела место функциональная связь направляющей последовательности и регуляторного элемента. В некоторых вариантах осуществления набор содержит матричный полинуклеотид для гомологичной рекомбинации.
В одном аспекте настоящее изобретение предусматривает способы применения одного или нескольких элементов системы CRISPR. Комплекс CRISPR по настоящему изобретению обеспечивает эффективное средство модификации целевого полинуклеотида. Комплекс CRISPR по настоящему изобретению характеризуется большим разнообразием полезных свойств, включая модификацию (например, делению, вставку, транслокацию, инактавацию, активацию) целевого полинуклеотида во множестве типов клеток. Комплекс CRISPR по настоящему изобретению как таковой имеет широкий спектр применений, к примеру, в генной терапии, скрининге лекарственных средств, диагностике и прогнозировании заболеваний. Иллюстративный комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, которая гибридизируется с целевой последовательностью в целевом полинуклеотиде. Направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.
Целевым полинуклеотидом комплекса CRISPR может быть любой полинуклеотид, эндогенный или экзогенный по отношению к эукариотической клетке. Например, целевой полинуклеотид может быть полинуклеотидом, находящимся в ядре эукариотической клетки. Целевой полинуклеотид может быть последовательностью, кодирующей продукт гена (к примеру, белок), или некодирующей последовательностью (к примеру, регуляторным полинуклеотидом или избыточной ДНК). Не желая быть связанными теорией, полагают, что целевая последовательность должна быть ассоциирована с РАМ (мотивом, смежным с протоспейсером); то есть короткой последовательностью, узнаваемой комплексом CRISPR. Определенные требования в отношении последовательности и длины РАМ различаются в зависимости от применяемого фермента CRISPR, но РАМ, как правило, является последовательностью в 2-5 пар оснований, смежной с протоспейсером (то есть целевой последовательности). Примеры последовательностей РАМ приведены в разделе "Примеры" ниже, и специалист в данной области сможет выявить дополнительные последовательности РАМ для применения с данным ферментом CRISPR.
Целевой полинуклеотид комплекса CRISPR может включать некоторое количество ассоциированных с заболеваниями генов и полинуклеотидов, а также ассоциированных с биохимическими путями проведения сигнала генов и полинуклеотидов, которые перечислены в предварительных заявках на патент США 61/736527 и 61/748427 с общей ссылкой BI-2011/008/WSGR, номер в реестре 44063-701.101, и BI-2011/008/WSGR, номер в реестре 44063-701.102, соответственно, обе озаглавленные "СИСТЕМЫ, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИЯ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION), поданные 12 декабря 2012 г. и 2 января 2013 г., соответственно, содержания всех из которых включены в данный документ при помощи ссылки в полном объеме.
Примеры целевых полинуклеотидов включают последовательность, ассоциированную с биохимическими путями передачи сигнала, к примеру, ген или полинуклеотид, ассоциированные с биохимическими путями передачи сигнала. Примеры целевых полинуклеотидов включают ассоциированный с заболеванием ген или полинуклеотид. "Ассоциированный с заболеванием" ген или полинуклеотид означает любой ген или полинуклеотид, который обеспечивает продукты транскрипции или трансляции на отклоняющемся от нормы уровне или в отклоняющейся от нормы форме в клетках, полученных из пораженных заболеванием тканей, по сравнению с тканями или клетками контроля без заболевания. Это может быть ген, который начинает экспрессироваться при ненормально высоком уровне; это может быть ген, который начинает экспрессироваться при ненормально низком уровне, где измененная экспрессия коррелирует с появлением и/или развитием заболевания. Ассоциированный с заболеванием ген также означает ген, несущий мутацию(и) или генетическое изменение, который непосредственно ответственен или находится в неравновесном сцеплении с геном(ами), который(е) ответственен(ны) за этиологию заболевания. Транскрибируемые или транслируемые продукты могут быть известными или неизвестными и могут быть на нормальном уровне или на отклоняющемся от нормального уровне.
Примеры ассоциированных с заболеваниями генов и полинуклеотидов доступны от Института генетической медицины Маккьюсика-Натанса (McKusick-Nathans Institute of Genetic Medicine) при Университете Джонса Хопкинса (Johns Hopkins University) (Балтимор, Мэриленд) и Национального центра биотехнологической информации (National Center for Biotechnology Information) при Национальной библиотеке медицины (National Library of Medicine) (Бетесда, Мэриленд), доступных во всемирной сети Интернет.
Примеры ассоциированных с заболеваниями генов и полинуклеотидов перечислены в таблицах А и В. Конкретная информация в отношении заболеваний доступна от Института генетической медицины Маккьюсика-Натанса (McKusick-Nathans Institute of Genetic Medicine) при Университете Джонса Хопкинса (Johns Hopkins University) (Балтимор, Мэриленд) и Национального центра биотехнологической информации (National Center for Biotechnology Information), Национальной библиотеки медицины (National Library of Medicine) (Бетесда, Мэриленд), доступных во всемирной сети Интернет. Примеры ассоциированных с биохимическими путями передачи сигнала генов и полинуклеотидов перечислены в таблице С.
Мутации в этих генах и путях могут приводить к продуцированию несоответствующих белков или белков в несоответствующих количествах, которые воздействуют на функцию. Дополнительные примеры генов, заболеваний и белков, таким образом, включены при помощи ссылки из предварительных заявок на патент США 61/736527 и 61/748427. Такие гены, белки и пути могут быть целевым полинуклеотидом комплекса CRISPR.
Варианты осуществления настоящего изобретения также относятся к способам и композициям, связанным с нокаутированием генов, амплифицированием генов и репарацией конкретных мутаций, ассоциированных с нестабильностью ДНК-повторов и неврологическими нарушениями (Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Second Edition, Academic Press, Oct 13, 2011 - Medical). Как было обнаружено, определенные аспекты последовательностей тандемных повторов ответственны за более двадцати заболеваний человека (New insights into repeat instability: role of RNA•DNA hybrids. Mclvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct; 7(5): 551-8). Система CRISPR-Cas может быть приспособлена для корректировки таких дефектов геномной нестабильности.
Дополнительный аспект настоящего изобретения относится к использованию системы CRISPR-Cas для корректирования дефектов в генах ЕМР2А и ЕМР2 В, которые, как было обнаружено, ассоциированы с болезнью Лафора. Болезнь Лафора представляет собой аутосомно-рецессивное состояние, которое характеризуется прогрессирующей миоклонус-эпилепсией, которая может начинаться как эпелиптический приступ в подростковом возрасте. Некоторые случаи заболевания могут вызываться мутациями в генах, которые уже были выявлены. Заболевание вызывает приступы, мышечные спазмы, затрудненную ходьбу, слабоумие и, в конечном итоге, смерть. В настоящее время не существует терапии, которая показала эффективность против развития заболевания. На другие генетические расстройства, ассоциированные с эпилепсией, также можно целенаправленно воздействовать при помощи системы CRISPR-Cas, и лежащая в основе генетика дополнительно описана в Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology: 20; 2009).
В еще одном аспекте настоящего изобретения систему CRISPR-Cas можно использовать для корректировки офтальмологических дефектов, которые являются результатом нескольких генетических мутаций, дополнительно описанных в Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012.
Некоторые дополнительные аспекты настоящего изобретения связаны с корректированием дефектов, ассоциированных с широким спектром генетических заболеваний, которые дополнительно описаны на веб-сайте Национальных институтов здравоохранения (National Institutes of Health) в тематическом подразделе "Наследственные заболевания" ("Genetic Disorders"). Наследственные заболевания головного мозга могут включать без ограничения адренолейкодистрофию, агенезию мозолистого тела, синдром Айкарди, синдром Альперса, болезнь Альцгеймера, синдром Барта, болезнь Баттена, CADASIL, мозжечковую дегенерацию, болезнь Фабри, синдром Герстмана-Штраусслера-Шейнкера, болезнь Гентингтона и другие связанные с триплетным повтором нарушения, болезнь Лея, синдром Леша-Найхана, болезнь Менкеса, типы митохондриальной миопатии и кольпоцефалию по критериям NTNDS. Такие заболевания дополнительно описаны на веб-сайте Национальных институтов здравоохранения (National Institutes of Health) в тематическом подразделе "Наследственные заболевания головного мозга" ("Genetic Brain Disorders").
В некоторых вариантах осуществления состоянием может быть неоплазия. В некоторых вариантах осуществления, где состоянием является неоплазия, гены, на которые целенаправленно воздействуют, являются любыми из перечисленных в таблице А (в данном случае PTEN и так далее). В некоторых вариантах осуществления состоянием может быть возрастная дегенерация желтого пятна. В некоторых вариантах осуществления состоянием может быть шизофреническое нарушение. В некоторых вариантах осуществления состоянием может быть связанное с тринуклеотидным повтором нарушение. В некоторых вариантах осуществления состоянием может быть синдром ломкой Х-хромосомы. В некоторых вариантах осуществления состоянием может быть связанное с активностью секретазы нарушение. В некоторых вариантах осуществления состоянием может быть связанное с прионами нарушение. В некоторых вариантах осуществления состоянием может быть ALS. В некоторых вариантах осуществления состоянием может быть привыкание к наркотическим средствам. В некоторых вариантах осуществления состоянием может быть аутизм. В некоторых вариантах осуществления состоянием может быть болезнь Альцгеймера. В некоторых вариантах осуществления состоянием может быть воспаление. В некоторых вариантах осуществления состоянием может быть болезнь Паркинсона.
Примеры белков, ассоциированных с болезнью Паркинсона, включают без ограничения α-синуклеин, DJ-1, LRRK2, PINK1, паркин, UCHL1, синфилин-1 и NURR1.
Примеры связанных с привыканием белков могут включать, например, АВАТ.
Примеры связанных с воспалением белков могут включать, например, моноцитарный хемоаттрактантный белок-1 (monocyte chemoattractant protein-1) (МСР1), кодируемый геном Ccr2, С-С рецептор хемокина 5 типа (С-С chemokine receptor type 5) (CCR5), кодируемый геном Ccr5, IgG-рецептор IIB (IgG receptor IIB) (FCGR2b, также называемый CD32), кодируемый геном Fcgr2b, или белок Fc-эпсилон-R1g (Fc epsilon R1g) (FCER1g), кодируемый геном Fcer1g.
Примеры ассоциированных с заболеваниями сердечно-сосудистой системы белков могут включать, например, IL1B (интерлейкин 1, бета (interleukin 1, beta)), XDH (ксантиндегидрогеназу (xanthine dehydrogenase)), TP53 (опухолевый белок р53 (tumor protein р53)), PTGIS (простагландин-I2(простациклин)-синтазу (prostaglandin I2 (prostacyclin) synthase)), MB (миоглобин (myoglobin)), IL4 (интерлейкин 4 (interleukin 4)), ANGPT1 (ангиопоэтин 1 (angiopoietin 1)), ABCG8 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 8 (ATP-binding cassette, sub-family G (WHITE), member 8)) или CTSK (катепсин K (cathepsin K)).
Примеры ассоциированных с болезнью Альцгеймера белков могут включать, например, белок, представляющий собой рецептор липопротеинов очень низкой плотности (very low density lipoprotein receptor protein) (VLDLR), кодируемый геном VLDLR, убиквитин-подобный модификатор-активирующий фермент 1 (ubiquitin-like modifier activating enzyme 1) (UBA1), кодируемый геном UBA1, или белок, являющийся каталитической субъединицей NEDD8-aKTHBHpyioniero фермента E1 (NEDD8-activating enzyme E1 catalytic subunit protein) (UBE1C), кодируемый геном UBA3.
Примеры белков, ассоциированных с расстройствами аутистического спектра, могут включать, например, белок 1, ассоциированный с периферическим бензодиазепиновым рецептором (benzodiazapine receptor (peripheral) associated protein 1) (BZRAP1), кодируемый геном BZRAP1, белок, представитель 2 семейства AF4/FMR2 (AF4/FMR2 family member 2 protein) (AFF2), кодируемый геном AFF2 (также называемый MFR2), белок-аутосомный гомолог 1, ассоциированный с умственной отсталостью, связанной с ломкой Х-хромосомой (fragile X mental retardation autosomal homolog 1 protein) (FXR1), кодируемый геном FXR1, или белок-аутосомный гомлог 2, ассоциированный с умственной отсталостью, связанной с ломкой Х-хромосомой (fragile X mental retardation autosomal homolog 2 protein) (FXR2), кодируемый геном FXR2.
Примеры белков, ассоциированных с дегенерацией желтого пятна, могут включать, например, АТФ-связываюшую кассету, белок-представитель 4 подсемейства А (АВС1) (ATP-binding cassette, sub-family А (АВС1) member 4 protein) (ABCA4), кодируемый геном ABCR, белок-аполипротеин E (apolipoprotein E protein) (APOE), кодируемый геном APOE, или белок-лиганд 2 хемокина (С-С мотив) (chemokine (С-С motif) Ligand 2 protein) (CCL2), кодируемый геном CCL2.
Примеры белков, ассоциированных с шизофренией, могут включать NRG1, ErbB4, CPLX1, ТРН1, ТРН2, NRXN1, GSK3A, BDNF, DISCI, GSK3B и их комбинации.
Примеры белков, вовлеченных в подавление опухоли, могут включать, например, ATM (мутированный, атаксия-телеангиэктазия (ataxia telangiectasia mutated)), ATR (атаксия-телеангиэктазия- и Rad3-родственный (ataxia telangiectasia and Rad3 related)), EGFR (рецептор эпидермального фактора роста (epidermal growth factor receptor)), ERBB2 (гомолог 2 v-erb-b2 эритробластического лейкоза вирусного онкогена (v-erb-b2 erythroblastic leukemia viral oncogene homolog 2)), ERBB3 (гомолог 3 v-erb-b2 эритробластического лейкоза вирусного онкогена (v-erb-b2 erythroblastic leukemia viral oncogene homolog 3)), ERBB4 (гомолог 4 v-erb-b2 эритробластического лейкоза вирусного онкогена (v-erb-b2 erythroblastic leukemia viral oncogene homolog 4)), Notch 1, Notch 2, Notch 3 или Notch 4.
Примеры белков, ассоциированных с нарушением, связанным с активностью секретазы, могут включать, например, PSENEN (presenilin enhancer 2 homolog (С. elegans)), CTSB (катепсин В (cathepsin В)), PSEN1 (пресенилин 1 (presenilin 1)), APP (белок-предшественник бета-амилоида (A4) (amyloid beta (A4) precursor protein)), APH1B (anterior pharynx defective 1 homolog В (С.elegans)), PSEN2 (пресенилин 2 (болезнь Альцгеймера 4) (presenilin 2 (Alzheimer disease 4)) или BACE1 (АРР-расщепляющий фермент 1 по бета-сайту (beta-site APP-cleaving enzyme 1)).
Примеры белков, ассоциированных с амиотрофическим латеральным склерозом, могут включать, например, SOD1 (супероксиддисмутазу 1 (superoxide dismutase 1)), ALS2 (белок, ассоциированный с амиотрофическим латеральным склерозом 2 (amyotrophic lateral sclerosis 2)), FUS (РНК-связывающий белок FUS (fused in sarcoma)), TARDBP (TAR-ДНК связывающий белок (TAR DNA binding protein)), VAGFA (фактор роста эндотелия сосудов A (vascular endothelial growth factor A)), VAGFB (фактор роста эндотелия сосудов В (vascular endothelial growth factor В)) и VAGFC (фактор роста эндотелия сосудов С (vascular endothelial growth factor С)) и любую их комбинацию.
Примеры белков, ассоциированных с прионными болезнями, могут включать SOD1 (супероксиддисмутазу 1), ALS2 (белок, ассоциированный с амиотрофическим латеральным склерозом 2 (amyotrophic lateral sclerosis 2)), FUS (РНК-связывающий белок FUS (fused in sarcoma)), TARDBP (TAR-ДНК связывающий белок (TAR DNA binding protein)), VAGFA (фактор роста эндотелия сосудов A (vascular endothelial growth factor A)), VAGFB (фактор роста эндотелия сосудов В (vascular endothelial growth factor В)) и VAGFC (фактор роста эндотелия сосудов С (vascular endothelial growth factor С)) и любую их комбинацию.
Примеры белков, связанных с нейродегенеративными состояниями при прионных болезнях, могут включать, например, А2М (альфа-2-макроглобулин (Alpha-2-Macroglobulin)), AATF (фактор транскрипции, противодействующий апоптозу (Apoptosis antagonizing transcription factor)), ACPP (простатоспецифическую кислую фосфатазу (Acid phosphatase prostate)), ACTA2 (альфа-актин 2 гладкой мускулатуры аорты (Actin alpha 2 smooth muscle aorta)), ADAM22 (ADAM, металлопептидазный домен (ADAM metallopeptidase domain)), ADORA3 (аденозиновыи рецептор A3 типа (Adenosine A3 receptor)) или ADRA1D (альфа-1D адренергический рецептор для альфа-1D адренорецептора (Alpha-1D adrenergic receptor for Alpha-1D adrenoreceptor)).
Примеры белков, ассоциированных с иммунодефицитом, могут включать, например, А2М [альфа-2-макроглобулин (alpha-2-macroglobulin)]; AANAT [арилалкиламин-N-ацетилтрансферазу (arylalkylamine N-acetyltransferase)]; АВСА1 [АТФ-связывающую кассету, подсемейство А (АВС1), представитель 1 (ATP-binding cassette, sub-family А (АВС1), member 1)]; ABCA2 [АТФ-связывающую кассету, подсемейство А (АВС1), представитель 2 (ATP-binding cassette, sub-family A (ABC1), member 2)] или АВСАЗ [АТФ-связывающую кассету, подсемейство А (АВС1), представитель 3 (ATP-binding cassette, sub-family А (АВС1), member 3)].
Примеры белков, ассоциированных с нарушениями, связанными с тринуклеотидным повтором, включают, например, AR (андрогеновый рецептор (androgen receptor)), FMR1 (белок 1, ассоциированный с умственной отсталостью, связанной с ломкой Х-хромосомой (fragile X mental retardation 1)), НТТ (хантигтин (huntmgtin)) или DMPK (протеинкиназу, ассоциированную с мышечной дистрофией (dystrophia myotonica-protein kinase)), FXN (фратаксин (frataxin)), ATXN2 (атаксин 2 (ataxin 2)).
Примеры белков, ассоциированных с нарушениями передачи нервных импульсов включают, например, SST (соматостатин (somatostatin)), NOS1 (синтазу оксида азота 1 (нейрональную) (nitric oxide synthase 1 (neuronal)), ADRA2A (адренергический, альфа-2А-, рецептор (adrenergic, alpha-2A-, receptor)), ADRA2C (адренергический, альфа-2С-, рецептор (adrenergic, alpha-2C-, receptor)), TACR1 (тахикининовый рецептор 1 (tachykinin receptor 1)) или HTR2c (5-гадрокситриптаминовый (серотониновый) рецептор 2С (5- hydroxytryptamine (serotonin) receptor 2C)).
Примеры последовательностей, ассоциированных с неврологическим развитием, включают, например, А2 ВР1 [атаксин 2-связывающий белок 1 (ataxin 2-binding protein 1)], AADAT [аминоадипатаминотрансферазу (aminoadipate aminotransferase)], AANAT [арилалкиламин-Н-ацетилтрансферазу (arylalkylamine N-acetyltransferase)], ABAT [4- аминобутиратаминтрансферазу (4-aminobutyrate aminotransferase)], ABCA1 [АТФ-связывающую кассету, подсемейство A (ABC1), представитель 1 (ATP-binding cassette, sub-family A (ABC1), member 1)] или ABCA13 [АТФ-связывающую кассету, подсемейство А (АВС1), представитель 13 (ATP-binding cassette, sub-family А (АВС1), member 13)].
Дополнительные примеры предпочтительных состояний, которые подлежат лечению с помощью данной системы, включают те, которые могут быть выбраны из синдрома Айкарди-Гутьереса; болезни Александера; синдрома Аллана-Херндона-Дадли; связанных с геном POLG нарушений; альфа-маннозидоза (II и III тип); синдрома Альстрема; синдрома Ангельмана; атаксии-телеангиэктазии; нейронного высоковидного липофусциноза; бета-талассемии; двусторонней атрофии зрительного нерва и (инфантильной) атрофии зрительного нерва 1 типа; ретинобластомы (двусторонней); болезни Канавана; церебро-окуло-фацио-скелетного синдрома 1 [COFS1]; церебротендинального ксантоматоза; синдрома Корнелии де Ланге; связанных с геном МАРТ нарушений; наследственных прионных болезней; синдрома Драве; семейной болезни Альцгеймера с ранним началом; атаксии Фридрейха [FRDA]; синдрома Фринса; фукозидоза; врожденной мышечной дистрофии Фукуямы; галактосиалидоза; болезни Гоше; органической ацидемии; гемофагоцитарного лимфогистиоцитоза; синдрома прогерии Гетчинсона-Гилфорда; муколипидоза II; инфантильной болезни накопления свободной сиаловой кислоты; ассоциированной с геном PLA2G6 нейродегенерации; синдрома Джервелла-Ланге-Нильсена; узелкового врожденного буллезного эпидермолиза; болезни Гентингтона; болезни Краббе (инфантильной); ассоциированного с митохондриальной ДНК синдрома Ли и NARP; синдрома Леша-Найхана; ассоциированной с геном LIS1 лиссэнцефалии; синдрома Лоу; болезни "кленового сиропа"; синдрома дупликации МЕСР2; связанных с геном АТР7А нарушений обмена меди; связанной с геном LAMA2 мышечной дистрофии; недостаточности арилсульфатазы А; мукополисахаридоза I, II или III типов; связанных с биогенезом пероксисом нарушений, спектра заболеваний по типу синдрома Цельвегера; нарушений по типу нейродегенерации с накоплением железа в головном мозге; недостаточности кислой сфингомиелиназы; болезни Ниманна-Пика С типа; глициновой энцефалопатии; связанных с геном ARX нарушений; нарушений орнитинового цикла; связанного с геном COL1A1/2 несовершенного остеогенеза; синдромов удаления митохондриальной ДНК; связанных с геном PLP1 нарушений; синдрома Перри; синдрома Фелана-МакДермида; болезни накопления гликогена II типа (болезни Помпе) (инфантильной); связанных с геном МАРТ нарушений; связанных с геном МЕСР2 нарушений; эпифизарной точечной хондродисплазии 1 типа костей верхних конечностей или бедренной кости; синдрома Робертса; болезни Сандхоффа; болезни Шиндлера - 1 типа; аденозиндезаминазной недостаточности; синдрома Смита-Лемли-Опитца; спинальной мышечной атрофии; спинально-церебеллярной атаксии с возникновением в младенческом возрасте; недостаточности гексозаминидазы А; танатофорной дисплазии 1 типа; связанных с геном коллагена VI типа нарушений; синдрома Ашера I типа; врожденной мышечной дистрофии; синдрома Вольфа-Хиршхорна; недостаточности лизосомной кислой липазы и пигментной ксеродермы.
Длительное введение белковых терапевтических средств может вызвать нежелательные иммунные ответы на данный белок. Иммуногенность белковых лекарственных средств может объясняться наличием нескольких иммунодоминантных эпитопов для Т-лимфоцитов-хелперов (HTL). Путем снижения аффинности связывания этих эпитопов для HTL, содержащихся в данных белках, с МНС можно создавать лекарственные средства с более низкой иммуногенностью (Tangri S, et al. ("Rationally engineered therapeutic proteins with reduced immunogenicity" J Immunol. 2005 Mar 15; 174(6): 3187-96.) В настоящем изобретении иммуногенность фермента CRISPR, в частности, можно снизить, следуя подходу, впервые изложенному Tangri и соавт. в отношении эритропоэтина и впоследствии получившему развитие. Соответственно, для снижения иммуногенности фермента CRISPR (например, Cas9) у вида-хозяина (человека или другого вида) можно применять направленную эволюцию или рациональное проектирование.
У растений патогены часто являются специфичными по отношению к хозяину. Например, Fusarium oxysporum f. sp. lycopersici вызывает фузариозный вилт томата, но поражает только томат, a F. oxysporum f. dianthii и Puccinia graminis f. sp.tritici поражают только пшеницу. Растения обладают присущими и индуцированньгми защитными реакциями, обеспечивающими устойчивость к большинству патогенов. Мутации и события рекомбинации в поколениях растений приводят к генетической изменчивости, которая обуславливает восприимчивость, тем более, что патогены размножаются с большей частотой, чем растения. У растений может наблюдаться устойчивость видов - нехозяев, например, хозяин и патоген являются несовместимыми. Также может наблюдаться горизонтальная устойчивость, например, частичная устойчивость ко всем расам патогена, обычно контролируемая многими генами, и вертикальная устойчивость, например, полная устойчивость к некоторым расам патогена, но не к другим расам, обычно контролируемая несколькими генами. На уровне взаимодействия генов растения и патогены эволюционируют совместно, а генетические изменения одного уравновешивают изменения другого. Соответственно, используя естественную изменчивость, селекционеры комбинируют наиболее полезные гены для урожайности, качества, однородности, выносливости, устойчивости. Источники генов устойчивости включают нативные или чужеродные сорта, старинные сорта, родственные дикорастущие растения и индуцированные мутации, например, при обработке растительного материала мутагенными средствами. Применяя настоящее изобретение, селекционеры растений получают новый инструмент для индукции мутаций. Соответственно, специалист в данной области может проанализировать геном источников генов устойчивости, а в отношении сортов, имеющих желаемые характеристики или признаки, использовать настоящее изобретение для индукции появления генов устойчивости с большей точностью, чем в случае применявшихся ранее мутагенных средств, и, следовательно, ускорять и улучшать программы селекции растений.
Как будет понятно, предусматривается, что настоящую систему можно использовать для целенаправленного воздействия на любую представляющую интерес полинуклеотидную последовательность. Некоторые состояния или заболевания, которые можно эффективно лечить с использованием настоящей системы, включены в таблицы выше, и примеры известных на данный момент генов, ассоциированных с такими состояниями, также предоставлены в них. Тем не менее, гены, приведенные в качестве примеров, не являются исчерпывающими.
ПРИМЕРЫ
Следующие примеры приведены с целью иллюстрации различных вариантов осуществления настоящего изобретения и не предназначены для ограничения настоящего изобретения каким-либо образом. Данные примеры совместно со способами, описанными в данном документе, в настоящее время отражают предпочтительные варианты осуществления, являются иллюстративными и не предназначены для ограничения объема настоящего изобретения. Изменения в данном документе и другие применения, которые охватываются сутью настоящего изобретения, как определено объемом формулы изобретения, будут очевидны специалистам в данной области.
Пример 1: Активность комплекса CRISPR в ядре эукариотической клетки
Примером системы CRISPR II типа является локус CRISPR II типа из Streptococcus pyogenes SF370, который содержит кластер из 4 генов Cas9, Cas1, Cas2 и Csn1, а также два некодирующих элемента РНК, tracrRNA и характерный массив повторяющихся последовательностей (прямых повторов), чередующихся с короткими фрагментами неповторяющихся последовательностей (спейсерами, примерно 30 п.о. каждый). В этой системе двухцепочечный разрыв (DSB) целевой ДНК образовывается в ходе четырех последовательных стадий (фигура 2А). Во-первых, две некодирующие РНК, массив pre-crRNA и tracrRNA транскрибируются с локуса CRISPR. Во-вторых, tracrRNA гибридизируется с прямыми повторами pre-crRNA, которая затем процессируется в зрелые crRNA, содержащие индивидуальные спейсерные последовательности. В-третьих, комплекс зрелая crRNA: tracrRNA направляет Cas9 к ДНК-мишени, состоящей из протоспейсера и соответствующего РАМ, посредством образования гетеродуплекса между спейсерным участком crRNA и протоспейсерной ДНК. И наконец, Cas9 опосредует расщепление целевой ДНК выше РАМ с образованием DSB внутри протоспейсера (фигура 2А). В данном примере описывается иллюстративный способ для приспособления этой РНК-программируемой нуклеазной системы к управлению активностью комплекса CRISPR в ядрах эукариотических клеток.
Для улучшения экспрессии компонентов CRISPR в клетках млекопитающих два гена из локуса 1 SF370 Streptococcus pyogenes (S. pyogenes) были кодон-оптимизированы, Cas9 (SpCas9) и РНКаза III (SpRNase III). Для обеспечения ядерной локализации клеточный сигнал ядерной локализации (NLS) включали в амино(N-) или карбоксильные(С-) терминальные области и SpCas9, и SpRNase III (Фигура 2В). Для обеспечения визуализации экспрессии белков ген флуоресцентного белка в качестве маркера также включали в N- или С-терминальные области обоих белков (фигура 2В). Также был создан вариант SpCas9 с NLS, прикрепленным и к N-, и к С-терминальным областям (2xNLS-SpCas9). Конструкции, содержащие слитый с NLS SpCas9 и SpRNase III трансфицировали в клетки почки эмбриона человека (HEK) 293FT, и было обнаружено, что относительное положение NLS относительно SpCas9 и SpRNase III влияет на их эффективность ядерной локализации. Хотя С-терминального NLS было достаточно для нацеливания SpRNase III в ядро, прикрепление одной копии этих конкретных NLS либо к N-, либо к C-терминальной области SpCas9 не было способно обеспечить адекватную ядерную локализацию в этой системе. В этом примере C-терминальный NLS был из нуклеоплазмина (KRPAATKKAGQAKKKK), а C-терминальный NLS был из большого Т-антигена SV40 (PKKKRKV). Из тестируемых вариантов SpCas9 только 2xNLS-SpCas9 проявлял ядерную локализацию (фигура 2 В).
tracrRNA из локуса CRISPR S. pyogenes SF370 содержал два сайта инициации транскрипции, дающие начало двум транскриптам из 89 нуклеотидов (нт) и 171 нт, которые затем подвергались процессингу в идентичные зрелые tracrRNA из 75 нт. Более короткие tracrRNA из 89 нт отбирали на предмет экспрессии в клетках млекопитающих (экспрессирующая конструкция изображена на фигуре 6, с функциональностью, как определено по результатам анализа с помощью Surveryor, показанным на фигуре 6В). Сайты инициации транскрипции обозначены как +1, а также указаны терминатор транскрипции и последовательность, гибридизирующаяся с зондом при нозерн-блоттинге. Экспрессию подвергнутой процессингу tracrRNA также подтверждали с помощью нозерн-блоттинга. На фигуре 7С показаны результаты анализа с помощью нозерн-блоттинга общей РНК, экстрагированной из клеток 293FT, трансфицированных экспрессирующими конструкциями U6, несущими длинную или короткую tracrRNA, а также SpCas9 и DR-EMX1(1)-DR. Левая и правая секции получены с клетками 293FT, трансфицированными без или с SpRNase III, соответственно. U6 являются показателем для контроля загрузки при блоттинге с зондом, нацеленным на малую ядерную РНК (snRNA) U6 человека. Трансфекция экспрессирующей конструкции с короткой tracrRNA приводит к избыточным уровням подвергшейся процессингу формы tracrRNA (~75 п.о.). Очень низкие количества длинных tracrRNA обнаруживали при нозерн-блоттинге.
Для стимуляции точной инициации транскрипции промотор U6 на основе РНК-полимеразы III выбирали для управления экспрессией tracrRNA (фигура 2С). Подобным образом, конструкцию на основе промотора U6 разрабатывали для экспрессии массива pre-crRNA, состоящего из одного спейсера, фланкированного двумя прямыми повторами (DR, также включены в выражение "парные tracr-последовательности"; фигура 2С). Исходный спейсер был разработан для целенаправленного воздействия на целевой сайт из 33 пар оснований (п.о.) (протоспейсер из 30 п.о., а также последовательность мотива CRISPR (РАМ) из 3 п.о., соответствующая мотиву узнавания NGG у Cas9) в локусе ЕМХ1 человека (фигура 2С), ключевом гене в развитии коры головного мозга.
Клетки НЕК 293FT трансфицировали комбинациями компонентов CRISPR для того, чтобы определить, возможно ли при гетерологичной экспрессии системы CRISPR (SpCas9, SpRNase III, tracrRNA и pre-crRNA) в клетках млекопитающих достичь целенаправленного расщепления хромосом млекопитающего. Поскольку DSB в ядрах млекопитающих подвергаются частичной репарации с помощью пути негомологичного соединения концов (NHEJ), который приводит к образованию вставок/делений, анализ с помощью Surveyor использовали для выявления возможной активности для расщепления в целевом локусе ЕМХ1 (см., например, Guschin et al., 2010, Methods Mol Biol 649: 247). Котрансфекция всех четырех компонентов CRISPR была способна индуцировать расщепления в протоспейсере до 5,0% (см. фигуру 2D). Котрансфекция всех компонентов CRISPR, за исключением SpRNase III, также индуцировала образование вставок/делеций в протоспейсере на уровне до 4,7%, что указывало на то, что могут существовать эндогенные РНКазы млекопитающих, которые способны помогать созреванию crRNA, такие как, например, родственные ферменты Dicer и Drosha. Удаление любого из трех остальных компонентов ликвидировало активность системы CRISPR для расщепления генома (фигура 2D). Секвенирование по Сэнгеру ампликонов, содержащих целевой локус, подтверждало активность для расщепления: на 43 подвергшихся секвенированию клонов было обнаружено 5 мутированных аллелей (11,6%). В подобных экспериментах с использованием ряда направляющих последовательностей процентные значения содержания вставок/делеций составляли до 29% (см. фигуры 4-7, 12 и 13). Эти результаты определяют трехкомпонентную систему для эффективной опосредованной CRISPR модификации генома в клетках млекопитающих.
Для оптимизации эффективности расщепления авторы данной заявки также определяли, влияют ли различные изоформы tracrRNA на эффективность расщепления, и обнаружили, что в этой иллюстративной системе только короткая (89 п.о.) форма транскрипта была способна опосредовать расщепление локуса генома ЕМХ1. На фигуре 9 представлен дополнительный анализ процессинга crRNA в клетках млекопитающих с помощью нозерн-блоттинга. На фигуре 9А показано схематическое изображение вектора экспрессии для одного спейсера, фланкированного двумя прямыми повторами (DR-EMX1(1)-DR). Спейсер из 30 п.о. нацеленный на протоспейсер 1 локуса ЕМХ1 человека и последовательности прямых повторов показаны в последовательности внизу фигуры 9А. Линия указывает на участок, обратно комплементарную последовательность которого использовали для создания зондов для нозерн-блоттинга для выявления crRNA ЕМХ1(1). На фигуре 9В показаны результаты анализа с помощью нозерн-блоттинга общей РНК, экстрагированной из клеток 293FT, трансфицированных экспрессирующими конструкциями U6, несущими DR-EMX1(1)-DR. Левая и правая секции получены с клетками 293FT, трансфицированными без или с SpRNase III, соответственно. DR-EMX1(1)-DR подвергался процессингу в зрелые crRNA только в присутствии SpCas9 и короткой tracrRNA и не зависел от присутствия SpRNase III. Зрелая crRNA, обнаруженная в общей РНК трансфицированных 293FT, имела длину ~33 п.о. и была короче, чем зрелая crRNA из S. pyogenes длиной 39-42 п.о. Данные результаты демонстрируют, что систему CRISPR можно перенести в эукариотические клетки и перепрограммировать для облегчения расщепления эндогенных целевых полинуклеотидов млекопитающих.
На фигуре 2 показана бактериальная система CRISPR, описанная в этом примере. На фигуре 2А показано схематическое изображение локуса 1 CRISPR из Streptococcus pyogenes SF370 и предполагаемый механизм опосредованного CRISPR расщепления ДНК с помощью этой системы. Зрелая crRNA, подвергшаяся процессингу из массива прямых повторов-спейсеров, направляет Cas9 к мишеням в геноме, состоящим из комплементарных протоспейсеров и мотива, смежного с протоспейсером (РАМ). При спаривании оснований мишень-спейсер Cas9 опосредует двухцепочечный разрыв в целевой ДНК. На фигуре 2 В показано конструирование Cas9 S. pyogenes (SpCas9) и РНКазы III (SpRNase III) с клеточными сигналами ядерной локализации (NLS) для обеспечения импорта в ядро млекопитающих. На фигуре 2С показана экспрессия SpCas9 и SpRNase III у млекопитающих, управляемая конститутивным промотором EF1a, и массива tracrRNA и pre-crRNA (DR-cneftcep-DR), управляемая промотором U6 РНК-полимеразы 3 для стимуляции точной инициации и терминации транскрипции. Протоспейсер из локуса ЕМХ1 человека с удовлетворительной последовательностью РАМ использовали в качестве спейсера в массиве pre-crRNA. На фигуре 2D показан анализ с помощью нуклеазы Surveyor для опосредованных SpCas9 минорных вставок и делеций. SpCas9 экспрессировался с SpRNase III, tracrRNA и массивом pre-crRNA, несущим целевой спейсер для ЕМХ1, и без таковых. На фигуре 2Е показано схематическое изображение спаривания оснований между целевым локусом и нацеленной на ЕМХ1 crRNA, а также иллюстративная хроматограмма, на которой показана микроделеция, смежная по отношению к сайту расщепления SpCas9. На фигуре 2F показаны мутированные аллели, идентифицированные в результате анализа секвенирования 43 клональных ампликонов, показывающие разнообразие микровставок и микроделеций. Штрихами указаны удаленные основания, а невыровненные или несовпадающие основания указывают на вставки или мутации. Масштабная метка =10 мкм.
Для дальнейшего упрощения трехкомпонентной системы адаптировали химерную crRNA-tracrRNA гибридную структуру, в которой зрелую crRNA (содержащую направляющую последовательность) сливали с частичной tracrRNA при помощи структуры по типу стебель-петля для имитации естественного дуплекса crRNA : tracrRNA (фигура 3А).
Направляющие последовательности можно встроить между сайтами BbsI с использованием гибридизированных олигонуклеотидов. Протоспейсеры на смысловой и антисмысловой нитях указаны выше и ниже последовательностей ДНК, соответственно. Степень модификации для локусов PVALB человека и Th мыши достигали 6,3% и 0,75%, соответственно, демонстрируя широкую применимость системы CRISPR при модификации различных локусов у многих организмов. Хотя при использовании химерных конструкций расщепление обнаруживали только с одним из трех спейсеров для каждого локуса, все целевые последовательности расщеплялись с эффективностью получения вставок/делений, достигающей 27%, при использовании схемы с коэкспрессируемой pre-crRNA (фигуры 4 и 5).
На фигуре 5 представлена дополнительная иллюстрация того, что SpCas9 можно перепрограммировать для целенаправленного воздействия на несколько локусов генома в клетках млекопитающих. На фигуре 5А представлено схематическое изображение локуса ЕМХ1 человека, на котором показано положение пяти протоспейсеров, указанных с помощью подчеркнутых последовательностей. На фигуре 5В представлено схематическое изображение комплекса pre-crRNA/trcrRNA, на котором показана гибридизация между участком прямого повтора в pre-crRNA и tracrRNA (вверху), и схематическое изображение химерной структуры РНК, содержащей направляющую последовательность из 20 п.о. и парную tracr-последовательность и tracr-последовательность, состоящие из неполного прямого повтора и последовательностей tracrRNA, гибридизованных в "шпилечную" структуру (внизу). Результаты анализа с помощью Surveyor со сравнением эффективности опосредованного Cas9 расщепления в пяти протоспейсерах в локусе ЕМХ1 человека показаны на фигуре 5С. Целенаправленное воздействие на каждый протоспейсер осуществляли либо с использованием подвергнутого процессингу комплекса pre-crRNA/tracrRNA (crRNA), либо с использованием химерной РНК (chiRNA).
Поскольку вторичная структура РНК может быть важной для межмолекулярных взаимодействий, алгоритм предсказания структуры на основе минимальной свободной энергии и ансамбля взвешенных структур по Больцману использовали для сравнения предполагаемой вторичной структуры всех направляющих последовательностей, используемых в эксперименте с целенаправленным воздействием на геном (фигура 3В) (см., например, Gruber et al., 2008, Nucleic Acids Research, 36: W70). Анализ выявил, что в большинстве случаев эффективные направляющие последовательности в контексте химерной crRNA, по сути, не содержали мотивов вторичной структуры, тогда как неэффективные направляющие последовательности с большей вероятностью образовывали внутренние вторичные структуры, которые могут препятствовать спариванию оснований с ДНК целевого протоспейсера. Следовательно, возможно, что вариабельность во вторичной структуре спейсера может оказывать воздействие на эффективность опосредованной CRISPR интерференции при использовании химерной crRNA.
На фигуре 3 показан пример векторов экспрессии. На фигуре 3А представлено схематическое изображение бицистронного вектора для управления экспрессией химерной синтетической конструкции crRNA-tracrRNA (химерной РНК), а также SpCas9. Химерная направляющая РНК содержит направляющую последовательность из 20 п.о., соответствующую протоспейсеру в геномном целевом сайте. На фигуре 3В представлено схематическое изображение, на котором показаны направляющие последовательности, нацеленные на локусы ЕМХ1, PVALB человека и Th мыши, а также их предсказанные вторичные структуры. Эффективность модификации в каждом целевом сайте указана ниже рисунка вторичной структуры РНК (ЕМХ1, n=216 считываемых фрагментов при секвенировании ампликонов; PVALB, n=224 считываемых фрагментов; Th, n=265 считываемых фрагментов). Представлены результаты по алгоритму укладки каждого основания, окрашенного соответственно его возможности принятия предсказанной вторичной структуры, как указано с помощью цветной шкалы, воспроизведенной на фигуре 3B в виде серой шкалы. Структуры дополнительных векторов для SpCas9 показаны на фигуре 3А, в том числе отдельные векторы экспрессии, включающие промотор U6, сцепленный с сайтом встраивания для направляющего олигонуклеотида, и промотор Cbh, сцепленный с кодирующей последовательностью SpCas9.
Для того, чтобы определить, способны ли спейсеры с вторичными структурами функционировать в прокариотических клетках, где в естественных условиях функционируют CRISPR, интерференцию при трансформации плазмидами, несущими протоспейсеры, исследовали в штамме Е. coli, гетерологично экспрессирующем локус 1 CRISPR S. pyogenes SF370 (фигура 3С). Локус CRISPR клонировали в низкокопийный вектор экспрессии Е. coli и массив crRNA замещали одним спейсером, фланкированным парой DR (pCRISPR). Штаммы E. coli, несущие разные плазмиды pCRISPR, трансформировали контрольными плазмидами, содержащими соответствующие протоспейсер и последовательности РАМ (фигура 3С). При анализе у бактерий все спейсеры способствовали эффективной CMSPR-интерференпии (фигура 3С). Эти результаты указывают на то, что могут существовать дополнительные факторы, влияющие на эффективность активности CRISPR в клетках млекопитающих.
Для исследования специфичности опосредованного CRISPR расщепления эффект однонуклеотидных мутаций в направляющей последовательности в отношении расщепления протоспейсера в геноме млекопитающих анализировали с использованием ряда целенаправленно воздействующих на ЕМХ химерных crRNA с единичными точковыми мутациями (фигура 4А). На фигуре 4 В показаны результаты анализа с помощью нуклеазы Surveyor со сравнением эффективности расщепления Cas9 при спаривании с различными мутантными химерными РНК. Несовпадение одного основания в участке вплоть до 12 п.о. с 5' в РАМ, по сути, прекращало расщепление генома SpCas9, тогда как спейсеры с мутациями в положениях, расположенных в более отдаленных положениях выше относительно хода транскрипции сохраняли активность в отношении исходного протоспейсера-мишени (фигура 4В). В дополнение к РАМ, SpCas9 характеризуется специфичностью в отношении одного основания в последних 12 п.о. спейсера. Кроме того, CRISPR способен опосредовать расщепление генома столь же эффективно, как и пара нуклеаз TALE (TALEN), целенаправленно воздействующих на тот же протоспейсер ЕМХ1. На фигуре 4С представлено схематическое изображение, на котором показана структура TALEN, целенаправленно воздействующих на ЕМХ1, и на фигуре 4D показано сравнение эффективности TALEN и Cas9 (n=3) при разгонке в геле продуктов, полученных в результате анализа с помощью Surveyor.
Установив набор компонентов для достижения опосредованного CRISPR редактирования генов в клетках млекопитающих посредством склонного к ошибкам механизма NHEJ, исследовали способность CRISPR к стимуляции гомологичной рекомбинации (HR), высокоточный путь репарации генов для создания точных редакционных изменений в геноме. SpCas9 дикого типа способен опосредовать сайт-специфические DSB, которые могут репарироваться как с помощью NHEJ, так и HR. Кроме того, замену аспартата на аланин (D10A) в каталитическом домене RuvCI в SpCas9 производили посредством методик генетической инженерии для превращения нуклеазы в никазу (SpCas9n; проиллюстрировано на фигуре 5А) (см., например, Sapranausaks et al., 2011, Cucleic Acis Research, 39: 9275; Gasiunas et al., 2012, Proc. Natl. Acad. Sci. USA, 109: E2579) так, чтобы надрезанная геномная ДНК подвергалась высокоточной репарации с использованием гомологичной рекомбинации (HDR). Анализ с помощью Surveyor подтвердил, что SpCas9n не создает вставок/делеций в протоспейсере-мишени ЕМХ1. Как показано на фигуре 5В, коэкспрессия целенаправленно воздействующей на ЕМХ1 химерной crRNA с SpCas9 давала вставки/делеции в целевом сайте, тогда как коэкспрессия с SpCas9n - нет (n=3). Более того, при секвенировании 327 ампликонов не обнаружили каких-либо вставок/делеций, индуцированных SpCas9n. Для исследования опосредованной CRISPR HR при совместной трансфекции клеток НЕК 293FT химерной РНК, целенаправленно воздействующей на ЕМХ1, hSpCas9 или hSpCas9n, выбирали тот же локус, также как и матрицу для HR для введения пары сайтов рестрикции (HindIII и NheI) возле протоспейсера. На фигуре 5 С приведена схематическая иллюстрация стратегии HR с относительными положениями точек рекомбинации и последовательностей для гибридизации праймеров (стрелки). SpCas9 и SpCas9n действительно катализировали интеграцию матрицы для HR в локус ЕМХ1. ПЦР амплификация целевого участка с последующим рестрикционным расщеплением HindIII выявила продукты расщепления, соответствующие ожидаемым размерам фрагментов (стрелки на результатах анализа полиморфизма длин рестрикционных фрагментов с помощью гель-электрофореза, показанных на фигуре 5D), причем SpCas9 и SpCas9n опосредуют подобные уровни эффективности HR. Заявители дополнительно подтверждали HR с использованием секвенирования геномных ампликонов по Сэнгеру (фигура 5Е). Эти результаты демонстрировали пригодность CRISPR для облегчения целенаправленной вставки генов в геном млекопитающего. С учетом специфичности к мишени в 14 п.о. (12 п.о. от спейсера и 2 п.о. от РАМ) SpCas9 дикого типа доступность никазы может значительно снизить вероятность нецелевой модификации, поскольку одноцепочечные разрывы не являются субстратами для склонного к ошибкам пути NHEJ.
Экспрессирующие конструкции, имитирующие естественную архитектуру локусов CRISPR с собранными в массив спейсерами (фигура 2А), создавали для исследования возможности мультиплексного целенаправленного воздействия на последовательности. При использовании одного массива CRISPR, кодирующего пару спейсеров, нацеленных на ЕМХ1 и PVALB, обнаруживали эффективное расщепление в обоих локусах (фигура 4F, на которой показаны как схематическая структура массива crRNA, так и блот, полученный после анализа с помощью Surveyor, показывающий эффективное опосредование расщепления). Также исследовали целенаправленную делецию геномных участков большего размера посредством одновременных DSB с использованием спейсеров против двух мишеней в ЕМХ1, разделенных 119 п.о., и обнаруженная эффективность делении составляла 1,6% (3 из 182 ампликонов; фигура 5G). Это демонстрирует, что система CRISPR может опосредовать мультиплексное редактирование в пределах одного генома.
Пример 2: модификации и альтернативы системы CRISPR
Возможность применения РНК для программирования специфичного к последовательности расщепления ДНК определяет новый класс инструментов для конструирования генома для разнообразных исследовательских и промышленных применений. Несколько аспектов системы CRISPR можно дополнительно улучшить для повышения эффективности и универсальности целенаправленного воздействия с помощью CRISPR. Оптимальная активность Cas9 может зависеть от доступности несвязанного Mg2+ на уровнях, которые превышают имеющиеся в ядре млекопитающего (см., например, Jinek et al., 2012, Science, 337: 816), и предпочтение в отношении мотива NGG непосредственно ниже протоспейсера ограничивает способность к целенаправленному воздействию в среднем на каждые 12 п.о. в геноме человека. Некоторые из этих затруднений можно преодолеть путем изучения разнообразия локусов CRISPR в микробном метагеноме (см., например, Makarova et al., 2011, Nat Rev Microbiol, 9: 467). Другие локусы CRISPR можно переместить в микроокружение клетки млекопитающего с помощью способа, подобного описанному в примере 1. Эффективность модификации в каждом целевом сайте указана ниже вторичных структур РНК. Алгоритм, генерирующий цвета структуры каждого основания соответственно его возможности принятия предсказанной вторичной структуры. РНК направляющих спейсеров 1 и 2 индуцировали 14% и 6,4%, соответственно. Статистический анализ активности для расщепления по биологическим копиям в этих двух протоспейсерных сайтах также приведен на фигуре 7.
Пример 3: алгоритм выбора примерной целевой последовательности
Создали компьютерную программу для идентификации кандидатных целевых последовательностей CRISPR на обеих нитях вводимой последовательности ДНК на основе длины желаемой направляющей последовательности и мотива последовательности CRISPR (РАМ) для определенного фермента CRISPR. Например, целевые сайты для Cas9 из S. pyogenes с последовательностями РАМ NGG можно идентифицировать путем поиска в отношении 5'-Nx-NGG-3' как на вводимой последовательности, так и на последовательности, обратно-комплементарной вводимой. Подобным образом, целевые сайты для Cas9 CRISPR1 S. thermophilus с последовательностью РАМ NNAGAAW, можно идентифицировать путем поиска в отношении 5'-Nx-NNAGAAW-3' как на вводимой последовательности, так и на последовательности, обратно-комплементарной вводимой. Подобным образом, целевые сайты для Cas9 CRISPR3 S. thermophilus с последовательностью РАМ NGGNG можно идентифицировать путем поиска в отношении 5'-Nx-NGGNG-3' как на вводимой последовательности, так и на последовательности, обратно-комплементарной вводимой. Значение "х" в Nx может фиксироваться программой или может быть определено пользователем, как, например, 20.
Поскольку несколько случаев появления целевого сайта ДНК в геноме могут приводить к неспецифическому редактированию генома, после идентификации всех возможных сайтов программа профильтровывает последовательности, исходя из количества раз, когда они встречаются в соответствующем эталонном геноме. Для тех ферментов CRISPR, для которых специфичность к последовательности определяется "затравочной" последовательностью, такой как находящаяся в 11-12 п.о. в направлении 5' от последовательности РАМ, в том числе сама последовательность РАМ, стадия фильтрования может основываться на "затравочной" последовательности. Следовательно, во избежание редактирования в дополнительных локусах генома результаты фильтруют, исходя из числа случаев обнаружения последовательности затравки: РАМ в подходящем геноме. Пользователь может иметь возможность выбора длины затравочной последовательности. Пользователь также может иметь возможность определять число случаев обнаружения последовательности затравки: РАМ в геноме применительно к прохождению фильтра По умолчанию установлен скрининг в отношении уникальных последовательностей. Уровень фильтрования изменяют путем изменения как длины затравочной последовательности, так и числа случаев обнаружения последовательности в геноме. В качестве дополнения или альтернативы, программа может обеспечивать последовательность направляющей последовательности, комплементарную сообщенной(ым) целевой(ым) последовательности(ям) путем обеспечения последовательности, обратно комплементарной идентифицированной(ым) целевой(ым) последовательности(ям).
Дальнейшие детали способов и алгоритмов для оптимизации выбора последовательности можно найти в заявке на патент США с серийным номером ТВА (общая ссылка В1-2012/084 44790.11.2022); включенной в данный документ при помощи ссылки.
Пример 4: оценка гибридов нескольких химерных crRNA-tracrRNA
В данном примере описаны результаты, полученные для химерных РНК (chiRNA; содержащие направляющую последовательность, парную tracr-последовательность и tracr-последовательность в одном транскрипте), имеющих tracr-последовательности, которые включают фрагменты последовательности tracrRNA дикого типа с разной длиной. На фигуре 18а показано схематическое изображение бицистронного вектора экспрессии для химерной РНК и Cas9. Cas9 управляется промотором CBh, а химерная РНК управляется промотором U6. Химерная направляющая РНК состоит из направляющей последовательности (Ns) из 20 п.о., соединенной с tracr-последовательностью (проходящей от первого "U" в нижней нити к концу транскрипта), которая усечена в разных указанных положениях. Направляющие и tracr-последовательности разделены парной tracr-последовательностью GUUUUAGAGCUA, за которой следует последовательность петли GAAA. Результаты анализов с помощью SURVEYOR в отношении опосредованных Cas9 вставок/делеций в локусах ЕМХ1 и PVALB человека показаны на фигурах 18b и 18с, соответственно. Стрелки указывают на ожидаемые фрагменты, полученные в результате расщепления с помощью SURVEYOR. ChiRNA показаны путем обозначения их "+n", a crRNA относится к гибридной РНК, в которой направляющие и tracr-последовательности экспрессируются в виде раздельных транскриптов. Количественный анализ этих результатов, выполненный в трех повторностях, проиллюстрирован с помощью гистограмм на фигурах 11а и 11b, соответствующих фигурам 10b и 10с, соответственно ("N.D." означает отсутствие обнаруженных вставок/делеций). ID (идентификационные данные) протоспейсеров и их соответствующей мишени в геноме, последовательность протоспейсера, последовательность РАМ и положение нити приведены в таблице D. Направляющие последовательности разработаны так, чтобы они были комплементарны полной последовательности протоспейсера в случае отдельных транскриптов в гибридной системе или только подчеркнутой части в случае химерных РНК.
Клеточная культура и трансфекция
Линию клеток почки эмбриона человека (HEK) 293FT (Life Technologies) поддерживали в среде Игла в модификации Дульбекко (DMEM), дополненной 10% фетальной бычьей сыворотки (HyClone), 2 мМ GlutaMAX (Life Technologies), 100ЕД/мл пенициллина и 100 мкг/мл стрептомицина, при 37°C с инкубированием при 5% СО СО2. Клетки 293FT засевали в 24-луночные планшеты (Corning) за 24 часа до трансфекции при плотности 150000 клеток на лунку. Клетки трансфицировали с применением Lipofectamine 2000 (Life Technologies), следуя рекомендованному производителем протоколу. Для каждой лунки 24-луночного планшета использовали в общей сложности 500 нг плазмид.
Анализ с помощью SURVEYOR на предмет наличия модификации генома
Клетки 293FT трансфицировали плазмидной ДНК, как описано выше. Клетки инкубировали при 37°C в течение 72 часов после трансфекции перед экстракцией геномной ДНК. Геномную ДНК экстрагировали с помощью раствора QuickExtract DNA Extraction Solution (Epicentre), следуя протоколу производителя. Вкратце, осажденные центрифугированием клетки ресуспендировали в растворе QuickExtract solution и инкубировали при 65°C в течение 15 минут и 98°C в течение 10 минут. Геномный участок, фланкирующий целевой сайт CRISPR каждого гена, амплифипировали с помощью ПЦР (праймеры перечислены в таблице Е) и продукты очищали с применением колонки QiaQuick Spin Column (Qiagen), следуя протоколу производителя. В общей сложности 400 нг очищенных ПЦР-продуктов смешивали с 2 мкл 10Х ПЦР-буфера для ДНК- полимеразы Taq (Enzymatics) и воды сверхвысокой чистоты до конечного объема 20 мкл и подвергали процессу повторного отжига для обеспечения образования гетеродуплекса: 95°C в течение 10 мин., линейное снижение температуры с 95°C до 85°C со скоростью 2°C/с, с 85°C до 25°C со скоростью 0,25°C/с и с выдерживанием при 25°C в течение 1 минуты. После повторного отжига продукты обрабатывали нуклеазой SURVEYOR и энхансером S SURVEYOR (Transgenomics), следуя рекомендованному производителем протоколу, и анализировали в 4-20% полиакриламидных гелях Novex ТВЕ (Life Technologies). Гели окрашивали красителем ДНК SYBR Gold (Life Technologies) в течение 30 минут и получали изображение с помощью системы обработки изображений Gel Doc gel imaging system (Bio-rad). Количественный анализ основывался на относительных интенсивностях полос.
Вычислительная идентификация уникальных целевых сайтов CRISPR
Для идентификации уникальных целевых сайтов для фермента Cas9 (SpCas9) S. pyogenes SF370 в геноме человека, мыши, крысы, данио, плодовой мухи и С. elegans был разработан пакет программ для сканирования обеих нитей последовательности ДНК и идентификации всех возможных целевых сайтов SpCas9. Для этого примера каждый целевой сайт SpCas9 был оперативно определен как последовательность из 20 п.о., за которой следует последовательность мотива, смежного с протоспейсером, (РАМ) NGG, при этом были определены все последовательности, удовлетворяющие определению 5'-N20-NGG-3' на всех хромосомах. Для предотвращения неспецифического редактирования генома после идентификации всех потенциальных сайтов все целевые сайты фильтровали, исходя из количества раз, когда они встречаются в соответствующем эталонном геноме. Для того чтобы извлечь пользу из специфичности к последовательности активности Cas9, обеспечиваемой "затравочной" последовательностью, которой может быть, например, последовательность из приблизительно 11-12 п.о. 5' от последовательности РАМ, при этом последовательности 5'-NNNNNNNNNN-NGG-3' выбирали как уникальные в соответствующем геноме. Все геномные последовательности загружали из геномного браузера UCSC (геном человека hg19, геном мыши mm9, геном крысы rn5, геном данио danRer7, геном D. melanogaster dm4 и геном С. elegans се10). Все результаты поиска доступны для просмотра с использованием информации из геномного браузера UCSC. Иллюстративная визуализация некоторых целевых сайтов в геноме человека представлена на фигуре 22.
Первоначально целенаправленному воздействию подвергали три сайта в пределах локуса ЕМХ1 в клетках HEK 293FT человека. Эффективность модификации генома каждой сhiРНК оценивали с использованием анализа с помощью нуклеазы SURVEYOR, который позволяет обнаруживать мутации, возникающие в результате двухцепочечных разрывов (DSB) ДНК и их последующей репарации с помощью пути репарации повреждения ДНК за счет негомологичного соединения концов (NHEJ). В конструкциях, обозначенных chiRNA(+n), указывается, что нуклеотиды в количестве до +n нуклеотида tracrRNA дикого типа включены в химерную РНК-конструкцию, при этом для n используются значения 48, 54, 67 и 85. Химерные РНК, содержащие более длинные фрагменты tracrRNA дикого типа (chiRNA(+67) и chiRNA(+85)), опосредовали расщепление ДНК во всех трех целевых сайтах ЕМХ1, причем chiRNA(+85), в частности, демонстрировал значительно более высокие уровни расщепления ДНК, чем соответствующие гибриды crRNA/tracrRNA, у которых направляющие и tracr-последовательности экспрессируются в отдельных транскриптах (фигуры 10b и 10а). Два сайта в локусе PVALB, которые не давали обнаруживаемого расщепления с использованием гибридной системы (направляющая последовательность и tracr-последовательность, экспрессируемые в виде отдельных транскриптов), также подвергались целенаправленному воздействию с использованием chiRNA. chiRNA(+67) и chiRNA(+85) были способны опосредовать значительное расщепление в двух протоспейсерах в PVALB (фигуры 10с и 10b).
Для всех пяти мишеней в локусах ЕМХ1 и PVALB наблюдали соответствующее повышение эффективности модификации генома с увеличением длины tracr-последовательности. Не вдаваясь в какую-либо теорию, вторичная структура, формируемая 3' концом tracrRNA, может играть роль в увеличении скорости образования комплекса CRISPR. Иллюстрация предсказанных вторичных структур для каждой химерной РНК, использованной в этом примере, представлена на фигуре 21. Вторичную структуру предсказывали с применением RNAfold (http://RNA.tbi.univie.ac.at/cgi-bin/RNAfold.cgi) с использованием минимальной свободной энергии и алгоритма функции распределения. Псевдоцвет для каждого основания (воспроизведен в серой шкале) указывает на возможность спаривания. По причине того, что chiRNA с более длинными tracr-последовательностями были способны расщеплять мишени, которые не были расщеплены нативными гибридами crRNA/tracrRNA CRISPR, возможно, что химерная РНК может загружаться на Cas9 более эффективно, чем ее нативный гибридный аналог. Для обеспечения применения Cas9 для сайт-специфического редактирования генома в эукариотических клетках и организмах все предсказанные уникальные целевые сайты для Cas9 S. pyogenes определяли путем вычислений в геномах человека, мыши, крысы, данио, С. elegans и D. melanogaster. Химерные РНК можно разрабатывать для ферментов Cas9 из других микроорганизмов для расширения целевого пространства CRISPR РНК-программируемых нуклеаз.
На фигурах 11 и 21 показаны примерные бицистронные векторы экспрессии для экспрессии химерной РНК, включающие tracr-последовательность РНК дикого типа вплоть до нуклеотида +85 и SpCas9 с последовательностями ядерной локализации SpCas9 экспрессируется с промотора CBh и терминируется polyA-сигналом bGH (bGH рА). Расширенная последовательность, показанная непосредственно под схематическим изображением, соответствует участку, окружающему направляющую последовательность сайта встраивания, и включает от 5' до 3', 3'-часть промотора U6 (первый заштрихованный участок), сайты расщепления BbsI (стрелки), неполный прямой повтор (парная tracr-последовательность GTTTTAGAGCTA, подчеркнутая), последовательность петли GAAA и +85 tracr-последовательность (подчеркнутая последовательность, следующая за последовательностью петли). Иллюстративное встраивание направляющей последовательности изображено ниже сайта встраивания направляющей последовательности, при этом нуклеотиды направляющей последовательности для выбранной мишени представлены как "N".
Последовательности, описанные в приведенных выше примерах, представляют собой следующие (полинуклеотидные последовательности представлены от 5' к 3').
U6 с короткой tracrRNA (Streptococcuspyogenes SF370):
(жирный шрифт = последовательность tracrRNA; подчеркивание = терминаторная последовательность).
U6 с длинной tracrRNA (Streptococcus pyogenes SF370):
U6-DR-BbsI-остов-DR (Streptococcus pyogenes SF370):
U6-химерная PHK-BbsI-остов (Streptococcus pyogenes SF370)
NLS-SpCas9-EGFP:
SpCas9-EGFP-NLS:
NLS-SpCas9-EGFP-NLS:
NLS-SpCas9-NLS:
NLS-mCherry-SpRNase3:
SpRNase3-mCherry-NLS:
NLS-SpCas9n-NLS (D10A мутация никазы представлена в нижнем регистре):
hEMX1-HR-матрица-HindII-NheI:
NLS-StCsn1-NLS:
U6-St_tracrRNA(7-97):
U6-DR-спейсер-DR (S. pyogenes SF370)
(нижний регистр, подчеркивание - прямой повтор; N = направляющая последовательность; жирный шрифт = терминатор).
Химерная РНК, содержащая +48 tracr RNA (S. pyogenes SF370)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Химерная РНК, содержащая +54 tracr RNA (S. pyogenes SF370)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Химерная РНК, содержащая +67 tracr RNA (S. pyogenes SF370)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор) Химерная РНК, содержащая +85 tracr RNA (S. pyogenes SF370)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
CBh-NLS-SpCas9-NLS
(подчеркивание = NLS-hSpCas9-NLS).
Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с РАМ NNAGAAW)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с РАМ NNAGAAW)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с РАМ NNAGAAW)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с РАМ NNAGAAW)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с РАМ NNAGAAW)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Иллюстративная химерная РНК для Cas9 из CPJSPR1 LMD-9 S. thermophilus (с РАМ NNAGAAW)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с РАМ NNAGAAW)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 £ thermophilus (с РАМ NNAGAAW)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с РАМ NNAGAAW)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с РАМ NGGNG)
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор).
Кодон-ошимизированный вариант Cas9 из локуса CRISPR3 LMD-9 S. thermophilus (с NLS и на 5'-, и на 3'-концах)
Пример 5: оптимизация направляющей РНК для Cas9 Streptococcus pyogenes (называемого SpCas9)
Авторы данной заявки вносили мутации в tracrRNA и последовательности прямых повторов или вносили мутации в химерную направляющую РНК для повышения экспрессии РНК в клетках.
Оптимизация основана на наблюдении, что присутствовали фрагменты тимина (Ts) в tracrRNA и направляющей РНК, которые могли приводить к ранней терминации транскрипции посредством промотора pol 3. Таким образом заявители создавали следующие оптимизированные последовательности. Оптимизированная tracrRNA и соответствующий оптимизированный прямой повтор представлены в парах.
Оптимизированная tracrRNA 1 (мутация подчеркнута):
Оптимизированный прямой повтор 1 (мутация подчеркнута):
Оптимизированная tracrRNA 2 (мутация подчеркнута):
Оптимизированный прямой повтор 2 (мутация подчеркнута):
Авторы данной заявки также оптимизировали химерную направляющую РНК для оптимальной активности в эукариотических клетках. Исходная направляющая РНК:
Оптимизированная химерная направляющая последовательность РНК 1:
Оптимизированная химерная направляющая последовательность РНК 2:
Оптимизированная химерная направляющая последовательность РНК 3:
Авторы данной заявки показали, что оптимизированная химерная направляющая РНК работает лучше, как показано на фигуре 9. Эксперимент проводили путем котрансфекции клеток 293FT Cas9 и ДНК-кассетой с U6-направляющей РНК для экспрессии одной из четырех форм РНК, показанных выше. Мишень направляющей РНК является таким же целевым сайтом в локусе ЕМХ1 человека: "GTCACCTCCAATGACTAGGG".
Пример 6: оптимизация Cas9 из CRISPR1 LMD-9 Streptococcus thermophilus (называемого St1Cas9)
Авторы данной заявки разрабатывали направляющие химерные РНК, как показано на фигуре 12.
Направляющие РНК St1Cas9 можно подвергать такому же типу оптимизации, как и направляющие РНК SpCas9, путем разрушения политиминовых фрагментов (Ts).
Пример 7: улучшение системы Cas9 для применения in vivo
Авторы данной заявки проводили поиск с использованием метагеномного подхода в отношении Cas9 с малым молекулярным весом. Большинство гомологов Cas9 являются достаточно большими. Например, SpCas9 имеет длину около 1368 а.к., что слишком много для легкой упаковки в вирусные векторы для доставки. Некоторые из последовательностей могли быть неверно аннотированы, и, таким образом, точная частота каждой длины не обязательно может быть достоверной. Тем не менее она дает некоторое представление о распределении белков Cas9 и указывает на то, что существуют более короткие гомологи Cas9.
С помощью анализа на основе расчетов авторы данной заявки обнаружили, что у штамма бактерии Campylobacter присутствуют два белка Cas9 с менее чем 1000 аминокислот. Последовательность для одного Cas9 из Campylobacter jejuni представлена ниже. При такой длине CjCas9 может быть легко упакован в AAV, лентивирусы, аденовирусы и другие вирусные векторы для надежной доставки в первичные клетки и in vivo в животные модели.
>Cas9 Campylobacter jejuni (CjCas9)
Предполагаемый элемент tracrRNA для данного CjCas9 представляет собой:
Последовательность прямого повтора представляет собой:
Совместно свернутая структура tracrRNA и прямой повтор представлены на фигуре 6.
Пример химерной направляющей РНК для CjCas9 представляет собой:
Авторы данной заявки также оптимизировали направляющую РНК для Cas9 с применением способов in vitro. На фигуре 18 показаны данные, полученные в результате in vitro оптимизации химерной направляющей РНК St1Cas9.
Несмотря на то, что предпочтительные варианты осуществления настоящего изобретения были показаны и описаны в данном документе, для специалиста в данной области будет очевидно, что такие варианты осуществления предоставлены только в качестве примера. Многочисленные вариации, изменения и замены теперь будут очевидны для специалиста в данной области без отступления от сути настоящего изобретения. Следует понимать, что различные альтернативные варианты вариантов осуществления настоящего изобретения, раскрытые в данном документе, можно применять при практическом осуществлении настоящего изобретения. Предполагают, что следующая формула изобретения определяет объем настоящего изобретения, и что, таким образом, охвачены способы и структуры в пределах объема данной формулы изобретения и их эквиваленты.
Пример 8: оптимизация Sa sgRNA
Авторы данной заявки разрабатывали пять вариантов sgRNA для SaCas9 для оптимальной усеченной архитектуры с наивысшей эффективностью расщепления. Кроме того, дуплексную систему нагивный прямой повтор : tracr исследовали совместно с sgRNA. Гиды с указанными длинами совместно трансфицировали SaCas9 и исследовали в клетках HEK 293FT в отношении активности. Посредством в общей сложности 100 нг sgRNA U6-ПЦР-ампликона (или 50 нг прямого повтора и 50 нг tracrRNA) и 400 нг плазмид с SaCas9 совместно трансфицировали 200000 гепатоцитов мыши Hepa1-6 и ДНК собирали через 72 часа после трансфекции для анализа при помощи SURVEYOR. Результаты показаны на фиг. 23.
Библиографические ссылки:
1. Urnov, F.D., Rebar, E.J., Holmes, М.С., Zhang, H.S. & Gregory, P.D. Genome editing with engineered zinc finger nucleases. Nat. Rev. Genet. 11, 636-646 (2010).
2. Bogdanove, A.J. & Voytas, D.F. TAL effectors: customizable proteins for DNA targeting. Science 333, 1843-1846 (2011).
3. Stoddard, B.L. Homing endonuclease structure and function. Q. Rev. Biophys. 38, 49-95 (2005).
4. Bae, T. & Schneewind, O. Allelic replacement in Staphylococcus aureus with inducible counter-selection. Plasmid 55, 58-63 (2006).
5. Sung, C.K., Li, H., Claverys, J.P. & Morrison, D.A. An rpsL cassette, janus, for gene replacement through negative selection in Streptococcus pneumoniae. Appl. Environ. Microbiol. 67,5190-5196(2001).
6. Sharan, S.K., Thomason, L.C., Kuznetsov, S.G. & Court, D.L. Recombineering: a homologous recombination-based method of genetic engineering. Nat. Protoc. 4, 206-223 (2009).
7. Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).
8. Deveau, H., Garneau, J.E. & Moineau, S. CRISPR-Cas system and its role in phage-bacteria interactions. Annu. Rev. Microbiol. 64, 475-493 (2010).
9. Horvath, P. & Barrangou, R. CRISPR-Cas, the immune system of bacteria and archaea. Science 327,167-170 (2010).
10. Terns, M.P. & Terns, R.M. CRISPR-based adaptive immune systems. Curr. Opin. Microbiol. 14, 321-327 (2011).
11. van der Oost, I., Jore, M.M., Westra, E.R., Lundgren, M. & Brouns, S.J. CRISPR-based adaptive and heritable immunity in prokaryotes. Trends. Biochem. Sci. 34, 401-407 (2009).
12. Brouns, S.J. et al. Small CRISPR RNAs guide antiviral defense in prokaryotes. Science 321, 960-964 (2008).
13. Carte, J., Wang, R., Li, H., Terns, R.M. & Terns, M.P. Cas6 is an endoribonuclease that generates guide RNAs for invader defense in prokaryotes. Genes Dev. 22, 3489-3496 (2008).
14. Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607 (2011).
15. Hatoum-Asian, A., Maniv, I. & Marraffini, L.A. Mature clustered, regularly interspaced, short palindromic repeats RNA (crRNA) length is measured by a ruler mechanism anchored at the precursor processing site. Proc. Natl. Acad. Sci. U.S.A. 108, 21218-21222 (2011).
16. Haurwitz, R.E., Jinek, M., Wiedenheft, В., Zhou, K. & Doudna, J.A. Sequence- and structure-specific RNA processing by a CRISPR endonuclease. Science 329,1355-1358 (2010).
17. Deveau, H. et al. Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. J. Bacteriol. 190,1390-1400 (2008).
18. Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc. Natl. Acad. Sci. U.S.A. (2012).
19. Makarova, K.S., Aravind, L., Wolf, Y.I. & Koonin, E.V. Unification of Cas protein families and a simple scenario for the origin and evolution of CRISPR-Cas systems. Biol. Direct. 6,38(2011).
20. Barrangou, R. RNA-mediated programmable DNA cleavage. Nat. Biotechnol. 30, 836-838 (2012).
21. Brouns, S.J. Molecular biology. A Swiss army knife of immunity. Science 337, 808-809 (2012).
22. Carroll, D. A CRISPR Approach to Gene Targeting. Mol. Ther. 20, 1658-1660 (2012).
23. Bikard, D., Hatoum-Aslan, A., Mucida, D. & Marraffrni, L.A. CRISPR interference can prevent natural transformation and virulence acquisition during in vivo bacterial infection. Cell Host Microbe 12,177-186 (2012).
24. Sapranauskas, R. et al. The Streptococcus thermophilus CRISPR-Cas system provides immunity in Escherichia coli. Nucleic Acids Res. (2011).
25. Semenova, E. et al. Interference by clustered regularly interspaced short palindromic repeat (CRISPR) RNA is governed by a seed sequence. Proc. Natl. Acad Sci. U.S.A. (2011).
26. Wiedenheft, B. et al. RNA-guided complex from a bacterial immune system enhances target recognition through seed sequence interactions. Proc. Natl. Acad. Sci. U.S.A. (2011).
27. Zahner, D. & Hakenbeck, R. The Streptococcus pneumoniae beta-galactosidase is a surface protein. J. Bacteriol. 182, 5919-5921 (2000).
28. Marraffrni, L.A., Dedent, A.C. & Schneewind, O. Sortases and the art of anchoring proteins to the envelopes of gram-positive bacteria. Microbiol. Mol. Biol. Rev. 70, 192-221 (2006).
29. Motamedi, M.R., Szigety, S.K. & Rosenberg, S.M. Double-strand-break repair recombination in Escherichia coli: physical evidence for a DNA replication mechanism in vivo. Genes Dev. 13, 2889-2903 (1999).
30. Hosaka, T. et al. The novel mutation K87E in ribosomal protein S12 enhances protein synthesis activity during the late growth phase in Escherichia coli. Mol. Genet. Genomics 271, 317-324(2004).
31. Costantino, N. & Court, D.L. Enhanced levels of lambda Red-mediated recombinants in mismatch repair mutants. Proc. Natl. Acad. Sci. U.S.A. 100, 15748-15753 (2003).
32. Edgar, R. & Qimron, U. The Escherichia coli CRISPR system protects from lambda lysogenization, lysogens, and prophage induction. J. Bacteriol. 192, 6291-6294 (2010).
33. Marraffini, L.A. & Sontheimer, E.J. Self versus non-self discrimination during CRISPR RNA-directed immunity. Nature 463, 568-571 (2010).
34. Fischer, S. et al. An archaeal immune system can detect multiple Protospacer Adjacent Motifs (PAMs) to target invader DNA. J. Biol. Chem. 287, 33351-33363 (2012).
35. Gudbergsdottir, S. et al. Dynamic properties of the Sulfolobus CRISPR-Cas and CRISPR/Cmr systems when challenged with vector-borne viral and plasmid genes and protospacers. Mol. Microbiol. 79, 35-49 (2011).
36. Wang, H.H. et al. Genome-scale promoter engineering by coselection MAGE. Nat Methods 9, 591-593 (2012).
37. Cong, L. et al. Multiplex Genome Engineering Using CRISPR-Cas Systems. Science в печати (2013).
38. Mali, P. et al. RNA-Guided Human Genome Engineering via Cas9. Science в печати (2013).
39. Hoskins, J. et al. Genome of the bacterium Streptococcus pneumoniae strain R6. J. Bacteriol. 183, 5709-5717 (2001).
40. Havarstein, L.S., Coomaraswamy, G. & Morrison, D.A. An unmodified heptadecapeptide pheromone induces competence for genetic transformation in Streptococcus pneumoniae. Proc. Natl. Acad. Sci. U.S.A. 92, 11140-11144 (1995).
41. Horinouchi, S. & Weisblum, B. Nucleotide sequence and functional map of pC194, a plasmid that specifies inducible chloramphenicol resistance. J. Bacteriol. 150, 815-825 (1982).
42. Horton, R.M. In Vitro Recombination and Mutagenesis of DNA: SOEing Together Tailor-Made Genes. Methods Mol. Biol. 15, 251-261 (1993).
43. Podbielski, A., Spellerberg, В., Woischnik, M., Pohl, B. & Lutticken, R. Novel series of plasmid vectors for gene inactivation and expression analysis in group A streptococci (GAS). Gene 177, 137-147 (1996).
44. Husmann, L.K., Scott, J.R., Lindahl, G. & Stenberg, L. Expression of the Arp protein, a member of the M protein family, is not sufficient to inhibit phagocytosis of Streptococcus pyogenes. Infection and immunity 63, 345-348 (1995).
45. Gibson, D.G. et al. Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat Methods 6, 343-345 (2009).
46. Tangri S, et al. ("Rationally engineered therapeutic proteins with reduced immunogenicity" J Immunol. 2005 Mar 15; 174(6): 3187-96.
* * * *
Несмотря на то, что предпочтительные варианты осуществления настоящего изобретения были показаны и описаны в данном документе, для специалиста в данной области будет очевидно, что такие варианты осуществления предоставлены только в качестве примера. Многочисленные вариации, изменения и замены будут теперь будут очевидны для специалиста в данной области без отступления от сути настоящего изобретения. Следует понимать, что различные альтернативные варианты вариантов осуществления настоящего изобретения, раскрытые в данном документе, можно применять при практическом осуществлении настоящего изобретения.
Изобретение относится к биотехнологии. Описана система CRISPR-Cas для редактирования генома в эукариотической клетке, содержащая: белок Cas9, содержащий по меньшей мере одну последовательность ядерной локализации, и химерную РНК (chiRNA) системы CRISPR-Cas, содержащую: (a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке, (b) парную tracr-последовательность, способную гибридизоваться с tracr-последовательностью, и (c) tracr-последовательность, где (a), (b) и (c) расположены в 5’-3’ ориентации, где одна или несколько из направляющей, tracr- и парной tracr-последовательностей модифицированы для повышения стабильности и где необязательно белок Cas9 образует комплекс с химерной РНК (chiRNA) системы CRISPR-Cas. Представлена векторная система CRISPR-Cas для модификации целевой последовательности в эукариотической клетке, содержащая один или несколько векторов, содержащих: I. первый регуляторный элемент, функционально связанный с нуклеотидной последовательностью, кодирующей химерную РНК (chiRNA) системы CRISPR-Cas, содержащую: (a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке, (b) парную tracr-последовательность, способную гибридизоваться с tracr-последовательностью, и (c) tracr-последовательность, где (a), (b) и (c) расположены в 5’-3’ ориентации, и II. второй регуляторный элемент, функционально связанный с нуклеотидной последовательностью, кодирующей белок Cas9, содержащий по меньшей мере одну последовательность ядерной локализации, где компоненты I и II находятся в одном и том же или в разных векторах системы, где одна или несколько из направляющей, tracr- и парной tracr-последовательностей модифицированы для повышения стабильности. Изобретение расширяет арсенал средств, контролирующих экспрессию. 2 н. и 47 з.п. ф-лы, 23 ил., 4 табл., 8 пр.
1. Сконструированная система CRISPR-Cas для редактирования генома в эукариотической клетке, содержащая:
белок Cas9, содержащий по меньшей мере одну последовательность ядерной локализации, и
химерную РНК (chiRNA) системы CRISPR-Cas, содержащую:
(a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке,
(b) парную tracr-последовательность, способную гибридизоваться с tracr-последовательностью, и
(c) tracr-последовательность,
где (a), (b) и (c) расположены в 5’-3’ ориентации,
где одна или несколько из направляющей, tracr- и парной tracr-последовательностей модифицированы для повышения стабильности и где необязательно белок Cas9 образует комплекс с химерной РНК (chiRNA) системы CRISPR-Cas.
2. Система CRISPR-Cas по п. 1, где модификация включает сконструированную вторичную структуру.
3. Система CRISPR-Cas по п. 1, где модификация включает уменьшение участка гибридизации между парной tracr-последовательностью и tracr-последовательностью.
4. Система CRISPR-Cas по п. 1, где модификация включает слияние парной tracr- последовательности и tracr-последовательности посредством искусственной петли.
5. Система CRISPR-Cas п. 1, где модификация включает tracr-последовательность длиной от 40 до 120 п.о.
6. Система CRISPR-Cas п. 1, где tracr-последовательность составляет от 40 п.о. до полной длины tracr.
7. Система CRISPR-Cas по п. 1, где tracr-последовательность включает по меньшей мере нуклеотиды 1-67 соответствующей tracrRNA дикого типа.
8. Система CRISPR-Cas п. 1, где tracr-последовательность включает по меньшей мере нуклеотиды 1-85 соответствующей tracrRNA дикого типа.
9. Система CRISPR-Cas по п. 1, где tracr-последовательность содержит нуклеотиды, соответствующие нуклеотидам 1-67 tracrRNA Cas9 S. pyogenes дикого типа.
10. Система CRISPR-Cas по п. 1, где tracr-последовательность содержит нуклеотиды, соответствующие нуклеотидам 1-85 tracrRNA Cas9 S. pyogenes дикого типа.
11. Система CRISPR-Cas по п. 9, где tracr-последовательность состоит, по сути, из нуклеотидов, соответствующих нуклеотидам 1-67 tracrRNA Cas9 S. pyogenes дикого типа.
12. Система CRISPR-Cas по п. 10, где tracr-последовательность состоит, по сути, из нуклеотидов, соответствующих нуклеотидам 1-85 tracrRNA Cas9 S. pyogenes дикого типа.
13. Система CRISPR-Cas по п. 1, где модификация включает оптимизацию последовательности.
14. Система CRISPR-Cas по п. 13, где модификация включает уменьшение полиТ-последовательностей в tracr- и/или парной tracr-последовательностях.
15. Система CRISPR-Cas по п. 14, где один или несколько T, присутствующие в полиТ-последовательности, соответствующей последовательности дикого типа, были заменены на отличный от Т нуклеотид.
16. Система CRISPR-Cas по пп. 13, 14 или 15, где модифицированная последовательность не содержит какую-либо полиТ-последовательность, имеющую более 4 смежных T.
17. Система CRISPR-Cas по п. 1, где модификация включает добавление терминаторной полиТ-последовательности.
18. Система CRISPR-Cas по п. 17, где модификация включает добавление терминаторной полиТ-последовательности в tracr- и/или парную tracr-последовательности.
19. Система CRISPR-Cas по п. 17 или 18, где модификация включает добавление терминаторной полиТ-последовательности в направляющую последовательность.
20. Система CRISPR-Cas по п. 1, где модификация включает изменение петель и/или "шпилек".
21. Система CRISPR-Cas по п. 20, где модификация включает обеспечение минимум двух "шпилек" в направляющей последовательности.
22. Система CRISPR-Cas по п. 20 или 21, где модификация включает обеспечение "шпильки", образованной при помощи комплементации между tracr- и парной tracr-последовательностями.
23. Система CRISPR-Cas по п. 20 или 21, где модификация включает обеспечение одной или нескольких дополнительных "шпилек" на 3'-конце последовательности tracrRNA.
24. Система CRISPR-Cas по п. 20 или 21, где модификация включает обеспечение одной или нескольких дополнительных "шпилек", добавленных на 3' направляющей последовательности.
25. Система CRISPR-Cas по п. 1, где модификация включает удлинение 5'-конца направляющей последовательности.
26. Система CRISPR-Cas по п. 25, где модификация включает обеспечение одной или нескольких "шпилек" на 5'-конце направляющей последовательности.
27. Система CRISPR-Cas по п. 25 или 26, где модификация включает введение последовательности (5'-AGGACGAAGTCCTAA) на 5'-конце направляющей последовательности.
28. Система CRISPR-Cas по п. 1, где модификация включает обеспечение образования перекрестных связей или обеспечение одного или нескольких модифицированных нуклеотидов в полинуклеотидной последовательности.
29. Система CRISPR-Cas по п. 28, где модифицированные нуклеотиды предусматриваются в любой или во всех из tracr-, парной tracr- и/или направляющей последовательностей.
30. Система CRISPR-Cas по п. 28 или 29, где обеспечение модифицированных нуклеотидов предусматривает включение по меньшей мере одного не встречающегося в природе нуклеотида, или модифицированного нуклеотида, или их аналогов.
31. Система CRISPR-Cas по п. 30, где модифицированные нуклеотиды модифицированы по компоненту, представляющему собой рибозу, фосфат и/или основание.
32. Система CRISPR-Cas по п. 30, где модифицированный нуклеотид выбран из группы, состоящей из 2'-O-метил-аналогов, 2'-дезокси-аналогов или 2'-фтор-аналогов.
33. Система CRISPR-Cas по п. 30, где модифицированный нуклеотид выбран из группы, состоящей из 2-аминопурина, 5-бромуридина, псевдоуридина, инозина, 7-метилгуанозина.
34. Система CRISPR-Cas по п. 1, где модификация включает две "шпильки".
35. Система CRISPR-Cas по п. 1, где модификация включает три "шпильки".
36. Система CRISPR-Cas по п. 1, где модификация включает самое большее пять "шпилек".
37. Система CRISPR-Cas по п. 1, где белок Cas9 является SpCas9.
38. Система CRISPR-Cas по п. 1, где белок Cas9 является SaCas9.
39. Система CRISPR-Cas по п. 1, где белок Cas9 состоит менее чем из одной тысячи аминокислот.
40. Система CRISPR-Cas по п. 1, где белок Cas9 состоит менее чем из четырех тысяч аминокислот.
41. Система CRISPR-Cas по п. 1, где белок Cas9 представляет собой StCas9 или StlCas9.
42. Система CRISPR-Cas по п. 1, где белок Cas9 является ферментом Cas9 из организма, выбранного из группы, состоящей из рода Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium или Corynebacter.
43. Система CRISPR-Cas по п. 1, где белок Cas9 является нуклеазой, управляющей расщеплением обеих нитей в определенной точке целевой последовательности.
44. Система CRISPR-Cas по п. 1, где направляющая последовательность содержит по меньшей мере пятнадцать нуклеотидов.
45. Система CRISPR-Cas по п. 1, где модификация включает оптимизированную tracr-последовательность и/или оптимизированную направляющую последовательность РНК, и/или совместно свернутую структуру tracr-последовательности и/или парной(ых) tracr-последовательности(ей), и/или стабилизирующие вторичные структуры tracr-последовательности, и/или tracr-последовательности с уменьшенным участком спаривания оснований, и/или tracr-последовательность, слитую с элементами РНК.
46. Система CRISPR-Cas по любому из пп. 1-45, где белок Cas9 кодон-оптимизирован для экспрессии в эукариотической клетке.
47. Сконструированная векторная система CRISPR-Cas для модификации целевой последовательности в эукариотической клетке, содержащая один или несколько векторов, содержащих:
I. первый регуляторный элемент, функционально связанный с нуклеотидной последовательностью, кодирующей химерную РНК (chiRNA) системы CRISPR-Cas, содержащую:
(a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке,
(b) парную tracr-последовательность, способную гибридизоваться с tracr-последовательностью, и
(c) tracr-последовательность,
где (a), (b) и (c) расположены в 5’-3’ ориентации, и
II. второй регуляторный элемент, функционально связанный с нуклеотидной последовательностью, кодирующей белок Cas9, содержащий по меньшей мере одну последовательность ядерной локализации,
где компоненты I и II находятся в одном и том же или в разных векторах системы,
где одна или несколько из направляющей, tracr- и парной tracr-последовательностей модифицированы для повышения стабильности.
48. Векторная система по п. 47, где компоненты I и II находятся в одном и том же векторе системы.
49. Векторная система по п. 47, где первый регуляторный элемент является промотором полимеразы II или промотором полимеразы III.
Dana Carrall et al | |||
A CRISPR Approach to Gene Targeting, Mol | |||
Ther., 2012 sep | |||
Очаг для массовой варки пищи, выпечки хлеба и кипячения воды | 1921 |
|
SU4A1 |
RU 2009136452 A, 10.04.2011. |
Авторы
Даты
2019-10-01—Публикация
2013-12-12—Подача